python的Requests库的使用
Requests模塊:
Requests 是用Python語言編寫,基于 urllib,采用 Apache2 Licensed 開源協(xié)議的 HTTP 庫。它比 urllib 更加方便,可以節(jié)約我們大量的工作,完全滿足 HTTP 測試需求。Requests 的哲學(xué)是以 PEP 20 的習(xí)語為中心開發(fā)的,所以它比 urllib 更加Pythoner。更重要的是它支持 Python3!
1.安裝:
pip install requests
2.Requests 簡便的API意味著所有HTTP請求類型都支持:
r = requests.put("http://httpbin.org/put")
r = requests.delete("http://httpbin.org/delete")
r = requests.head("http://httpbin.org/get")
r = requests.options("http://httpbin.org/get")
3.傳遞URL參數(shù):
①:
>>> payload = {'key1': 'value1', 'key2': 'value2'}
>>> r = requests.get("http://httpbin.org/get", params=payload)
>>> print(r.url)
輸出:http://httpbin.org/get?key2=value2&key1=value1 #通過打印輸出該 URL,你能看到URL已被正確編碼 ②:
>>> payload = {'key1': 'value1', 'key2': ['value2', 'value3']}
>>> r = requests.get('http://httpbin.org/get', params=payload)
>>> print(r.url)
輸出:http://httpbin.org/get?key1=value1&key2=value2&key2=value3
4.編碼:
你可以找出 Requests 使用了什么編碼,并且能夠使用 r.encoding 屬性來改變它
resopnse = requests.get("http://www.baidu.com")
>>> r.encoding
'ISO-8859-1'
>>> r.encoding = 'utf-8'
5.解析JSON:
Requests 中也有一個內(nèi)置的 JSON 解碼器,助你處理 JSON 數(shù)據(jù):
>>> r = requests.get('https://github.com/timeline.json')
>>> r.json()
{'message': 'Hello there, wayfaring stranger. If you’re reading this then you probably didn’t see our blog post a couple of years back announcing that this。。。
注意:如果 JSON 解碼失敗, r.json() 就會拋出一個異常。例如,響應(yīng)內(nèi)容是 401 (Unauthorized),嘗試訪問 r.json() 將會拋出 ValueError: No JSON object could be decoded 異常。需要注意的是,成功調(diào)用 r.json() 并**不**意味著響應(yīng)的成功。有的服務(wù)器會在失敗的響應(yīng)中包含一個 JSON 對象(比如 HTTP 500 的錯誤細(xì)節(jié))。這種 JSON 會被解碼返回。要檢查請求是否成功,請使用 r.raise_for_status() 或者檢查 r.status_code 是否和你的期望相同。
6.獲取http響應(yīng)碼/響應(yīng)狀態(tài):
>>> r = requests.get('https://github.com/timeline.json')
>>> r.status_code
410 #響應(yīng)碼
7.請求頭定制:
如果你想為請求添加 HTTP 頭部,只要簡單地傳遞一個 dict 給 headers 參數(shù)就可以了。
url = 'https://api.github.com/some/endpoint'
headers = {'user-agent': 'my-app/0.0.1'}
r = requests.get(url, headers=headers)
8.更加復(fù)雜的 POST 請求:
payload = {'key1': 'value1', 'key2': 'value2'}
r = requests.post("http://httpbin.org/post", data=payload)
print(r.text)
輸出:
{
...
"form": {
"key2": "value2",
"key1": "value1"
},
...
}
你還可以為 data 參數(shù)傳入一個元組列表。在表單中多個元素使用同一 key 的時候,這種方式尤其有效:
>>> payload = (('key1', 'value1'), ('key1', 'value2'))
>>> r = requests.post('http://httpbin.org/post', data=payload)
>>> print(r.text)
{
...
"form": {
"key1": [
"value1",
"value2"
]
},
...
}
很多時候你想要發(fā)送的數(shù)據(jù)并非編碼為表單形式的。如果你傳遞一個 string 而不是一個 dict,那么數(shù)據(jù)會被直接發(fā)布出去。
>>> import json
>>> url = 'https://api.github.com/some/endpoint'
>>> payload = {'some': 'data'}
>>> r = requests.post(url, data=json.dumps(payload))
9.獲取響應(yīng)頭:
r = requests.get("http://www.xxx.com")
>>> r.headers
{
'content-encoding': 'gzip',
'transfer-encoding': 'chunked',
'connection': 'close',
'server': 'nginx/1.0.4',
'x-runtime': '148ms',
'etag': '"e1ca502697e5c9317743dc078f67693f"',
'content-type': 'application/json'
>>>r.headers['content-encoding']
>>>r.headers.get('content-encoding') #這種方法不會報(bào)錯
10.Cookies:
如果某個響應(yīng)中包含一些 cookie,你可以快速訪問它們:
url = 'http://example.com/some/cookie/setting/url'
r = requests.get(url)
r.cookies['example_cookie_name']
輸出:'example_cookie_value'
要想發(fā)送你的cookies到服務(wù)器,可以使用 cookies 參數(shù):
url = 'http://httpbin.org/cookies'
cookies = dict(cookies_are='working')
r = requests.get(url, cookies=cookies)
r.text
輸出:'{"cookies": {"cookies_are": "working"}}'
11.超時:
你可以告訴 requests 在經(jīng)過以 timeout 參數(shù)設(shè)定的秒數(shù)時間之后停止等待響應(yīng)。基本上所有的生產(chǎn)代碼都應(yīng)該使用這一參數(shù)。
如果不使用,你的程序可能會永遠(yuǎn)失去響應(yīng):
>>> requests.get('http://github.com', timeout=0.001)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
requests.exceptions.Timeout: HTTPConnectionPool(host='github.com', port=80): Request timed out. (timeout=0.001)
注意:timeout 僅對連接過程有效,與響應(yīng)體的下載無關(guān)。 timeout 并不是整個下載響應(yīng)的時間限制,而是如果服務(wù)器在timeout 秒內(nèi)沒有應(yīng)答,將會引發(fā)一個異常(更精確地說,是在 timeout 秒內(nèi)沒有從基礎(chǔ)套接字上接收到任何字節(jié)的數(shù)據(jù)時)If no timeout is specified explicitly, requests do not time out.
12.錯誤與異常:
①遇到網(wǎng)絡(luò)問題(如:DNS 查詢失敗、拒絕連接等)時,Requests 會拋出一個 ConnectionError 異常。
②如果 HTTP 請求返回了不成功的狀態(tài)碼, Response.raise_for_status() 會拋出一個 HTTPError 異常。
③若請求超時,則拋出一個 Timeout 異常。
④若請求超過了設(shè)定的最大重定向次數(shù),則會拋出一個 TooManyRedirects 異常。
⑤所有Requests顯式拋出的異常都繼承自 requests.exceptions.RequestException 。
Requests的Cookies文檔
這里有一篇關(guān)于cookie和session詳解的文章挺不錯的!
13.Session會話對象:
在以上的請求中,每次請求其實(shí)都相當(dāng)于發(fā)起了一個新的請求。也就是相當(dāng)于我們每個請求都用了不同的瀏覽器單獨(dú)打開的效果。也就是它并不是指的一個會話,即使請求的是同一個網(wǎng)址。比如:
import requests
requests.get('http://httpbin.org/cookies/set/sessioncookie/123456789')
r = requests.get("http://httpbin.org/cookies")
print(r.text)
結(jié)果是:
{
"cookies": {}
}
很明顯,這不在一個會話中,無法獲取 cookies,那么在一些站點(diǎn)中,我們需要保持一個持久的會話怎么辦呢?就像用一個瀏覽器逛淘寶一樣,在不同的選項(xiàng)卡之間跳轉(zhuǎn),這樣其實(shí)就是建立了一個長久會話。
解決方案如下:
import requests
s = requests.Session()
s.get('http://httpbin.org/cookies/set/sessioncookie/123456789')
r = s.get("http://httpbin.org/cookies")
print(r.text)
在這里我們請求了兩次,一次是設(shè)置 cookies,一次是獲得 cookies
運(yùn)行結(jié)果:
{
"cookies": {
"sessioncookie": "123456789"
}
}
發(fā)現(xiàn)可以成功獲取到 cookies 了,這就是建立一個會話到作用。體會一下。
那么既然會話是一個全局的變量,那么我們肯定可以用來全局的配置了。
import requests
s = requests.Session()
s.headers.update({'x-test': 'true'})
r = s.get('http://httpbin.org/headers', headers={'x-test2': 'true'})
print r.text
通過 s.headers.update 方法設(shè)置了 headers 的變量。然后我們又在請求中設(shè)置了一個 headers,那么會出現(xiàn)什么結(jié)果?
很簡單,兩個變量都傳送過去了。
運(yùn)行結(jié)果:
{
"headers": {
"Accept": "*/*",
"Accept-Encoding": "gzip, deflate",
"Host": "httpbin.org",
"User-Agent": "python-requests/2.9.1",
"X-Test": "true",
"X-Test2": "true"
}
}
如果get方法傳的headers 同樣也是 x-test 呢?
r = s.get('http://httpbin.org/headers', headers={'x-test': 'true'})
1
r = s.get('http://httpbin.org/headers', headers={'x-test': 'true'})
它會覆蓋掉全局的配置
{
"headers": {
"Accept": "*/*",
"Accept-Encoding": "gzip, deflate",
"Host": "httpbin.org",
"User-Agent": "python-requests/2.9.1",
"X-Test": "true"
}
}
那如果不想要全局配置中的一個變量了呢?很簡單,設(shè)置為 None 即可
r = s.get('http://httpbin.org/headers', headers={'x-test': None})
運(yùn)行結(jié)果:
{
"headers": {
"Accept": "*/*",
"Accept-Encoding": "gzip, deflate",
"Host": "httpbin.org",
"User-Agent": "python-requests/2.9.1"
}
}
Requests的Session文檔
14.代理:
如果需要使用代理,你可以通過為任意請求方法提供 proxies 參數(shù)來配置單個請求
import requests
proxies = {
"https": "http://41.118.132.69:4433"
}
r = requests.post("http://httpbin.org/post", proxies=proxies)
print r.text
也可以通過環(huán)境變量 HTTP_PROXY 和 HTTPS_PROXY 來配置代理
export HTTP_PROXY="http://10.10.1.10:3128"
export HTTPS_PROXY="http://10.10.1.10:1080"
簡單實(shí)例:
import requests
html = requests.get("https://www.baidu.comindex.php?tn=monline_3_dg")
print(html.text) #返回的是Unicode型的數(shù)據(jù)。
print(html.content) #返回的是bytes型也就是二進(jìn)制的數(shù)據(jù)。
print(html.status_code) #返回http狀態(tài)碼
print(html.cookies) #返回cookie
print(html.headers) #返回http頭信息
print(html.url) #返回請求的url地址
附:
①Requests的text和content的區(qū)別:
resp.text返回的是Unicode型的數(shù)據(jù)。
resp.content返回的是bytes型也就是二進(jìn)制的數(shù)據(jù)。
也就是說,如果你想取文本,可以通過r.text。
如果想取圖片,文件,則可以通過r.content。
②編碼問題:
不論使用urllib還是使用requests庫經(jīng)常會遇到中文編碼錯誤的問題,我就經(jīng)常遇到,因?yàn)閜ython安裝在windows平臺上,cmd的默認(rèn)編碼為GBK,所以在cmd中顯示中文時會經(jīng)常提示gbk編碼錯誤,后來找到了貼在,完美的解決了該問題,下面我分享給大家:
UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 0: illegal multibyte sequence
在cmd中我們輸出data.read()時,中文亂碼,大部分時候是因?yàn)閜rint函數(shù),其實(shí)print()函數(shù)的局限就是Python默認(rèn)編碼的局限,因?yàn)橄到y(tǒng)是win7的,python的默認(rèn)編碼不是'utf-8',改一下python的默認(rèn)編碼成'utf-8'就行了,sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8') #改變標(biāo)準(zhǔn)輸出的默認(rèn)編碼
可以看到該語句修改了python的默認(rèn)編碼為utf8,并賦予了我們的stdout輸出,使得python的輸出默認(rèn)編碼為utf8,但是當(dāng)我們在cmd中輸出還是中文亂碼,這是cmd的鍋,cmd不能很好地兼容utf8,而IDLE就可以,甚至在IDLE下運(yùn)行,連“改變標(biāo)準(zhǔn)輸出的默認(rèn)編碼”都不用,因?yàn)樗J(rèn)就是utf8。如果一定要在cmd下運(yùn)行,那就改一下編碼,比如我換成“gb18030”,就能正常顯示了:
import io
import sys
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030') #改變標(biāo)準(zhǔn)輸出的默認(rèn)編碼
data.decode('utf8')完美解決。
Requets文檔
總結(jié)
以上是生活随笔為你收集整理的python的Requests库的使用的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ACM公选第六节下DP基础(当复习了)2
- 下一篇: Java大神带你领略queue的风采