添加请求头 retrofit_Python爬虫偷懒神器 — 快速构造请求头!
我們在寫爬蟲構(gòu)建請求的時候,不可避免地要添加請求頭( headers ),一般來說,我們只要添加 user-agent 就能滿足絕大部分需求了
但這并不是絕對的,有些請求單單添加一個 user-agent 是不能獲取到數(shù)據(jù)的,在不知道是缺少哪個請求頭參數(shù)的情況下,我一般會先把所有參數(shù)全部添加上,然后再逐個排除。
如果是后面這種情況,相信大家都會有這種感覺:手動將瀏覽器中請求頭復(fù)制粘貼然后構(gòu)造成字典里的每一個 鍵值對 簡直太TM太費時間了
所以,本文將介紹幾個快速構(gòu)造請求頭的方法,供君選擇:
正則一鍵替換
正則替換指的是利用 Pycharm 的 ctrl+R 替換功能,下面帶大家一步一步來演示該操作,我們將瀏覽器的請求頭復(fù)制到 Pycharm 中,如下面所示
然后按住 crtl+R,會出現(xiàn)上下兩個輸入框,然后勾選 Regx 以及 In selection 這兩個選項
在上面框填入要匹配內(nèi)容的正則表達式:
(.*?): (.*)第二個填入匹配組后的格式
"$1": "$2",其中 "$$1 ", "$2" 分別表示匹配組,即匹配成功的原文
填完之后,選中我們剛復(fù)制的內(nèi)容,點擊 Replace all 按鈕即可
最后在外層加上 headers = {} 就完成我們要構(gòu)造的格式了
Pycharm 快捷鍵
這里再介紹一種利用 Pycharm 快捷鍵替換方法,常用的快捷鍵還是要記住,對平常快速代碼幫助很大 。
- 第一步
還是以上面復(fù)制的請求頭為例,按住 Alt 鍵,同時鼠標定位字典鍵名結(jié)束位置,如下所示,注意看鍵名旁邊都有一個鼠標指針
- 第二步
輸入引號,然后指針再前進兩步,在字典值前面輸入引號。
- 第三步
再按下 End 鍵,在最末尾輸入引號及逗號。
最后按下 Home 鍵,在最前面輸入引號,即大功告成!
和正則替換法一樣,在最外層輸入 headers = {} 即完成
postman
在瀏覽器中 Copy as cURL(bash) 我們要構(gòu)造的請求,如下圖所示
然后打開 postman,選擇左上角的 New 旁邊的 Import 按鈕 ,粘貼我們剛 copy 的內(nèi)容
點擊 Import, 就回到了發(fā)現(xiàn)請求的界面,選擇發(fā)送按鈕下方的 code 鍵,
如上圖, headers 已生成,不僅支持 Python 還支持其他語言,強大
網(wǎng)站一鍵替換
有不少網(wǎng)站都有這個構(gòu)造功能,但是該網(wǎng)站是我用過的最好用的最強大的
除了能構(gòu)造請求頭,還能單獨構(gòu)造 cookies 同時自動幫我們生成請求的代碼。你甚至你不用自己手寫代碼
同樣的在瀏覽器中 Copy as cURL(bash) 我們要構(gòu)造的請求,打開網(wǎng)站 https://curl.trillworks.com/
粘貼到左邊框后即自動生成,快得很...
還有多種語言供你選擇。源碼私信我01獲取哦
上面便是我介紹的幾種方法,是不是很方便,不用再一個一個手動輸入了。當然除了上面的方法之外,你也可以自己動手用代碼生成,因為都是有一定規(guī)律的
總結(jié)
以上是生活随笔為你收集整理的添加请求头 retrofit_Python爬虫偷懒神器 — 快速构造请求头!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: gcn语义分割_ICCV Oral 20
- 下一篇: 添加cacti监控_小水谈监控---Ca