python抓取微信文件_python 如何爬取微信公众号里的图片?
首先,你要知道.read處理出來的是什么東西
我們能讀取服務(wù)器響應(yīng)的內(nèi)容。再次以 GitHub 時間線為例:
>>> import requests
>>> r = requests.get('https://github.com/timeline.json')
>>> r.text
u'[{"repository":{"open_issues":0,"url":"https://github.com/...
Requests 會自動解碼來自服務(wù)器的內(nèi)容。大多數(shù) unicode 字符集都能被無縫地解碼。
返回的是解碼過的數(shù)據(jù),自然不是直接寫入二進制文件中.
常見的方法時:
在罕見的情況下,你可能想獲取來自服務(wù)器的原始套接字響應(yīng),那么你可以訪問 r.raw。 如果你確實想這么干,那請你確保在初始請求中設(shè)置了 stream=True。具體你可以這么做:
>>> r = requests.get('https://github.com/timeline.json', stream=True)
>>> r.raw
>>> r.raw.read(10)
'\x1f\x8b\x08\x00\x00\x00\x00\x00\x00\x03'
但一般情況下,你應(yīng)該以下面的模式將文本流保存到文件:
with open(filename, 'wb') as fd:
for chunk in r.iter_content(chunk_size=1024):
fd.write(chunk)
使用 Response.iter_content 將會處理大量你直接使用 Response.raw 不得不處理的。 當(dāng)流下載時,上面是優(yōu)先推薦的獲取內(nèi)容方式。
總結(jié)
以上是生活随笔為你收集整理的python抓取微信文件_python 如何爬取微信公众号里的图片?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微信群机器人自动管理系统源码
- 下一篇: 记一次微信点赞小网站的事故