爬取酷6网小视频
本文只為學(xué)習(xí)交流。
目標網(wǎng)站
這個就是我們需要的請求數(shù)據(jù)
這個是含視頻的請求
構(gòu)建請求
解析數(shù)據(jù)
循環(huán)提取數(shù)據(jù)
# 一定要注意縮進問題,不然可能只循環(huán)一個 for data in jsod_list:playUrl = data['title'] + 'mp4'title = data['playUrl']#print(playUrl,title)然后對視頻的url進行提取,并保存到本地
values = requests.get(url=playUrl,headers=headers).contentwith open('kuwang\\' + title,'wb') as f:f.write(values)print('正在下載:',title)最后一步,翻頁提取。
這個翻頁是最簡單的翻頁,利用循環(huán)翻頁。
最后還是注意一點,縮進問題,任何一點縮進問題都會出錯,我以踩過坑。
本人小白,哪有出錯,請多多指教。
完整代碼
# Author:風(fēng)啟新塵 # Date: 2020/9/5 14:03 # @Software: PyCharm import requests import json import pprint from lxml import etree for page in range(1,6):print('************************************正在爬取第{}*********************************'.format(page))url = 'https://www.ku6.com/video/feed?pageNo={}&pageSize=40&subjectId=76'.format(page)headers = {'user-agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Mobile Safari/537.36'}redf = requests.get(url=url,headers=headers)#pprint.pprint(redf.json())json_wqx = redf.json()jsod_list = json_wqx['data']#print(jsod)# 一定要注意縮進問題,不然可能只循環(huán)一個for data in jsod_list:title = data['title'] + '.mp4'playUrl= data['playUrl']#print(playUrl,title)values = requests.get(url=playUrl,headers=headers).contentwith open('kuwang\\' + title,'wb') as f:f.write(values)print('正在下載:',title)總結(jié)
- 上一篇: 《码农翻身》读后感---程序员的潜规则
- 下一篇: 如何使用GRUFF