當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

爬取酷6网小视频

發(fā)布時間：2024/1/1 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了爬取酷6网小视频小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

本文只為學(xué)習(xí)交流。
目標網(wǎng)站

https://m.ku6.com/index

這個就是我們需要的請求數(shù)據(jù)

這個是含視頻的請求

構(gòu)建請求

# Date: 2020/9/5 14:03 # @Software: PyCharm import requests import json import pprint from lxml import etreeurl = 'https://m.ku6.com/video/feed?pageNo=0&pageSize=8' headers = {'user-agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Mobile Safari/537.36' } redf = requests.get(url=url,headers=headers) pprint.pprint(redf.json())

解析數(shù)據(jù)

json_wqx = redf.json() jsod_list = json_wqx['data'] #print(jsod)

循環(huán)提取數(shù)據(jù)

# 一定要注意縮進問題，不然可能只循環(huán)一個 for data in jsod_list:playUrl = data['title'] + 'mp4'title = data['playUrl']#print(playUrl,title)

然后對視頻的url進行提取，并保存到本地

values = requests.get(url=playUrl,headers=headers).contentwith open('kuwang\\' + title,'wb') as f:f.write(values)print('正在下載:',title)

最后一步，翻頁提取。

這個翻頁是最簡單的翻頁，利用循環(huán)翻頁。

for page in range(1,6):print('************************************正在爬取第{}*********************************'.format(page))url = 'https://www.ku6.com/video/feed?pageNo={}&pageSize=40&subjectId=76'.format(page)

最后還是注意一點，縮進問題，任何一點縮進問題都會出錯，我以踩過坑。
本人小白，哪有出錯，請多多指教。

完整代碼

# Author:風(fēng)啟新塵 # Date: 2020/9/5 14:03 # @Software: PyCharm import requests import json import pprint from lxml import etree for page in range(1,6):print('************************************正在爬取第{}*********************************'.format(page))url = 'https://www.ku6.com/video/feed?pageNo={}&pageSize=40&subjectId=76'.format(page)headers = {'user-agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Mobile Safari/537.36'}redf = requests.get(url=url,headers=headers)#pprint.pprint(redf.json())json_wqx = redf.json()jsod_list = json_wqx['data']#print(jsod)# 一定要注意縮進問題，不然可能只循環(huán)一個for data in jsod_list:title = data['title'] + '.mp4'playUrl= data['playUrl']#print(playUrl,title)values = requests.get(url=playUrl,headers=headers).contentwith open('kuwang\\' + title,'wb') as f:f.write(values)print('正在下載:',title)

總結(jié)

以上是生活随笔為你收集整理的爬取酷6网小视频的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：《码农翻身》读后感---程序员的潜规则
下一篇：如何使用GRUFF

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

爬取酷6网小视频

總結(jié)