python爬虫短片_Python爬虫练习:爬取全民小视频(附代码,过程)
前言
本文的文字及圖片來源于網絡,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理
本次目標
爬取全民小視頻
https://quanmin.baidu.com/
確定目標網頁
選擇影視類目
右鍵選擇檢查,開發開發者工具
選擇 Network,網頁往下滑,可以看到數據加載
視頻地址
視頻名字
視頻ID
接口數據鏈接是通過pn的變化,實現翻頁效果
如果想要爬取其他分類視頻,把參數中tab_name 更改即可
環境
Python3.6
pycharm
開始代碼
導入工具
import pprint
import requests
相關庫可以用 pip install 安裝
請求、解析、爬取網頁數據,并保存
url = 'https://quanmin.baidu.com/wise/growth/api/home/tabmorelist'
for page in range(1, 100):
params = {
'rn': '12',
'pn': '{}'.format(page),
'timestamp': '1603442730716',
'session_id': '1603442719704',
'tab_name': 'movie',
'_format': 'json',
}
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, params=params, headers=headers)
html_data = response.json()
lis = html_data['data']['list']['video_list']
for li in lis:
play_url = li['play_url']
title = li['title']
filename = 'C:\\Users\\Administrator\\Desktop\\新建文件夾\\' + title + '.mp4'
response_2 = requests.get(url=play_url, headers=headers)
with open(filename, mode='wb') as f:
f.write(response_2.content)
print(title, play_url)
運行代碼,效果如下
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的python爬虫短片_Python爬虫练习:爬取全民小视频(附代码,过程)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ThinkPHP6项目基操(17.实战部
- 下一篇: thinkPHP6.0 控制器请求方法延