视频文件详细信息python3_如何用python3爬取自己的收藏夹视频信息
【Part1 查找請求鏈接、請求頭、請求參數】
1.點開自己b站收藏夾的某一個子收藏夾的具體網址
2.右鍵,‘檢查’;
3.點擊開發工具欄的Network;
4.刷新網頁;
5.選擇XHR;
6.左側窗口點擊List_all請求找到請求連接
7.右側窗口的Headers--General--Request URL ,找到請求的網址,復制粘貼,直到?前的內容;再找到user-agent作為請求頭;最后找到Query String Parameters的所有params參數找到請求頭和請求參數
8.查看Preview部分的json層級
查看preview中的json層級
【Part2爬取數據并用csv或者excel保存】
【寫入csv】
import requests
import csv
headers={'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}
start_url='# 自創建收藏夾其中一個收藏夾的網址 ?之前的內容'
with open('bilibili_1.csv','w',encoding='utf-8') as file:#with open語句處理csv的寫入
writer=csv.writer(file)
writer.writerow(['視頻標題','視頻鏈接','視頻簡介'])# 寫入第一行標題
for i in range(1,5):#一次爬取4(1-4)頁,否則有可能被當成惡意請求
params={
'media_id': '224273278',
'pn': i,
'ps': 20,
'keyword':'',
'order': 'mtime',
'type': 0,
'tid': 0,
'jsonp': 'jsonp'
}
res=requests.get(start_url,headers=headers,params=params)
json=res.json()
list=json['data']['medias']# 一層一層提取Json
for info in list:# 用for循環爬取所有目標值
title=info['title']
link=info['link']
intro=info['intro']
writer.writerow([title,link,intro])#寫入數據
【寫入excel】
import requests
import openpyxl
headers={'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}
start_url='# 自創建收藏夾其中一個收藏夾的網址 ?之前的內容'
wb=openpyxl.Workbook()
sheet=wb.active
sheet.title = '搞笑視頻'
sheet.append(['標題','鏈接','簡介'])
for i in range(1,5):
params={
'media_id': '224273278',
'pn': i,
'ps': 20,
'keyword':'',
'order': 'mtime',
'type': 0,
'tid': 0,
'jsonp': 'jsonp'
}
res=requests.get(start_url,headers=headers,params=params)
json=res.json()
list=json['data']['medias']
for info in list:
title=info['title']
link=info['link']
intro=info['intro']
sheet.append([title,link,intro])
wb.save('bilibili_lol.xlsx')
wb.close()? # 最后要寫上關閉文件
【追加sheet】需要變動的地方
import openpyxl
wb=openpyxl.load_workbook('bilibili_lol.xlsx')
sheet4=wb.create_sheet()
sheet4.title='17_18'
sheet4.append(['標題','鏈接','簡介'])
import requests
import openpyxl
headers={'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}
start_url='https://api.bilibili.com/x/v3/fav/resource/list'
for i in range(17,19):
params={
'media_id': '224273278',
'pn': i,
'ps': 20,
'keyword':'',
'order': 'mtime',
'type': 0,
'tid': 0,
'jsonp': 'jsonp'
}
res=requests.get(start_url,headers=headers,params=params)
json=res.json()
list=json['data']['medias']
for info in list:
title=info['title']
link=info['link']
intro=info['intro']
sheet4.append([title,link,intro])
wb.save('bilibili_lol.xlsx')
wb.close()
總結
以上是生活随笔為你收集整理的视频文件详细信息python3_如何用python3爬取自己的收藏夹视频信息的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python学号怎么编写_用python
- 下一篇: python模块导入红色波浪线_解决py