python 爬取网易云音乐歌单
生活随笔
收集整理的這篇文章主要介紹了
python 爬取网易云音乐歌单
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
Python 爬取網(wǎng)易云音樂
來自嗶哩嗶哩學(xué)習(xí)視頻 爬取網(wǎng)易云音樂視頻總結(jié),也算是為自己記個筆記吧
所需庫
requests 點擊查看介紹
lxml 點擊查看介紹
確定url地址
以谷歌瀏覽器
進(jìn)入所需歌單,隨便點首歌,右鍵,檢查
找到network—XHR,如果沒有內(nèi)容,刷新一下,接下來可看到如圖
可看到所需歌曲的url
https://m801.music.126.net/20191203211801/8a4fe99967c7a8b03ef13992bed3e408/jdyyaac/075b/560e/515a/01d7ceed01adc38a2402f0bce5efa4fa.m4a
用瀏覽器直接瀏覽,可播放歌曲
也就是可以用python來訪問這個網(wǎng)址
#導(dǎo)入庫(框架,模塊) import requests#1.確定url(網(wǎng)址,統(tǒng)一資源定位)地址 url = "https://m801.music.126.net/20191203211801/8a4fe99967c7a8b03ef13992bed3e408/jdyyaac/075b/560e/515a/01d7ceed01adc38a2402f0bce5efa4fa.m4a"#2.請求 music=requests.get(url).content#4.保存 #后面的wb,是允許寫入二進(jìn)制的 with open('mysic.m4a','wb') as file:file.write(music)https://www.jianshu.com/p/c00df845323c with as 用法
下載成功
如果要下整個歌單,這種方法肯定是不行的
這是一場爬蟲與反爬蟲的較量
看到headers
為post請求,肯定會被加密
如圖網(wǎng)址為外鏈地址
不過有個外鏈轉(zhuǎn)化工具幫我們解決一切
干起來
#導(dǎo)入庫(框架,模塊) import requests from lxml import etree#1.確定url(網(wǎng)址,統(tǒng)一資源定位)地址,歌單地址,利用xpath得到每首歌的外鏈地址 url="https://music.163.com/playlist?id=10702884" base_url='https://link.hhtjim.com/163/' headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36', }#2.請求 result=requests.get(url,headers=headers).text#3.刪選數(shù)據(jù) dom=etree.HTML(result) ids = dom.xpath('//a[contains(@href,"/song?")]/@href') #print(ids) #https://link.hhtjim.com/163/347230.mp3 for songid in ids:#print(songid)count_id=songid.strip('/song?id=')#print(count_id)if ('$' in count_id) == False:music_url = base_url+'%s'%count_id+'.mp3'print(music_url)music=requests.get(music_url).content#4.保存with open('./music_wangyi/%s.mp3'%count_id,'wb') as file:file.write(music)下載成功
Vip的也可以下載,不過很容易被發(fā)現(xiàn),但我們只是為了學(xué)習(xí)而已
總結(jié)
以上是生活随笔為你收集整理的python 爬取网易云音乐歌单的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 三维向量变化为角度_物体的三维识别与6D
- 下一篇: .java文件_【转】java文件操作大