我用Python爬取了难下载的电子教材(内附代码)
生活随笔
收集整理的這篇文章主要介紹了
我用Python爬取了难下载的电子教材(内附代码)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
我用Python爬取了難下載的電子教材(內附代碼)
第一次在CSDN上面分享經歷,有點激動。本大二狗最近這段時間去不了學校又想看教材,不巧學習通上面的部分內容老師設置了不可下載啊。好在最近學習了一點Python爬蟲的知識,歡迎需要下載的同學看過來!還請各位大佬多多指教哦!
聲明 下載僅供學習,不應到處轉發電子版本侵害教材版權!
學習系統簡介
學習通
以如下這門課為例,教師設置了不可下載:
Windows系統按F12檢查網頁,再點擊右上角的定位(或Ctrl+Shift+C),去網頁中選擇你想下載的內容。觀察右側Elements欄可知該教案的鏈接,并得知其為png圖片格式。
將左欄教材逐漸翻頁,依次觀察鏈接,可見文件名稱的更改有以下規律:
https://s3.ananas.chaoxing.com/doc/90/82/9f/a0166ab6ad54432fe759395aaf79af62/thumb/2.png
僅圖片名稱逐張加一。
對此可以寫一個循環,拼接鏈接并下載圖片。
代碼實現
注意,本段代碼需要使用requests庫。
import requests headers={'user-agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'} # 設置請求頭for i in range(1,23): # 根據實際情況設置頁數# 發出請求,并把返回的結果放在變量res中res = requests.get('https://s3.ananas.chaoxing.com/doc/90/82/9f/a0166ab6ad54432fe759395aaf79af62/thumb/'+str(i)+'.png')# 把Reponse對象的內容以二進制數據的形式返回pic=res.content# 這里的文件沒加路徑,它會被保存在程序運行的當前目錄下。# 圖片內容需要以二進制wb讀寫。你在學習open()函數時接觸過它。photo = open(str(i)+'.png','wb')# 獲取pic的二進制內容photo.write(pic) # 關閉文件photo.close()
在當前路徑中就能看到下載好的圖片啦。
結語
真的不太會編程,只是感覺有必要學習一下,終于在 風變編程 的幫助下學會了一點一直很渴望學的實用技能。忍不住要夸夸它!
這個代碼也是很簡單,以后也要繼續加油!
總結
以上是生活随笔為你收集整理的我用Python爬取了难下载的电子教材(内附代码)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: cadencesxstrace.exe修
- 下一篇: mysql数据库1067_MySQL数据