gmail cid图片不显示_python爬虫:爬取男生喜欢的图片
任務目標:
1.抓取不同類型的圖片
2.編寫一個GUI界面爬蟲程序,打包成exe重新文件
3.遇到的難點
1.分析如何抓取不同類型的圖片
首先打開網站,可以看到有如下6個類型的菜單
在這里插入圖片描述
點擊不同菜單,發現URL顯示如下
大胸妹:https:/cid = 2
小翹臀:https:/cid = 6
可以看到每個類型圖片對應不同的cid值
所以要想抓取不同類型的圖片,只需要構造下url
將cid進行參數化,然后傳給url即可
具體代碼在以下定義
2.利用tkinter進行GUI編程
之前有寫過一些tkinter編程的隨筆
例如 利用python制作一個翻譯工具
先來看一下這次設計的程序最終頁面布局,
然后再具體講下如何實現的,頁面布局如下:
選擇圖片存儲路徑
抓取到的圖片要保存到電腦本地,所以就想著最好能夠自己挑選本地任意一個文件夾作為存儲路徑
后來網上沖浪一番發現tkinter是可以實現這個功能的
可以通過tkinter.filedialog模塊中的askdirectory()方法實現
下面是在網上找到的一段示例代碼
具體到這個例子,
(1)定義一個文本框,用來存放(顯示)選擇的存儲路徑
(2)定一個按鈕,來觸發選擇本地路徑功能
(3)定義一個函數,來實現選取路徑功能
后續保存圖片時,路徑可以直接使用前面定義好的的self.input中的值
選擇分類
因為圖片分為了6個類別,每個類別對應一個cid值,所以可以預先把cid抽象出來,視為參數傳遞 (1)定義一個拖動框,存儲圖片類型
(2)根據選擇性類型不同,返回不同的cid值
3.填寫爬取頁數
在這里插入圖片描述
自定義抓取深度,某些抓取前5頁或者前10頁
后面把這個文本文本的值傳給url即可
3.遇到的問題
下載圖片的名稱無效,導致無法保存
有些圖片沒有名稱,文件名就是.jpg, 這樣在保存時會提示非法字符無法保存,程序也會報錯,終止運行。
為了解決這個問題,我在每個文件名的末尾都加一個字母,這樣就不會存在無名稱圖片了
整體效果如下:
總結
以上是生活随笔為你收集整理的gmail cid图片不显示_python爬虫:爬取男生喜欢的图片的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: xman的思维导图快捷键_这个良心好用的
- 下一篇: 毛线精灵2如何双人玩