斗图网的图片抓取
import requests, re, multiprocessingdef main(url):response = requests.get(url)html = response.textimgs_name = re.findall('alt="(.*?)"', html, re.S) # 獲取到每張圖片的名稱imgs_url = re.findall('data-original="(.*?)"', html, re.S) # 獲取到每張圖片的url地址for img_name, img_url in zip(imgs_name, imgs_url):print('正在抓取: ' + img_url)response = requests.get(img_url)with open(r'E:\demo' + '\\' + img_name + '.jpg', 'wb') as f:f.write(response.content)print('success')if __name__ == '__main__':url = 'http://www.doutula.com/photo/list/?page='pool = multiprocessing.Pool(4) # 使用四個進程pool.map(main, [url + str(i) for i in range(1, 30)]) # 1-29頁的圖片
總結
- 上一篇: 关于问题“应用程序未安装或安装时出现「I
- 下一篇: 安装虚拟机提示未启动服务器,Hyper-