當(dāng)前位置：首頁(yè) > 编程语言 > python >内容正文

python

爬取千库网ppt_Python——如何实现千图成像：初级篇（从图片爬取到图片合成）...

發(fā)布時(shí)間：2023/12/9 python 27 豆豆

生活随笔收集整理的這篇文章主要介紹了爬取千库网ppt_Python——如何实现千图成像：初级篇（从图片爬取到图片合成）... 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

千圖成像：用N張圖片拼湊成一張圖片。

實(shí)現(xiàn)原理：先將所要成像的圖片轉(zhuǎn)化成馬賽克圖片，然后從圖庫(kù)中用對(duì)應(yīng)顏色的圖片替換相應(yīng)色塊。

圖庫(kù)中的圖片處理：標(biāo)記圖庫(kù)中每張圖片的混合顏色，用于替換目標(biāo)色塊，并記錄每張圖片的特征用于成像，增加成像質(zhì)量。

0，起源

圖片局部

很久前在刷微博的時(shí)候看到了這條，被他給震撼到了，圖片是由LOL近千張皮膚圖片組合構(gòu)成的(難道這是用ps做的，還是一張張拼的，應(yīng)該不可能吧)，就在昨天突然就想起了這個(gè)事，就決定也做一個(gè)，隨即便展開了行動(dòng)。搜到了這篇文章，看了下圖片的構(gòu)成，決定先取得所有皮膚的圖片再說吧！便又開始了爬蟲！運(yùn)行環(huán)境：Python3.6.5 ， pycharm-2018-1-2 ， win10

愣著干嘛，快往下看

1.爬蟲思路皮膚圖片的來源問題，首先到官網(wǎng)去找了找，想到了道聚城皮膚專賣區(qū)，其中正好有所有我們需要的圖片。

皮膚圖片來源

以此類推便可取得多個(gè)皮膚的URL，發(fā)現(xiàn)只有圖中紅框處不同

URLS

嘗試著改變紅框內(nèi)的數(shù)字(玄學(xué))，在改變后三位(122015-->122001)時(shí)，獲得了另一張諾手的皮膚，基本可以確定后三位為皮膚編號(hào)，前面的數(shù)字為英雄編號(hào)，且皮膚編號(hào)必須為三位，這一步得感謝這位博主，讓我更加確定了這個(gè)規(guī)律的可行性。(這一步花了好久)

看到這里你可能會(huì)有所疑問，為什么不直接正則獲取所需圖片的URL呢？為什么要大費(fèi)周章地尋找規(guī)律？因?yàn)檫@個(gè)翻頁(yè)式網(wǎng)站比較特殊，在翻頁(yè)時(shí)URL并不會(huì)改變，所以無法通過常用方法獲取所有皮膚，那估計(jì)又有人要提出使用selenium庫(kù)來模擬人使用瀏覽器獲取所有圖片，但是這會(huì)造成爬取圖片的速度大大下降，只能作為下策(在這過程中了解到了八爪魚，發(fā)現(xiàn)其原理類似于selenium，是模擬人操控瀏覽器，速度也是不容直視，雖然它能爬取近98%的網(wǎng)站)，在博主能力有限的情況下選擇了尋找規(guī)律之旅！

如果你有好的方法解決這個(gè)問題，可以在評(píng)論處提出，十分感謝！

接下來在知道了規(guī)律的情況下，那么如何獲取每個(gè)不同英雄的編號(hào)呢？在其他博主的引導(dǎo)下，發(fā)現(xiàn)LoL資料庫(kù)中有所有英雄的頭像，通過F12的慢慢查找，發(fā)現(xiàn)了這個(gè)js文件！

Network

查看其preview，便可得到所有英雄編號(hào)，并測(cè)試發(fā)現(xiàn)可用！比如Ashe艾希的第一個(gè)皮膚對(duì)應(yīng)編號(hào)按規(guī)律應(yīng)該是22001，所以URL就是https://game.gtimg.cn/images/daoju/app/lol/medium/2-22001-9.jpg，測(cè)試發(fā)現(xiàn)確實(shí)成功了！

preview

好了，到此為止網(wǎng)頁(yè)分析到此結(jié)束了，終于可以編寫代碼了！

2，代碼框架1，獲取英雄編號(hào)及皮膚編號(hào)(說明：關(guān)于皮膚編號(hào)并未找到每個(gè)英雄皮膚的數(shù)量，所以設(shè)置成查找所有001到015的圖片，當(dāng)然也可以更多020也行)

3，根據(jù)URL來下載對(duì)應(yīng)圖片，并保存到本地。

3，完整代碼

import requests

import re

import os

# # # # # # # # # # # # # #

# title:獲取LOL英雄皮膚圖像 #

# author:簡(jiǎn)書 Wayne_Dream #

# date:2018-7-5 #

# 轉(zhuǎn)載請(qǐng)注明出處！！！ #

# # # # # # # # # # # # # #

def getHero_data():

try:

headers = {

'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'

}

url = 'http://lol.qq.com/biz/hero/champion.js'

r = requests.get(url, headers=headers)

r.raise_for_status()

r.encoding = r.apparent_encoding

text = r.text

hero_id = re.findall(r'"id":"(.*?)","key"', text)

hero_num = re.findall(r'"key":"(.*?)"', text)

return hero_id, hero_num

except:

return '臥槽，獲取英雄編碼失敗！'

def getUrl(hero_num):

part1 = 'https://game.gtimg.cn/images/daoju/app/lol/medium/2-'

part3 = '-9.jpg'

skin_num = []

Url_list = []

for i in range(1, 21):

i = str(i)

if len(i) == 1:

i = '00'+i

elif len(i) == 2:

i = '0'+i

else:

continue

skin_num.append(i)

for hn in hero_num:

for sn in skin_num:

part2 = hn + sn

url = part1 + part2 + part3

Url_list.append(url)

print('圖片URL獲取成功')

return Url_list

def PicName(hero_id, path):

pic_name_list = []

for id in hero_id:

for i in range(1, 21):

pic_name = path + id + str(i) + '.jpg'

pic_name_list.append(pic_name)

return pic_name_list

def DownloadPic(pic_name_list, Url_list):

count = 0

n = len(Url_list)

try:

for i in range(n):

headers = {

'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'

}

res = requests.get(Url_list[i], headers=headers).content

if len(res) < 100:

count += 1

print('\r當(dāng)前進(jìn)度：{:.2f}%'.format(100*(count/n)), end='')

else:

with open(pic_name_list[i], "wb") as f:

f.write(res)

count += 1

print('\r當(dāng)前進(jìn)度：{:.2f}%'.format(100*(count/n)), end='')

except:

return '臥槽，獲取圖片失敗！'

if __name__ == '__main__':

print('author:簡(jiǎn)書 Wayne_Dream:')

print('https://www.jianshu.com/u/6dd4484b4741')

input('請(qǐng)輸入任意字符開始爬蟲:')

if os.path.exists('D:\LOLimg_wayne\\') == False:

path = r'D:\LOLimg_wayne\\'

os.mkdir(path)

hero_id, hero_num = getHero_data()

Url_list = getUrl(hero_num)

pic_name_list = PicName(hero_id, path)

print('正在下載圖片，請(qǐng)稍等。。。')

print('在' + path + '下查看...')

DownloadPic(pic_name_list, Url_list)

print('圖片下載完畢')

else:

path = r'D:\LOLimg_wayne\\'

hero_id, hero_num = getHero_data()

Url_list = getUrl(hero_num)

pic_name_list = PicName(hero_id, path)

print('正在下載圖片，請(qǐng)稍等。。。')

print('在' + path + '下查看...')

DownloadPic(pic_name_list, Url_list)

print('圖片下載完畢')

代碼寫的比較丑，如有看不懂的部分可在評(píng)論區(qū)提出，我會(huì)秒回你的！/認(rèn)真臉好了，到這里我們已經(jīng)完成了LOL全皮膚的獲取，接下來進(jìn)行最有意思的一步，千圖成像！(文末有我爬取到的皮膚圖集百度網(wǎng)盤地址)

4，初級(jí)階段我們先使用一款國(guó)外的合成軟件

軟件下載地址如果打不開，那就搜索“foto-mosaik-edda”下載即可！

Windows用戶請(qǐng)選這個(gè)

打開后界面是這樣的。

第一步創(chuàng)建圖庫(kù)

先選第一步

1.1

1.2

等待一會(huì)兒

再選第二步create photo mosaic

2.1

2.2

2.3

2.4

2.5，彈出警告點(diǎn)確認(rèn)

效果圖

局部

大吉大利，今晚吃雞

有時(shí)間再分享如何用python實(shí)現(xiàn)這個(gè)軟件的功能………… 如發(fā)現(xiàn)錯(cuò)誤或看不懂的地方，可在評(píng)論區(qū)提出，大家一起交流！

如果想直接嘗試一下千圖成像的，可以私信小編“資料”來領(lǐng)取哦

總結(jié)

以上是生活随笔為你收集整理的爬取千库网ppt_Python——如何实现千图成像：初级篇（从图片爬取到图片合成）...的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： Python学习笔记__10.4章进程
下一篇： React开发（186）:react 父

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

python

爬取千库网ppt_Python——如何实现千图成像：初级篇（从图片爬取到图片合成）...

總結(jié)