Python爬知乎妹子都爱取啥名
生活随笔
收集整理的這篇文章主要介紹了
Python爬知乎妹子都爱取啥名
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
閑來無事上知乎,看到好多妹子,于是抓取一波。
有沒有興趣??
目標網址https://www.zhihu.com/collection/78172986
抓取分析
爬取分析
使用pandas操作文件
import pandas as pd fp = pd.read_excel('D:\Backup\桌面\lunzige.xlsx')fp name = fp['name'].tolist() li1 = list(set(name)) li1['阿蕾','楊面','陳10','楊順順','霧橤','真順順真','謝椿明','刀刀','水槍大帝','傾淺','Listening','小火龍','包子琛','楊筍筍','蜉蝣','十元','靡靡之音','Real機智張','陳梓小童鞋','花甲','窗里窗外','劉梓喬','璇璇97','Olivia菊香小姐姐','牛奶小夏目','周依寧','萬阿咸','一蓑煙雨任平生','來都來了','就像周一','Mc蛋蛋','秉劍侯','李大夢Lee','Diss銳雯','雨音眞白','半仙幺幺','Natsuki是只蠢兔紙','夏冰瑩','guuweihai','阿舞','肖柚妮','墨脫要開','芷珞','舒西婷','Childe0Q','被壓扁的海螺','snow arc','灰灰灰灰灰plus','小兔子菲呀','士多啤梨羊咩咩','李小可可','誰來拽我的尾巴','飛鴿之舞','小美','櫻雪綾sama','zshiyao','王漠里','Slivan','喵小蝦','SUSAN蘇','上官蘭顏','這個殺手不太冷','看朱成碧紛思君','情緒','我系小忌廉','一只兔','June','我就想改名而已','溫柔的大貓Leo','貓芙琳','以太','博麗魔理沙','洛麗塔','羽小團','婁良','Rosi','葉以北','吃不胖的小貓','Lina','ingrid','itttttx','胡楊','孫阿童','林美珍','赫蘿Taiga','宮曼曼','Yoonyicc','ZW711','笙簫','KIKI.Liu','另一只襪子','荒野大嫖客','少女詩','蕓豆豆豆豆','璐璐嚕','棹歌','夢里有只獨角獸','Oo澄子oO','雷梅苔絲','CherryZhao','李萬一','琴脂','鹿斑比','Chris姬-云煙','hyoram','蔗蔗蔗','柚子Ruby','Sheena','孟德爾','kaka小師妹','楨視明','大豆苗','少女開膛手','陳詩茗']那么,下一步就是對名字進行分詞了,jieba分詞,你值得擁有。fxsjy/jieba
li2 = ''.join(li1) li2'阿蕾楊面陳10楊順順霧橤真順順真謝椿明刀刀水槍大帝傾淺Listening小火龍包子琛楊筍筍蜉蝣十元靡靡之音Real機智張陳梓小童鞋花甲窗里窗外劉梓喬璇璇97Olivia菊香小姐姐牛奶小夏目周依寧萬阿咸一蓑煙雨任平生來都來了就像周一Mc蛋蛋秉劍侯李大夢LeeDiss銳雯雨音眞白半仙幺幺Natsuki是只蠢兔紙夏冰瑩guuweihai阿舞肖柚妮墨脫要開芷珞舒西婷Childe0Q被壓扁的海螺snow arc灰灰灰灰灰plus小兔子菲呀士多啤梨羊咩咩李小可可誰來拽我的尾巴飛鴿之舞小美櫻雪綾samazshiyao王漠里Slivan喵小蝦SUSAN蘇上官蘭顏這個殺手不太冷看朱成碧紛思君情緒我系小忌廉一只兔June我就想改名而已溫柔的大貓Leo貓芙琳以太博麗魔理沙洛麗塔羽小團婁良Rosi葉以北吃不胖的小貓Linaingriditttttx胡楊孫阿童林美珍赫蘿Taiga宮曼曼YoonyiccZW711笙簫KIKI.Liu另一只襪子荒野大嫖客少女詩蕓豆豆豆豆璐璐嚕棹歌夢里有只獨角獸Oo澄子oO雷梅苔絲CherryZhao李萬一琴脂鹿斑比Chris姬-云煙hyoram蔗蔗蔗柚子RubySheena孟德爾kaka小師妹楨視明大豆苗少女開膛手陳詩茗'下一步就是分詞制作圖云了
import jieba seg_list = jieba.cut(li2) word = "/".join(seg_list) print("Full Mode: " + "/ ".join(seg_list)) Building prefix dict from the default dictionary ... Dumping model to file cache C:\Users\ADMINI~1\AppData\Local\Temp\jieba.cache Loading model cost 1.148 seconds. Prefix dict has been built succesfully. Full Mode: 阿蕾/ 楊/ 面陳/ 10/ 楊/ 順順/ 霧/ 橤/ 真/ 順順/ 真/ 謝椿明/ 刀刀/ 水槍/ 大帝/ 傾淺/ Listening/ 小/ 火龍/ 包子/ 琛/ 楊筍/ 筍/ 蜉蝣/ 十元/ 靡靡之音/ Real/ 機智/ 張/ 陳梓/ 小/ 童鞋/ 花甲/ 窗里/ 窗外/ 劉梓喬/ 璇/ 璇/ 97Olivia/ 菊香/ 小姐姐/ 牛奶/ 小夏目/ 周依寧/ 萬/ 阿/ 咸一/ 蓑/ 煙雨任/ 平生/ 來/ 都/ 來/ 了/ 就/ 像/ 周一/ Mc/ 蛋蛋/ 秉劍侯/ 李大夢/ LeeDiss/ 銳雯雨/ 音眞白/ 半仙/ 幺/ 幺/ Natsuki/ 是/ 只/ 蠢/ 兔紙/ 夏/ 冰瑩/ guuweihai/ 阿舞/ 肖柚妮/ 墨脫/ 要/ 開芷/ 珞/ 舒西婷/ Childe0Q/ 被/ 壓扁/ 的/ 海螺/ snow/ / arc/ 灰灰/ 灰灰/ 灰/ plus/ 小兔子/ 菲/ 呀/ 士多啤梨/ 羊/ 咩/ 咩/ 李小/ 可可/ 誰/ 來/ 拽/ 我/ 的/ 尾巴/ 飛鴿/ 之舞/ 小美/ 櫻雪/ 綾/ samazshiyao/ 王漠/ 里/ Slivan/ 喵/ 小蝦/ SUSAN/ 蘇/ 上官/ 蘭顏/ 這個/ 殺手/ 不/ 太冷/ 看朱成碧/ 紛思君/ 情緒/ 我系/ 小忌廉/ 一只/ 兔/ June/ 我/ 就/ 想/ 改名/ 而已/ 溫柔/ 的/ 大貓/ Leo/ 貓/ 芙琳/ 以太/ 博麗/ 魔理沙/ 洛麗塔/ 羽小團/ 婁良/ Rosi/ 葉/ 以北/ 吃不胖/ 的/ 小貓/ Linaingriditttttx/ 胡楊/ 孫阿童/ 林美珍/ 赫蘿/ Taiga/ 宮曼曼/ YoonyiccZW711/ 笙簫/ KIKI/ ./ Liu/ 另一只/ 襪子/ 荒野/ 大/ 嫖客/ 少女/ 詩/ 蕓豆/ 豆豆/ 豆璐璐嚕/ 棹/ 歌夢里/ 有/ 只/ 獨角獸/ Oo/ 澄子/ oO/ 雷梅/ 苔絲/ CherryZhao/ 李萬/ 一琴脂/ 鹿斑/ 比/ Chris/ 姬/ -/ 云煙/ hyoram/ 蔗蔗蔗/ 柚子/ RubySheena/ 孟德爾/ kaka/ 小/ 師妹/ 楨視/ 明大/ 豆苗/ 少女/ 開膛手/ 陳詩/ 茗下一步繪制圖云,用jupyter遇到了很多坑。。
# -*- coding: utf-8 -*- import matplotlib.pyplot as plt from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator# 直接從文件讀取數據text = '''阿蕾/楊/面陳/10/楊/順順/霧/橤/真/順順/真/謝椿明/刀刀/水槍/大帝/傾淺/Listening/小/火龍/包子/琛/楊筍/筍/蜉蝣/十元/靡靡之音/Real/機智/張/陳梓/小/童鞋/花甲/窗里/窗外/劉梓喬/璇/璇/97Olivia/菊香/小姐姐/牛奶/小夏目/周依寧/萬/阿/咸一/蓑/煙雨任/平生/來/都/來/了/就/像/周一/Mc/蛋蛋/秉劍侯/李大夢/LeeDiss/銳雯雨/音眞白/半仙/幺/幺/Natsuki/是/只/蠢/兔紙/夏/冰瑩/guuweihai/阿舞/肖柚妮/墨脫/要/開芷/珞/舒西婷/Childe0Q/被/壓扁/的/海螺/snow/ /arc/灰灰/灰灰/灰/plus/小兔子/菲/呀/士多啤梨/羊/咩/咩/李小/可可/誰/來/拽/我/的/尾巴/飛鴿/之舞/小美/櫻雪/綾/samazshiyao/王漠/里/Slivan/喵/小蝦/SUSAN/蘇/上官/蘭顏/這個/殺手/不/太冷/看朱成碧/紛思君/情緒/我系/小忌廉/一只/兔/June/我/就/想/改名/而已/溫柔/的/大貓/Leo/貓/芙琳/以太/博麗/魔理沙/洛麗塔/羽小團/婁良/Rosi/葉/以北/吃不胖/的/小貓/Linaingriditttttx/胡楊/孫阿童/林美珍/赫蘿/Taiga/宮曼曼/YoonyiccZW711/笙簫/KIKI/./Liu/另一只/襪子/荒野/大/嫖客/少女/詩/蕓豆/豆豆/豆璐璐嚕/棹/歌夢里/有/只/獨角獸/Oo/澄子/oO/雷梅/苔絲/CherryZhao/李萬/一琴脂/鹿斑/比/Chris/姬/-/云煙/hyoram/蔗蔗蔗/柚子/RubySheena/孟德爾/kaka/小/師妹/楨視/明大/豆苗/少女/開膛手/陳詩/茗'''backgroud_Image = plt.imread('girl.jpg') wc = WordCloud( background_color = 'white', # 設置背景顏色mask = backgroud_Image, # 設置背景圖片max_words = 2000, # 設置最大現實的字數stopwords = STOPWORDS, # 設置停用詞font_path = 'C:/Users/Windows/fonts/msyh.ttf',# 設置字體格式,如不設置顯示不了中文max_font_size = 300, # 設置字體最大值random_state = 50, # 設置有多少種隨機生成狀態,即有多少種配色方案) wc.generate(text) image_colors = ImageColorGenerator(backgroud_Image) #wc.recolor(color_func = image_colors) plt.imshow(wc) plt.axis('off') plt.show()?
?
0 陳詩茗 https://www.zhihu.com/people/chen-shi-ming-69 1 李大夢Lee https://www.zhihu.com/people/li-da-meng-58-44 2 snow arc https://www.zhihu.com/people/xiaoxueli 3 夏冰瑩 https://www.zhihu.com/people/xia-bingying 4 Sheena https://www.zhihu.com/people/zhang-chu-yun-84 5 喵小蝦 https://www.zhihu.com/people/maoxiaoxia233 6 李大夢Lee https://www.zhihu.com/people/li-da-meng-58-44 7 李大夢Lee https://www.zhihu.com/people/li-da-meng-58-44 8 以太 https://www.zhihu.com/people/elapse08 9 zshiyao https://www.zhihu.com/people/duo-rou-wan-zi-89 10 SUSAN蘇 https://www.zhihu.com/people/susansu-66?
學習過程中遇到什么問題或者想獲取學習資源的話,歡迎加入學習交流群
626062078,我們一起學Python!
轉載于:https://www.cnblogs.com/jiaoyu121/p/6942467.html
總結
以上是生活随笔為你收集整理的Python爬知乎妹子都爱取啥名的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CIA-SSD: Confident I
- 下一篇: 【C语言】用递归编写程序计算Hermit