爬虫 wordcloud操作
生活随笔
收集整理的這篇文章主要介紹了
爬虫 wordcloud操作
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
import jieba #分詞
from matplotlib import pyplot as plt #繪圖
from wordcloud import WordCloud #詞云
from PIL import Image #圖片處理
import numpy as np #矩陣運算
import sqlite3 #數據庫#準備詞云所需要的文字(詞)
con = sqlite3.connect('movie.db')
cur = con.cursor()
sql = 'select instroduction from main.movie250'
data = cur.execute(sql)
text= ""
for item in data:text = text +item[0]
#print(text)cur.close()
con.close()#分詞
cut = jieba.cut(text)
string = ' '.join(cut)
print(len(string))img = Image.open(r'.\static\assets\img\tree.jpg') #打開遮罩圖片img_array = np.array(img) #將圖片轉換為數組wc = WordCloud(background_color='white',mask = img_array,font_path="蘭亭特黑長簡.TTF"
)
wc.generate_from_text(string)#繪制圖片
fig = plt.figure(1)
plt.imshow(wc)
plt.axis('off')#plt.show() #現實生成的詞云圖片#輸出詞云圖片到文件
plt.savefig(r'.\static\assets\img\word.jpg')
總結
以上是生活随笔為你收集整理的爬虫 wordcloud操作的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Anaconda安装jieba方法
- 下一篇: Java基础部分自测题(持续更新)