您好,登錄后才能下訂單哦!
詞云圖是將詞匯按照頻率的高低顯示不同大小而形成的圖,可以一目了然地看出關鍵詞。下面是詞云圖的python代碼~
#導入需要模塊
import jieba
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
text_road=str(input('請輸入文章的路徑:'))
picture_road=str(input('請輸入圖片的路徑:'))
#加載需要分析的文章
text = open(text_road,'r',encoding='utf-8').read()
#對文章進行分詞
wordlist_after_jieba = jieba.cut(text, cut_all=False)
wl_space_split = " ".join(wordlist_after_jieba)
#讀取照片通過numpy.array函數將照片等結構數據轉化為np-array
mask=np.array(Image.open(picture_road))
#選擇屏蔽詞,不顯示在詞云里面
stopwords = set(STOPWORDS)
#可以加多個屏蔽詞
stopwords.add("<br/>")
#創建詞云對象
wc = WordCloud(
background_color="white",
font_path='/Library/Fonts/Arial Unicode.ttf',
max_words=1000, # 最多顯示詞數
mask=mask,
stopwords=stopwords,
max_font_size=100 # 字體最大值
)
#生成詞云
wc.generate(text)
#從背景圖建立顏色方案
image_colors =ImageColorGenerator(mask)
#將詞云顏色設置為背景圖方案
wc.recolor(color_func=image_colors)
#顯示詞云
plt.imshow(wc,interpolation='bilinear')
#關閉坐標軸
plt.axis("off")
#顯示圖像
plt.show()
#保存詞云
wc.to_file('詞云圖.png')
下面這張圖是我爬了阿里巴巴招聘網站上所有數據分析職位需求,生成的詞云圖,大家可以看看阿里對數據分析師的要求~
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。