您好,登錄后才能下訂單哦!
今天小編給大家分享一下Python評論提取關鍵詞制作精美詞云的方法的相關知識點,內容詳細,邏輯清晰,相信大部分人都還太了解這方面的知識,所以分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后有所收獲,下面我們一起來了解一下吧。
評論情況: {'android': 545 次, 'ios': 110 次, 'pc': 44 次, 'uniapp': 1 次}
一個小細節:給我評論的設備中,安卓蘋果比是 5:1。
Building prefix dict from the default dictionary ... Loading model cost 0.361 seconds. Prefix dict has been built successfully.
打開 chrome 瀏覽器,開發者模式
點擊評論列表(圖標 1)
點擊接口鏈接(圖標 2)
查看 response 返回值(評論結果的 json 格式)
def get_comments(articleId): # 確定評論的頁數 main_res = get_commentId(articleId,1) pageCount = json.loads(main_res)['data']['pageCount'] comment_list,comment_list2 = [],[] source_analy = {} for p in range(1,pageCount+1): res = get_commentId(articleId, p) try: commentIds = json.loads(res)['data']['list'] for i in commentIds: commentId = i['info']['commentId'] userName = i['info']['userName'] nickName = i['info']['nickName'] ## 獲取用戶名 source_dvs = i['info']['commentFromTypeResult']['key'] # 操作設備 content = i['info']['content'] comment_list.append([commentId, userName, nickName, source_dvs, content]) comment_list2.append("%s 丨 %s"%(userName, nickName)) if source_dvs not in source_analy.keys(): source_analy[source_dvs] = 1 else: source_analy[source_dvs] = source_analy[source_dvs] + 1 # print(source_analy) except: print('本頁失敗!') print('評論數:' + str(len(comment_list))) return source_analy, comment_list, comment_list2
西紅柿采用的是 結巴 分詞, 和 wordcloud。
# -*- coding:utf8 -*- import jieba import wordcloud
代碼實現:
seg_list = jieba.cut(comments, cut_all=False) # 精確模式 word = ' '.join(seg_list)
背景圖 西紅柿采用的是 心形圖片
pic = mpimg.imread('/Users/pray/Downloads/aixin.jpeg')
完整代碼::
def word_cloud(articleId): source_analy, comment_list, comment_list2 = get_comments(articleId) print("評論情況:", source_analy) comments = '' for one in comment_list: comment = one[4] if 'face' not in comment: comments = comments + comment seg_list = jieba.cut(comments, cut_all=False) # 精確模式 word = ' '.join(seg_list) pic = mpimg.imread('/Users/pray/Downloads/aixin.jpeg') wc = wordcloud.WordCloud(mask=pic, font_path='/Library/Fonts/Songti.ttc', width=1000, height=500, background_color='white').generate(word)
西紅柿發現文字模糊、圖像曲線邊緣不清晰的問題。
于是,指定分辨率,高清整起來。
# 保存 plt.savefig('xin300.png', dpi=300) #指定分辨率保存
以上就是“Python評論提取關鍵詞制作精美詞云的方法”這篇文章的所有內容,感謝各位的閱讀!相信大家閱讀完這篇文章都有很大的收獲,小編每天都會為大家更新不同的知識,如果還想學習更多的知識,請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。