亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么使用Python爬取網易云歌曲評論實現詞云圖

發布時間:2022-06-02 16:47:06 來源:億速云 閱讀:197 作者:iii 欄目:開發技術

這篇文章主要講解了“怎么使用Python爬取網易云歌曲評論實現詞云圖”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“怎么使用Python爬取網易云歌曲評論實現詞云圖”吧!

環境使用

Python 3.8 解釋器 3.10

Pycharm 2021.2 專業版

selenium 3.141.0

代碼實現

先是安裝、導入所需模塊

from selenium import webdriver  # 導入瀏覽器的功能
import re   # 正則表達式模塊, 內置
import time   # 時間模塊, 程序延遲

1. 創建一個瀏覽器對象

driver = webdriver.Chrome()

2. 執行自動化

driver.get('https://music.163.com/#/song?id=488249475')
# selenium無法直接獲取到嵌套頁面里面的數據
driver.switch_to.frame(0)  # switch_to.frame()  切換到嵌套網頁
driver.implicitly_wait(10)  # 讓瀏覽器加載的時候, 等待渲染頁面

下拉頁面, 直接下拉到頁面的底部

js = 'document.documentElement.scrollTop = document.documentElement.scrollHeight'
driver.execute_script(js)

3.解析數據

divs = driver.find_elements_by_css_selector('.itm') 
# 所有div  css語法: 定位到 html 數據/xpath/正則
for div in divs:
    cnt = div.find_element_by_css_selector('.cnt.f-brk').text
    cnt = re.findall(':(.*)', cnt)[0]  # 中英文有區別
    print(cnt)

保存數據

翻頁

for page in range(10):  # 控制翻頁  速度太快
    # 翻頁 , 找到下一頁標簽, 點擊?
    driver.find_element_by_css_selector('.znxt').click()
    time.sleep(1)
# selenium  欲速則不達

保存為txt文件

with open('contend.txt', mode='a', encoding='utf-8') as f:
    f.write(cnt + '\n')

運行代碼得到結果

怎么使用Python爬取網易云歌曲評論實現詞云圖

再做個詞云

導入相關模塊

import jieba  # 中文分詞庫  pip install jieba
import wordcloud  # 制作詞云圖的模塊  pip install wordcloud
import imageio

讀取文件數據

with open('contend.txt', mode='r', encoding='utf-8') as f:
    txt = f.read()
print(txt)

詞云圖 分詞<中文(詞語)> 基于結果

txt_list = jieba.lcut(txt)
print('分詞結果:', txt_list)

合并

string_ = ' '.join(txt_list)  # 1 + 1 = 2   字符串的基本語法
print('合并分詞:', string_)

創建詞云圖

wc = wordcloud.WordCloud(
    width=1000,  # 圖片的寬
    height=800,  # 圖片的高
    background_color='white',  # 圖片的背景色
    font_path='msyh.ttc',  # 微軟雅黑
    scale=15,  # 詞云圖默認的字體大小
    # mask=img,  # 指定詞云圖的圖片
    # 停用詞&lt; 語氣詞, 助詞,....
    stopwords=set([line.strip() for line in open('cn_stopwords.txt', mode='r', encoding='utf-8').readlines()] )
)
print('正在繪制詞云圖...')
wc.generate(string_)  # 繪制詞云圖
wc.to_file('out.png')  # 保存詞云圖
print('詞云圖繪制完成...')

最后效果

怎么使用Python爬取網易云歌曲評論實現詞云圖

感謝各位的閱讀,以上就是“怎么使用Python爬取網易云歌曲評論實現詞云圖”的內容了,經過本文的學習后,相信大家對怎么使用Python爬取網易云歌曲評論實現詞云圖這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

维西| 汉川市| 金塔县| 响水县| 郓城县| 潜山县| 大城县| 成都市| 宁安市| 桃园市| 镇雄县| 六安市| 广安市| 文水县| 郯城县| 广宁县| 花莲县| 瓦房店市| 偃师市| 淳化县| 濮阳市| 宜昌市| 凤山县| 定日县| 富顺县| 许昌县| 怀宁县| 固安县| 视频| 吉隆县| 城口县| 获嘉县| 隆尧县| 吉木萨尔县| 华池县| 应城市| 江西省| 余庆县| 密山市| 陕西省| 定兴县|