您好,登錄后才能下訂單哦!
如何使用Python統計180班QQ群聊文本可視化分析,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
轉眼就到大四年級,留在學校的時日不多了
分為網站請求、偽裝、解析、存儲四個過程
更為詳細的爬取流程如下所示
需要添加一些規則
然而,本文的文本數據
是我從QQ電腦端后臺導出的
目前對于網絡爬蟲的學習
我只會豆瓣影評、書評、淘寶價格的爬取
等具體學習成熟了
發一篇網絡爬蟲的推文
敬請期待
導出文本數據后
編寫程序,調試代碼,做可視化分析
詳細代碼如下所示
#QQ群聊數據分析代碼import reimport datetimeimport seaborn as snsimport matplotlib.pyplot as pltimport jiebafrom wordcloud import WordCloud, STOPWORDSfrom scipy.misc import imread# 日期def get_date(data): # 日期 dates = re.findall(r'\d{4}-\d{2}-\d{2}', data) # 天 days = [date[-2:] for date in dates] plt.subplot(221) sns.countplot(days) plt.title('Days') # 周幾 weekdays = [datetime.date(int(date[:4]), int(date[5:7]), int(date[-2:])).isocalendar()[-1] for date in dates] plt.subplot(222) sns.countplot(weekdays) plt.title('WeekDays')# 時間def get_time(data): times = re.findall(r'\d{2}:\d{2}:\d{2}', data) # 小時 hours = [time[:2] for time in times] plt.subplot(223) sns.countplot(hours, order=['06', '07', '08', '09', '10', '11', '12', '13', '14', '15', '16', '17', '18', '19', '20', '21', '22', '23', '00', '01', '02', '03', '04', '05']) plt.title('Hours')代碼演示:# 詞云def get_wordclound(text_data): word_list = [" ".join(jieba.cut(sentence)) for sentence in text_data] new_text = ' '.join(word_list) pic_path = 'QQ.jpg' mang_mask = imread(pic_path) plt.subplot(224) wordcloud = WordCloud(background_color="white", font_path='/home/shen/Downloads/fonts/msyh.ttc', mask=mang_mask, stopwords=STOPWORDS).generate(new_text) plt.imshow(wordcloud) plt.axis("off")# 內容及詞云def get_content(data): pa = re.compile(r'\d{4}-\d{2}-\d{2}.*?\(\d+\)\n(.*?)\n\n', re.DOTALL) content = re.findall(pa, data) get_wordclound(content)def run(): filename = '新建文本文檔.txt' with open(filename) as f: data = f.read() get_date(data) get_time(data) get_content(data) plt.show()
做出文本可視話圖后,可以得出如下結論
在2018年1月1日~1月31日統計180班群聊中
1月2日這一天群聊次數最多
每周的星期二群聊次數做多
每天的16時群聊次數最多
做詞云圖發現
“全體成員”出現的詞頻最多
關于如何使用Python統計180班QQ群聊文本可視化分析問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。