亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

python怎么對文本進行詞頻統計

小億
123
2024-01-03 18:55:13
欄目: 編程語言

使用Python對文本進行詞頻統計可以使用下面的步驟:

  1. 打開文本文件并讀取文本內容。
with open("text.txt", "r") as file:
    text = file.read()
  1. 對文本進行分詞。
import re

# 去除標點符號和空白字符
text = re.sub(r'[^\w\s]', '', text)

# 將文本拆分為單詞列表
words = text.split()
  1. 統計每個單詞的出現次數。
from collections import Counter

word_count = Counter(words)
  1. 排序并輸出詞頻結果。
for word, count in word_count.most_common():
    print(word, count)

完整的代碼如下:

import re
from collections import Counter

with open("text.txt", "r") as file:
    text = file.read()

text = re.sub(r'[^\w\s]', '', text)
words = text.split()
word_count = Counter(words)

for word, count in word_count.most_common():
    print(word, count)

請確保將代碼中的"text.txt"替換為實際的文本文件路徑。

0
林周县| 饶阳县| 志丹县| 息烽县| 独山县| 花莲市| 柯坪县| 乐至县| 沐川县| 古交市| 银川市| 郑州市| 天水市| 临夏市| 沧州市| 新乡市| 灵武市| 东至县| 白沙| 康平县| 高州市| 含山县| 新宁县| 和顺县| 陈巴尔虎旗| 阳原县| 逊克县| 曲阳县| 尉犁县| 恩施市| 桐城市| 阿拉善右旗| 平定县| 绥江县| 无棣县| 望都县| 织金县| 尚义县| 井冈山市| 大连市| 英山县|