亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何進行Python 中文亂碼問題的分析

發布時間:2021-10-26 15:21:58 來源:億速云 閱讀:133 作者:柒染 欄目:編程語言

本篇文章給大家分享的是有關如何進行Python 中文亂碼問題的分析,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

建立一個文件test.txt,文件格式用ANSI,內容為:abc中文用python來讀取

# coding=gbk print open("Test.txt").read()

結果:abc中文把文件格式改成UTF-8這里需要解碼:

# coding=gbk import codecs  print open("Test.txt").read().decode("utf-8")

結果:abc中文上面的test.txt我是用Editplus來編輯的,但當我用Windows自帶的記事本編輯并存成UTF-8格式時,運行時報錯:

  1. Traceback (most recent call last):  

  2. File "ChineseTest.py", line 3, in   

  3. print open("Test.txt").read().decode("utf-8")  

  4. UnicodeEncodeError: 'gbk' codec can't encode 
    character u'\ufeff' in position 0: illegal multibyte 
    sequence   

原來,某些軟件,如notepad,在保存一個以UTF-8編碼的文件時,會在文件開始的地方插入三個不可見的字符(0xEF 0xBB 0xBF,即BOM)。因此我們在讀取時需要自己去掉這些字符,python中的codecs module定義了這個常量:

# coding=gbk import codecs  data = open("Test.txt").read()  if data[:3] == codecs.BOM_UTF8:  datadata = data[3:]  print data.decode("utf-8")

結果:abc中文

以上就是如何進行Python 中文亂碼問題的分析,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

宜兰县| 承德县| 广汉市| 广平县| 泗洪县| 博野县| 大同县| 旬邑县| 兖州市| 井冈山市| 涿州市| 南郑县| 阳信县| 中西区| 南靖县| 云龙县| 定州市| 确山县| 禹城市| 灵台县| 临泽县| 沙河市| 灵石县| 盐山县| 东丰县| 诸暨市| 达拉特旗| 青冈县| 左权县| 德令哈市| 哈巴河县| 昭平县| 长岛县| 朝阳县| 乌恰县| 泸西县| 肇东市| 香格里拉县| 寿光市| 东乌珠穆沁旗| 砀山县|