亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何理解Python vim檢查編碼

發布時間:2021-10-26 15:49:44 來源:億速云 閱讀:126 作者:柒染 欄目:編程語言

這篇文章將為大家詳細講解有關如何理解Python vim檢查編碼,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。

如果你在打開一個文件時中文編碼是什么格式不太清楚的話,例如文件頭可能指定是utf8,而實際編碼卻不是,就針對這一情況,你就可以用Python vim檢查編碼對其進行解決。

打開一個中文文件,不清楚其中文編碼到底是什么格式。python源程序文件頭可能指定是utf8,而實際編碼卻是gbk。不一致的編碼在python源碼中,可能在執行時得到錯誤的結果。一種解決辦法是查看二進制,但漢字的二進制到底對應什么編碼呢?

vim的vimrc里面增加兩行:

  1. set fenc=utf-8  

  2. set fileencodings=utf-8,cp936,big5,euc-jp,
    euc-kr,latin1,ucs-bom 

這樣,文件保存缺省的為utf-8編碼。

set enc=cp936

這是gvim界面顯示的編碼,windows下用cp936,linux下用utf8,***不要設,系統自己判斷。

對新打開的已經存在的文件,如果不確定一個文件是否是utf8還是gbk,用Pythonvim打開文件,看到中文,再在命令模式下執行

:%!xxd

看到相應的二進制。假如文本中有“你好”,會在左邊對應位置看到你好的十六進制表示。打開python3.0,在命令行下將文本中的特定字“你好”進行二進制轉碼。

view plaincopy to clipboardprint?  >>> a='你好'   >>> b=a.encode('utf8')   >>> b   b'\xe4\xbd\xa0\xe5\xa5\xbd'   >>> c=a.encode('gbk')   >>> c   b'\xc4\xe3\xba\xc3'   >>> a='你好' >>> b=a.encode('utf8')  >>> b  b'\xe4\xbd\xa0\xe5\xa5\xbd'  >>> c=a.encode('gbk')  >>> c  b'\xc4\xe3\xba\xc3'

可以看到,對中文“你好”的二進制,utf8是

0xe4ba0 0xe5a5bd

而對gbk,gb2312,cp936,gb18030,則二進制是:0xc4e3 0xbac3與Python vim檢查編碼中二進制一比較,就看出文本中是什么編碼了。知道編碼后,再用

:%!xxd -r

命令將十六進制轉為普通的文本,保存。對已經存在的文本,linux下可以用iconv將其轉碼。

關于如何理解Python vim檢查編碼就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

茌平县| 亳州市| 嘉禾县| 扶余县| 莱州市| 兴文县| 扶风县| 竹北市| 会宁县| 长葛市| 盐亭县| 濮阳市| 曲沃县| 大荔县| 肇庆市| 侯马市| 白玉县| 肥东县| 育儿| 肥乡县| 安西县| 大庆市| 华蓥市| 清丰县| 正宁县| 长子县| 会昌县| 泾源县| 普安县| 隆子县| 永平县| 克拉玛依市| 师宗县| 叙永县| 石泉县| 高州市| 淮阳县| 新邵县| 临泉县| 石家庄市| 台东县|