您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關python中有哪些編碼方式的內容。小編覺得挺實用的,因此分享給大家做個參考。一起跟隨小編過來看看吧。
python編碼方式有:1、ASCII;2、GB2312;3、Unicode;4、UTF-8。ASCII編碼的制定是為了顯示現代美國英語。為了解決信息交流的要求,可以使用GB2312編碼來進行漢語交流。
編碼方式:
1、ASCII
眾所周知,計算機是由美國人發明的,那么ASCII的制定也是由美國人完成的,因此ASCII的制定是為了顯示現代美國英語。其中包括:
26個基本拉丁字母、阿拉伯數字和英式標點符號。
2、GB2312
ASCII只能解決美國人的信息交換需求,對于以漢字漢語為交流工具的中國人必須制定自己的編碼方式,才能解決信息交流的要求。
GB2312就是這樣一種編碼方式,它是中華人民共和國國家標準簡體中文字符集,全稱《信息交換用漢字編碼字符集·基本集》。
3、Unicode
世界上有200多個國家和地區,常用的語言文字也有幾十種,各國都制定了自己的編碼標準。例如日本:Shift_JIS,韓國:Euc-kr,各國有各國的標準,就會不可避免地出現沖突,結果就是,在多語言混合的文本中,顯示出來會有亂碼。
Unicode的產生就是為了解決這個問題的。Unicode把所有語言都統一到一套編碼里,這樣就不會再有亂碼問題了。
常用的是用兩個字節表示一個字符(如果要用到非常偏僻的字符,就需要4個字節)。現代操作系統和大多數編程語言都直接支持Unicode。
4、UTF-8
如果信息基本上全部是英文的話,用Unicode編碼比ASCII編碼需要多一倍的存儲空間,在存儲和傳輸上就十分不劃算。 所以,為了節約空間,又出現了把Unicode編碼轉化為“可變長編碼”的UTF-8編碼。
UTF-8編碼把一個Unicode字符根據不同的數字大小編碼成1-6個字節,常用的英文字母被編碼成1個字節,漢字通常是3個字節,只有很生僻的字符才會被編碼成4-6個字節。如果你要傳輸的文本包含大量英文字符,用UTF-8編碼就能節省空間。
感謝各位的閱讀!關于python中有哪些編碼方式就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。