亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python中將亂碼解碼的方法

發布時間:2020-07-27 09:28:30 來源:億速云 閱讀:256 作者:清晨 欄目:編程語言

小編給大家分享一下python中將亂碼解碼的方法,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!

中文編碼問題一直是程序員頭疼的問題,而Python2中的字符編碼足矣令新手抓狂。本文將盡量用通俗的語言帶大家徹底的了解字符編碼

以及Python2和3中的各種編碼問題。

一、什么是字符編碼。

要徹底解決字符編碼的問題就不能不去了解到底什么是字符編碼。計算機從本質上來說只認識二進制中的0和1,可以說任何數據在計算機

中實際的物理表現形式也就是0和1,如果你將硬盤拆開,你是看不到所謂的數字0和1的,你能看到的只是一塊光滑閃亮的磁盤,如果你

用足夠大的放大鏡你就能看到磁盤的表面有著無數的凹凸不平的元件,凹下去的代表0,突出的代表1,這就是計算機用來表現二進制的方

式。

1.ASCII

現在我們面臨了第一個問題:如何讓人類語言,比如英文被計算機理解?我們以英文為例,英文中有英文字母(大小寫)、標點符號、特

殊符號。如果我們將這些字母與符號給予固定的編號,然后將這些編號轉變為二進制,那么計算機明顯就能夠正確讀取這些符號,同時通

過這些編號,計算機也能夠將二進制轉化為編號對應的字符再顯示給人類去閱讀。由此產生了我們最熟知的ASCII碼。ASCII 碼使用指定

的7 位或8 位二進制數組合來表示128 或256 種可能的字符。這樣在大部分情況下,英文與二進制的轉換就變得容易多了。

2.GB2312

然而,雖然計算機是美國人發明的,但是全世界的人都在使用計算機。現在出現了另一個問題:如何讓中文被計算機理解?這下麻煩了,

中文不像拉丁語系是由固定的字母排列組成的。ASCII 碼顯然沒辦法解決這個問題,為了解決這個問題中國國家標準總局1980年發布《信

息交換用漢字編碼字符集》提出了GB2312編碼,用于解決漢字處理的問題。1995年又頒布了《漢字編碼擴展規范》(GBK)。GBK與

GB 2312—1980國家標準所對應的內碼標準兼容,同時在字匯一級支持ISO/IEC10646—1和GB 13000—1的全部中、日、韓(CJK)漢

字,共計20902字。這樣我們就解決了計算機處理漢字的問題了。

3.Unicode

現在英文和中文問題被解決了,但新的問題又出現了。全球有那么多的國家不僅有英文、中文還有阿拉伯語、西班牙語、日語、韓語等

等。難不成每種語言都做一種編碼?基于這種情況一種新的編碼誕生了:Unicode。Unicode又被稱為統一碼、萬國碼;它為每種語言中

的每個字符設定了統一并且唯一的二進制編碼,以滿足跨語言、跨平臺進行文本轉換、處理的要求。Unicode支持歐洲、非洲、中東、亞

洲(包括統一標準的東亞象形漢字和韓國表音文字)。這樣不管你使用的是英文或者中文,日語或者韓語,在Unicode編碼中都有收錄,

且對應唯一的二進制編碼。這樣大家都開心了,只要大家都用Unicode編碼,那就不存在這些轉碼的問題了,什么樣的字符都能夠解析

了。

4.UTF-8

但是,由于Unicode收錄了更多的字符,可想而知它的解析效率相比ASCII碼和GB2312的速度要大大降低,而且由于Unicode通過增加一

個高字節對ISO Latin-1字符集進行擴展,當這些高字節位為0時,低字節就是ISO Latin-1字符。對可以用ASCII表示的字符使用Unicode

并不高效,因為Unicode比ASCII占用大一倍的空間,而對ASCII來說高字節的0對他毫無用處。為了解決這個問題,就出現了一些中間格

式的字符集,他們被稱為通用轉換格式,即UTF(Unicode Transformation Format)。而我們最常用的UTF-8就是這些轉換格式中的一

種。在這里我們不去研究UTF-8到底是如何提高效率的,你只需要知道他們之間的關系即可。

總結:

1.為了處理英文字符,產生了ASCII碼。 
2.為了處理中文字符,產生了GB2312。 
3.為了處理各國字符,產生了Unicode。 
4.為了提高Unicode存儲和傳輸性能,產生了UTF-8,它是Unicode的一種實現形式。

看完了這篇文章,相信你對python中將亂碼解碼的方法有了一定的了解,想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

方正县| 靖宇县| 伽师县| 阿巴嘎旗| 余庆县| 清流县| 乌兰察布市| 南投市| 资源县| 浪卡子县| 汽车| 腾冲县| 湘潭市| 嘉义县| 肃南| 古蔺县| 德安县| 衡阳市| 泰安市| 施甸县| 措勤县| 怀集县| 通山县| 丽水市| 西吉县| 罗田县| 北票市| 徐水县| 惠州市| 无极县| 海晏县| 新乡县| 安多县| 丹阳市| 黄平县| 宜兴市| 柘城县| 左贡县| 盖州市| 德州市| 雷州市|