您好,登錄后才能下訂單哦!
這篇文章主要介紹了 字符集ASCII、GBK、UNICODE、UTF在儲存字符時的區別有哪些,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
ASCII編碼(American Standard Code for Information Interchange,美國信息互換標準代碼),使用127個8進制字節表示英文和半角字符。
GBK (Guo Biao Kuozhan,國標擴展),當在ASCII 碼的范圍時,就用一個字節表示,然后每兩個字節表示一個漢語和全角字符。
UCS(Universal Multiple-Octet Coded Character Set)俗稱UNICODE,所有的字符都是兩個字節。ASCII字符前面全部補零,其他字符重新編碼。
UTF(UCS Transfer Format,萬國碼),當在ASCII 碼的范圍時,就用一個字節表示,一個中 文字符占3個字節,從unicode到uft-8并不是直接的對應。
中英文各字符集十進制編碼對照表
字符 | ASCII | GBK | UNICODE | UTF8 |
---|---|---|---|---|
a | 97 | 97 | 97 | 97 |
阿 | 無 | 45218 | 38463 | 15308991 |
中英文各字符集二進制編碼對照表
字符 | ASCII | GBK | UNICODE | UTF8 |
---|---|---|---|---|
a | 01100001 | 01100001 | 0000000001100001 | 01100001 |
阿 | 無 | 1011000010100010 | 1001011000111111 | 111010011001100010111111 |
從第一個表中,我們可以看出英文字符(更準確的來說是ASCII字符集的字符)編碼順序沒有改變,中文字符則都做了從新的編排。
從第二個表中,我們很容易看出,四種字符編碼集對英文字符的處理除了“UNICODE”用兩個字節,其他都是使用一個字節來表示。對于中文字符,“GBK”和“UNICODE”使用兩個字節來表示,UTF8使用三個字節來表示。
感謝你能夠認真閱讀完這篇文章,希望小編分享的“ 字符集ASCII、GBK、UNICODE、UTF在儲存字符時的區別有哪些”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。