亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

utf-8指的是什么編碼

發布時間:2021-01-21 12:58:14 來源:億速云 閱讀:360 作者:小新 欄目:互聯網科技

小編給大家分享一下utf-8指的是什么編碼,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

UTF-8是針對Unicode的一種可變長度字符編碼;它可以用來表示Unicode標準中的任何字符,而且其編碼中的第一個字節仍與ASCII相容,使得原來處理ASCII字符的軟件無須或只進行少部份修改后,便可繼續使用。

UTF-8(8位元,Universal Character Set/Unicode Transformation Format)是針對Unicode的一種可變長度字符編碼。它可以用來表示Unicode標準中的任何字符,而且其編碼中的第一個字節仍與ASCII相容,使得原來處理ASCII字符的軟件無須或只進行少部份修改后,便可繼續使用。因此,它逐漸成為電子郵件、網頁及其他存儲或傳送文字的應用中,優先采用的編碼。

基本特征

UCS字符U+0000到U+007F(ASCII)被編碼為字節0×00到0x7F(ASCIⅡ兼容)。這意味著只包含7位ASCIl字符的文件在ASCIⅡ和UTF-8兩種編碼方式下是一樣的。

所有大于0x007F的UCS字符被編碼為一個有多個字節的串,每個字節都有標記位集。因此,ASCIl字節(0x00-0x7F)不可能作為任何其他字符的一部分。表示非ASCIl字符的多字節串的第一個字節總是在0xC0到0XFD的范圍里,并指出這個字符包含多少個字節。多字節串的其余字節都在0x80到0xBF范圍里。這使得重新同步非常容易,并使編碼無國界,且很少受丟失字節的影響。

UTF-8編碼字符理論上可以最多到6個字節長,然而16位BMP字符最多只用到3字節長,Bigendian UCS-4字節串的排列順序是預定的,字節0xFE和OxFF在UTF-8編碼中從未用到。

編碼字節數

UTF-8使用1~4字節為每個字符編碼:

·一個US-ASCIl字符只需1字節編碼(Unicode范圍由U+0000~U+007F)。

·帶有變音符號的拉丁文、希臘文、西里爾字母、亞美尼亞語、希伯來文、阿拉伯文、敘利亞文等字母則需要2字節編碼(Unicode范圍由U+0080~U+07FF)。

·其他語言的字符(包括中日韓文字、東南亞文字、中東文字等)包含了大部分常用字,使用3字節編碼。

·其他極少使用的語言字符使用4字節編碼。

UTF-8編碼規則:

如果只有一個字節則其最高二進制位為0;如果是多字節,其第一個字節從最高位開始,連續的二進制位值為1的個數決定了其編碼的字節數,其余各字節均以10開頭。

看完了這篇文章,相信你對“utf-8指的是什么編碼”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

泸定县| 友谊县| 武乡县| 漳州市| 沙洋县| 南安市| 泾源县| 南澳县| 大同市| 阳东县| 鄯善县| 吉安市| 常德市| 西吉县| 南开区| 德保县| 那曲县| 德令哈市| 新余市| 盐边县| 清原| 科尔| 喜德县| 四川省| 南阳市| 凤山县| 确山县| 沈阳市| 土默特左旗| 忻城县| 新郑市| 上高县| 彭阳县| 邵武市| 扶余县| 河津市| 元阳县| 九台市| 清水县| 建湖县| 萨迦县|