您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關網頁編碼不用gbk或者gb2312而用utf-8的原因分析的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
能選擇的話還是應該用UTF-8
事實上Windows系統自己的程序已經全面轉向Unicode,而GBK只是為了應付中國標準的權宜之計。
GBK的文字編碼是雙字節來表示的,即不論中、英文字符均使用雙字節來表示,只不過為區分中文,將其最高位都定成1。
至于UTF-8編碼則是用以解決國際上字符的一種多字節編碼,它對英文使用8位(即一個字節),中文使用24位(三個字節)來編碼。對于英文字符較多的論壇則用UTF-8節省空間。
GBK包含全部中文字符,
UTF-8則包含全世界所有國家需要用到的字符。
GBK是在國家標準GB2312基礎上擴容后兼容GB2312的標準(好像還不是國家標準)
UTF-8編碼的文字可以在各國各種支持UTF8字符集的瀏覽器上顯示。
比如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。
所以,對于英文比較多的論壇 ,使用GBK則每個字符占用2個字節,而使用UTF-8英文卻只占一個字節。
請注意:UTF-8版本雖然具有良好的國際兼容性,但中文需要比GBK/BIG5版本多占用50%的數據庫存儲空間,因此并非推薦使用,僅供對國際兼容性有特殊要求的用戶使用。
簡單地說:
對于中文較多的論壇,適宜用GBK編碼節省數據庫空間。
對于英文較多的論壇,適宜用UTF-8節省數據庫空間。
gbk和gb2312的區別有哪些
首先大家要了解什么是gbk?什么是gb2312?我們要知道他們都是一種字符編碼,當然字符編碼還有很多種。
而字符編碼我們可以這樣理解:
在計算機中存放的都是0和1的二進制值。
8個位對應一個字節,常用16進制來表示。
那么我們如果想要在計算機上看到我們想要的字符顯示,而不是各種0和1的數字該怎么實現呢?
這里我們就需要使計算機把其所存儲的對應的16進制的數值,轉化為對應的字符,包括英文和中文等其他語言的字符,然后輸出到屏幕上。
所以編碼也就是,定義了一套規則,去指定哪些數值,對應著哪些字符。
那么字符編碼,就是定義了一套規則,指定了計算機中存放的這么多值中的哪個值,對應了電腦屏幕顯示出來的哪個字母。
綜上所述,大家應該都能理解GBK和GB2312是一種字符編碼了吧。
下面我們再具體說說他們的區別與相同點:
相同點:
1、GBK和GB2312 都是16位的!
2、它們通常用在網頁的meta標簽內。
不同點:
1、GBK字符編碼支持簡體中文和繁體中文!
GBK全稱《漢字內碼擴展規范》(GBK即“國標”、“擴展”漢語拼音的第一個字母,英文名稱:Chinese Internal Code Specification) ,中華人民共和國全國信息技術標準化技術委員會1995年12月1日制訂,國家技術監督局標準化司、電子工業部科技與質量監督司1995年12月15日聯合以技監標函1995 229號文件的形式,將它確定為技術規范指導性文件。
2、GB2312只支持簡體中文!
《信息交換用漢字編碼字符集》是由中國國家標準總局1980年發布,1981年5月1日開始實施的一套國家標準,標準號是GB 2312—1980。
GB 2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個;同時,GB 2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內的682個全角字符。
如果你的網頁主要面對使用漢語的中國人的話,使用 GB2312和GBK非常好,文字儲存體積要小,有一些優點。如果你的網頁要面向世界的話,你再用GB2312和GBK作為網頁編碼的話,有些電腦上的瀏覽器沒有這種編碼,你的網頁漢字內容就會變成無法識別的亂碼。
感謝各位的閱讀!關于“網頁編碼不用gbk或者gb2312而用utf-8的原因分析”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。