不卡AV在线|网页在线观看无码高清|亚洲国产亚洲国产|国产伦精品一区二区三区免费视频

學習啦>學習電腦>操作系統(tǒng)>Linux教程>

gbk與utf-8的詳細區(qū)別

時間: 志藝942 分享

  GB 2312或GB 2312-80是一個簡體中文字符集的中國國家標準,全稱為《信息交換用漢字編碼字符集·基本集》,又稱為GB0,由中國國家標準總局發(fā)布,1981年5月1日實施。接下來是小編為大家收集的gbk與utf-8的詳細區(qū)別,希望能幫到大家。

  gbk與utf-8的詳細區(qū)別

  GB 2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個;同時,GB 2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內(nèi)的682個全角字符。

  GB 2312的出現(xiàn),基本滿足了漢字的計算機處理需要,它所收錄的漢字已經(jīng)覆蓋中國大陸99.75%的使用頻率。

  對于人名、古漢語等方面出現(xiàn)的罕用字,GB 2312不能處理,這導致了后來GBK及GB 18030漢字字符集的出現(xiàn)。

  UTF-8是UNICODE的一種變長字符編碼又稱萬國碼,由Ken Thompson于1992年創(chuàng)建?,F(xiàn)在已經(jīng)標準化為RFC 3629。UTF-8用1到6個字節(jié)編碼UNICODE字符。用在網(wǎng)頁上可以同一頁面顯示中文簡體繁體及其它語言(如日文,韓文)KesionCMS的GBK版本與UTF-8版本功能是一樣的.只不過編碼方式不同。

  GBK的文字編碼是雙字節(jié)來表示的,即不論中、英文字符均使用雙字節(jié)來表示,只不過為區(qū)分中文,將其最高位都定成1。

  至于UTF-8編碼則是用以解決國際上字符的一種多字節(jié)編碼,它對英文使用8位(即一個字節(jié)),中文使用24位(三個字節(jié))來編碼。對于英文字符較多的網(wǎng)站則用UTF-8節(jié)省空間。

  GBK包含全部中文字符;UTF-8則包含全世界所有國家需要用到的字符。

  GBK是在國家標準GB2312基礎上擴容后兼容GB2312的標準,UTF-8編碼的文字可以在各國各種支持UTF8字符集的瀏覽器上顯示。

  比如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。 所以,對于英文比較多的論壇 ,使用GBK則每個字符占用2個字節(jié),而使用UTF-8英文卻只占一個字節(jié)。


看了“gbk與utf-8的詳細區(qū)別”還想看:
1.編碼與編號有區(qū)別嗎

gbk與utf-8的詳細區(qū)別

GB 2312或GB 2312-80是一個簡體中文字符集的中國國家標準,全稱為《信息交換用漢字編碼字符集基本集》,又稱為GB0,由中國國家標準總局發(fā)布,1981年5月1日實施。接下來是小編為大家收集的gbk與utf-8的詳細區(qū)別,希望能幫到大家。 gbk與u
推薦度:
點擊下載文檔文檔為doc格式
2773537