2-02字符编码的演化
生活随笔
收集整理的這篇文章主要介紹了
2-02字符编码的演化
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
- GB2312又稱國標碼,由國家標準總局發(fā)布,1981年5月1日實施,通行于大陸。新加坡等地也使用此編碼,共7445個圖形字符,其中漢子占6763個。
- 1995年發(fā)布GBK1.0,gbk編碼能夠用來同時表示繁體字和簡體字,該編碼標準兼容GB2312,共收錄漢字21003個,同時包含中日韓文字里所有漢字。
- 2000年發(fā)布GB18030,是對GBK編碼的擴充,覆蓋中文、日文、朝鮮語和中國少數(shù)民族文字,其中收錄27484個漢字,兼容GBK和GB2312字符集。
- BIG5編碼:臺灣地區(qū)繁體中文標準字符,采用雙字節(jié)編碼,共收錄13053個中文字,1984年實施。
為解決每個國家不同編碼間不互通的問題,ISO標準組織出馬了!
- Unicode編碼:國際標準字符集,它將世界各種語言的每個字符定義一個唯一的編碼,以滿足跨語言、跨平臺的文本信息轉(zhuǎn)換。Unicode(統(tǒng)一碼,萬國碼)規(guī)定所有的字符和符號最少由16位來表示(2個字節(jié)),即:2**16=65536
- UTF-8,是對Unicode編碼的壓縮和優(yōu)化,他不再使用最少使用2個字節(jié),而是將所有的字符和符號進行分類:ascii碼中的內(nèi)容用1個字節(jié)保存、歐洲的字符用2個字節(jié)保存、東亞的字符用3個字節(jié)保存。
?
windows系統(tǒng)中文版默認編碼是GBK
Mac OS \ Linux系統(tǒng)默認編碼是UTF-8
python2的默認編碼為ASCII碼
python3的默認編碼為UTF-8
聲明編碼:#! -*- coding: utf-8 -*- (一定要寫在第一行)
轉(zhuǎn)載于:https://www.cnblogs.com/echo-kid-coding/p/11132197.html
總結(jié)
以上是生活随笔為你收集整理的2-02字符编码的演化的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 顺序表应用事例
- 下一篇: 单例模式 Singleton