Python学习-字符编码的理解
Unicode編碼和ASCII碼兩者都是機器能夠理解的編碼,你就是說出現(xiàn)一個碼,計算機知道它對應(yīng)哪種符號。因為這種編碼形式將不同的字符全都和電平的高低電位聯(lián)系在一起。
Unicode,這種編碼是全球通用的編碼,就是說所有計算機都包含的編碼。包含?utf-32(占4個字節(jié)),utf-16(占兩個字節(jié)),utf-8(占1-4個字節(jié)),這三種形式。
也就是說utf-8,就是一種Unicode的編碼。?
?utf-16就是現(xiàn)在最常用的unicode版本, 不過在文件里存的還是utf-8,因為utf8省空間。
?
GBK編碼就是另一種編碼的形式。這是包含中文漢字的一種早期編碼形式,但是,沒有包含所有的漢字。并且和Unicode的不同。所以如果以g?b k編碼的形式存儲,我們就要專門指定用g b k的形式進行解碼。
?
1.在python2默認(rèn)編碼是ASCII, python3里默認(rèn)是unicode;另外每個軟件通常也會有自己默認(rèn)的編碼形式。
2.在py3中encode,在轉(zhuǎn)碼的同時還會把string 變成bytes類型,decode在解碼的同時還會把bytes變回string
3.另外,這里非常值得注意的事情是,我們所關(guān)心的字符編碼,他的對象是字符而不是數(shù)字。數(shù)字基本上可以看成是直接存儲的。
http://www.cnblogs.com/yuanchenqi/articles/5956943.html
轉(zhuǎn)載于:https://www.cnblogs.com/Ian-learning/p/7906775.html
總結(jié)
以上是生活随笔為你收集整理的Python学习-字符编码的理解的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vue-cli安装笔记
- 下一篇: 微风轻轻起