Python学习日记day4 字符编码
1.內存和硬盤都是用來存儲的。
CPU:速度快
硬盤:永久保存
2.文本編輯器存取文件的原理(nodepad++,pycharm)
打開編輯器就可以啟動一個進程,是在內存中的,所以在編輯器編寫的內容也都是存放在內存中的,斷電后數據就丟失了。因而需要保存在硬盤上,點擊保存按鈕或快捷鍵,就把內存中的數據保存到了硬盤上。在這一點上,我們編寫的py文件(沒有執(zhí)行時),跟編寫的其他文件沒有什么區(qū)別,都只是編寫一堆字符而已。
3.python解釋器執(zhí)行py文件的原理,例如python ?test.py
第一階段:python解釋器啟動,此時就相當于啟動了一個文本編輯器
第二階段:python解釋器相當于文本編輯器,去打開test.py,從硬盤上將test.py的文件內容讀入到內存中
第三階段:python解釋器執(zhí)行剛剛加載到內存中的test.py的代碼(在該階段,即執(zhí)行時,才會識別python的語法,執(zhí)行到字符串時,會開辟內存空間存放字符串)
總結:python解釋器與文本編輯器的異同
相同點:python解釋器是解釋執(zhí)行文件內容的,因而python解釋器具備讀py文件的功能,這一點與文本編輯器一樣
不同點:文本編輯器將文件內容讀入內存后,是為了顯示/編輯,而python解釋器將文件內容讀入內存后,是為了執(zhí)行(識別python的語法)
4.什么是編碼
編碼是信息從一種形式或格式轉換為另一種形式的過程也稱為計算機編程語言的代碼簡稱編碼。用預先規(guī)定的方法將文字、數字或其它對象編成數碼,或將信息、數據轉換成規(guī)定的電脈沖信號。編碼在電子計算機、電視、遙控和通訊等方面廣泛使用。編碼是信息從一種形式或格式轉換為另一種形式的過程。解碼,是編碼的逆過程。
5.以下兩個場景涉及到字符編碼的問題:
1.一個python文件中的內容是由一堆字符組成的(python文件未執(zhí)行時)
2.python中的數據類型字符串是由一串字符組成的(python文件執(zhí)行時)
6.字符編碼的發(fā)展史
階段一:現代計算機起源于美國,最早誕生也是基于英文考慮的ASCII
? ?ASCII:一個Bytes代表一個字符(英文字符/鍵盤上的所有其他字符),1Bytes=8bit,8bit可以表示0-2**8-1種變化,即可以表示256個字符
ASCII最初只用了后七位,127個數字,已經完全能夠代表鍵盤上所有的字符了(英文字符/鍵盤的所有其他字符)
后來為了將拉丁文也編碼進了ASCII表,將最高位也占用了
階段二:為了滿足中文,中國人定制了GBK
GBK:2Bytes代表一個字符,為了滿足其他國家,各個國家紛紛定制了自己的編碼,日本把日文編到Shift_JIS里,韓國把韓文編到Euc-kr里
階段三:各國有各國的標準,就會不可避免地出現沖突,結果就是,在多語言混合的文本中,顯示出來會有亂碼。
于是產生了unicode, 統一用2Bytes代表一個字符, 2**16-1=65535,可代表6萬多個字符,因而兼容萬國語言
但對于通篇都是英文的文本來說,這種編碼方式無疑是多了一倍的存儲空間(二進制最終都是以電或者磁的方式存儲到存儲介質中的)
于是產生了UTF-8,對英文字符只用1Bytes表示,對中文字符用3Bytes
需要強調的是:
unicode:簡單粗暴,多有的字符都是2Bytes,優(yōu)點是字符--數字的轉換速度快;缺點是占用空間大。
utf-8:精準,可變長,優(yōu)點是節(jié)省空間;缺點是轉換速度慢,因為每次轉換都需要計算出需要多長Bytes才能夠準確表示。
1.內存中使用的編碼是unicode,用空間換時間(程序都需要加載到內存才能運行,因而內存應該是越快越好)
2.硬盤中或網絡傳輸用utf-8,保證數據傳輸的穩(wěn)定性。
七、字符編碼轉換
在python2中有兩種字符串類型str和unicode
在python2中,str就是編碼后的結果bytes,所以在Python2中,unicode字符編碼的結果就是str/bytes
?
對于unicode格式的數據來說,無論怎么打印,都不會亂碼
python3中的字符串與python2中的u'字符串',都是unicode,所以無論如何打印都不會亂碼
在python3中也有兩種字符串類型str和bytes\
str是unicode
encoude()#編碼
decode()#解碼
轉載于:https://www.cnblogs.com/goaway/p/8484205.html
總結
以上是生活随笔為你收集整理的Python学习日记day4 字符编码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: LAMP+LNMP(三)Apache(h
- 下一篇: 构建简单spring boot 项目