Python3中的GBK、UTF-8和Unicode
生活随笔
收集整理的這篇文章主要介紹了
Python3中的GBK、UTF-8和Unicode
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
GBK、Unicode、UTF都可以看做編碼集,每一個數字代表一個字符。其中utf-8作為Unicode的優化,減少了純英文字符的字節數。
計算機在內存中都使用Unicode編碼,在輸出時轉化為GBK/UTF-8編碼。在python3中也是這樣的。
假設一個非常簡單的流程:從一個GBK編碼的文件讀出,寫到一個以UTF-8編碼的文件。
其中數據的流動是這樣的:
a. 讀:open按照GBK的編碼,兩個字節兩個字節的讀出一個個漢字,然后將其以Unicode編碼存在內存里;
b. 寫:把內存中的Unicode編碼的字節序列解碼,再編碼成UTF-8的字節,寫入到硬盤中。
上面一些實驗的代碼:
總結
以上是生活随笔為你收集整理的Python3中的GBK、UTF-8和Unicode的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Google's BBR拥塞控制算法模型
- 下一篇: 物理运动方程