python3字节转化字符_捋一捋字符串与字节序列的关系
生活随笔
收集整理的這篇文章主要介紹了
python3字节转化字符_捋一捋字符串与字节序列的关系
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Python3的一個新特性算是把文本和二進制數據清晰地區分開來了。我們看到的文本其實就是一連串的Unicode字符組成的str(下文文無特殊說明均指Unicode字符),最后計算機以二進制數據的形式存儲起來。Python內置了兩種二進制數據類型,分別是bytes和bytearray。
每一個字符都有一個對應的標識,即碼位,是0-1 114 111的數字(十進制),在Unicode標準中以4-6個十六進制數字表示。例如字母A的碼位表示為U+0041。有了字符,計算機會把字符的碼位通過某種算法轉換為字節序列(二進制數據),就是我們通常所說的編碼。相反,如果把字節序列通過某種算法轉換為字符碼位,就是常說的解碼。字符串和字節序列關系總結如圖1所示。
實例1:
>>>s = '中國' >>>len(s) #1 2 >>>b = s.encode('utf-8') #2 >>>b b'xe4xb8xadxe5x9bxbd' #3 >>>len(b) #4 6 >>>b.decode('utf-8') #5 '中國'- 1. '中國'字符串有2個Unicode字符
- 2. 把str對象編碼成bytes對象
- 3. bytes字面量以b開頭
- 4. 字節序列b有6個字節
- 5. 使用UTF-8把bytes對象解碼為str對象
歡迎交流~
總結
以上是生活随笔為你收集整理的python3字节转化字符_捋一捋字符串与字节序列的关系的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 域用户频繁被锁定怎么解决_Oracle1
- 下一篇: PAT乙类1014 福尔摩斯的约会 (2