【廖雪峰Python学习笔记】字符串与编码
生活随笔
收集整理的這篇文章主要介紹了
【廖雪峰Python学习笔记】字符串与编码
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
字符串與編碼
三種字符編碼
- ASCII編碼 :計算機由美國人發明,最早只有127個字符編碼—— 大小寫英文字母、數字和符號
- Unicode:把中文、日文、韓文等所有語言統一到一套編碼中,2-4byte,現代OS和大多數語言都支持
- utf-8:可變長度編碼,1-6byte。[使用utf-8編碼,傳輸英文字符,節省空間]
計算機系統字符編碼轉化:
- 計算機內存中統一使用Unicode編碼
- 保存到硬盤中或需要傳輸時,轉化為UTF-8編碼
瀏覽網頁:
服務器把動態生成的Unicode內容,轉化為UTF-8在傳輸到瀏覽器
記事本編輯:
從文本讀取UTF-8被轉換為Unicode到內存中
編輯完成保存時,將Unicode轉為UTF-8保存到文件中
Python中的字符串
- Python3中以Unicode編碼,支持多語言
- 以Unicode表示的str通過encode()方法,可以編碼為指定的bytes
- 網絡或磁盤讀取的字節流bytes,通過decode()方法,轉化為Unicode表示的str
- 如果bytes中只有一小部分無效的字節,可以傳入errors='ignore’忽略錯誤的字節
- 純英文的str可以用ASCII編碼為bytes
- 含有中文的str可以用UTF-8編碼為bytes
- 含有中文的str無法用ASCII編碼 —— 中文編碼的范圍超過了ASCII編碼的范圍,Python會報錯
- 如果.py文件本身使用UTF-8編碼,并且也申明了# -- coding: utf-8 --,打開命令提示符測試就可以正常顯示中文:
Python格式化
| 占位符 | 替換內容 |
|---|---|
| %d | 整數 |
| %f | 浮點數 |
| %s | 字符串 |
| %x | 十六進制整數 |
tips:如果不太確定應該用什么,%s永遠起作用,它會把任何數據類型轉換為字符串
總結
以上是生活随笔為你收集整理的【廖雪峰Python学习笔记】字符串与编码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vbs脚本在服务器上虚拟按键,iisvd
- 下一篇: 【廖雪峰Python学习笔记】list