Python 2 中文乱码解决方案:
1.文件編碼是UTF-8,同時在文件頭添加 # -*- coding: utf-8 -*-
2.文件中所有的字符串前都加u,如 u"中文"
3.在輸入(抓取某些utf-8/gbk的網頁)、輸出(輸出到網頁、終端)的時候,要記住python內部是用Unicode存儲的
4.所有輸入要先decode,變成unicode,輸出時要encode變成想要的編碼(MacOS X/Linux下輸出為utf-8,Windows下輸出為gbk,但如果是在pycharm自己的控制臺下的話,windows下輸出為utf-8也可以正常顯示)
5.還有其他很多種古老的解決方案,比如統一用gbk,比如中轉編碼不用unicode,而用utf-8,如此種種。。
更新一下,來源于 http://www.newsmth.net/nForum/article...
1.源碼文件用coding: utf-8指定編碼并把文件保存為utf-8格式
2.為了作為__main__模塊執行時不出不必要的錯誤,統一使用\n換行
3.如果需要在源碼內嵌入漢字等非ascii字符,建議使用u前綴作為unicode字符串,這樣在print時可以可以不做編碼轉換,
4.否則如果控制臺編碼與源文件編碼不一致就必須顯式轉換,通過locale.getdefaultlocale()可以獲取系統語言和編碼
5.涉及文件路徑的最好轉換為sys.getfilesystemencoding()編碼
6.unicode字符串在寫入文件時必須轉換為某種字節編碼
7.json默認支持utf-8編碼
8.盡量用utf-8和unicode,除了前面說的文件路徑和寫入文件等少數情況
---------------------------------------------------------------------------------------------
其實如果想考慮今后遷移到 python 3 或者只是想使用 python 3 風格的默認 unicode, 可以使用
from __future__ import unicode_literals
之后不需要再在所有中文字符串前加 u 了, 相反, 所有原來的"字符串"現在默認均為unicode串了. 如果需要使用utf-8串可以選擇在前面加 b :)
轉載于:https://www.cnblogs.com/findeasy/p/4053098.html
總結
以上是生活随笔為你收集整理的Python 2 中文乱码解决方案:的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Remote System Upgrad
- 下一篇: 自学MVC——添加一个控制器