Python——文本中读取到【\ufeff】解决方案
生活随笔
收集整理的這篇文章主要介紹了
Python——文本中读取到【\ufeff】解决方案
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
問題描述
['\ufeff詩名', '賊退示官吏并序\n']
問題分析
文本保存時包含了BOM(Byte Order Mark,字節順序標記,出現在文本文件頭部,Unicode編碼標準中用于標識文件是采用哪種格式的編碼)
解決方案
方法一:
使用 utf-8-sig 編碼打開文件
name = [] with open('唐詩宋詞.txt', 'r', encoding='utf-8-sig') as f:for i in f:fen = i.split(':')print(fen)if fen[0].strip() == '詩名':name.append(fen[1].strip())print(name)['詩名', '賊退示官吏并序\n']
['賊退示官吏并序']?
方法二:
通過NotePad++等文本編輯器轉編碼為UTF-8無BOM格式編碼?
參考文章
產生 \ufeff 問題的原因及解決辦法
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的Python——文本中读取到【\ufeff】解决方案的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Linux——top命令查看cpu利用率
- 下一篇: PaddleOCR——申请显存不足【Al