从python存入的文件是乱码_如何解决python写入html文件中乱码的现象(图文详解)...
python寫入html文件中文亂碼問題
使用open函數將爬蟲爬取的html寫入文件,有時候在控制臺不會亂碼,但是寫入文件的html中的中文是亂碼的
案例分析
看下面一段代碼:# 爬蟲未使用cookiefrom urllib import requestif __name__ == '__main__':
url = "http://www.renren.com/967487029/profile"
rsp = request.urlopen(url)
html = rsp.read().decode() with open("rsp.html","w")as f: # 將爬取的頁面
print(html)
f.write(html)
看似沒有問題,并且在控制臺輸出的html也不會出現中文亂碼,但是創建的html文件中
解決方案
使用open方法的一個參數,名為encoding=” “,加入encoding=”utf-8”即可# 爬蟲未使用cookiefrom urllib import requestif __name__ == '__main__':
url = "http://www.renren.com/967487029/profile"
rsp = request.urlopen(url)
html = rsp.read().decode() with open("rsp.html","w",encoding="utf-8")as f: # 將爬取的頁面
print(html)
f.write(html)
運行結果
感謝大家的閱讀,希望大家收益多多。
本文轉自: https://blog.csdn.net/qq_40147863/article/details/81746445
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的从python存入的文件是乱码_如何解决python写入html文件中乱码的现象(图文详解)...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python基础语法手册_说一说pyth
- 下一篇: python正则表达式使用实例_正则表达