Python问题记录:如何处理中文网页中的多余空格
生活随笔
收集整理的這篇文章主要介紹了
Python问题记录:如何处理中文网页中的多余空格
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
在制作Epub電子書的時候,因為有從網絡上下載的格式比較混亂的電子書,現在打算自己用Pythonc處理一下。
1、如何刪除掉網頁(html)中的多余空額。尤其是包含在tag(標簽:span、p)當中的。
下面我們一步一步的來摸索下如何去做。因為網頁呢都是由許多的字符串組成的,那么假如一個字符串里有空格如何處理呢?
?(1)對于一個字符串如何刪除其中的空格呢?
# -*- coding: utf-8 -*- a = '美國數學家,對 策論的創始人。——校者';a = a.replace(" ","");print a;這樣可以刪除字符串中的空格,注意這里沒有測試這種方法的效率問題,先解決這樣問題,下面再去處理這個東西。
?
轉載于:https://www.cnblogs.com/xuanyuanchen/p/4555392.html
總結
以上是生活随笔為你收集整理的Python问题记录:如何处理中文网页中的多余空格的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jstl fmt:formatNumbe
- 下一篇: 小米手机调用系统截图挂掉问题