如何去掉html body里的 nbsp,html的空格和nbsp怎么去除?
同樓主,這個問題我也碰到了。
用html_parser好像不也行
replace也不解決不完全,我希望把所有數據(房間類型,面積,位置,詳細位置,發布時間,價格)放一行
最后沒辦法只能這樣了
import requests ##導入requests
from bs4 import BeautifulSoup ##導入bs4中的BeautifulSoup
res = requests.get('http://sz.58.com/nanshan/zufang/0/j2/?minprice=0_1600&PGTID=0d300008-0071-367d-7e8f-38bb92b6eebc&ClickID=2')
res.encoding='utf-8'
soup=BeautifulSoup(res.text,'html.parser')
for info in soup.select('li'):
a=info.select('.des .room')[0].text.replace(" ","")
b=info.select('.des .add')[0].text.replace(" ","")
c=info.select('.listliright .sendTime')[0].text.replace(" ","")
d=info.select('.listliright .money')[0].text
print(a,b,c,d)
print(".....................................................")
總結
以上是生活随笔為你收集整理的如何去掉html body里的 nbsp,html的空格和nbsp怎么去除?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 创建数组表格PHP苹果价格,如何从PHP
- 下一篇: 计算机桌面程序名,深度技术win7旗舰版