【爬虫】beautiful soup笔记(待填坑)
生活随笔
收集整理的這篇文章主要介紹了
【爬虫】beautiful soup笔记(待填坑)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Beautiful Soup是一個第三方的網頁解析的模塊。其遵循的接口為Document Tree,將網頁解析成為一個樹形結構。
其使用步驟如下:
1、創建對象:根據網頁的文檔字符串
2、搜索節點:名稱、屬性、文字。
3、處理節點:
?
BeautifulSoup(文檔字符串, 'html.parser' 解析器,from_encoding='utf8')
find_all(名稱,屬性,文字):可以傳入字符串 也可以傳入正則表達式。
node.name 名稱
node['href'] 屬性
node.get_text 文字
?
轉載于:https://www.cnblogs.com/yesuuu/p/5747463.html
超強干貨來襲 云風專訪:近40年碼齡,通宵達旦的技術人生總結
以上是生活随笔為你收集整理的【爬虫】beautiful soup笔记(待填坑)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 设置SecureCRT配色和解决乱码问题
- 下一篇: 工作几年的感想(一)