Python爬虫应用实战案例-xpath正则表达式使用方法,爬取精美壁纸
生活随笔
收集整理的這篇文章主要介紹了
Python爬虫应用实战案例-xpath正则表达式使用方法,爬取精美壁纸
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
使用XPath
XPath,全稱XML Path Language,即XML路徑語言,它是在XML語言中查找信息的語言。它最初是用來搜尋XML文檔的,但是它同樣適用于HTML文檔的搜索。
在上一篇文章中講述了正則表達式的使用方法,正則表達式的難度還是比較大的,如果不花足夠多的時間去做的話還是比較難的,所以今天就來分享比正則簡單的內容,方便大家接下來的學習。
XPath常用規則
XPath的規則是非常豐富的,本篇文章無法一次性全部概括,只能為大家介紹幾個常用的規則。
| nodename | 選取此節點的所有子節點 |
| / | 從當前節點選取直接子節點 |
| // | 從當前節點選取子孫節點 |
| . | 選取當前子節點 |
| .. | 選取當前節點的父節點 |
| @ | 選取屬性 |
準備工作
在使用之前得先安裝好lxml這個庫,如果沒有安裝請參考下面的安裝方式。
pip install lxml案例導入
現在通過實例來xpath對網頁解析的過程
from lxml import etreetext = ''' <div> <ul> <li class="item-0"><a href="link1.ht總結
以上是生活随笔為你收集整理的Python爬虫应用实战案例-xpath正则表达式使用方法,爬取精美壁纸的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MySQL快速查询的12条建议,让你不止
- 下一篇: Linux疑难杂症解决方案100篇(二十