python lxml xpath_Python/lxml/Xpath:如何找到包含特定文本的行?
例如,要獲得一個類似以下內容的輸出,需要什么
“現金和短期投資144841 169760 189252 86743 57379”?或者類似“物業、廠房和設備-總價值725104 632332 571467 538805 465493”?在
我已經通過siteshttp://www.techchorus.net/web-scraping-lxml介紹了Xpath的基本知識。然而,Xpath語法對我來說仍然是個謎。在
我已經成功地完成了這個任務。我喜歡這樣一個事實,beauthoulsoup不需要我知道文件的結構-它只查找包含我搜索的文本的元素。不幸的是,beauthulsoup對于一個需要執行數千次的腳本來說太慢了。我在BeautifulGroup中任務的源代碼是(title_input等于“現金和短期投資”):page = urllib2.urlopen (url_local)
soup = BeautifulSoup (page)
soup_line_item = soup.findAll(text=title_input)[0].parent.parent.parent
list_output = soup_line_item.findAll('td') # List of elements
那么在lxml中等價的代碼是什么呢?在
編輯1:我第一次發布時,網址被隱藏了。我現在已經修好了。在
編輯2:我添加了基于beauthoulsoup的解決方案,以澄清我要做什么。在
編輯3:+10為您的解決方案添加根目錄。為了將來有同樣問題的開發人員的利益,我在這里發布了一個對我有用的快速而骯臟的腳本:
^{pr2}$
總結
以上是生活随笔為你收集整理的python lxml xpath_Python/lxml/Xpath:如何找到包含特定文本的行?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mulitpartfile怎么接收不到值
- 下一篇: 服务器Ubuntu Import Er