python抓取网页信息_python抓取网页中的动态数据
生活随笔
收集整理的這篇文章主要介紹了
python抓取网页信息_python抓取网页中的动态数据
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
一、概念
網頁中的許多數據并不是寫死在HTML中的,而是通過js動態載入的。所以也就引出了什么是動態數據的概念,動態數據在這里指的是網頁中由Javascript動態生成的頁面內容,是在頁面加載到瀏覽器后動態生成的,而之前并沒有的。在編寫爬蟲進行網頁數據抓取的時候,經常會遇到這種需要動態加載數據的HTML網頁,如果還是直接從網頁上抓取那么將無法獲得任何數據。
二、操作
1.先進入網址如:https://dujia.qunar.com/
2.在Chrome瀏覽器中,點擊F12,打開Network中的XHR,我們來抓取對應的js文件來進行解析:
3.向下拖拽或點擊獲取更多時,使得頁面加載入更多的數據信息,從而我們可以抓取對應的報文。如點擊“度假”
4.查看XHR
5.訪問Request URL查看json信息:
https://dujia.qunar.com/golfz/urlProxy/proxy.qunar?urlPath=http%3A%2F%2Fdiy.dujia.qunar.com%2Fapi%2Fdest.json&_=1501918232175
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的python抓取网页信息_python抓取网页中的动态数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: sqlite3 select查询一列_P
- 下一篇: springboot启动不了_七款高St