當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

爬取动态页面2

發(fā)布時間：2024/9/5 编程问答 23 豆豆

生活随笔收集整理的這篇文章主要介紹了爬取动态页面2 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

動態(tài)頁面的爬取思路：

　　1.? ajax? -----數(shù)據(jù)放在 json 中，在里面是否有url

　　2.? js? 數(shù)據(jù)? ?通過? ? 搜索原頁面上的數(shù)據(jù)關鍵字? ? ：ctrl + f? ?, 全局搜索關鍵字

例子：

開始網(wǎng)站? url = 'https://www.xuexi.cn/'

爬取的頁面1:

url 1= 'https://www.xuexi.cn/f997e76a890b0e5a053c57b19f468436/018d244441062d8916dd472a4c6a0a0b.html'

需求：爬取url1 所有新聞的詳情頁面

分析思路：圖示

　　用?js 數(shù)據(jù)動態(tài)生成的思路：? ?通過搜索原頁面上的數(shù)據(jù)關鍵字? ? ：ctrl + f? ?, 全局搜索關鍵字

爬取的頁面2:

url 2= 'https://www.xuexi.cn/261c9a142ef8e6375ed554815a26d585/f2d8ff735982530b7a8c9bb90fa99f68.html'

需求：爬取url2 所有新聞的詳情頁面

分析思路：

　　先按思路，js 動態(tài)生成數(shù)據(jù)的思路，找，沒找到在按ajax 動態(tài)生成數(shù)據(jù)的思路。

　　用 ajax動態(tài)生成的思路：??ajax? -----數(shù)據(jù)放在 json 中，在里面是否有數(shù)據(jù)。（此處為ajax）

圖示:

代碼：

import requests分析之后得到獲取數(shù)據(jù)的url地址： url1 文需求1 的數(shù)據(jù)地址，url2 為需求2 的數(shù)據(jù)獲取地址。 url1 = 'https://www.xuexi.cn/f997e76a890b0e5a053c57b19f468436/data018d244441062d8916dd472a4c6a0a0b.js' url2 = 'https://www.xuexi.cn/lgdata/261c9a142ef8e6375ed554815a26d585/f2d8ff735982530b7a8c9bb90fa99f68.json'headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36' } res1 = requests.get(url=url2,headers=headers) res2 = requests.get(url=url2,headers=headers)

print(res1.content.decode()) print(res2.content.decode())

轉載于:https://www.cnblogs.com/knighterrant/p/10575523.html

總結

以上是生活随笔為你收集整理的爬取动态页面2的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

爬取动态页面2

爬取的頁面1:

爬取的頁面2:

總結