當(dāng)前位置：首頁 > 编程语言 > python >内容正文

python

python3.0下载用什么浏览器_无法让Python下载网页源代码：“不支持浏览器版本”...

發(fā)布時(shí)間：2025/3/8 python 25 豆豆

生活随笔收集整理的這篇文章主要介紹了 python3.0下载用什么浏览器_无法让Python下载网页源代码：“不支持浏览器版本”... 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

查看您列出的url，我執(zhí)行了以下操作：使用wget下載了頁面

將urllib與ipython一起使用并下載了頁面

使用chrome，只保存了url

所有3個(gè)都給了我相同的結(jié)果文件(相同的大小，相同的內(nèi)容)。在

這可能是因?yàn)槲覜]有登錄，但我確實(shí)看到這個(gè)網(wǎng)站包含了大量的javascript來呈現(xiàn)頁面。在

我知道您正在嘗試使用urllib，但是考慮到上述情況，我將使用selenium并將詳細(xì)介紹如何開始使用它。這個(gè)例子需要selenium和phantomjs，但是對于selenium和firefox也可以這樣做。在from selenium import webdriver

from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

browser_agent = "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36"

url = 'https://scrap.tf/stranges/47'

dcap = {}

mydriver = None

dcap = dict(DesiredCapabilities.PHANTOMJS)

dcap["phantomjs.page.settings.userAgent"] = browser_agent

mydriver = webdriver.PhantomJS(desired_capabilities=dcap)

mydriver.implicitly_wait(30)

mydriver.set_window_size(1366,768)

mydriver.get(url)

title = mydriver.title

print (title)

page = mydriver.page_source

# debugging get screen shot to see how we look

mydriver.get_screenshot_as_file('/data/screen/test.png')

這會下載頁面，并且所有javascript都會正確呈現(xiàn)，但是您需要登錄到steam，這需要一些交互。在

您可以通過檢查Chrome或Firefox中的頁面，找到css選擇器或xpath，并使用webdriver find_element函數(shù)來確定需要做什么。在

這也允許按鍵和單擊。在

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。