Python实战:利用正则表达式(requests模块)获取电影排行榜
本文的文字及圖片來(lái)源于網(wǎng)絡(luò),僅供學(xué)習(xí)、交流使用,不具有任何商業(yè)用途,版權(quán)歸原作者所有,如有問(wèn)題請(qǐng)及時(shí)聯(lián)系我們以作處理
以下文章來(lái)源于騰訊云 作者:做全棧攻城獅
( 想要學(xué)習(xí)Python?Python學(xué)習(xí)交流群:1039649593,滿足你的需求,資料都已經(jīng)上傳群文件流,可以自行下載!還有海量最新2020python學(xué)習(xí)資料。 )
Python應(yīng)用現(xiàn)在如火如荼,應(yīng)用范圍很廣。因其效率高開(kāi)發(fā)迅速的優(yōu)勢(shì),快速進(jìn)入編程語(yǔ)言排行榜前幾名。本系列文章致力于可以全面系統(tǒng)的介紹Python語(yǔ)言開(kāi)發(fā)知識(shí)和相關(guān)知識(shí)總結(jié)。希望大家能夠快速入門并學(xué)習(xí)Python這門語(yǔ)言。
這個(gè)網(wǎng)頁(yè)也是由html編寫而成的。打開(kāi)微博熱搜。在網(wǎng)頁(yè)空白處點(diǎn)擊右鍵就可以看到網(wǎng)頁(yè)源代碼。
你會(huì)發(fā)現(xiàn)整個(gè)html代碼非常復(fù)雜。所以我們這邊就使用一個(gè)神器:開(kāi)發(fā)人員工具。
網(wǎng)頁(yè)空白處點(diǎn)擊右鍵審查元素
然后選擇實(shí)時(shí)熱搜里面的內(nèi)容。下方就會(huì)自動(dòng)定位到你所選擇的代碼了。
我們查看一下實(shí)時(shí)熱搜這幾個(gè)標(biāo)簽有什么規(guī)律:
我們可以看到我們想要的熱搜的內(nèi)容都是如下結(jié)構(gòu):
電影名稱
所以我們就可以按照如上內(nèi)容寫正則表達(dá)式,然后在html源代碼中匹配出來(lái)電影名稱就可以了
我們正則表達(dá)式可以這樣寫
.*?
其中我們用到了一個(gè)python網(wǎng)絡(luò)請(qǐng)求的框架。這個(gè)框架默認(rèn)是沒(méi)有的。我們需要進(jìn)行安裝的。
下載requests模塊,
安裝requests模塊
解壓模塊文件并打開(kāi)kennethreitz-requests-3314259文件夾
按住鍵盤shift鍵,在空白區(qū)域右鍵點(diǎn)擊-在此處打開(kāi)命令窗口
輸入以下指令:python setup.py install
點(diǎn)擊回車即可安裝。此時(shí)就可以導(dǎo)入requests模塊了
至此一個(gè)簡(jiǎn)單的獲取熱門電影的爬蟲(chóng)小程序開(kāi)發(fā)完成。
總結(jié)
以上是生活随笔為你收集整理的Python实战:利用正则表达式(requests模块)获取电影排行榜的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: MySQL8.0 setup_actor
- 下一篇: 飞机大战小游戏 C语言(课设任务)