Python小说爬虫
                                                            生活随笔
收集整理的這篇文章主要介紹了
                                Python小说爬虫
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.                        
                                今天做的練習(xí)是在網(wǎng)站上爬蟲(chóng)某一部小說(shuō),并將其存入到文檔中~~
 首先,按照上一次爬蟲(chóng)的步驟,獲取到該小說(shuō)目錄頁(yè)的url
 url=“https://www.kanunu8.com/book2/10881/”
 注:若print出該頁(yè)內(nèi)容為亂碼時(shí),因考慮到編碼方式的轉(zhuǎn)換;
 在這次爬蟲(chóng)過(guò)程中,我們需要將編碼進(jìn)行轉(zhuǎn)換,將其轉(zhuǎn)換為gbk形式,所使用的語(yǔ)句如下:
 txt=requests.get(url).content.decode(“gbk”)
 具體實(shí)現(xiàn)代碼如下:
 
 過(guò)程中遇到過(guò)的錯(cuò)誤:
 expected string or bytes-like object 這是由于數(shù)據(jù)類型不匹配造成的
 findall獲取的為一個(gè)列表,而sub需要對(duì)字符串進(jìn)行操作,所以此處需要現(xiàn)將列表中的字符串取出,再進(jìn)行替換
接下來(lái)就是成果圖了:
 
 
 
 嗯嗯~~就是這樣啦
總結(jié)
以上是生活随笔為你收集整理的Python小说爬虫的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
 
                            
                        - 上一篇: Python爬虫西安七天天气预报
- 下一篇: Tensorflow实现自动编码器
