起点小说网小说爬取
小說目錄和網址的獲取
進入官網,點擊輸入書名,點擊搜索,進入免費試讀。
打開開發者工具,刷新頁面,找到小說目錄json格式對應的網址
先獲取json格式的數據
然后獲取json中小說對應的章節以及內容所對應的部分網址并構建小說的網址并保存到本地
# 此書一共10卷,若沒有VIP限制則可全部下載,獲取每一卷的章節及部分網址 for i in range(1, 11):chapters_info = novel_json['data']['vs'][i]['cs']for item in chapters_info:ids = item['cU']name = item['cN']url = 'https://read.qidian.com/chapter/'url = url + idsresponse = requests.get(url=url, headers=headers)response.encoding = response.apparent_encodinghtml = etree.HTML(response.text)contents = html.xpath('//*[@class="text-wrap"]/div/div[2]/p/text()')length = len(contents)content = ''for p in range(length):content = content + contents[p]content.replace('\u3000\u3000', '')print(content)chapter = name + '\n' + content + '\n'with open('獨步天下.txt', 'a') as f:f.write(chapter)效果圖如下
下載前兩卷后,vip資源已被封鎖,不過可以從小網站下載。
總結
- 上一篇: agc012E Camel and Oa
- 下一篇: 至简播放器ffplay工作原理