python爬取学校题库_pyhton 网络爬取软考题库保持txt
#-*-coding:utf-8-*-
#參考文檔
#https://www.crummy.com/software/beautifulsoup/bs4/doc/index.zh.html#find-all
#https://m.cnitpm.com
import requests
import re
from bs4 import beautifulsoup
html = requests.get('https://m.cnitpm.com/exam/examst1_1031655.htm/')
soup = beautifulsoup(html.text,'lxml')
ultag=soup.find_all('ul','tit')
for item in ultag:
a_temp=item.find_all('a')
#print(a_temp)
for aitem in a_temp:
#print (aitem.get('href'))
html2 = requests.get(aitem.get('href'))
#解決亂碼問題
html2.encoding = 'utf-8'
soup2 = beautifulsoup(html2.text, 'lxml')
divtag = soup2.find_all('div', 'tm-box')
for divitem in divtag:
print(divitem.get_text())
#print(divtag.replace('[
', ''))################################以上為爬取############################################
希望與廣大網友互動??
點此進行留言吧!
總結
以上是生活随笔為你收集整理的python爬取学校题库_pyhton 网络爬取软考题库保持txt的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python字符串的美化_Python构
- 下一篇: 小甲鱼python的课后题好难_小甲鱼《