python爬取中国最好大学排名(实例)
生活随笔
收集整理的這篇文章主要介紹了
python爬取中国最好大学排名(实例)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
要求
爬取2018年最好大學網上排名前20的學校,以表格形式輸出,包括(排名,學校名稱,總分)
代碼
根據基本要求可以編寫出初始代碼A
#CrawUnivRankingA.py import requests from bs4 import BeautifulSoup import bs4 def getHTMLText(url):try:r=requests.get(url,timeout=30)r.raise_for_status()r.encoding=r.apparent_encodingreturn r.textexcept:return""def fillUnivList(ulist,html):soup=BeautifulSoup(html,"html.parser")for tr in soup.find('tbody').children:if isinstance(tr,bs4.element.Tag):tds=tr('td')ulist.append([tds[0].string,tds[1].string,tds[3].string])def printUnivList(ulist,num):print("{:^10}\t{:^6}\t{:^10}".format("排名","學校名稱","總分"))for i in range(num):u=ulist[i]print("{:^10}\t{:^6}\t{:^10}".format(u[0],u[1],u[2]))def main():uinfo=[]url='http://www.zuihaodaxue.cn/zuihaodaxuepaiming2018.html'html=getHTMLText(url)fillUnivList(uinfo,html)printUnivList(uinfo,20) #排名前二十 main()但是輸出效果如下:
學校名稱居中對齊并未對齊,是因為自動填充的是英文的空格,要想使得中文獲得居中應填充中文的空格,所以進行代碼優化,得到代碼B:
主要優化部分為:
def printUnivList(ulist,num):tplt="{0:^10}\t{1:{3}^10}\t{2:^10}"print(tplt.format("排名","學校名稱","總分",chr(12288)))for i in range(num):u=ulist[i]print(tplt.format(u[0],u[1],u[2],chr(12288)))利用chr(12288)進行優化,以后很多項目中對中文居中對齊格式優化都會運用它
優化后輸出:
總結
以上是生活随笔為你收集整理的python爬取中国最好大学排名(实例)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ZEMAX实例学习5:施密特—卡塞格林系
- 下一篇: MYSQL数据库ANY的用法_列子查询中