过年回家抢不到火车票?教你用 Python 开发 12306 查票神器
臨近年關(guān),不少在外的游子都急著買票回家,但這時(shí)候的火車票,總是供不應(yīng)求的。
我想到了幾年前徐崢主演的《人在囧途》,春運(yùn)期間,一個(gè)老板,一個(gè)民工,同時(shí)都因?yàn)橘I不到火車票而囧態(tài)百出,甚至輾轉(zhuǎn)到了坐拖拉機(jī)回家的地步。
但回家,始終是春節(jié)期間,一個(gè)無法阻擋的詞匯。
實(shí)驗(yàn)樓的項(xiàng)目《Python3 實(shí)現(xiàn)火車票查詢工具》可以在幫助大家練習(xí)Python的同時(shí),實(shí)時(shí)查詢火車票,感興趣的同學(xué)還能實(shí)現(xiàn)一些拓展功能,比如有票時(shí)的郵件提醒,顯示有無座位,顯示時(shí)間格式等。
項(xiàng)目簡(jiǎn)介:使用 Python3 抓取 12306 網(wǎng)站信息提供一個(gè)命令行的火車票查詢工具。通過該項(xiàng)目的實(shí)現(xiàn),可以熟悉 Python3 基礎(chǔ)及網(wǎng)絡(luò)編程,以及 docopt,requests,prettytable 等庫的使用。
項(xiàng)目由小蝸牛發(fā)布在實(shí)驗(yàn)樓,完整教程及在線練習(xí)地址:Python3 實(shí)現(xiàn)火車票查詢工具,可以直接在教程中下載代碼使用demo。
一、實(shí)驗(yàn)簡(jiǎn)介
當(dāng)你想查詢一下火車票信息的時(shí)候,你還在上 12306 官網(wǎng)嗎?或是打開你手機(jī)里的 APP?
下面讓我們來用 Python 寫一個(gè)命令行版的火車票查看器, 只要在命令行敲一行命令就能獲得你想要的火車票信息!如果你剛掌握了Python基礎(chǔ),這將是個(gè)不錯(cuò)的小練習(xí)。
1.1 知識(shí)點(diǎn)
-
Python 基礎(chǔ)知識(shí)的綜合運(yùn)用
-
docopt、requests、colorama 及 prettytable 庫的使用
-
setuptools 的使用
1.2 效果截圖
二、接口設(shè)計(jì)
一個(gè)應(yīng)用寫出來最終是要給人使用的,哪怕只是給你自己使用。
所以,首先應(yīng)該想想你希望怎么使用它?讓我們先給這個(gè)小應(yīng)用起個(gè)名字吧,既然涉及查詢票務(wù)信息,那就叫它 tickets 好了。
我們希望用戶只要輸入出發(fā)站,到達(dá)站以及日期就能獲得想要的信息,比如要查看10月10號(hào)上海-北京的火車余票, 我們只需輸入:
$ python3 tickets.py 上海 北京 2016-10-10**注意:**上面的日期(包括后面的)是筆者寫文章時(shí)確定的日期,當(dāng)你在做這個(gè)項(xiàng)目的時(shí)候可能要根據(jù)當(dāng)前時(shí)間做適當(dāng)調(diào)整。
轉(zhuǎn)化為程序語言就是:
$ python tickets.py from to date另外,火車有各種類型,高鐵、動(dòng)車、特快、快速和直達(dá),我們希望可以提供選項(xiàng)只查詢特定的一種或幾種的火車,所以,我們應(yīng)該有下面這些選項(xiàng):
- -g 高鐵
- -d 動(dòng)車
- -t 特快
- -k 快速
- -z 直達(dá)
這幾個(gè)選項(xiàng)應(yīng)該能被組合使用,所以,最終我們的接口應(yīng)該是這個(gè)樣子的:
$ python3 tickets.py [-gdtkz] from to date接口已經(jīng)確定好了,剩下的就是實(shí)現(xiàn)它了。
三、代碼實(shí)現(xiàn)
首先安裝一下實(shí)驗(yàn)需要用到的庫:
$ sudo pip3 install requests prettytable docopt $ sudo pip3 install --upgrade colorama #升級(jí)環(huán)境中的 colorama- requests,使用 Python 訪問 HTTP 資源的必備庫。
- docopt,Python3 命令行參數(shù)解析工具。
- prettytable, 格式化信息打印工具,能讓你像 MySQL 那樣打印數(shù)據(jù)。
- colorama,命令行著色工具
3.1 解析參數(shù)
Python有很多寫命令行參數(shù)解析工具,如 argparse, docopt, click,這里我們選用的是 docopt 這個(gè)簡(jiǎn)單易用的工具。docopt 可以按我們?cè)谖臋n字符串中定義的格式來解析參數(shù).
我們?cè)?/home/shiyanlou/ 目錄下新建 tickets.py 文件,并向其中寫入下面的內(nèi)容(實(shí)驗(yàn)樓環(huán)境下,通過點(diǎn)擊右下角的鍵盤小圖標(biāo)可以選擇中文輸入法):
# coding: utf-8"""命令行火車票查看器Usage:tickets [-gdtkz] <from> <to> <date>Options:-h,--help 顯示幫助菜單-g 高鐵-d 動(dòng)車-t 特快-k 快速-z 直達(dá)Example:tickets 北京 上海 2016-10-10tickets -dg 成都 南京 2016-10-10 """ from docopt import docoptdef cli():"""command-line interface"""arguments = docopt(__doc__)print(arguments)if __name__ == '__main__':cli()上面的程序中, docopt 會(huì)根據(jù)我們?cè)?docstring 中的定義的格式自動(dòng)解析出參數(shù)并返回一個(gè)字典,也就是 arguments, 我們打印出了這個(gè)字典的內(nèi)容。下面我們運(yùn)行一下這個(gè)程序, 比如查詢一下10月30號(hào)從成都到南京的動(dòng)車和高鐵:
$ python3 tickets.py -dg 成都 南京 2016-10-10我們得到下面的參數(shù)解析結(jié)果:
3.2 獲取數(shù)據(jù)
參數(shù)已經(jīng)解析好了,下面就是如何獲取數(shù)據(jù)了,這也是最主要的部分。首先我們用實(shí)驗(yàn)樓環(huán)境的Firefox瀏覽打開 12306,進(jìn)入余票查詢頁面,按下 F12 打開開發(fā)者工具,選中 Network 一欄,在查詢框中隨便查詢一次,我們?cè)谡{(diào)試工具觀察下請(qǐng)求和響應(yīng):
注意到上面的請(qǐng)求 URL ,它是由基 URL https://kyfw.12306.cn/otn/leftTicket/queryO 加四個(gè)參數(shù)構(gòu)成的,這四個(gè)參數(shù)分別代表,查詢的類型(成人?學(xué)生?),日期,出發(fā)車站,到達(dá)車站:
再來看看響應(yīng):
返回的是JSON格式的數(shù)據(jù)! 我們打開返回的數(shù)據(jù)看看:
可以看到一列火車的數(shù)據(jù)用 Python 的語言說就是一個(gè)字典。
接下來問題就簡(jiǎn)單了,我們只需要利用這個(gè)接口, 構(gòu)建請(qǐng)求URL然后解析返回的JSON數(shù)據(jù)就可以了。但是我們發(fā)現(xiàn),URL里面參數(shù) from_station 和 to_station 并不是漢字,而是一個(gè)代號(hào),而我們想要輸入的是漢字,我們要如何獲取代號(hào)呢?我們打開網(wǎng)頁源碼看看有沒有什么發(fā)現(xiàn)。
果然,這里有個(gè)關(guān)于 station 的文件,打開看看:
station_names 是一個(gè)很長(zhǎng)的字符串, 這里面貌似是包含了所有車站的中文名,拼音,簡(jiǎn)寫和代號(hào)等信息。但是這些信息擠在一起,而我們只想要車站的拼音和大寫字母的代號(hào)信息,怎么辦呢? 正則表達(dá)式!我們寫個(gè)小腳本來匹配提取出想要的信息吧。
在 /home/shiyanlou/ 目錄下新建 parse_station.py ,并向其中寫入如下代碼:
available_trains = r.json()['data']['result']我們運(yùn)行這個(gè)腳本,它將以字典的形式返回所有車站和它的大寫字母代號(hào), 我們將結(jié)果重定向到 stations.py 中,
$ python3 parse_station.py > stations.py我們?yōu)檫@個(gè)字典加名字,stations, 最終,stations.py文件是這樣的:
現(xiàn)在,用戶輸入車站的中文名,我們就可以直接從這個(gè)字典中獲取它的字母代碼了:
class TrainsCollection:header = '車次 車站 時(shí)間 歷時(shí) 一等 二等 高級(jí)軟臥 軟臥 硬臥 硬座 無座'.split()def __init__(self, available_trains,available_place, options):"""查詢的火車班次集合:param available_trains: 一個(gè)列表, 包含可獲得的火車班次, 每個(gè)火車班次是一個(gè)字典:param options: 查詢的選項(xiàng), 如高鐵, 動(dòng)車, etc..."""self.available_trains = available_trainsself.available_place = available_placeself.options = options@propertydef trains(self):for raw_train in self.available_trains:raw_train_list = raw_train.split('|')train_no = raw_train_list[3]initial = train_no[0].lower()duration = raw_train_list[10]if not self.options or initial in self.options:train = [train_no,# train number'\n'.join([self.available_place[raw_train_list[6]],#始發(fā)站self.available_place[raw_train_list[7]]]),#終點(diǎn)站'\n'.join([raw_train_list[8],# 發(fā)車時(shí)間raw_train_list[9]]),# 到站時(shí)間duration,#時(shí)長(zhǎng)raw_train_list[-6] if raw_train_list[-6] else '--',# 一等 raw_train_list[-7] if raw_train_list[-7] else '--',# 二等 raw_train_list[-15] if raw_train_list[-15] else '--',# 高級(jí)軟臥raw_train_list[-8] if raw_train_list[-8] else '--',# 軟臥raw_train_list[-14] if raw_train_list[-14] else '--',#硬臥raw_train_list[-11] if raw_train_list[-11] else '--',#硬座raw_train_list[-9] if raw_train_list[-9] else '--',#無座]yield traindef pretty_print(self):pt = PrettyTable()pt._set_field_names(self.header)for train in self.trains:pt.add_row(train)print(pt)萬事俱備,下面我們來請(qǐng)求這個(gè)URL獲取數(shù)據(jù)吧!這里我們使用 requests 這個(gè)庫, 它提供了非常簡(jiǎn)單易用的接口,
... import requestsdef cli():...# 添加verify=False參數(shù)不驗(yàn)證證書r = requests.get(url, verify=False)print(r.json())</pre>我們已經(jīng)知道該請(qǐng)求返回的是JSON數(shù)據(jù), 使用 requests 提供的 r.json() 可以將 JSON 數(shù)據(jù)轉(zhuǎn)化為 Python 字典,上面我們打印了這個(gè)字典,運(yùn)行程序,我們看到:
佷明顯,查詢結(jié)果中與列車時(shí)刻相關(guān)的信息都位于一個(gè)名為 result 的數(shù)組中:
...class TrainCollection:......def cli():"""command-line interface"""arguments = docopt(__doc__)from_station = stations.get(arguments['<from>'])to_station = stations.get(arguments['<to>'])date = arguments['<date>']url = ('https://kyfw.12306.cn/otn/leftTicket/queryO?''leftTicketDTO.train_date={}&''leftTicketDTO.from_station={}&leftTicketDTO.to_station={}&purpose_codes=ADULT').format(date, from_station, to_station)r = requests.get(url, verify=False)available_trains = r.json()['data']['result']available_place = r.json()['data']['map']options = ''.join([key for key, value in arguments.items() if value is True])TrainsCollection(available_trains,available_place, options).pretty_print()result 中的每個(gè)元素都是包含了列車信息的字符串,并以 | 分隔。所以可以先用 split 將字符串分解成列表,然后再讀取感興趣的數(shù)據(jù)。
3.3 解析數(shù)據(jù)
我們封裝一個(gè)簡(jiǎn)單的類來解析數(shù)據(jù):
...class TrainCollection:......def cli():"""command-line interface"""arguments = docopt(__doc__)from_station = stations.get(arguments['<from>'])to_station = stations.get(arguments['<to>'])date = arguments['<date>']url = ('https://kyfw.12306.cn/otn/leftTicket/queryO?''leftTicketDTO.train_date={}&''leftTicketDTO.from_station={}&leftTicketDTO.to_station={}&purpose_codes=ADULT').format(date, from_station, to_station)r = requests.get(url, verify=False)available_trains = r.json()['data']['result']available_place = r.json()['data']['map']options = ''.join([key for key, value in arguments.items() if value is True])TrainsCollection(available_trains,available_place, options).pretty_print()3.4 顯示結(jié)果
最后,我們將上述過程進(jìn)行匯總并將結(jié)果輸出到屏幕上:
...class TrainCollection:......def cli():"""command-line interface"""arguments = docopt(__doc__)from_station = stations.get(arguments['<from>'])to_station = stations.get(arguments['<to>'])date = arguments['<date>']url = ('https://kyfw.12306.cn/otn/leftTicket/queryO?''leftTicketDTO.train_date={}&''leftTicketDTO.from_station={}&leftTicketDTO.to_station={}&purpose_codes=ADULT').format(date, from_station, to_station)r = requests.get(url, verify=False)available_trains = r.json()['data']['result']available_place = r.json()['data']['map']options = ''.join([key for key, value in arguments.items() if value is True])TrainsCollection(available_trains,available_place, options).pretty_print()運(yùn)行下程序看看效果吧:
3.5 著色
至此, 程序的主體已經(jīng)完成了, 但是上面打印出的結(jié)果是全是黑白的,很是乏味, 我們來給它添加點(diǎn)顏色吧! 這里我們使用 colorama 這個(gè)命令行著色工具:
from colorama import init, Foreinit()修改一下程序,將出發(fā)車站與出發(fā)時(shí)間顯示為綠色,到達(dá)車站與到達(dá)時(shí)間顯示為紅色:
... '\n'.join([Fore.GREEN + raw_train['from_station_name'] + Fore.RESET,Fore.RED + raw_train['to_station_name'] + Fore.RESET]), '\n'.join([Fore.GREEN + raw_train['start_time'] + Fore.RESET,Fore.RED + raw_train['arrive_time'] + Fore.RESET]), ...現(xiàn)在再運(yùn)行程序就可以像文章開始的效果圖一樣了!
四、Setup
上面的程序中我們運(yùn)行程序的方式是這樣的:
python3 tickets.py from to date我們當(dāng)然可以將腳本改成可執(zhí)行的,然后這樣執(zhí)行:
./tickets.py from to date但這也不是理想的方案,因?yàn)槲覀儽仨氃谀_本的目錄下才能運(yùn)行。我們想要的是在命令行的任何地方都可以這樣運(yùn)行:
ticktes from to date這是可以實(shí)現(xiàn)的,我們需要借助 Python 的 SETUP 工具。寫一個(gè)簡(jiǎn)單的 setup 腳本:
from setuptools import setupsetup(name='tickets',py_modules=['tickets', 'stations'],install_requires=['requests', 'docopt', 'prettytable', 'colorama'],entry_points={'console_scripts': ['tickets=tickets:cli']} )在命令行運(yùn)行一下:
python3 setup.py install現(xiàn)在我們可以愉快的查詢了:
五、總結(jié)
本課程使用 Python3 抓取 12306 網(wǎng)站信息提供一個(gè)命令行的火車票查詢工具。通過該項(xiàng)目的實(shí)現(xiàn),可以學(xué)習(xí)并實(shí)踐 Python3 基礎(chǔ)及網(wǎng)絡(luò)編程,以及 docopt,requests,prettytable,colorama 等庫的使用。
感興趣的同學(xué)可以實(shí)現(xiàn)更多拓展功能:
- 有票時(shí),郵箱提醒
- 顯示商務(wù)坐, 是否有無座位
- 添加參數(shù)支持,用戶可以指定火車類型
- 支持更多的時(shí)間格式,如:20161010
本項(xiàng)目的完整代碼及demo,可在實(shí)驗(yàn)樓課程《Python3 實(shí)現(xiàn)火車票查詢功能》查看并在線完成。
總結(jié)
以上是生活随笔為你收集整理的过年回家抢不到火车票?教你用 Python 开发 12306 查票神器的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 输出 100 万字、维护 3 个GitH
- 下一篇: 10 分钟学会 5 个酷炫 Linux