3位高二女生用大数据成功预测地铁出站人数 | 00后正在抛弃你
導讀:有人用大數據“殺熟”,她們卻用大數據做了軌道交通客流分析,運用自己設計的算法,對軌道交通出站人數的預測平均精準率達到了93%。4月15日,在第33屆重慶市青少年科技創新大賽上,南開中學三位高二女生的研究項目獲得了一等獎。
01 擠地鐵,擠出來這個課題
譚婧懿、韋沐汐、唐睿詩是南開中學高二年級的學生,雖然三人不在同一班上,但她們都有一個共同的愛好,參加科技創新活動。說起這次參加重慶市科技創新大賽,譚婧懿有些不好意思,“這個選題,還是我們上學放學擠地鐵擠出來的。”
原來,三位女生經常坐1號線。
“每天早上上學和放學回家乘坐軌道交通會這么擁擠?根本就擠不進去啊!”“如果有方法能夠迅速疏散客流,為市民提供快捷、舒適的出行服務,那該多好!”
三個人你一言,我一語,就把選題給定了下來。
02 找數據,一站就是3小時
確定了選題,就開始找數據。“她們用了最笨但也是最實在的辦法,就是高峰、平峰兩個時間段,到地鐵站數人。”指導老師楊夢寧說。
“我們三個人,一人數出站人數,一人數進站人數,一人看車廂的擁擠程度。”唐睿詩說,雖然大家有分工,但一天數下來,“是真累,好想帶個小板凳坐下,好想吃個面包充饑。那段時間真是太累了,回去就不想動,放空自己。”放學后、假期里,在地鐵1號線的沙坪壩站,三位小女生成了常客。還因為長時間站在那里,不少人以為她們是志愿者,“好多來問路的。”
付出總是有回報,數了一段日子后,孩子們在自己整理的記錄上,發現了一些規律,“我們通過這些數字中的規律,再找到負責部門要了一些數據,做后期的研究。”
03 做分析,手算一個月才處理兩個星期數據
拿到了海量數據,就要做分析找規律。因為之前沒有做過類似的課題,三位女生又用到了最原始的方法,把數據錄入到Excel里“手算”。“因為數據要錄入,還要排版,這樣‘手算’了一個月,才處理兩個星期的數據,這樣不是辦法。”楊夢寧說。
于是孩子們運用多種算法對數據進行計算,“最開始,預測精準率只有60%,后來加入其他算法,提升到70%以上。但她們拿著這樣的結果給運營部門看時,他們說精準率在80%以上,才算有點意義。”在加入深度學習算法后,“我們再把空間特征轉化為時間特性來進行計算,平均精準率就達到了93%。”譚婧懿說。
“我們的創新主要是將軌道交通的空間信息引入到客流預測中,同時引入了兩種不同的時間信息,即歷史同期序列與順序時間序列,并將其結合,形成新的特征組。除此之外,還將時空特征進行結合引入到客流預測中,將空間特征以及時間特征歷史共同結合來創建模型,能更準確全面地進行客流預測。”三個女生的這一項目不僅獲得了一等獎,目前也正在申請相關的專利。
來源:重慶晨報
記者:羅薛梅
推薦閱讀
日本老爺爺堅持17年用Excel作畫,我可能用了假的Excel···
看完此文再不懂區塊鏈算我輸:手把手教你用Python從零開始創建區塊鏈
為什么要學數學?因為這是一場戰略性的投資
180頁PPT,講解人工智能技術與產業發展
Q:?你高中時都干了些啥?
歡迎留言與大家分享
覺得不錯,請把這篇文章分享給你的朋友
轉載 / 投稿請聯系:baiyu@hzbook.com
更多精彩文章,請在公眾號后臺點擊“歷史文章”查看
總結
以上是生活随笔為你收集整理的3位高二女生用大数据成功预测地铁出站人数 | 00后正在抛弃你的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Simulink之不可控整流电路
- 下一篇: 2018世界杯数据清单:真球迷看球必备,