用深度学习预知城市未来人流量
本文轉載自公眾號“百度地圖慧眼”(微信號:baiduhuiyan)
作者簡介:
闞長城 百度地圖資深研發工程師
馬琦偉 中國城市規劃設計研究院學術信息中心博士
前言
作為一名常年與城市規劃和管理打交道的從業人員,筆者對漫威旗下超級英雄奇異博士的時間寶石眼紅不已。在最新上映的《復仇者聯盟3》中,奇異博士憑借此寶推演了超級英雄們與滅霸的14000605次交鋒,并發現了唯一的成功之法。看完此片后筆者浮想聯翩:如果在城市發展中我們也能擁有時間寶石,根據當下的情況預知未來一段時間內的發展走勢,那城市管理者手中無疑將增加一件強大的工具。
當前的技術還不能支撐我們如此的全知全能,但在業內相關研究成果[1]的基礎上,聯合實驗室最新的成果卻已邁出了第一步——根據實時獲取的人流量數據,預測未來整個城市范圍內不同地區一小時后的人口流入流出變化情況。
可以預見,基于這一成果部署城市的人流量監控和預警平臺,可以有效地提高城市的運行效率,更有力地保障城市公共安全。在這一技術的支持下,管理部門可以提前預知因各類公共事件和突發事件引起的人流快速聚集,從而提前做好相應的疏導、管控和限流等應急預案,最大限度地降低由此帶來的負面影響。
研究方法
研究范圍與數據
本研究的范圍為北京市區,劃分為1公里×1公里的網格。
人流量的統計數據源為百度位置服務數據,來自百度地圖開放平臺的去隱私化定位數據。
人流量預測面臨的挑戰
預測城市中每一個地區的人流量變化是一個復雜的工程,其關鍵要點主要在于對以下三個方面特征的把握:
兼顧時間變化的連續性、差異性和周期性
任一地區的人流量變化從時間角度來看一般是連續的,即后一時刻的人流量與前一時刻的人流量關聯性最強,而隨著時間間隔的增大,兩個時刻之間的人流量相關性會逐漸變小。下圖展示了一個典型居住區域和一個典型工作區域的人流量時間變化曲線,可以看到兩條曲線均較為平滑,體現了上述的連續變化特征,而我們的模型需要抓住這一特征。
同時從圖中我們還能看到,居住區域的人流量變化曲線與工作區域的人流量變化曲線迥異,我們的模型同樣需要體現此種差異性。
另一個時間維度上的重要特征是周期性。從下方的圖 2和圖 3可以明顯看出,無論是工作區域的人流量變化還是居住區域的人流量變化,均呈現明顯的周期性變化特征。更加復雜的是,這種周期性在不同的時間尺度下還會有所差別:以天為單位觀察,我們能看到每天人口從早到晚的漲落;以周為單位觀察,我們能看到工作日和周末的明顯差異;以年為單位觀察,則又能看到四季氣候與節假日對人流量的影響。
在人流量預測中,對于復雜的周期性特征也需要予以體現。
?考慮空間相關性
任何的人流集聚都具有空間相關性:一場社區聯歡會能吸引本社區和附近社區的市民參加,一個跨年倒計時可能吸引周邊地區乃至全城的人流,一場明星演唱會則會吸引從本市到周邊城市乃至全國歌迷的涌入。
這要求我們在預測人流量變化時須具備全局眼光,不僅考慮本地區的人流變化,也要通盤考慮周邊更大范圍內的人流動向。
考慮各類外部因素影響
毫無疑問,城市日常運行節奏中如果加入外部因素,則城市的人流量時空變化將會產生突變。圖 4展示了北京市某地區在長假期間與工作日的人流量變化差異性,節假日的人流量激增現象明顯。圖 5則展示了極端天氣對人流量的影響,由于極端天氣一般持續時間相對較短,其影響也顯得更加微妙而難以把握。
在人流量變化預測的三個關鍵點中,外部因素的影響需引起重視,這是因為準確把握外部因素對人流的作用是提前化解人口異常集聚問題的前提條件,也是人流量預測的核心價值所在。
小結
? ? ? 以上三個關鍵點是準確預測人流量時空變化的基礎,但傳統預測方法中要同時兼顧三者的難度相當大。本研究引入深度學習方法,借助深度殘差網絡,取得了更好的效果。
基于深度殘差網絡的人流量預測方法
在深度殘差網絡中,我們通過以下三項策略來解決上述的三個關鍵問題。
1.通過逐步輸入長時間訓練數據來反映時間的連續性、差異性和周期性
通過分步輸入不同的時間尺度下的人流量分布數據,深度殘差網絡可以同時實現時間變化的連續性、差異性和周期性。
具體而言,首先把最近幾幀的數據放到殘差網絡的模型中,來模擬一天內相鄰時間點上人流量的平穩變化;然后將前幾天同一時刻的數據輸入到中間的模型,來模擬以天為單位的時間周期性;再將過去幾周同一時刻的數據輸入到左側的殘差網絡模型,來模擬以周為單位的時間周期性;然后對結果進行融合。
2.通過不斷“擴大視野”來感知不同空間尺度的人流變化
在深度殘差網絡中,通過大量次數的卷積計算來捕捉空間相關性。在此我們不必深究卷積計算的含義,而是可以將其視為我們觀察城市人流變化的“視野”。當進行一次卷積計算時,相當于我們觀察了研究地點周邊的人流變化;而反復進行卷積計算則意味著我們不斷擴大我們的“視野”,從而觀察了從周邊地區到片區、乃至整個城市的人流量變化情況。
由此,我們的分析也可以較準確的把握各種尺度下人流量的空間分布相關性。
3.通過融合外部因素來模擬異常情況
在把握時空特征的基礎上,我們進而將節假日、極端天氣、大型公共活動等各類外部因素與神經網絡進行結構融合。
通過上述的方法,我們成功訓練了一個深度殘差網絡,接下去我們將對其預測的效果進行檢驗和評估。
效果檢驗
城市層面的預測效果評估
下面兩個圖對比了2018年工作日某一天早上07:00-09:00早高峰時段的實際人流量時空分布變化和我們的預測結果。從圖中展示的結果來看,我們的模型較好地把握了人流量變化的內在時空特征,并進行了相當高精度的預測。
圖 9展示了在早上08:00預測值與真實值之間的誤差及其空間分布情況,為方便讀者觀察,柱體高度均為實際誤差值的10倍。總體而言,絕大部分地區的誤差值保持在一個可接受的范圍內。誤差相對較大的地區一部分是人流量較大的地區,另一部分則是存在少量偶發性人流量的地區,特別是城市邊緣地區。
圖 7 實際07:00-09:00人流量變化圖
圖 8 預測07:00-09:00人流量變化圖
從總體的誤差度分布情況來看,我們可以看到大部分網格損失小于10%,超過80%的網格損失在20%以內。這進一步印證了深度殘差網絡在人流量預測中的有效性。
?局部層面的預測效果評估
在全局預測效果評估的基礎上,我們進一步對一些人流量較大的重點地區和重點事件進行評估。
周期性人口集聚現象的預測
下圖展示了上地華聯地區的人流量預測情況及其與真實值之間的比對關系。從曲線走勢可以看到,總體上預測值與真實值的符合度比較高,損失值的時間分布沒有明顯的趨勢性,表明造成預測誤差的一個重要原因可能是隨機因素的影響。
對回龍觀地鐵站的人流量預測結果也具有類似的特征。由圖中可以看到我們訓練的模型對地鐵人流高峰期的人流量預測是較為精準的,這表明本模型可以在地鐵人流預測和預警中發揮較好的作用。
?突發性人口集聚現象的預測
商場和地鐵站的人流量時空分布相對周期性比較強,其預測難度相對低一些。真正的挑戰則是對非常規的公共活動的識別和預測。
此處我們利用訓練好的模型對5.20號林俊杰演唱會期間的人流量進行預測,并將該特殊時刻的預測精確度與平時工作日的預測精度進行對比。
從結果來看,我們的模型仍然準確識別了人流量的異常集聚,并進行了較高精度的預測,這表明本模型在大型公共活動、突發事件等異常情況的預測和預警中也可以發揮較好的預見性。
與平時某天的預測結果進行對比表明,在演唱會期間人流量激增、且基數增加較多的情況下,相應的預測精確度僅略有下降,模型的表現較能令人滿意。
結語
人流量預測對城市規劃管理和城市公共安全具有重要的作用,本研究立足深度學習技術,構建深度殘差網絡模型,并對模型的實際預測效果進行了系統的檢驗。檢驗結果表明,我們的模型可以較好地將人流量預測中的時間相關性、空間相關性、外部因素三個關鍵問題綜合考慮,預測精度達到較為先進的水平。
未來通過進一步的優化和部署,本研究結果可以在城市動態監測和應急管理等領域發揮重要的作用。
[1] Zhang J, Zheng Y, Qi D. Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction[C]//AAAI. 2017: 1655-1661.
總結
以上是生活随笔為你收集整理的用深度学习预知城市未来人流量的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: solidworks装配体改为柔性_情人
- 下一篇: 计算机考试桌贴,Word2010邮件合并