JUST技术:探查城市中的异常事件
城市在正常運行的過程中,也伴隨著一些異常事件的發生,例如某一路段突發的交通擁堵,這些異常事件往往會對我們帶來負面影響。前幾年,30多萬人涌入上海外灘觀看除夕燈光秀,人群的數量遠遠超出了組織者的預期。過度擁擠導致了一場悲慘的踩踏事件(圖1),最終造成36人死亡,49人受傷。
圖1 上海外灘踩踏事件
對城市中異常事件的及時感知甚至提前預測,能夠幫助政府或是相關機構及時應對突發異常,將其帶來的負面影響降到最低。如果能夠提前預測即將發生擁堵的路段,通過對車流的提前疏導能夠避免擁堵的進一步擴散。上海外灘事件中,如果能及早感知到人群聚集,及時對人群進行限流,悲劇可能就不會發生。對于不同類型的異常事件,提前感知從而及時處理都是至關重要的。
隨著智能設備的普及以及城市傳感器的大量部署,大量不同類型的城市數據被收集、管理與挖掘。這些數據具有實時、大量、多源等特點,且一般具有時空屬性,包含了豐富的居民出行、城市治安等信息,例如出租車上傳的實時地理位置數據、市民在社交軟件分享的打卡數據。充分利用這些數據為我們進行城市異常事件的檢測與預測提供了很好的機會。本文基于香港科技大學2020年的一篇綜述:Urban Anomaly Analytics: Description, Detection, andPrediction[1],介紹利用時空數據檢測不同類型的城市異常事件的工作,并在一些重要部分進行補充,同時介紹JUST系統在城市異常事件檢測中的應用。
數據驅動的城市異常檢測的主要邏輯如圖2,城市中發生的異常事件會影響到正常的城市運行動態,這些異常的變化信息會被遍布在城市的智能設備與傳感器采集到。數據驅動的城市異常檢測即是利用這些數據描述的城市動態信息,找出其中發生的異常事件。城市異常事件可以根據其發生的主體分為交通異常、人群流量異常、環境異常和個體異常。下面將分別對這幾種異常進行介紹。
圖2數據驅動的城市異常檢測
一、交通異常
交通出行影響到城市中的每個人。交通異常的產生主要有兩個原因。第一個是交通擠塞,通常是由交通事故或交通超載引起的。交通擠塞會導致特定道路的車速減慢或交通量增加,但這些影響只會持續很短的時間,如幾分鐘或幾個小時。另一個是道路管理,例如維修或封閉道路,這通常會導致交通量大幅下降,而且其影響會持續更長時間。
交通異常檢測主要基于交通流量分析,交通流量數據往往采集與部署在道路的傳感器。交通流量異常分析的工作可以分為兩類:局部流量異常分析和群體流量異常分析。第一類工作將路網視為獨立路段的組合,并檢測或預測每個路段的異常,這些方法首先會提取路段的特征信息例如道路上車輛的平均速度,然后通過基于統計的方法[2][3]或是最近鄰計算的方法[4]進行異常識別,由于這些工作的假設中將路段之間看作是獨立的關系,QQ號出售平臺會忽視實際路網上重要的流量傳播關系。群體流量異常分析則主要解決這一問題,他們往往將路網用圖結構表示,交通異常的預測可以看作是在圖上發現異常子圖的過程,這些方法可以找到一些有異常的路段集合[5]。同時交通流量異常往往也可以在人們的社交媒體中呈現,[5]中還對異常發生的同一時段的社交媒體信息進行簡單挖掘,探究交通流量異常的更多信息。然而,很多時候無法得到大量的實時交通數據支撐上述交通異常檢測的應用。也有工作借鑒交通工程領域利用稀疏數據建立正常的交通流量特征[6]。除了及時的異常檢測,對交通異常的原因分析可能更加能夠幫助到城市規劃者。[7]中作者為檢測到交通異常的時空屬性建立因果關系樹結構,其中的頻繁子結構能夠顯示出不同異常的相互影響與潛在的路網設計缺陷。
二、人群流量異常
人群流量異常指的是在短時間內城市中某一區域突然聚集大量人群的事件,是公共安全的主要威脅之一。2014年外灘事件最終造成36人死亡,49人受傷。如果在早期階段檢測到或預測到人群聚集,這類事故是可以被預防的。另一方面,一個地區人口密度的增加通常可以被很多城市數據所感知,例如該地區周圍基站的蜂窩用戶數量突然增加,附近地鐵站的出境乘客數量意外上升[8]。
然而,不同種類的人群流量異常的現象往往與多個數據源相關,為了能夠充分利用多個數據源,[9]作者建模時考慮到了多源數據融合的需求。另一方面,人群流量的異常一般從區域粒度進行檢測,區域之間的時空關聯一般較為復雜,而圖結構能夠較好地描述這種關聯,很多工作借鑒了圖表示網絡的成果,例如基于圖嵌入[10]或者圖卷積[11]的方式增強對時空關系的抽取。
檢測或預測意外人群的另一個難點是記錄的事件數量有限,這給評估不同檢測和預測算法的有效性帶來了困難。為了豐富數據驅動的模型的標簽,現有的工作通常將節日慶典、流行音樂會、體育比賽作為非正常事件。這些事件與潛在的城市異常事件有著相似性,都會導致城市動態與正常狀態的差異。
三、環境異常
城市環境異常主要指城市中基礎設置與城市環境出現的異常事件,與公眾安全高度相關。例如,城市中的火災是一種對人民生命財產的嚴重威脅。水系污染可能影響到相當大區域內居民的正常生活甚至健康。因此,城市環境異常的檢測同樣十分重要。
環境異常檢測主要基于部署在相關基礎設置與環境中傳感器采集的數據。與其他類型的城市異常不同,環境異常主要是由環境變化引起的,而不是由大規模的人類活動引起的,通常在發生之前沒有明顯的跡象。因此,目前的環境異常工作并不是直接對城市異常進行檢測和預警,而是側重于風險評估或原因追蹤。例如,[12]根據建筑物的狀況信息預測一棟建筑是否有著火的風險,[13]根據水樣檢抽測的結果探索了居民區水污染的原因。
四、個體異常
個體異常主要指城市中個體違法違規行為導致的異常。例如出租車司機的故意繞路行為,車輛在非機動車道的非法停放。個體異常一般影響的人群范圍較小。但是由于一些個體工作的特殊性,也會產生較大的危害,這些異常需要能夠被及時檢測。例如危化品司機將危化品運輸到非法小化工,這些小化工普遍存在的對危化品不規范處置行為會對造成極大的安全隱患。時空個體異常檢測的另一個特點是,每一種異常檢測任務之間較為獨立,不同的異常檢測模型設計的出發點差異較大。
個體異常檢測的數據主要來自于安置于個體設備上的傳感器,如出租車或是危化品車輛上的GPS采集器。出租車繞路的異常檢測是較早被研究的一種時空異常,模型設計主要是對起點終點間正常的行駛模式分布進行建模。由于實際路網形態較為復雜,很多方法會選擇對軌跡進行網格化表征[14][15][16][17],然后計算從起點到終點期間走到某一網格的異常程度,所有網格累計的異常值作為判定標準。在一些實際應用對繞路檢測算法往往有實時性的需求,例如網約車公司會希望當車輛有繞路傾向時就及時發出警報,一些實時算法被提出[16][18],其中,[18]主要通過一種啟發式的思想計算當前位置到起點的距離和行駛時間與距離的比例是否正常,利用廣義線性模型來對兩種比例的分布進行建模。為了有更好的表征空間,基于深度學習的模型也被嘗試用于繞路檢測[17],作者考慮到一組起點終點間有多種可能的路段選擇,用高斯混合模型結合變分自編碼器的方式將原始軌跡映射到高維空間,不同蔟代表著不同的合理路段選擇,表征離蔟中心較遠的軌跡被認為是異常。
然而上述方法如果要投入實際應用仍有困難,由于不同起點終點間可能的正常路線選擇較為多樣,上述方法往往需要對于每個起點終點都訓練一個模型,這會有兩個問題,首先對于一些歷史稀疏的路段,這種方法難以有較好的效果,第二如果要實際部署這種模型,需要對城市內所有起點終點都訓練一個模型,消耗的資源較大。
相對于出租車,危險化學品運載車輛的異常行為往往會產生更大的危害,因而這些車輛的行駛路線與行為都受到嚴格的管控,其行駛軌跡數據被實時上傳。然而仍然有少數司機會選擇鋌而走險,將危化品送到一些小化工進行非法存儲銷售。為此基于京東城市時空數據引擎JUST設計了危化品車輛軌跡特征和地點上游工廠信息檢測非法小化工地點的模型。部署在江蘇南通的危化品監管系統在兩個月的試運行期間檢測出了296個危化品異常駐留點,和南通市此前花大力氣排查出的91家要求整改的“小化工”成功匹配64個,匹配覆蓋度達到70%。
另外,即使是有正常危化品需求的地點,過量存儲危化品仍然會有很大安全隱患。在[19]中,作者尋找城市中危化品事故高危區域,他利用貨車軌跡數據計算所有區域危化品車輛停放密度分布,通過運營商數據計算人流密度分布,如果某一區域某一時段同時有較多的危化品車輛分布和人流分布則被判定為危險區域,其成果被應用到北京多個地區的天然氣整改中。
利用軌跡數據,還能檢測車輛停放的異常行為。JUST團隊的工作[20]中,我們利用自行車軌跡數據檢測停留在非機動車道的車輛,由于自行車在經過有車輛停放的道路時一定會繞行,從大量自行車的軌跡分布可以明顯檢測出這種特征。
五、總結
以上就是本次關于利用時空數據探查城市異常事件的分享,主要從四個分類介紹了當前城市中異常事件檢測的進展以及JUST系統中城市異常事件檢測的應用。未來JUST系統還將集成更多城市異常檢測算法,助力城市的安全發展。
總結
以上是生活随笔為你收集整理的JUST技术:探查城市中的异常事件的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 在unity2d同屏显示9千人
- 下一篇: 时空AI技术:深度强化学习在智能城市领域