在灾难发生之时,你在Facebook的社交定位或许能救你一命
自然災害發生后,人道主義救援組織需要了解受影響人群的位置,需要哪些資源以及安全信息。這些信息是很難在一定時間內用傳統的數據收集方法捕獲的。隨著更多人在Facebook上連接和分享,這些數據能夠提供實時近距離觀察,以幫助人道主義救援組織協調工作,并在災害期間填補信息的重大差距。雷鋒網(公眾號:雷鋒網)了解到,Facebook團隊近日宣布了一個Facebook災難地圖計劃,幫助救援組織解決他們在應對自然災害時經常遇到的信息方面的關鍵差距。
Facebook災難地圖提供有關人口所在地點,移動方式以及自然災害時候安全檢查位置的信息。 所有數據會取消個人的身份識別標記,并匯總到360平方米的網格或本地管理邊界(例如人口普查邊界)。[1]
本篇博客描述了災難地圖數據集,如何計算觀察,以及為確保保護隱私而采取的措施。
(視頻:https://www.facebook.com/facebook/videos/10155889045356729/)
數據和匯總
當人們使用啟用位置服務的Facebook應用程序時,他們的經緯信息會定期被收集。位置信息被廣泛應用在很多方面,例如推送與使用者最相關的功能或內容。 例如,它允許在小孩被綁架后的目標搜索區域向人民新聞Feed發送AMBER警報,或者向受自然災害影響的地區的人員發送安全檢查通知。
據雷鋒網了解,在匯總和去除識別的情況下,相同的地理位置數據可以在自然災害發生后向人道主義救援組織提供有價值的信息。 聚合信息不僅有助于保護隱私,還可以通過將信號與噪聲分離,使數據更易于使用和解釋,從而減少從數據轉變為行動視角所需的中間處理步驟。
災難地圖數據集通過以下方式跨越時間和空間進行聚合:
-
時間聚合:盡管災害期間需要及時的數據,但是Facebook得合作伙伴的反饋表明,救援組織并不會實時的處理和響應新的輸入。 因此,該系統會定期(例如,每小時,每6小時,每24小時)共享數據。[2]
-
空間聚合:將地理定位點聚合為360平方米的網格或本地管理邊界。
-
空間平滑:一旦計算出了每個度量(例如,在時間段y內的管理或像素單位x中的人數),則執行空間平滑。 對于每個空間位置,使用相鄰瓦片中的值來計算瓦片本身的值的加權平均值,更鄰近的瓷磚對最終結果有更大的貢獻。 這種局部平均結果是獲得有更平滑,更清晰信號的地圖,由于隨機變化而降低噪聲,同時保持關鍵信號并進一步保護隱私。
災害地圖數據集的組成
使用上述數據和聚合技術,可以生成三個獨特但互補的數據集:
-
人口:指示每個網格中Facebook使用群體密度的指標。
-
運動:與網格對之間的人口移動相關的指標。
-
安全檢查:指示安全檢查簽入密度與每個網格的總邀請度的指標。
密度地圖
通過聚合地理位置數據,能夠顯示一個平滑的表示出有多少使用位置服務的用戶在每個管理區域或每個時間段的地圖網格中使用Facebook的應用程序。
提供計數的一個限制是,哪些值代表與正常重要的偏差并不是很明顯。 為了幫助提供這方面的信息,還需要包括基線計數 —— 同時在過去三個星期內平均每個行政區域中有多少人(從同一人口測量)的近似值。 通過匹配位置和時間,研究團隊更加自信,他們所觀察到的任何差異都是由于災難事件。 他們還提供額外的統計數據,以說明觀察到的密度變化是否具有統計意義。
數據的結構如下,每個獨特的區域計算每個度量:[3]
其中,
-
crisis_name:事件的名稱。
-
time_window:記錄數據的時間。
-
area_id:瓦片名稱。 在光柵形式中,這表示地圖上的給定光柵像素,可以在空間上聚合,以便與其他數據集可互操作。 在管理表單中,area_id表示可以與其他管理數據集(例如普查數據)連接的區域的管理邊界名稱。
-
n_baseline,density_baseline:人們在同一范圍在同一時間窗口的平均個數,但是是前三個星期平均的數字。這個可以估計出在特定時間每個范圍有多少人
-
n_crisis,density_crisis:在時間t內在瓦片中觀察到的人數。
-
n_diff:危機時人口與基線人口之間的差異。
-
percent_change:危機時人口與基線人口之間的百分比差異。
-
z_score:危機人口與基線差異的標準偏差。
運動地圖
此數據集包含有關在給定時間段內在網格對之間運動的人數的信息。 在基線期間(在災難發生前三周平均的瓦片對之間的運動)也是這樣測量的,所以可以了解到與災難相比,在災難期間有多少人或幾個人正在移動。 這有助于將災害相關的運動與人們的正常遷移模式進行區分。
數據集如下所示:
其中,
-
area_id_start和area_id_end:表示瓦片對,其中s是起始瓦片,e是最終瓦片。
-
n_people_baseline:在災難發生前三個星期的時間段內從s向e移動的總人數。
-
n_people_crisis:在時間t期間從s移動到e的總人數。
-
n_diff:在災難期間從s到e之間相對于基線的人數之間的差異。
-
percent_change:從s到從災難發生到基線的人數之間的百分比差異。
安全檢查地圖
為每個災難提供的一些指標來源于Facebook的安全檢查產品。 安全檢查幫助人們在災難中與朋友和家人聯系。 受到危機影響的人們可以安全檢查。 一旦他們簽到,他們還可以邀請可能受影響的其他人。 以這種方式,受邀請人群可以安全地傳播給Facebook上可能受到災難影響的人們。
他們匯總并分享安全檢查數據,以向人們表明他們是安全的。
這些數據如下所示:
其中:
-
n_invited是被邀請到安全檢查的人員總數,位于a區域。
-
n_safe是在時間t或之前某個時間內a進行安全檢查的總人數。
-
safe_ratio是在被邀請的人數中安全檢查的區域中的人員的比例。
在分析這些信息時,請務必記住,受到安全檢查的人員可能不代表受災地區的統一樣本,并且數據會隨著時間的推移而累積。 另外,為什么人們不能安全檢查有很多原因,例如:他們在危機時是不安全或忙碌的,缺乏連接性,或者完全不受影響,也不覺得需要回應邀請。 由于這些原因,重要的是在上下文中考慮這些信息。
代表性
災害地圖數據中包含的觀察代表使用Facebook應用程序并啟用位置服務的人員。 這個人群可能與更廣泛的人口不同,特別是在信息落后的地區。
Facebook團隊鼓勵作為災難應對專家的人道主義伙伴將他們的數據用作更廣泛的數據集的一部分,以幫助資源部署。 具體來說,他們應該考慮到這些數據代表一些具體的人口,并在他們收到的其他信息的背景下考慮。 作為下一步,他們正在與聯合國兒童基金會,世界糧食計劃署和紅十字會的數據科學小組合作,分析數據中的潛在偏差,以便能夠糾正和報告給社區。
例如,可以通過將災難地圖密度數據集與開源人口密度數據集(如Facebook的人口密度圖)進行比較來評估數據的空間覆蓋。 通過進行這種比較,可以清楚地向合作伙伴傳達任何可能沒有被災害地圖人口數據集覆蓋的領域。
讓災難地圖數據觸手可及
在接下來的幾個月中,Facebook團隊將與合作伙伴密切合作,進一步驗證災難地圖數據。 在驗證數據時,他們將采取并行工作,以確保在自然災害中積極推動政策和響應工作的人道主義應急人員可以訪問數據集。
目前正在開發的災難地圖API和可視化工具的屏幕截圖,顯示的內容是2017年3月秘魯皮烏拉的洪水。
Facebook的基礎設施團隊正在建立一個API和可視化工具,能夠向世界各地有能力使用數據進行人道主義反應的救援組織提供災難地圖。 該API將提供可視化和下載功能,并將與災難地圖數據集進行互操作,從而允許合作伙伴在對其最有用的聚合級別(例如網格或管理數據)中以時間和空間高分辨率的訪問數據。
[1]在某些情況下,危機影響了整個國家等大地區,瓦片尺寸略低于分辨率。
[2]如果在時間窗口中收到一個人的多個位置,使用最常發生的地方; 如果數量剛好齊平,則在時間窗口內使用最近發生的最近的地點。
[3]圖表中的公式便于增加理解。
本文作者:哈帝?白求恩
本文轉自雷鋒網禁止二次轉載,原文鏈接
總結
以上是生活随笔為你收集整理的在灾难发生之时,你在Facebook的社交定位或许能救你一命的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: nodejs全局安装和本地安装的区别
- 下一篇: 3大常见光伏加盟骗局大起底