数据分析学习总结笔记12:空间自相关——空间位置与相近位置的指标测度
文章目錄
- 1 空間地理相關性
- 2 技術性定義
- 3 空間相關類型
- 4 Moran’s I(莫蘭系數)
- 5 空間自相關的應用
- 6 案例研究: 意大利人口遷移分析
- 7 總結
- 8 實現工具
1 空間地理相關性
地理空間自相關是指一個物體與附近其他物體的相似程度。通俗地說,它度量的是相近物體與其他相近物體的相似程度。
地理信息系統的第一規則: 一切事物都與其他事物相關聯。但是相近事物比較遠事物更相關 (Waldo r. Tobler,1970)。
為了理解這個定律,例如:
-
假設從一個網站隨機挑選了一套房子,價格是60萬美元。那么,如果它旁邊的房子也掛牌出售,如何預測它的價格。65萬美元和280萬美元,會選擇哪一個?
-
如果選擇了65萬美元,那么我們已經潛意識地知道什么是空間自相關了。它是一些共同特征(例如房價)中兩個相近物體之間的相關性。
空間自相關的一個潛在應用是,它有助于分析生態和疾病的集群和擴散。諸如“這種疾病是一個孤立的案例嗎”或“降雨模式在不同地區是聚集的還是相同的”這樣的問題可以通過空間自相關分析得到很好的理解和回答。
2 技術性定義
從技術上講,空間自相關性是指在空間尺度上觀測彼此相近的變量之間的關聯性的度量。這個變量可能是:
- 在連續表面上的任何一點(例如一個地區的土地使用類型,或年降水量);
- 在特定區域內的一組固定地點(例如一組零售店鋪);
- 細分地區的一組區域(如人口普查數據中有兩輛或兩輛以上汽車的家庭數量或比例)。
自相關違反了統計學的核心原則,即觀察值是相互獨立的。根據經典統計學中的獨立性假設,群體之間的觀察值和群體內部的觀察值應該是獨立的。
因此,空間自相關顯然違背了上述假設。
空間相關概念是時間相關的一種延伸。唯一的區別是時間相關性衡量一個變量隨時間的變化,而空間相關性衡量兩個變量的變化,即觀測值(如收入、降雨量等)和位置的關系。
3 空間相關類型
地理空間相關性最常見的形式是斑塊和梯度。
一個變量的空間相關性可以是外生的(由另一個空間自相關的變量引起, 如降雨),也可以是內生的(由某個過程引起,如疾病的傳播)。
4 Moran’s I(莫蘭系數)
空間自相關性通過Moran’s I系數進行度量,它是一個相關系數,用來度量數據集的整體空間相關性。Moran’s I系數可以分為正相關、負相關和無空間自相關:
(1)空間正相關
一張地圖上,當相似值聚集在一起時,空間相關性為正相關的。當Moran’s I系數接近+1時,出現正自相關。下面的圖像顯示了一個地區的土地覆蓋情況,這是一個正相關的例子,因為類似的群集集中在一起。
(2)空間負相關
在一張地圖上,當不同的值聚集在一起時,空間相關性為負相關的。當 Moran’s I系數接近-1時,出現負的空間自相關性。棋盤是負自相關的一個很好的例子,因為不同的值相鄰。
(3)空間不相關
當Moran’s I系數為0時,代表不具有空間自相關性。
5 空間自相關的應用
空間自相關的重要性在于,它有助于確定空間特征影響空間物體的重要性,以及物體與空間特性之間是否存在明確的關系。
以下是空間自相關的一些有趣的工業用例:
(1)衡量不平等性
空間自相關有助于找出衡量收入、人口或種族不平等和多樣性的方法。可以利用Moran’s I系數分析收入、人口等參數在特定區域內是集中分布還是均勻分布。
[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6068954/]
(2)環境
空間自相關有助于發現城市土壤中稀土元素的聚集點。
[Spatial Autocorrelation: Neighbors Affecting Neighbors]
(3)興趣點
自相關是用來映射不同的參數作為興趣點距離變量的函數。
例如,離市中心多遠時,房價開始下降。
(4)生態學
空間自相關廣泛應用于與海洋和珊瑚礁生態系統有關的重要應用程序。
如場地適宜性分析,以確定貝類養殖場或海水養殖的規劃面積。
(5)人口統計學
空間自相關用于繪制和分析選舉期間的選民投票率。
例如,空間自相關用于繪制法國總統選舉和法國地區選舉期間的缺席率。
[https://www.researchgate.net/publication/320988214_Spatial_Autocorrelation_in_Voting_Turnout]
6 案例研究: 意大利人口遷移分析
意大利人口遷移分析
[Analyzing Migration Phenomena with Spatial Autocorrelation Techniques]
自相關對遷移分析有很大影響。本案研究意大利境內外國人口移徙情況的分析。
在不同規模的族群動態演變中,移民是一個關鍵因素,對經濟、文化和環境都有影響。利用空間自相關性,可以識別代表移民集中度的空間聚類。
- 從技術上講,Moran’s I系數在這里表示的是外國和本地居民人口比率的加權方差和整體方差之間的差異。
- 用外行術語來說,它表達了一個 給定地點的外來人口/總人口 與 鄰近空間單元的外來人口/總人口 之間的相關性。
利用相關性指數LISA (空間關聯的本地指標) ,將這些場景分為三類:
(1)現象值高,且與周圍環境相似程度高的地點(高-高)被定義為熱點;
(2)現象值低,且與周圍環境相似程度低的地點(低-低)被定義為冷點;
(3)現象值高(低),但與周圍環境相似程度低(高)的地點(高/低-低/高),被定義為空間異常點。
人口遷移受到限制的地區可分為以下三組:
(1)第一個集群在地理上集中在東北部地區,呈正相關(類型: 高-高)。這些群體擁有屬性:收入機會 / 福利的增加,因此吸引了尋找工作的外國人;
(2)第二個集群位于中心區域,呈正相關(類型: 高-高)。這些地區也表現出類似的福利增加的特點;
(3)第三個集群位于意大利南部的城鎮(類型: 低-低)。這些地區通常擁有屬性:收入低,就業機會少。
7 總結
空間自相關不僅可以將相似對象與其他相似對象進行聚類,而且可以反映相關程度或相似程度。
它有助于發現隱藏的模式和關系,在生態學和人口統計學方面有很多應用。
8 實現工具
(1)數據量較少時,可以使用QGIS地理分析軟件。
(2)Python編程進行大規模數據運算,地理分析中通常運用的分析包,包括:geopandas、OSMnx、pySal、geopy等。這些包可以幫助進行地理數據處理和運算,幾分鐘就可以得到結果。
LISA相關性指數:http://www.dpi.inpe.br/cursos/ser301/referencias/bivand/node9.html
原文鏈接:https://towardsdatascience.com/spatial-autocorrelation-close-objects-affecting-other-close-objects-90f3218e0ac8
本文主要參考于:空間自相關 | 空間位置與相近位置的指標測度(沈浩老師)
相關筆記:
總結
以上是生活随笔為你收集整理的数据分析学习总结笔记12:空间自相关——空间位置与相近位置的指标测度的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: android nv21 nv12,an
- 下一篇: Dxdesigner SCH to M