MATLAB中数据相关性所求相关系数的有关内容(3)
斯皮爾曼spearman相關系數
1、第一中斯皮爾曼spearman相關系數定義:
X和Y為兩組數據,其斯皮爾曼(等級)相關系數:
(其中,為和之間的等級差)
(一個數的等級,就是將它所在的一列數按照從小到大排序后,這個數所在的位置)
可以證明:位于-1和1之間。
(注意:如果有的數值相同,則將它們所在的位置取算術平均。)
根據公式:可得:
?
X和Y的斯皮爾曼相關系數:
2、另一種斯皮爾曼spearman相關系數的定義
斯皮爾曼相關系數被定義成等級之間的皮爾遜相關系數。
還以這張圖為例:
matlab中代碼為:
%% MATLAB求解皮爾遜相關系數 RX = [2 5 3 4 1] RY = [1 4.5 3 4.5 2] R = corrcoef(RX,RY) x = [ 3 8 4 7 2]' %一定要是列向量哦,一撇'表示求轉置 Y =[ 5 10 9 10 6]' coeff = corr(x , Y , 'type' , 'Spearman ' )?兩種用法:(1) corr(X , Y , 'type' , 'Spearman')(這里的X和Y必須是列向量) (2) corr(X , 'type', 'Spearman')
斯皮爾曼相關系數的假設檢驗(分為小樣本和大樣本兩種情況)
小樣本情況:即n ≤30時,直接查臨界值表即可。
(表A.7 斯皮爾曼相關的臨界值 - 百度文庫)
?
(這里的)
?大樣本情況下,統計量
我們計算檢驗值,并求出對應的p值與0.05相比即可。
斯皮爾曼相關系數和皮爾遜相關系數選擇:?
?1、連續數據,正態分布,線性關系,用pearson相關系數是最恰當,當然用spearman相關系數也可以,就是效率沒有pearson相關系數高。
2、上述任一條件不滿足,就用spearman相關系數,不能用pearson相關系數。
3、兩個定序數據之間也用spearman相關系數,不能用pearson相關系數。
( 定序數據是指僅僅反映觀測對象等級、順序關系的數據,是由定序尺度計量形成的,表現為類別,可以進行排序,屬于品質數據。例如:優、良、差;我們可以用1表示差、2表示良、3表示優,但請注意,用2除以1得出的2并不代表任何含義。定序數據最重要的意義代表了一組數據中的某種邏輯順序。)
注:斯皮爾曼相關系數的適用條件比皮爾遜相關系數要廣,只要數據滿足單調關系。(例如線性函數、指數函數、對數函數等)就能夠使用。
總結
以上是生活随笔為你收集整理的MATLAB中数据相关性所求相关系数的有关内容(3)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: NDoc 用户指南(转)
- 下一篇: Gdevops峰会北京站归来