python 皮尔森相关系数
生活随笔
收集整理的這篇文章主要介紹了
python 皮尔森相关系数
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
皮爾森理解
?皮爾森相關(guān)系數(shù)(Pearson correlation coefficient)也稱皮爾森積矩相關(guān)系數(shù)(Pearson product-moment correlation coefficient) ,是一種線性相關(guān)系數(shù)。皮爾森相關(guān)系數(shù)是用來反映兩個變量線性相關(guān)程度的統(tǒng)計量。相關(guān)系數(shù)用r表示,其中n為樣本量,分別為兩個變量的觀測值和均值。r描述的是兩個變量間線性相關(guān)強弱的程度。r的絕對值越大表明相關(guān)性越強。
簡單的相關(guān)系數(shù)的分類
- 0.8-1.0 極強相關(guān)
- 0.6-0.8 強相關(guān)
- 0.4-0.6 中等程度相關(guān)
- 0.2-0.4 弱相關(guān)
- 0.0-0.2 極弱相關(guān)或無相關(guān)
?r描述的是兩個變量間線性相關(guān)強弱的程度。r的取值在-1與+1之間,若r>0,表明兩個變量是正相關(guān),即一個變量的值越大,另一個變量的值也會越大;若r<0,表明兩個變量是負相關(guān),即一個變量的值越大另一個變量的值反而會越小。r 的絕對值越大表明相關(guān)性越強,要注意的是這里并不存在因果關(guān)系。
?
python 實現(xiàn)
# encoding:utf-8import pandas as pd
from pandas import DataFrame
import matplotlib.pyplot as plot
import math #target_url = ("https://archive.ics.uci.edu/ml/machine-learning-databases/undocumented/connectionist-bench/sonar/sonar.all-data") #rockVMines = pd.read_csv(target_url ,header=None,prefix="V") #prefix前綴 rockVMines = pd.read_csv('../rockdata.txt',header=None,prefix="V") #prefix前綴
row2 = rockVMines.iloc[1,0:60]
row3 = rockVMines.iloc[2,0:60]
n = len(row2)
mean2 = row2.mean()
mean3 = row3.mean()
t2=0 ; t3=0;t1=0
for i in range(n):
t2 += (row2[i] - mean2) * (row2[i] - mean2) / n
t3 += (row3[i] - mean3) * (row3[i] - mean3) / n
r23=0
for i in range(n):
r23 += (row2[i] - mean2)*(row3[i] - mean3)/(n* math.sqrt(t2 * t3))
print r23
corMat = DataFrame(rockVMines.corr()) #corr 求相關(guān)系數(shù)矩陣
print corMat
plot.pcolor(corMat)
plot.show()
轉(zhuǎn)載于:https://www.cnblogs.com/lxnz/p/7098954.html
總結(jié)
以上是生活随笔為你收集整理的python 皮尔森相关系数的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 理解JavaScript的运行
- 下一篇: 【bzoj2850】巧克力王国 KD-