概率统计笔记: 协方差与相关系数
1 協方差
1.1 定義
假設兩個隨機變量X和Y滿足未知的概率分布,那么X和Y的協方差為:
其中E是求解數學期望的運算符,μx,μy分別是X和Y的均值
1.2 存在的問題
????????協方差告訴我們兩個隨機變量是如何一起移動的,但只用協方差衡量變量相關性存在一些問題:協方差是有量綱的,它的大小受隨機變量本身取值范圍的影響。
2 相關系數
????????人們希望使用某個和協方差有關,但是又是無量綱的測量來描述兩個隨機變量的相關性。
????????最簡單的做法就是用變量自身的波動對協方差進行標準化,相關系數便由此得來。
2.1 相關系數的定義
? ? ? ??令ρ表示X和Y的相關系數,它的定義為
? ? ? ? 其中σx和σy分別是X和Y的標準差
????????通過使用X和Y的標準差對它們的協方差歸一化,ρ的取值范圍為 [-1, +1]:?
2.2 相關系數和XY分布之間的關系
-
ρ(X,Y)=1表示X和Y之間存在確切的線性正相關;
-
ρ(X,Y)=0表示X和Y之間不存在任何線性相關性;
-
ρ(X,Y)=-1表示X和Y之間存在確切的線性負相關。
????????值得一提的是,相關系數僅僅刻畫 X和Y之間的線性相關性;它不描述它們之間的(任何)非線性關系。
3 時間序列的自相關系數
3.1 時間序列的弱平穩性
算法筆記:ARIMA_UQI-LIUWJ的博客-CSDN博客?提及了弱平穩性
我們這里涉及的弱平穩性性質是:如果時間序列數據具有弱平穩性,那么對于所有的時刻t和任意的間隔k,值之間的協方差,其中γk與時間t無關。他僅僅依賴于時間間隔k。
(比如樣本是 {},那么)
3.2 自相關系數ACF
和的自相關系數稱為的間隔為k的自相關系數。
?當k=0的時候,有:
說明對任何時刻t,?的間隔為k的自相關系數恒為1?
?進一步,我們計算
?
【弱平穩性的性質,時間序列的期望不變】
這里的是 {},
?所以?
【注:也有很多版本底下除的是n,就不太明白究竟應該是哪個。。。但如果n很大h很小的時候,差距并不是很大】
3.2.1 自相關圖解讀
下面為一些時間序列的自相關圖。它們呈現出完全不同結構的自相關性。
?
這個自相關圖的時間序列存在明顯的趨勢
這個相關圖的時間序列存在明顯的周期性。
?
?這個則同時有一定的趨勢和周期性
總結
以上是生活随笔為你收集整理的概率统计笔记: 协方差与相关系数的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python 笔记:装饰器
- 下一篇: 错误处理: pip install 时候