统计学习:协方差和相关性
統(tǒng)計(jì)學(xué)習(xí)
前言
最近在做信號(hào)處理感覺理論掌握的不夠扎實(shí),開始了重新的補(bǔ)習(xí),提高自己的知識(shí)水平。
在概率論和統(tǒng)計(jì)學(xué)中,協(xié)方差和相關(guān)性的數(shù)學(xué)概念非常相似。它們用近似的方式度量了兩個(gè)隨機(jī)變量或者一組隨機(jī)變量偏離自己期望值的趨勢的程度。
協(xié)方差和相關(guān)性
如果X和Y是兩個(gè)隨機(jī)變量,它們的均值(期望值)是μXμX ,μYμY,同時(shí)它們的標(biāo)準(zhǔn)差是
σXσX 以及 σYσY,分別地,它們的協(xié)方差和相關(guān)性可以通過以下式子計(jì)算:
covariancecovariance σXY=E[(X?μX)(Y?μY)]σXY=E[(X?μX)(Y?μY)]
correlationcorrelation ρXY=E[(X?μX)(Y?μY)]/(σXσY)ρXY=E[(X?μX)(Y?μY)]/(σXσY)
因此:
covXY=σXY=ρXYσXσYcovXY=σXY=ρXYσXσY
其中E代表求期望,特別地,相關(guān)性是無量綱的,而協(xié)方差的單位是將兩個(gè)變量的單位相乘。
如果Y的值和X的值一直都是相同的,我們將會(huì)得到一個(gè)變量自身的協(xié)方差
(i.e.σXX)(i.e.σXX)也就是通常意義上講的方差,一般簡寫為 σX2σX2,
也就是標(biāo)準(zhǔn)差的平方。
一個(gè)變量自身的相關(guān)性永遠(yuǎn)是1(除了在退化的情況下,這個(gè)情況下,X是一個(gè)常量,因此兩個(gè)變量的方差都是0,也因此相關(guān)性計(jì)算中會(huì)涉及除數(shù)為0的情況,也因此相關(guān)性并不存在)。
更通俗地說,兩個(gè)變量間的相關(guān)性會(huì)是1(或者-1),如果它們中的一個(gè)是另一個(gè)通過一個(gè)具有正斜率(或者負(fù)斜率)的線性函數(shù)得到的。
雖然從理論上協(xié)方差的值和相關(guān)性的值通過上述方式聯(lián)系在了一起,但這些統(tǒng)計(jì)量的樣本估計(jì)的概率分布并沒有以任何簡單的方式關(guān)聯(lián),因此它們通常需要分開處理。
多重隨機(jī)變量
對(duì)于任意數(shù)量超過1的隨機(jī)變量,可以將隨機(jī)變量堆積成一個(gè)隨機(jī)向量,其第i個(gè)元素是第i個(gè)隨機(jī)變量。 然后,可以將方差和協(xié)方差放置在協(xié)方差矩陣中,其中(i,j)元素是第i個(gè)隨機(jī)變量和第j個(gè)隨機(jī)變量之間的協(xié)方差。 同樣,相關(guān)性指標(biāo)可以放置在相關(guān)矩陣中。
時(shí)間序列分析
對(duì)于一個(gè)滿足寬平穩(wěn)過程條件的時(shí)間序列,即它的均值和方差都是平穩(wěn)的(不隨著時(shí)間變化)
(E(Xn+m)=E(Xn)=μX和var(Xn+m)=var(Xn)并且這同樣對(duì)于Y也成立).(E(Xn+m)=E(Xn)=μX和var(Xn+m)=var(Xn)并且這同樣對(duì)于Y也成立).
在這個(gè)情況下,互協(xié)方差和互相關(guān)性是隨著時(shí)間變化的函數(shù):
cross?covarianceσXY(m)=E[(Xn?μX)(Yn+m?μY)],cross?covarianceσXY(m)=E[(Xn?μX)(Yn+m?μY)],
cross?correlationρXY(m)=E[(Xn?μX)(Yn+m?μY)]/(σXσY).cross?correlationρXY(m)=E[(Xn?μX)(Yn+m?μY)]/(σXσY).
如果Y和X是同一個(gè)隨機(jī)過程,以上的表達(dá)式則被叫做自協(xié)方差和自相關(guān)性。
autocovariance σXX(m)=E[(Xn?μX)(Xn+m?μX)],σXX(m)=E[(Xn?μX)(Xn+m?μX)],
σXX(m)=E[(Xn?μX)(Xn+m?μX)],σXX(m)=E[(Xn?μX)(Xn+m?μX)],
autocorrelation ρXX(m)=E[(Xn?μX)(Xn+m?μX)]/(σ2X).ρXX(m)=E[(Xn?μX)(Xn+m?μX)]/(σX2).
參考:
wikepedia
總結(jié)
以上是生活随笔為你收集整理的统计学习:协方差和相关性的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 你经常使用计算机吗这样的问题其主要缺点是
- 下一篇: transporter上传卡正在交付_X