可汗学院统计学笔记 42-81集
假設檢驗
假設檢驗是推論統計中用于檢驗統計假設的一種方法。而“統計假設”是可通過觀察一組隨機變量的模型進行檢驗的科學假說。一旦能估計未知參數,就會希望根據結果對未知的真正參數值做出適當的推論。統計上對參數的假設,就是對一個或多個參數的論述。而其中欲檢驗其正確性的為零假設(null hypothesis),零假設通常由研究者決定,反映研究者對未知參數的看法。相對于零假設的其他有關參數之論述是備擇假設(alternative hypothesis),它通常反映了執行檢定的研究者對參數可能數值的另一種(對立的)看法(換句話說,備擇假設通常才是研究者最想知道的)。假設檢驗的種類包括:t檢驗,z檢驗,卡方檢驗,F檢驗等等。
(百度百科)
在假設檢驗的問題中,通常需要根據已有的統計量對某一個假設進行檢驗。我們得到的統計量通常是樣本均值的抽樣分布,服從正態分布(當n足夠大時,例如n>=30)或t分布(當n<30)。在零假設成立的條件下,計算出現樣本統計量的概率。如果概率值小于某個閾值,則“拒絕”零假設,接受備擇假設。在這個問題中,有兩個假設的概念:
零假設,通常記為。備擇假設,通常記為或。
假設檢驗通常檢驗零假設的正確性,也即是問題中的假設的對立假設,對于利用這個零假設進行檢驗,我理解的原因是:題目中真正需要進行檢驗的假設通常不能提供確切的統計數值用于計算,而零假設可以充分利用題目中所給的條件,利用反正法推翻零假設,就證明了備擇假設的可信性。
p-value:在零假設成立的條件下,出現樣本統計情況的概率通常很小,將這種極端情況的概率值稱為p-value,通常設置5%為門限,當p-value低于這個門限時,就拒絕零假設。
雙側檢驗(two-tailed test):當樣本出現的極端情況可能出現在總體分布的兩側尾部時,稱為雙側檢驗。通常題目中的假設要求檢驗某個統計量是否變化;
單側檢驗(one-tailed test):當樣本出現的極端情況只可能出現在總體分布的一側尾部時,只需檢測一側的尾部,稱為單側檢驗。通常題目中的假設要求檢驗某個統計量向某個方向的變化。
z-統計量 和 t-統計量
與樣本容量有關。當樣本容量很大時(n>=30),樣本統計量(不一定是均值,可能是其他計算量)的抽樣分布服從正態分布,此時計算概率時使用z分布的計算表;當樣本容量不是很大(n<30)時,樣本統計量的抽樣分布不再服從正態分布,而服從t分布,此時使用t分布的計算表。
第一型錯誤(type 1 error):拒絕了正確的零假設的概率,也就是零假設判斷錯誤的概率。
大樣本占比的假設檢:
樣本占比實驗可以理解為伯努利實驗,占比就是伯努利實驗的成功率。n次伯努利實驗是二項分布,當n很大時,二項分布趨近于正態分布。具體地,當np>5,且n(1-p)>5,則可以假定樣本占比的分布為正態分布。
隨機變量之差的方差:
?
?
?
?
?
?
?
?
1.線性回歸
統計學中的線性回歸:對于一組具有線性關系的數據,可以用一條直線來擬合這些數據。用于擬合這些數據的直線應該使得所有數據到這條直線的距離最短(這里的距離簡化為真實值和預測值之間的距離)。
設這條直線為:y=mx+b
其中,m為直線的斜率,b為截距。線性回歸學習的目的是找到這樣的參數m和b,使得所有數據點到這條直線的距離最短。數據點到直線的距離的平方之和,或說是平方誤差為:
分別對m和b求偏導,并令其為0,可得:
求得:
?
決定系數(coefficient of determination):? ?y的波動多大程度上可以被x的波動描述,what % of the total variation is described by the variation in x
其中:
,
當很小時,說明直線很好地擬合了數據很小接近于1;當的值較大時,說明直線不能很好地擬合數據接近1接近于0。因此從的值可以推斷出直線的擬合程度。
線性回歸的斜率與隨機變量協方差的關系:
令X,Y為兩個隨機變量,X和Y的協方差定義為:
可以化簡為:
當X=Y時,有,即X和X的協方差等于X的方差
上式中的期望可以用樣本均值來估計,即:
,,
則用樣本均值估計的協方差可以寫為:
這是不是有點熟悉?線性回歸擬合的直線中的斜率就有上述類似的表達式。隨機變量的協方差是總體的統計量,而樣本均值是對樣本的統計量。之前得到的回歸線的斜率可以看成是從總體分布中抽樣得到的一個值,可以表示為:
則關于總體的回歸線斜率為:
分布(Chi-Squared distribution)
假設有一些相互獨立的服從標準正態分布的變量,例如:,另外一些變量與它們的關系為:
則稱分別服從分布:? ? 。下標1,2,3分別表示自由度為1,2,3。
檢驗(待補充)
皮爾遜檢驗
列聯表(contingency table)檢驗
列聯表自由度:
自由度是真正獨立的數據點個數
2.方差分析
總平均值(grand mean) ,所有樣本的均值,記為
總平方和(sum square total)SST,所有樣本離總平均值的距離的平方和。
,自由度為mn-1
組內平方和(the sum of squares within)SSW,每一組的樣本離本組的均值的距離的平方和的和。設每組均值分別為:
,自由度為m(n-1)
組間平方和(sum of squares between)SSB,每個樣本點所在組的均值與總體均值的距離的平方和。
,自由度為m-1
重要結論:總體波動可以描述為組內波動與組間波動的和。SST=SSW+SSB
總體的自由度=組內自由度+組間自由度。
第七十一集 協方差
度量各個維度偏離其均值的程度。協方差是為多維變量創立的,目的是為了描述兩個變量的關系(正相關,負向關。相互獨立)。需注意協方差只能兩個維度算,多個維度的協方差形成協方差矩陣。
cov(X,Y)=E[(x-E[X])(y-E[Y])]
第七十二集 卡方分布
一些服從標準正態隨機變量的平方求和即是分布,其中n為自由度,確定一個式子自由度的方法是:
若式子包含有n個獨立的隨機變量,和由它們所構成的k個樣本統計量,則這個表達式的自由度為n-k.比如中包含ξ1,ξ2,…,ξn這n個獨立的隨機變量,
同時還有它們的平均數ξ這一統計量,因此自由度為n-1.。
第七十三、四集 卡方檢驗
卡方分布可以不用對總體做任何假設,卡方檢驗可以用來衡量觀測與理論之間的擬合程度,或者推斷兩個分類變量是否相關或者獨立。
具體例子可參考:https://blog.csdn.net/bitcarmanlee/article/details/52279907
第七十五、六集 平方和
組內平方和:是每組的值減去每組自己的平均值,求平方和,組間平方和理解為兩組之間的差異。
組間平方和:是每組自己的平均值減去總均值,求平方和,組內平方和理解為兩組內部不同數據的差異。
如圖:這幾集的內容是為了說明總的波動=組內波動+組間波動
F假設檢驗
F統計量是組間平方和除以其自由度比上組內平方和除以其自由度。F值主要描述:組間的差異大,還是組內的差異大?如果是組間的差異大,那么這兩組數據本身不一致的概率就大,對應F值比較大。F檢驗又稱為方差其次性檢驗,檢查的是方差的差異性。需注意:F檢驗的前提是F分布,而F分布的前提是正態分布。F檢驗通常作為T檢驗的一步。
各個分布的應用如下:
方差已知情況下求均值是Z檢驗。
方差未知求均值是t檢驗(樣本標準差s代替總體標準差R,由樣本平均數推斷總體平均數)
均值方差都未知求方差是X^2檢驗
兩個正態分布樣本的均值方差都未知情況下求兩個總體的方差比值是F檢驗。
F-statistic
F分布其實是兩個?分布之比
當這個值的分子比分母大得多時,說明總體波動大部分來自組間波動,而較少來自組內波動,說明每個組的總體均值之間有差異。
當分母比分子大很多時,說明組內波動比組間波動在總體中占比更多,這意味著,差異可能只是隨機產生的。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
總結
以上是生活随笔為你收集整理的可汗学院统计学笔记 42-81集的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: appsan可以扫描linux吗,[经验
- 下一篇: android可以有一个悬浮窗口在进入屏