数据学习(十)-假设检验
目錄
1.假設檢驗的基本問題
2.一個總體參數的檢驗
3. 兩個總體參數的檢驗
1.假設檢驗的基本問題
假設檢驗是推斷統(tǒng)計的另一項重要內容,它與參數估計類似,但角度不同,參數估計是利用樣本信息推斷未知的總體參數,而假設檢驗則是先對總體參數提出一個假設值,然后利用樣本信息判斷這一假設是否成立。
1.1 假設的陳述
1.對總體參數的具體數值所作的陳述,稱為假設,或稱為統(tǒng)計假設。
2. 先對總體參數提出某種假設,然后利用樣本信息判斷假設是否成立的過程,稱為假設檢驗。
3. 通常將研究者想收集證據予以支持的假設稱為備擇假設,或稱為研究假設,用H1或Ha表示。
4.通常將研究者想收集證據予以反對的假設稱為原假設,或稱零假設,用H0表示。
備選假設具有特定的方向性,并含有符號“>”或“<”的假設檢驗,稱為單側檢驗或單尾檢驗。
在單側檢驗中,由于研究者感興趣的方向不同,又可以分為左側檢驗和右側檢驗。如果研究者選擇的備選假設的方向是“<”,稱為左側檢驗反之選擇是“>”,稱為右側檢驗。
備選假設沒特定的方向性,并含有符號“!=”的假設檢驗,稱為雙側檢驗或雙尾檢驗。
1.2 兩類錯誤與顯著性水平
當原假設為真時拒絕原假設,所犯的錯誤稱為第一類錯誤, 又稱棄真錯誤。犯第一類錯誤的概率通常記為a.
當原假設為假時沒有拒絕原假設,所犯的錯位稱為第二類錯誤,又稱取偽錯誤。犯第二類錯誤的概率通常記為b。
假設檢驗中犯第一類錯誤的概率,稱為顯著性水平,記為a。
1.3 統(tǒng)計檢驗量與拒絕域
根據樣本觀測結果計算得到的,并據以對原假設和備選假設作出決策的某個樣本統(tǒng)計量,稱為檢驗統(tǒng)計量。
標準化檢驗統(tǒng)計量=(點估計量-假設值)/點估計量的抽樣標準差
能夠拒絕原假設的檢驗統(tǒng)計量的所有可能取值的集合,成為拒絕域。
根據給定的顯著性水平確定的拒絕域的邊界值,稱為臨界值。
1.4 利用P值進行決策
在原假設為真的條件下,檢驗統(tǒng)計量的觀測值大于或等于其計算值的概率。稱為P值,也稱為觀察到的顯著性水平。
2.一個總體參數的檢驗
2.1 總體均值的檢驗
在對總體均值進行假設檢驗時,采用什么檢驗步驟和檢驗統(tǒng)計量取決于我們所抽取的樣本是大樣本(n>=30)還是小樣本(n<30),此外還需要區(qū)分總體是否服從正態(tài)分布、總體方差o2是否已知等幾種情況。
2.1.1 大樣本的檢驗方法
樣本均值經標準化后服從標準正太分布,因而采用正太分布的檢驗統(tǒng)計量。設假設的總體均值為u0,當總體方差o2已知時,總體均值檢驗的統(tǒng)計量為:
當總體方差o2未知時,可以用樣本方差s2來近似代替總體方差,此時總體均值檢驗的統(tǒng)計量為:
例題如下:
2.1.2 小樣本的檢驗方法
在小樣本(n<30)情形下,檢驗統(tǒng)計量的選擇與總體是否服從正太分布,總體方差是否已知有著密切聯系。
當總體方差o2已知時,即使在小樣本情況下,檢驗統(tǒng)計量認可根據大樣本的計算方式進行計算。
當總體方差o2未知時,需要用樣本方差s2代替總體方差o2,此時不再服從標準正態(tài)分布,而是服從n-1的t分布。因此需要采用t分布來檢驗總體均值,通常稱為t檢驗,檢驗的統(tǒng)計量為:
2.2 總體比例的檢驗
在構造檢驗統(tǒng)計量時,我們仍然利用樣本比例p與總體比例pi之間的距離等于多少個標準差op來衡量,因為在大樣本情形下統(tǒng)計量p近似服從正態(tài)分布,而統(tǒng)計量
2.3 總體方差的檢驗*
與總體均值和總體比例檢驗通常使用的抽樣分布不同,它使用的是卡方(y2)分布。此外,總體方差的檢驗,不論樣本容量n是大或小,都要求服從正態(tài)分布,這是由檢驗統(tǒng)計量的抽樣分布決定的。
檢驗統(tǒng)計量為
3. 兩個總體參數的檢驗
3.1 兩個總體均值之差的檢驗
在實際研究中,我們常常需要比較兩個總體的差異,如一所學校的重點班和普通班兩個班級的英語平均成績是否有顯著差別等。
3.1.1 兩個總體均值之差的檢驗:獨立樣本
(1)大樣本的檢驗方法
在大樣本情況下,兩個均值之差x1-x2的抽樣分布近似服從正態(tài)分布,而x1-x2經過標準化后則服從標準正態(tài)分布,如果兩個總體的方差o1,o2已知,則采用下面的檢驗統(tǒng)計量:
當兩個總體方差o1,o2未知時,可以分別用樣本方差s1,s2替代,此時檢驗統(tǒng)計量為:
(2)小樣本的檢驗方法
在兩個樣本都為獨立小樣本的情況下,檢驗兩個總體的均值之差,需要假定兩個總體都服從正態(tài)分布。檢驗時有四種情況:
1)總體服從正態(tài)分布,當兩個總體方差o1和o2已知時,無論樣本容量大小都服從正態(tài)分布,可用大樣本的公式
2)總體服從正態(tài)分布,當兩個總體的方差o1和o2未知但相等時,即o12=o22,則需要樣本的方差來估計,公式為:
這時,兩個樣本均值之差經標準化后服從自由度為(n1+n2-2)的t分布,因此采用下面的檢驗統(tǒng)計量為:
3)總體服從正態(tài)分布,當兩個總體的方差o1和o2未知且不相等時,o12!=o22,如果兩個樣本容量相等,即n1=n2=n,兩個樣本均值之差經標準化后服從自由度為(n1+n2-2)=2(n-1)的t分布,因而采用的檢驗統(tǒng)計量為:
4)總體服從正態(tài)分布,當兩個總體的方差o1和o2未知且不相等時,o12!=o22,而且兩個樣本容量不相等,即n1!=n2,兩個樣本均值之差經標準化后服從自由度為(n1+n2-2)的t分布,而是近似服從自由度為v的t分布,因而采用的檢驗統(tǒng)計量為:
該統(tǒng)計量的自由度為v,其計算公式為
3.1.2 兩個總體均值之差的檢驗:匹配樣本
d:第i個配對樣本數據的差值,i=1,2,3,…,n;
d把:配對樣本數據差值的平均值,即d把=di的和/n;
s2:配對樣本數據差值的方差
對于小樣本情形,配對差值服從自由度為n-1的t分布,統(tǒng)計量為
3.2 兩個總體比例之差的檢驗
兩個總體比例之差的檢驗思路與一個總體比例的檢驗類似,只是涉及兩個總體,可以得到檢驗統(tǒng)計量
但由于兩個總體的比例pi1和pi2是未知,需要采用兩個樣本比例p1,p2來估計op1-p2.這時又兩種情況:
第一種情況是原假設成立的情況下,即H0:pi1-pi2=0或H0:pi1=pi2,pi1=pi2=pi的最佳估計量是將兩個樣本合并后得到的合并比例p.如果設x1表示樣本1中具有某種屬性的單位數,x2表示樣本2具有某種屬性的單位數,則合并后的比例為:
這時兩個樣本比例之差pi1-pi2抽樣分布的標準差opi1-pi2的最佳估計量為:
將公式帶入其中得到統(tǒng)計量為
第二種情況是,當我們要檢驗假設H0:pi1-pi2=d0,d0!=0時,可直接用兩個樣本比例p1和p2作為相應的兩個總體比例pi1和pi2的估計量,標準差估計為
將公式帶入其中得到統(tǒng)計量為
3.3 兩個總體方差比的檢驗
由于兩個樣本方差比s12/s22是兩個總體方差比值o12/o22的理想估計量,而當容量為n1和n2的兩個樣本分別獨立得取自兩個正態(tài)分布時,統(tǒng)計量
服從F(n1-2,n2-1)分布,所以選擇上述公式作為統(tǒng)計量。在原假設成立的條件下,檢驗統(tǒng)量變?yōu)?br />
總結
以上是生活随笔為你收集整理的数据学习(十)-假设检验的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Latex beamer
- 下一篇: JavaScript制作网页动画