转载: 关于显著性检验,你想要的都在这儿了!!(基础篇)
關于顯著性檢驗,你想要的都在這兒了!!(基礎篇)
無論你從事何種領域的科學研究還是統計調查,顯著性檢驗作為判斷兩個乃至多個數據集之間是否存在差異的方法被廣泛應用于各個科研領域。筆者作為科研界一名新人也曾經在顯著性檢驗方面吃過許多苦頭。后來醉心于統計理論半載有余才摸到顯著性檢驗的皮毛,也為顯著性檢驗理論之精妙,品種之繁多,邏輯之嚴謹所折服。在此,特寫下這篇博文,以供那些仍然掙扎在顯著性檢驗泥潭的非統計專業的科研界同僚們參考。由于筆者本人也并非統計專業畢業,所持觀點粗陋淺鄙,貽笑大方之處還望諸位業界前輩,領域翹楚不吝賜教。小可在此謝過諸位看官了。
本篇博文致力于解決一下幾點問題,在此羅列出來:1.什么是顯著性檢驗? 2.為什么要做顯著性檢驗? 3.怎么做顯著性檢驗?下面就請跟隨筆者的步伐一步步走入顯著性檢驗的“前世與今生”。
一:顯著性檢驗前傳:什么是顯著性檢驗?它與統計假設檢驗有什么關系?為什么要做顯著性檢驗?
“顯著性檢驗”實際上是英文significance test的漢語譯名。在統計學中,顯著性檢驗是“統計假設檢驗”(Statistical hypothesis testing)的一種,顯著性檢驗是用于檢測科學實驗中實驗組與對照組之間是否有差異以及差異是否顯著的辦法。實際上,了解顯著性檢驗的“宗門背景”(統計假設檢驗)更有助于一個科研新手理解顯著性檢驗。“統計假設檢驗”這一正名實際上指出了“顯著性檢驗”的前提條件是“統計假設”,換言之“無假設,不檢驗”。任何人在使用顯著性檢驗之前必須在心里明白自己的科研假設是什么,否則顯著性檢驗就是“水中月,鏡中花”,可望而不可即。用更通俗的話來說就是要先對科研數據做一個假設,然后用檢驗來檢查假設對不對。一般而言,把要檢驗的假設稱之為原假設,記為H0;把與H0相對應(相反)的假設稱之為備擇假設,記為H1。
如果原假設為真,而檢驗的結論卻勸你放棄原假設。此時,我們把這種錯誤稱之為第一類錯誤。通常把第一類錯誤出現的概率記為α
如果原假設不真,而檢驗的結論卻勸你不放棄原假設。此時,我們把這種錯誤稱之為第二類錯誤。通常把第二類錯誤出現的概率記為β
通常只限定犯第一類錯誤的最大概率α, 不考慮犯第二類錯誤的概率β。我們把這樣的假設檢驗稱為顯著性檢驗,概率α稱為顯著性水平。顯著性水平是數學界約定俗成的,一般有α =0.05,0.025.0.01這三種情況。代表著顯著性檢驗的結論錯誤率必須低于5%或2.5%或1%(統計學中,通常把在現實世界中發生幾率小于5%的事件稱之為“不可能事件”)。(以上這一段話實際上講授了顯著性檢驗與統計假設檢驗的關系)
為了方便接下來的講授,這里舉一個例子。趙先生開了一家日用百貨公司,該公司分別在鄭州和杭州開設了分公司。現在存在下列數據作為兩個分公司的銷售額,集合中的每一個數代表著一年中某一個月的公司銷售額。
鄭州分公司Z = {23,25,26,27,23,24,22,23,25,29,30}
杭州分公司H = {24,25,23,26,27,25,25,28,30,31,29}
現在,趙先生想要知道兩個公司的銷售額是否有存在明顯的差異(是否存在鄭州分公司銷售額>杭州分公司銷售額,抑或反之),以便對接下來公司的戰略業務調整做出規劃。下屬們知道趙老板的難處,紛紛建議“只需要求平均值就知道哪個分公司的銷售額更大了”。但是作為擁有高學歷的趙先生懂得這樣一件哲學即“我們生活在概率的世界之中”。那也就意味著,平均值并不能夠說明什么問題,即便杭州分公司的銷售額平均值大于鄭州分公司的銷售額平均值仍然不能說明杭州分公司的銷售額一定就大于鄭州分公司的銷售額,因為“這樣一種看似存在的大于關系實質上是偶然造成的而并不是一種必然”。
趙先生最終決定,使用方差驗檢查這兩個數據。(請先忽略為什么用方差檢驗,檢驗方法的選擇下文中會詳述)
最后趙先生發現,方差檢驗的p 值= 0.2027,那也就意味著,雖然杭州分公司的年平均銷售額26.63大于鄭州分公司的銷售額25.18,但是實質上,兩個分公司的銷售額并沒有明顯的差異。(相信此時的你心中有萬千草泥馬奔過:方差檢驗是怎么做的?p值是什么鬼?為什么p=0.2027意味著銷售額沒有明顯差異?信息量好大腫么辦?)
不要急,不要慌,讓我們從頭來過,整理一下趙先生這里究竟發生了什么。這里很有必要了解一下根植于趙先生思維里的“慢動作”。
第一點:如上文所述的一樣,“無假設,不檢驗”,趙先生做了什么樣的假設(Hypothesis)?
由于趙先生想要知道兩個公司的銷售額是否有存在明顯的差異 ,所以他的假設就是“樣本集Z(鄭州分公司)和樣本集H(杭州分公司)不存在顯著性差異,換言之這兩個集合沒有任何區別(銷售額間沒有區別)!”這就是趙先生的假設。那么問題來了,為什么趙先生要假設這兩個樣本集之間不存在任何區別,而不是假設這兩個樣本集存在區別。因為這個假設(Hypothesis)正是方差檢驗的原假設(null hypothesis)。那么問題又來了,什么是原假設。所謂原假設是數學界為了方便討論而默認的“原始的假設”。沒有什么為甚么可言,約定俗成罷了。
第二點:p值怎么回事?
這里并不用管p值是怎樣得到的,直接給出結論。在顯著性水平α =0.05的情況下,p>0.05接受原假設,p值<0.05拒絕原假設。我們的原假設是樣本集Z和樣本集H間不存在顯著性差異,但是由于p=0.2027>0.05,所以接受原假設,即樣本集Z和樣本集H間不存在顯著性差異。當然有接受就有拒接,如果這里的p值小于0.05,那么就要拒絕原假設,即集合Z和集合H間存在顯著性差異。
第三點:怎么做方差檢驗以及為何做方差檢驗之后再細講,這里暫且不表。
在這一章節的最后,給出本章的兩個問題的答案,相信你現在已經可以理解:
1什么是統計假設檢驗?
所謂統計假設檢驗就是事先對總體(隨機變量)的參數或總體分布形式做出一個假設,然后利用樣本信息來判斷這個假設是否合理。而把只限定第一類錯誤概率的統計假設檢驗就稱之為顯著性檢驗。在上例中,我們的假設就是一種顯著性檢驗。因為方差檢驗不適用于估計參數和估計總體分布,而是用于檢驗試驗的兩個組間是否有差異。而方差檢驗正是用于檢測我們所關心的是這兩個集合(兩個分布)的均值是否存在差異。
2.為什么要做顯著性檢驗?
因為我們想要判斷樣本與我們對總體所做的假設之間的差異是純屬機會變異,還是由我們所做的假設與總體真實情況之間不一致所引起的。 在我們的例子中,差異就是H的均值要高于Z的均值,但是最終的結論p>0.05證明,這個差異純屬機會變異(H均值>Z均值是偶然的,當H和Z的采樣點數趨于無窮多時,H的均值會趨近等于Z的均值)而不是假設與真實情況不一致。如果p值<0.05,那么也就意味著我們的假設(H集合和Z集合沒差別)與真實情況不一致,這就使得假設不成立,即H集合和Z集合有差別。
二:怎么做顯著性檢驗?(基于MATLAB)
顯著性檢驗可以分為參數檢驗和非參數檢驗。參數檢驗要求樣本來源于正態總體(服從正態分布),且這些正態總體擁有相同的方差,在這樣的基本假定(正態性假定和方差齊性假定)下檢驗各總體均值是否相等,屬于參數檢驗。
當數據不滿足正態性和方差齊性假定時,參數檢驗可能會給出錯誤的答案,此時應采用基于秩的非參數檢驗。
參數檢驗的方法及其相應知識點的解釋(這里只給出參數檢驗中常見的方差分析):
方差分析主要分為’①單因素一元方差分析’; ‘②雙因素一元方差分析 ‘; ‘③多因素一元方差分析 ‘; ‘④單因素多元方差分析 ‘。下面一節對各種方差分析的實現方法進行介紹。但在介紹之前,我要首先“劇透”一下兩個重要的點,理解這些點有助于區別不同類型的方差分析。
什么叫做因素,什么叫做元?
先解釋一下什么叫做”元”。我假定正在看這篇博文的人一定具有小學以上文化水平,那么想必你一定對“一元二次方程”“二元一次方程”“多元一次方程”這種概念不陌生。所謂的“元”,正是指未知變量的個數。在統計假設檢驗中,仍然把待檢驗的未知變量稱之為“元”而把影響未知變量的行為(事件)稱之為“因素”。有過機器學習基礎的同學可以把“元”和“因素”分別理解成機器學習中的“特征個數”和“標簽個數”。擁有多個特征便是“多元”,而擁有多個標簽便是“多因素”。
①單因素一元方差分析的方法和案例:
相關MATLAB函數:
函數一:anova1( X, Group, displayopt)
參數解釋:在第一種用法中,X是一個n行1列的數組,Group也是一個n行1列的數組。X為待檢驗的樣本集,這個樣本集中包括若干個對照組和實驗組的全部數據。那么機器怎么知道哪個數據屬于哪個組呢?很簡單,通過Group這個列向量一一對應指明即可。一下這個例子來自于MATLAB的help文檔,在這里用于實例說明:
假定現在有三組數據
組一(st):82 86 79 83 84 85 86 87
組二(al1):74 82 78 75 76 77
組三(al2):79 79 77 78 82 79
現在需要對這三組數據做方差檢驗,使用anova1函數的方法如下
1.首先將所有的數據放在同一個數組strength中:
strength = [82 86 79 83 84 85 86 87 74 82 78 75 76 77 79 79 77 78 82 79];
2.設置對應與strength對應位置的標簽為alloy:
alloy = {‘st’,’st’,’st’,’st’,’st’,’st’,’st’,’st’,’al1’,’al1’,’al1’,’al1’,’al1’,’al1’,’al2’,’al2’,’al2’,’al2’,’al2’,’al2’};
3.調用anova1函數
p = anova1(strength,alloy)
最終得到的結果會是一個數值和兩幅圖,一個值是p值。p值得看法在上文已經介紹過,這里不再細細的介紹。在本例中,p的值如下
p =
1.5264e-004
顯然,從p值看,三組值之間存在顯著性差異。有一點必須提一下:這里p存在顯著性差異并不意味著三組之間兩兩都存在顯著性差異,而只是說明顯著性差異在這三組之間存在。
第一幅圖是一張表,這張表被稱之為ANOVA表。相信許多非統計專業的同學見到ANOVA表的一瞬間是崩潰的,一堆問題奔涌而出:
Source是什么鬼?SS是什么鬼,df是什么鬼,MS是什么鬼,F是什么鬼,Prob>F是什么鬼,etc.
這里為了解決“什么鬼”的問題,對這張表給出詳細的解釋:
Source表示方差來源(誰的方差),這里的方差來源包括Groups(組間),Error(組內),Total(總計);
SS(Sum of squares)表示平方和
df(Degree of freedom)表示自由度
MS(Mean squares)表示均方差
F表示F值(F統計量),F值等于組間均方和組內均方的比值,它反映的是隨機誤差作用的大小。
Prob>F表示p值
這里需要引出兩個小問題:第一個小問題是F值怎么使用,第二個小問題是p值和F值的關系是什么?
率先普及一下p值和F值之間的關系:
F實際值>F查表值,則p<=0.05
F實際值
總結
以上是生活随笔為你收集整理的转载: 关于显著性检验,你想要的都在这儿了!!(基础篇)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: taylor+swift纽约公寓_国际巨
- 下一篇: oracle十进制函数语法,Oracle