统计推断——假设检验——方差分析之多重比较(LSD法、Sidak法、Bonferroni法、Dunnett法、Tukey法、SNK 法、Duncan法)「建议收藏」
在一個試驗中,有個處理平均數間比較時,其全部可能的相互比較對數有個,這種比較是復式比較,亦稱多重比較(multiple comparisons)。
為什么要做多重比較呢?
方差分析后做多重比較有很多好處:
- 誤差由多個處理內的變異合并估計,自由度增大了,因而比較的精確度也增大了。
- 檢驗顯著,說明可以判定多個處理間存在顯著的變異。因此方差分析后再做多重比較,稱為Fisher氏保護性多重比較(Fisher’s protected multiple comparisons)。
- 如果有多個比較,不做F檢驗的情況下,很有可能有更多的比較是顯著的;做了F檢驗以后,顯著的平均數比較會相應減少。
- 顯然,在無檢驗保護時,設有4個處理(),需要做6個比較,若各個處理間總體上并無差異,每一比較誤判為有差異的概率為0.05,則6個比較中至少有1個被誤判的概率為。
多重比較有多重方法,本次依次介紹LSD法、Sidak法、Bonferroni法、Dunnett法、Tukey法、SNK 法、Duncan法等。
LSD法
LSD法全稱least significance difference,即最小顯著差異法。由Fisher最先提出,本質上是一種t檢驗。通常用于1對或者幾對專業上有特殊意義的樣本均數間的比較。
為了更好的理解LSD法的計算原理,我們首先回顧兩獨立樣本檢驗的:
其中是兩個樣本的聯合估計的方差(滿足樣本方差齊的前提下),本質就是組內誤差的均方,該統計量服從自由度為的分布。
與上述類似,LSD法也進行的是兩兩比較的t檢驗。所不同的是,在滿足方差齊性的前提下,LSD法采用所有樣本的聯合方差來估計均數差的標準誤,而不是要比較的兩個樣本的聯合方差。以三樣本之間均數差異比較為例,其公式為
LSD法往往計算最小顯著差異,即
當兩組均數差大于LSD時,說明差異達到顯著的水平,也就可以拒絕零假設,認為兩組均數不相等。需要注意的是,LSD法單次比較的檢驗水準仍然為。LSD法檢驗的靈敏度最高,但是會因為對比的頻數增加使得第一類型錯誤概率增加。為解決該問題,便出現了Sidak法和Bonferroni法。
Sidak法
Sidak法的也是一種t檢驗,計算公式和LSD法的相同。但是Sidak法對進行了調整。其調整方法如下:如果有組,對組進行兩兩比較的次數為
那么做完c次比較,累積犯一類錯誤的概率為:
令上面的公式值等于0.05,由此可以反推出調整后的? 。例如進行6次事后比較,則Sidak法的?=0.0085,以作為單次比較的顯著性水平,顯然變小了。由于?減小,結論趨于接受無效假設,因此該方法要比LSD法保守的多。
Bonferroni法
Bonferroni法與Sidak法類似,同樣是在LSD法的基礎上對進行了調整。其調整方法基于Bonferroni不等式。若有組,其計算公式為
一般認為Bonferroni法是最為保守的,仍然以上面例子來說明。若進行6次比較,則Bonferroni法的調整?=0.0083,比上面的sidak法還要小。事實上,當比較的次數不多時,該方法效果比較好,當比較次數較多時(如>10),該方法對?的調整有些矯枉過正,效果不如Sidak法。
Dunnett法
Dunnett法檢驗統計量為?,故又稱為Dunnett-t檢驗,實際上該方法的計算與LSD法相同,但是LSD法臨界值表基于分布,而該方法有特殊的臨界值表 ,通常用于多個實驗組和一個對照組均數的比較。
Tukey法
在介紹Tukey方法前,首先了解學生化極差分布。
在概率論和統計學中,學生化極差分布是極差的抽樣分布。該分布是一種連續型概率分布,用于在樣本量較小且總體標準差未知的情況下估計正態分布總體的極差。
假設要比較的組數為,那么在零假設成立的條件下,下面的隨機變量服從學生化極差分布。
公式中分子分別是最大和最小樣本的均值,?是所有樣本的聯合方差,為每個樣本的樣本含量。該統計量有兩個自由度,分別為和。
Turkey的HSD (Honestly significant difference)是基于學生化極差的成對比較。其思想和LSD方法類似,通過計算HSD統計量,如果兩組均數的差異大于該極差,認為差異是顯著的,因此拒絕零假設,認為兩組均數不同。計算臨界HSD的公式為
為組數,為聯合方差的自由度,即,為每個樣本的樣本含量。從HSD公式上看,Tukey法較LSD法保守,即較LSD不易發現顯著差異。Tukey法要求比較的樣本容量相差不大,一般用于樣本容量相同的組之間均數的比較。
SNK 法
SNK法全稱Newman–Keuls或者Student–Newman–Keuls,屬于復極差法(multiple range test),也稱為q檢驗。該方法是對Tukey法的修正,也用的是學生化極差統計量。但是與Tukey法所不同的是,該方法在計算臨界值時考慮了兩樣本均數排序的步長。因而不同步長的兩個樣本均數的比較使用不同的q臨界值。
例如比較三個樣本均數,樣本均數從小到大排列后,如果比較最大均數和最小均數的差異,兩者的步長為3(此時計算的臨界值等于HSD),若比較最小均數和第二個均數,步長為2。根據步長和自由度查q臨界值表,計算相應的q臨界值,即最小顯著極差,進而判斷均數差異的顯著性。
或
為組間步長,其他字母含義同Tukey法。可以發現Tukey法不管要比較的均數相差幾步都使用相同(且為最大)的臨界值,而SNK法則考慮了步長,并且隨著步長的減小,?也在減小,因而SNK法較Tukey法靈敏(更容易發現顯著差異)。另外,對所有>2,均有<img onload="Wpfcll.r(this,true);" src="https://javaforall.cn/wp-content/plugins/wp-fastest-cache-premium/pro/images/blank.gif" data-wpfc-original-src="https://private.codecogs.com/gif.latex" title="" alt="LSD?,因而SNK法又不及LSD法靈敏。
Duncan法
SNK法不同步長下的最小顯著極差變幅大,雖然減小了犯Ⅰ類錯誤的概率,但是同時增加了犯Ⅱ類錯誤的概率。
Duncan法的全稱為Duncan’s new multiple range test (MRT),也稱為新復極差法。該方法是對SNK法的修正,但是提高了一類錯誤概率,降低了二類錯誤的概率,通常用于農業研究。該方法與SNK法相似,區別在于計算最小顯著極差時,不是查q表,而是查SSR表,所得最小顯著極差值隨著k增大通常比SNK檢驗的小。
總結
以上是生活随笔為你收集整理的统计推断——假设检验——方差分析之多重比较(LSD法、Sidak法、Bonferroni法、Dunnett法、Tukey法、SNK 法、Duncan法)「建议收藏」的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CBA Opportunity Fior
- 下一篇: where does ZCRM_OPPO