UA MATH571B 试验设计III 单因素试验设计2
UA MATH571B 試驗設計III 單因素試驗設計2
- 非平衡試驗
- 驗證單因素ANOVA的假設
- 殘差圖
- 正態性
- Kolmogorov-Smirnov檢驗
- Cramer-von Mises檢驗
- Anderson-Darling檢驗
- 同方差
- Bartlett檢驗
- 修正的Levene檢驗
- 不滿足假設的補救措施
- Box-Cox變換
- Kruskal-Wallis檢驗
非平衡試驗
上一講提到單因素ANOVA的模型是
yij=μ+τi+?ij,?ij~iidN(0,σ2)i=1,2,?,a;j=1,2,?,ny_{ij} = \mu + \tau_i + \epsilon_{ij},\epsilon_{ij}\sim_{iid}N(0,\sigma^2)\\ i = 1,2,\cdots,a; j=1,2,\cdots,n yij?=μ+τi?+?ij?,?ij?~iid?N(0,σ2)i=1,2,?,a;j=1,2,?,n
因為每一個實驗組和對照組的試驗單位數量一樣,都是nnn,這種試驗叫平衡試驗(balanced experiment)。如果不同實驗組和對照組的試驗單位數目不一致,這種試驗叫做非平衡試驗(unbalanced experiment)。對于非平衡試驗,假設第iii中treatment的試驗單位數目為nin_ini?,則
試驗單位總數是
N=a∑i=1aniN = a\sum_{i=1}^a n_i N=ai=1∑a?ni?
平方和的計算稍微修改一下,但分解不變
SST=∑i=1a∑j=1ni(yij?yˉ..)2SSE=∑i=1a∑j=1nieij2SSM=∑i=1aniτ^i2SST=SSM+SSESST = \sum_{i=1}^a \sum_{j=1}^{n_i} (y_{ij}-\bar{y}_{..})^2 \\ SSE = \sum_{i=1}^a\sum_{j=1}^{n_i} e_{ij}^2 \\ SSM=\sum_{i=1}^a n_i\hat{\tau}_{i}^2 \\ SST = SSM + SSE SST=i=1∑a?j=1∑ni??(yij??yˉ?..?)2SSE=i=1∑a?j=1∑ni??eij2?SSM=i=1∑a?ni?τ^i2?SST=SSM+SSE
基于這個分解的ANOVA F檢驗不變。
驗證單因素ANOVA的假設
單因素ANOVA主要有三條重要假設:殘差相互獨立,殘差具有同方差性以及殘差服從正態分布。前兩者可以從殘差圖中觀察判斷,關于比較重要的同方差與正態性有相關的檢驗。
殘差圖
殘差圖一共有四種,殘差關于擬合值的圖、殘差關于下標的圖、殘差關于某個factor的圖、QQ圖。QQ圖的原理在回歸那個系列的文章解釋得比較清楚,這里就不解釋了,它是用來判斷正態性是否成立的。殘差關于擬合值的圖用來判斷同方差是否成立,如果隨著擬合值變換殘差分布的范圍發生明顯變化時,同方差假設就可能不成立。殘差關于下標的圖用來判斷獨立性,如果殘差關于指標有明顯的分布規律,那么獨立性就不成立。同樣的,如果殘差關于某個factor有明顯分布規律,就說明這個factor對response也會產生影響,需要重新設計試驗控制這個factor。
正態性
檢驗正態分布有四種常用的方法,Shapiro-Wilk檢驗、Kolmogorov-Smirnov檢驗、Cramer-von Mises檢驗、Anderson-Darling檢驗。Shapiro-Wilk檢驗在回歸那個系列就介紹過了,這里介紹后三種檢驗。
Kolmogorov-Smirnov檢驗
這個檢驗的思想是判斷殘差的經驗分布與正態分布之間的距離有多大,如果距離小于某個判別值就認定是正態分布。首先計算殘差的經驗分布函數
FN(x)=1N∑i=1a∑j=1niI(?∞,x](eij)F_N(x) = \frac{1}{N} \sum_{i=1}^a \sum_{j=1}^{n_i} I_{(-\infty,x]}(e_{ij}) FN?(x)=N1?i=1∑a?j=1∑ni??I(?∞,x]?(eij?)
定義
DN=sup?x∣FN(x)?F(x)∣D_N = \sup_x |F_N(x)-F(x)| DN?=xsup?∣FN?(x)?F(x)∣
其中F(x)F(x)F(x)是我們想驗證的分布形式,比如這里我們的原假設就是
H0:?~N(0,σ2)H_0:\epsilon \sim N(0,\sigma^2) H0?:?~N(0,σ2)
這就意味著F(x)F(x)F(x)就是N(0,σ2)N(0,\sigma^2)N(0,σ2)的分布函數。根據Glivenko-Cantelli定理,Dn→0a.s.D_n \to 0\ a.s.Dn?→0?a.s.,因此原假設成立DnD_nDn?會足夠小,因為DnD_nDn?服從Kolmogorov分布,所以可以由此構造假設檢驗。但需要注意的是,相比其他檢驗,在相同的檢驗水平下,Kolmogorov-Smirnov檢驗需要更大的樣本量以拒絕原假設,換句話說就是這個檢驗的勢不如Anderson-Darling檢驗和Shapiro-Wilk檢驗。
Cramer-von Mises檢驗
Cramer-von Mises檢驗也是用來判斷經驗分布函數與某種分布之間距離的檢驗方法。定義
w2=∫X[FN(x)?F(x)]2dF(x)w^2 = \int_{\mathcal{X}} [F_N(x)-F(x)]^2 dF(x) w2=∫X?[FN?(x)?F(x)]2dF(x)
將殘差按從小到大的順序排列,假設排列之后為{x1,?,xN}\{x_1,\cdots,x_N\}{x1?,?,xN?},定義統計量
T=Nw2=112N+∑i=1N[2i?12N?F(xi)]T = Nw^2 = \frac{1}{12N} + \sum_{i=1}^N \left[ \frac{2i-1}{2N} - F(x_i) \right] T=Nw2=12N1?+i=1∑N?[2N2i?1??F(xi?)]
這個統計量的判別值需要查表。這個檢驗的原假設與Kolmogorov-Smirnov檢驗一致,可以作為Kolmogorov-Smirnov檢驗的替代。
Anderson-Darling檢驗
Anderson-Darling檢驗比Cramer-von Mises檢驗更具有一般性。統計量定義為
N∫X[FN(x)?F(x)]2w(x)dF(x)N\int_{\mathcal{X}} [F_N(x)-F(x)]^2 w(x)dF(x) N∫X?[FN?(x)?F(x)]2w(x)dF(x)
其中w(x)w(x)w(x)是權重函數,如果取w(x)=1w(x)=1w(x)=1,就是Cramer-von Mises檢驗。通常為了有更大的勢,Anderson-Darling檢驗用這個權重函數
w(x)=1F(x)(1?F(x))w(x) = \frac{1}{F(x)(1-F(x))} w(x)=F(x)(1?F(x))1?
這個檢驗也需要查表找判別值。
同方差
同方差檢驗有兩種常用的方法,Bartlett檢驗、修正的Levene檢驗。
Bartlett檢驗
Bartlett檢驗的原假設是
H0:σ12=?=σa2H_0:\sigma_1^2=\cdots=\sigma_a^2H0?:σ12?=?=σa2?
檢驗的統計量是
χ02=2.3026qc~χ2(a?1)\chi_0^2 = 2.3026\frac{q}{c} \sim \chi^2(a-1) χ02?=2.3026cq?~χ2(a?1)
其中
q=(N?a)lg?Sp2?∑i=1a(ni?1)lg?Si2c=1+13(a?1)(∑i=1a1ni?1?1N?a)q = (N-a)\lg S_p^2 - \sum_{i=1}^a (n_i-1) \lg S_i^2 \\ c = 1+\frac{1}{3(a-1)} \left( \sum_{i=1}^a \frac{1}{n_i-1} - \frac{1}{N-a} \right) q=(N?a)lgSp2??i=1∑a?(ni??1)lgSi2?c=1+3(a?1)1?(i=1∑a?ni??11??N?a1?)
因為要檢驗的是每個treatment group的方差,所以這里用更一般的非平衡的式子來表示的,因為平衡的模型可以看成非平衡的一個特例。其中SiS_iSi?是組內樣本方差
Si2=1ni∑j=1ni(yij?yˉi.)2S_i^2 = \frac{1}{n_i}\sum_{j=1}^{n_i} (y_{ij} - \bar{y}_{i.})^2 Si2?=ni?1?j=1∑ni??(yij??yˉ?i.?)2
SpS_pSp?是pooled sample variance
Sp=∑i=1a(ni?1)Si2N?aS_p = \frac{\sum_{i=1}^a (n_i-1)S_i^2}{N-a} Sp?=N?a∑i=1a?(ni??1)Si2??
修正的Levene檢驗
修正的Levene檢驗和Bartlett檢驗都屬于Levene檢驗。修正的Levene檢驗原假設依然是
H0:σ12=?=σa2H_0:\sigma_1^2=\cdots=\sigma_a^2H0?:σ12?=?=σa2?
但用的是ANOVA的思路。先計算組內中位數
mi=median(yij),i=1,?,am_i = median(y_{ij}),i=1,\cdots,a mi?=median(yij?),i=1,?,a
將所有數值變換為
dij=∣yij?mi∣d_{ij} = |y_{ij} - m_i| dij?=∣yij??mi?∣
用dijd_{ij}dij?作為每組數據方差的代理變量,對其做ANOVA。
不滿足假設的補救措施
Box-Cox變換
如果同方差假設不成立,可以嘗試對response做Box-Cox變換。假設EY=μEY=\muEY=μ,Var(Y)=σ2Var(Y)=\sigma^2Var(Y)=σ2,如果同方差假設不成立,σ2\sigma^2σ2可以寫成μ\muμ的函數:
σ2=g(μ)\sigma^2 = g(\mu)σ2=g(μ)
。如果對response做變換
Y~=f(Y)\tilde{Y} = f(Y) Y~=f(Y)
根據Delta Method(參考概率論那個系列或者統計理論點估計基礎),
Var(Y~)≈[f′(μ)]2σ2=[f′(μ)]2g(μ)Var(\tilde{Y}) \approx [f'(\mu)]^2 \sigma^2 = [f'(\mu)]^2 g(\mu) Var(Y~)≈[f′(μ)]2σ2=[f′(μ)]2g(μ)
如果選擇的變換能使得Var(Y~)Var(\tilde{Y})Var(Y~)與μ\muμ無關,就可以使用這個變換解決異方差的問題。有幾種比較常見的情況:
Poisson型異方差:g(μ)=μg(\mu)=\mug(μ)=μ
假設[f′(μ)]2g(μ)=c[f'(\mu)]^2 g(\mu)=c[f′(μ)]2g(μ)=c,則f′(μ)=cμf'(\mu)=\frac{\sqrt{c}}{\sqrt{\mu}}f′(μ)=μ?c??,忽略積分常數,可以設變換為f(Y)=Yf(Y)=\sqrt{Y}f(Y)=Y?
Bernoulli型異方差:g(μ)=μ(1?μ)g(\mu)=\mu(1-\mu)g(μ)=μ(1?μ)
假設[f′(μ)]2g(μ)=c[f'(\mu)]^2 g(\mu)=c[f′(μ)]2g(μ)=c,則f′(μ)=cμ(1?μ)f'(\mu)=\frac{\sqrt{c}}{\sqrt{\mu(1-\mu)}}f′(μ)=μ(1?μ)?c??,忽略積分常數,可以設變換為f(Y)=arcsin?(x)f(Y)=\arcsin(\sqrt{x})f(Y)=arcsin(x?)
冪函數型異方差:g(μ)=θμβg(\mu)=\theta \mu^{\beta}g(μ)=θμβ
如果β=2\beta=2β=2,則變換應該設為f(Y)=ln?Yf(Y)=\ln Yf(Y)=lnY,如果β=2λ\beta=2\lambdaβ=2λ,可以將變換設為f(Y)=Y1?λf(Y)=Y^{1-\lambda}f(Y)=Y1?λ,這類異方差下的變換叫Box-Cox變換。
Box-Cox變換指數的確定可以用最大似然法,也可以用最小二乘法。不做正式推導的話可以用這個說明來簡單理解一下:
σ2=g(μ)=θμβ?ln?σ2=ln?θ+βln?μ\sigma^2 = g(\mu)=\theta \mu^{\beta} \Rightarrow \ln \sigma^2 = \ln \theta + \beta \ln \mu σ2=g(μ)=θμβ?lnσ2=lnθ+βlnμ
用yˉi.\bar{y}_{i.}yˉ?i.?作為μ\muμ的估計,用Si2S_i^2Si2?作為σ2\sigma^2σ2的估計,則用ln?yˉi.\ln \bar{y}_{i.}lnyˉ?i.?回歸ln?Si2\ln S_i^2lnSi2?可以確定兩個系數。
Kruskal-Wallis檢驗
如果正態假設不成立,可以考慮用非參的Kruskal-Wallis檢驗,這個檢驗的原假設是
H0:alltreatmentsareequalH_0: all\ treatments\ are\ equal H0?:all?treatments?are?equal
首先按從小到大的順序在組內給yijy_{ij}yij?排序,然后將其序號記為RijR_{ij}Rij?,如果是相同的值,比如第二和第三一樣,那他們的序號就是2.5。構造統計量
H=(N?1)∑i=1aRi.2ni?N(N+1)24∑i=1a∑j=1niRij2?N(N+1)24≈χ2(a?1)H = (N-1) \frac{\sum_{i=1}^a \frac{R_{i.}^2}{n_i} - \frac{N(N+1)^2}{4}}{\sum_{i=1}^a \sum_{j=1}^{n_i }R_{ij}^2 - \frac{N(N+1)^2}{4}} \approx \chi^2(a-1) H=(N?1)∑i=1a?∑j=1ni??Rij2??4N(N+1)2?∑i=1a?ni?Ri.2???4N(N+1)2??≈χ2(a?1)
這個檢驗不需要正態假設,所以正態性不成立的時候可以用這個替代ANOVA。
總結
以上是生活随笔為你收集整理的UA MATH571B 试验设计III 单因素试验设计2的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH575B 数值分析下I 梯
- 下一篇: UA MATH571B 试验设计III