UA MATH571B 试验设计II 简单试验的分析方法
UA MATH571B 試驗設計II 簡單試驗的分析方法
- Type I Error與Type II Error
- 單正態總體樣本的假設檢驗
- Z檢驗
- t檢驗
- 雙正態總體樣本的假設檢驗
- Z檢驗
- t檢驗
- 同方差
- 異方差
- 配對t檢驗
Type I Error與Type II Error
這里用一個簡單的例子說明這兩種錯誤。尿白蛋白與肌酐比值(Urinary Albumin to Creatinine Ratio,ACR)是腎臟化驗的一個化驗項,正常范圍是小于3。這個指標用來衡量尿液中的蛋白質數量,如果腎臟發生病變從血液漏入尿液中的蛋白質就會超出正常范圍。假設患有腎病的個體ACR為Y1Y_1Y1?,未患腎病的個體ACR為Y0Y_0Y0?,其中Y1Y_1Y1?的概率密度為f(y,θ1)f(y,\theta_1)f(y,θ1?),Y0Y_0Y0?的概率密度為f(y,θ0)f(y,\theta_0)f(y,θ0?)。人群中患腎病的個體占比為π\piπ,未患腎病的個體占比為1?π1-\pi1?π,則人群ACR記為YYY,其分布為
f(y)=πf(y,θ1)+(1?π)f(y,θ0)f(y) = \pi f(y,\theta_1) + (1-\pi)f(y,\theta_0) f(y)=πf(y,θ1?)+(1?π)f(y,θ0?)
記其均值為μ\muμ,則ACR檢驗的經驗法則可以用單側檢驗表示
H0:μ<μ0Ha:μ≥μ0H_0:\mu < \mu_0 \\H_a:\mu \ge \mu_0 H0?:μ<μ0?Ha?:μ≥μ0?
其中μ0=3\mu_0=3μ0?=3。現在分析一下這個檢驗。在假設檢驗中,Type I Error(也叫false positive rate,假陽性)是
α=P[rejectH0∣H0istrue]\alpha = P[reject\ H_0|H_0\ is\ true] α=P[reject?H0?∣H0??is?true]
Type II Error(也叫false negative rate,假陰性)是
β=P[acceptH0∣Haistrue]\beta = P[accept\ H_0|H_a\ is\ true] β=P[accept?H0?∣Ha??is?true]
檢驗的勢被定義為
Power=1?β=P[rejectH0∣H1istrue]Power = 1-\beta = P[reject\ H_0|H_1\ is\ true] Power=1?β=P[reject?H0?∣H1??is?true]
在這個例子中,Type I Error就是未患腎病的個體被醫生認為患有腎病,Type II Error就是患有腎病的個體被醫生認為未患腎病。計算一下這兩類錯誤發生的概率以及檢驗的勢
α=∫μ0+∞f(y,θ0)dyβ=∫0μ0f(y,θ1)dyPower=1?β=∫μ0+∞f(y,θ1)dy\alpha = \int_{\mu_0}^{+\infty} f(y,\theta_0)dy \\ \beta = \int_{0}^{\mu_0} f(y,\theta_1)dy \\ Power = 1-\beta = \int_{\mu_0}^{+\infty} f(y,\theta_1)dy α=∫μ0?+∞?f(y,θ0?)dyβ=∫0μ0??f(y,θ1?)dyPower=1?β=∫μ0?+∞?f(y,θ1?)dy
其中
?αμ0=?f(y,θ0)<0,?βμ0=f(y,θ1)>0\frac{\partial \alpha}{\mu_0} = -f(y,\theta_0)<0, \frac{\partial \beta}{\mu_0}=f(y,\theta_1)>0 μ0??α?=?f(y,θ0?)<0,μ0??β?=f(y,θ1?)>0
因此隨著判斷準則在(0,+∞)(0,+\infty)(0,+∞)之間增加的時候,假陽性的概率會逐漸減小,假陰性的概率會逐漸增大,二者總是此消彼長的。假設檢驗的目標一般是在給定的α\alphaα的情況下,找到最優的critical region最大化檢驗的勢。
單正態總體樣本的假設檢驗
f(y,θ0)f(y,\theta_0)f(y,θ0?)與f(y,θ1)f(y,\theta_1)f(y,θ1?)正態分布,假設前者均值為μ0\mu_0μ0?、標準差為σ0\sigma_0σ0?,為了驗證ACR的正常范圍是小于3這個判斷標準是否合理,現在從f(y,θ0)f(y,\theta_0)f(y,θ0?)中隨機抽取了12個個體,測得其ACR為
| 1.1 | 1.7 | 1.9 | 2.0 | 2.0 | 2.1 | 2.2 | 2.7 | 2.9 | 3.2 | 3.3 | 3.8 |
假設未患腎病群體ACR均值用μ0\mu_0μ0?表示,假設檢驗為
H0:μ0=3Ha:μ0<3H_0:\mu_0 = 3 \\ H_a:\mu_0 < 3 H0?:μ0?=3Ha?:μ0?<3
假設未患腎病群體ACR的簡單隨機樣本為{X1,?,Xn}\{X_1,\cdots,X_n\}{X1?,?,Xn?},則樣本均值Xˉ\bar{X}Xˉ是μ0\mu_0μ0?的UMVUE。
Z檢驗
假設單正態總體σ0\sigma_0σ0?已知,要檢驗均值是否等于一個已知量ccc,可以使用Z檢驗。假設檢驗水平為α\alphaα(這個α\alphaα就是假陽性的概率)
Z?Xˉ?cσ0/n~N(0,1)Z \triangleq \frac{\bar{X}-c}{\sigma_0/\sqrt{n}} \sim N(0,1) Z?σ0?/n?Xˉ?c?~N(0,1)
雙邊檢驗
H0:μ0=cHa:μ0≠cH_0:\mu_0 = c \\ H_a:\mu_0 \ne c H0?:μ0?=cHa?:μ0??=c
原假設的拒絕域為
∣Z∣≥Zα/2?Xˉ∈(?∞,c?σ0nZα/2]∩[c+σ0nZα/2,∞)|Z| \ge Z_{\alpha/2} \Rightarrow \bar{X} \in(-\infty,c-\frac{\sigma_0}{\sqrt{n}}Z_{\alpha/2}] \cap [ c+\frac{\sigma_0}{\sqrt{n}}Z_{\alpha/2},\infty) ∣Z∣≥Zα/2??Xˉ∈(?∞,c?n?σ0??Zα/2?]∩[c+n?σ0??Zα/2?,∞)
P值為
p=2[1?Φ(∣Z∣)]p = 2[1-\Phi(|Z|)] p=2[1?Φ(∣Z∣)]
單邊檢驗分為左側檢驗和右側檢驗,左側檢驗為
H0:μ0≥cHa:μ0<cH_0:\mu_0 \ge c \\ H_a:\mu_0 < c H0?:μ0?≥cHa?:μ0?<c
原假設的拒絕域為
Z<?Zα?Xˉ∈(?∞,c?σ0nZα)Z < -Z_{\alpha} \Rightarrow \bar{X} \in(-\infty,c-\frac{\sigma_0}{\sqrt{n}}Z_{\alpha}) Z<?Zα??Xˉ∈(?∞,c?n?σ0??Zα?)
P值為
p=Φ(Z)p = \Phi(Z) p=Φ(Z)
右側檢驗為
H0:μ0≤cHa:μ0>cH_0:\mu_0 \le c \\ H_a:\mu_0 > c H0?:μ0?≤cHa?:μ0?>c
原假設的拒絕域為
Z>Zα?Xˉ∈(c+σ0nZα,∞)Z > Z_{\alpha} \Rightarrow \bar{X} \in (c+\frac{\sigma_0}{\sqrt{n}}Z_{\alpha},\infty) Z>Zα??Xˉ∈(c+n?σ0??Zα?,∞)
P值為
p=1?Φ(Z)p = 1-\Phi(Z) p=1?Φ(Z)
需要注意的是,往往這個σ0\sigma_0σ0?是一個猜測值或者經驗值,所以我們也需要檢驗一下真實的標準差是不是這個
H0:Var(X)=σ02Ha:Var(X)≠σ02H_0:Var(X) = \sigma^2_0 \\ H_a : Var(X) \ne \sigma^2_0 H0?:Var(X)=σ02?Ha?:Var(X)?=σ02?
用樣本方差S2S^2S2構造Chi統計量
χ02=(n?1)S2σ02~χ2(n?1)\chi^2_0 = \frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1) χ02?=σ02?(n?1)S2?~χ2(n?1)
假設檢驗水平為α\alphaα,原假設的拒絕域為
χ02∈[0,χ2(α/2,n?1)]∩[χ2(1?α/2,n?1),∞)\chi^2_0 \in [0,\chi^2(\alpha/2,n-1) ] \cap [\chi^2(1-\alpha/2,n-1),\infty) χ02?∈[0,χ2(α/2,n?1)]∩[χ2(1?α/2,n?1),∞)
t檢驗
假設單正態總體σ0\sigma_0σ0?未知,要檢驗均值是否等于一個已知量ccc,可以使用t檢驗。假設檢驗水平為α\alphaα
T?Xˉ?cS/n~t(n?1)T \triangleq \frac{\bar{X}-c}{S/\sqrt{n}} \sim t(n-1) T?S/n?Xˉ?c?~t(n?1)
雙邊檢驗
H0:μ0=cHa:μ0≠cH_0:\mu_0 = c \\ H_a:\mu_0 \ne c H0?:μ0?=cHa?:μ0??=c
原假設的拒絕域為
∣T∣≥tα/2,n?1?Xˉ∈(?∞,c?Sntα/2,n?1]∩[c+Sntα/2,n?1,∞)|T| \ge t_{\alpha/2,n-1} \Rightarrow \bar{X} \in(-\infty,c-\frac{S}{\sqrt{n}}t_{\alpha/2,n-1}] \cap [ c+\frac{S}{\sqrt{n}}t_{\alpha/2,n-1},\infty) ∣T∣≥tα/2,n?1??Xˉ∈(?∞,c?n?S?tα/2,n?1?]∩[c+n?S?tα/2,n?1?,∞)
單邊檢驗分為左側檢驗和右側檢驗,左側檢驗為
H0:μ0≥cHa:μ0<cH_0:\mu_0 \ge c \\ H_a:\mu_0 < c H0?:μ0?≥cHa?:μ0?<c
原假設的拒絕域為
T<?tα,n?1?Xˉ∈(?∞,c?Sntα,n?1)T < - t_{\alpha,n-1} \Rightarrow \bar{X} \in(-\infty,c-\frac{S}{\sqrt{n}} t_{\alpha,n-1} ) T<?tα,n?1??Xˉ∈(?∞,c?n?S?tα,n?1?)
右側檢驗為
H0:μ0≤cHa:μ0>cH_0:\mu_0 \le c \\ H_a:\mu_0 > c H0?:μ0?≤cHa?:μ0?>c
原假設的拒絕域為
T>tα,n?1?Xˉ∈(c+Sntα,n?1,∞)T > t_{\alpha,n-1} \Rightarrow \bar{X} \in (c+\frac{S}{\sqrt{n}} t_{\alpha,n-1} ,\infty) T>tα,n?1??Xˉ∈(c+n?S?tα,n?1?,∞)
雙正態總體樣本的假設檢驗
假設數據生成過程(DGP,data generating process)是
yij=μi+?ij,?ij~iidN(0,σ2),i=1,2;j=1,?,ny_{ij} = \mu_i + \epsilon_{ij},\epsilon_{ij} \sim_{iid}N(0,\sigma^2),i=1,2;j=1,\cdots,n yij?=μi?+?ij?,?ij?~iid?N(0,σ2),i=1,2;j=1,?,n
yijy_{ij}yij?是第iii組試驗的第jjj個試驗單位的response的值,這個模型認為這個值由兩部分組成,一部分是第iii組試驗的組內平均μi\mu_iμi?,另一部分是隨機誤差?ij\epsilon_{ij}?ij?。兩正態總體樣本的假設檢驗想研究的問題其實是μ1\mu_1μ1?與μ2\mu_2μ2?的大小關系,從而比較兩種不同的試驗處理對response的影響。對于比較一般的情況,假設第一組試驗的方差為σ12\sigma_1^2σ12?,試驗單位數目為n1n_1n1?;第一組試驗的方差為σ22\sigma_2^2σ22?,試驗單位數目為n2n_2n2?。
Z檢驗
當σ1\sigma_1σ1?與σ2\sigma_2σ2?已知時,可以用Z檢驗。
雙邊檢驗:
H0:μ1=μ2Ha:μ1≠μ2H_0:\mu_1=\mu_2 \\ H_a: \mu_1 \ne \mu_2 H0?:μ1?=μ2?Ha?:μ1??=μ2?
構造Z統計量
Z=yˉ1?yˉ1σ12n1+σ22n2~N(0,1)Z = \frac{\bar{y}_1-\bar{y}_1}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1) Z=n1?σ12??+n2?σ22???yˉ?1??yˉ?1??~N(0,1)
原假設的拒絕域為
∣Z∣≥Zα/2|Z| \ge Z_{\alpha/2} ∣Z∣≥Zα/2?
P值為
p=2[1?Φ(∣Z∣)]p = 2[1-\Phi(|Z|)] p=2[1?Φ(∣Z∣)]
單側檢驗與單樣本的類似。
t檢驗
當σ1\sigma_1σ1?與σ2\sigma_2σ2?未知時,可以用t檢驗。考慮雙邊檢驗:
同方差
如果σ1=σ2\sigma_1=\sigma_2σ1?=σ2?,t統計量為
T=yˉ1?yˉ1S12n1+S22n2~t(v)v=n1+n2?2T = \frac{\bar{y}_1-\bar{y}_1}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}} \sim t(v) \\ v = n_1 + n_2 -2 T=n1?S12??+n2?S22???yˉ?1??yˉ?1??~t(v)v=n1?+n2??2
但如果不確定同方差是不是真的成立需要做同方差檢驗
H0:σ12=σ22H_0:\sigma_1^2 = \sigma_2^2 H0?:σ12?=σ22?
這個可以用F檢驗,構造F統計量
F0=S12S22~F(n1?1,n2?1)F_0 = \frac{S_1^2}{S_2^2} \sim F(n_1-1,n_2-1) F0?=S22?S12??~F(n1??1,n2??1)
原假設的拒絕域為
F0∈[0,F(α/2,n1?1,n2?1)]∩[F(1?α/2,n1?1,n2?1),∞)F_0 \in [0,F(\alpha/2,n_1-1,n_2-1) ] \cap [F(1-\alpha/2,n_1-1,n_2-1),\infty) F0?∈[0,F(α/2,n1??1,n2??1)]∩[F(1?α/2,n1??1,n2??1),∞)
異方差
如果上面的檢驗拒絕了原假設,還是可以用t檢驗,只是自由度的計算要改成
v=(S12n1+S22n2)2(S12n1)2n1?1+(S22n2)2n2?1v = \frac{(\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2})^2}{\frac{(\frac{S_1^2}{n_1})^2}{n_1-1} + \frac{(\frac{S_2^2}{n_2})^2}{n_2-1}} v=n1??1(n1?S12??)2?+n2??1(n2?S22??)2?(n1?S12??+n2?S22??)2?
配對t檢驗
配對t檢驗(paired t test)與兩樣本的t檢驗有區別。配對t檢驗是處理配對比較試驗(paired comparison)的統計方法。舉一個比較簡單的配對比較試驗的例子。某桑拿房宣稱自家定制桑拿配合自創按摩服務可以治療高血脂。某公眾號團隊為了驗證這家桑拿房的說法,隨機選擇了2n2n2n個人。測量并記錄其初始的血清總膽固醇(TC),并將TC相近的分為一對,記其TC均值為{βi}i=1n\{\beta_i\}_{i=1}^n{βi?}i=1n?。在每一對中隨機抽一人去體驗這家桑拿房定制桑拿配合自創按摩服務,另一個人去普通的桑拿房。體驗完畢后測血清總膽固醇為{(y1i,y2i)}i=1n\{(y_{1i},y_{2i})\}_{i=1}^n{(y1i?,y2i?)}i=1n?,其中111是去體驗定制桑拿配合自創按摩服務那一組。則建立體驗完畢后TC的統計模型
yij=μi+βj+?ij?ij~iidN(0,σi2);i=1,2;j=1,?,ny_{ij} = \mu_{i} + \beta_{j} + \epsilon_{ij}\\ \epsilon_{ij}\sim_{iid}N(0,\sigma_i^2);i=1,2;j=1,\cdots,n yij?=μi?+βj?+?ij??ij?~iid?N(0,σi2?);i=1,2;j=1,?,n
則我們要研究的問題可以寫成假設檢驗
H0:μ1<μ2Ha:μ1≥μ2H_0:\mu_1 < \mu_2 \\ H_a: \mu_1 \ge \mu_2 H0?:μ1?<μ2?Ha?:μ1?≥μ2?
從統計模型上來看配對t檢驗和兩樣本t檢驗就是有明顯差別的,配對t檢驗一般用來處理成對數據的問題。記dj=y1j?y2j=μ1?μ2+(?1j??2j)d_j = y_{1j}-y_{2j} = \mu_1 - \mu_2 + (\epsilon_{1j}-\epsilon_{2j})dj?=y1j??y2j?=μ1??μ2?+(?1j???2j?),定義μd=μ1?μ2\mu_d = \mu_1 - \mu_2μd?=μ1??μ2?,則假設檢驗又可以寫成
H0:μd<0Ha:μd≥0H_0:\mu_d<0 \\ H_a: \mu_d \ge 0 H0?:μd?<0Ha?:μd?≥0
由于djd_jdj?是服從正態分布的,所以這個假設檢驗可以用單正態總體樣本的t檢驗來做。
總結
以上是生活随笔為你收集整理的UA MATH571B 试验设计II 简单试验的分析方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH571B 试验设计III
- 下一篇: UA MATH575B 数值分析下I 梯