UA MATH566 统计理论5 假设检验简介
UA MATH566 統計理論5 假設檢驗簡介
- Neyman-Pearson Lemma
- 一個例子
- 構造拒絕域
- 分析檢驗的勢
- ROC曲線
這一講根據最簡單的一類假設檢驗介紹假設檢驗的思想。假設θ0,θ1∈Θ\theta_0,\theta_1 \in \Thetaθ0?,θ1?∈Θ,原假設和備擇假設是
H0:θ=θ0Ha:θ=θ1H_0:\theta = \theta_0 \\ H_a:\theta = \theta_1 H0?:θ=θ0?Ha?:θ=θ1?
我們需要根據樣本來決定是拒絕原假設或者不能拒絕原假設。假設檢驗有可能出現兩種錯誤,Type I error(假陽性)是在錯誤地拒絕了為真的原假設,Type II error(假陰性)是在原假設非真時沒能拒絕原假設。記α\alphaα為Type I error發生的概率,α\alphaα又叫顯著性水平,則
α=P(rejectH0∣θ=θ0)\alpha = P(reject\ H_0|\theta=\theta_0) α=P(reject?H0?∣θ=θ0?)
記β\betaβ為Type II error發生的概率,
β=P(acceptH0∣θ=θ1)\beta = P(accept\ H_0| \theta=\theta_1) β=P(accept?H0?∣θ=θ1?)
稱1?β1-\beta1?β為檢驗的勢(power)。記樣本為X={X1,?,Xn}X=\{X_1,\cdots,X_n\}X={X1?,?,Xn?},定義critical region,或者說拒絕域為
X∈C?rejectH0X \in C \Leftrightarrow reject\ H_0 X∈C?reject?H0?
記顯著性水平α\alphaα下,most powerful的拒絕域為C?C^*C?,若對所有(顯著性水平α\alphaα下的)拒絕域CCC:
ROC曲線可以比較直觀地比較不同檢驗的power。定義Receiving Operator Curve(ROC)為1?β1-\beta1?β關于α\alphaα的圖像,如果某個檢驗的ROC曲線在其他檢驗的上方,則這個檢驗就有更大的勢。
定義上面那個簡單檢驗的似然比為
λ(X)=sup?{θ=θ0}L(θ∣X)sup?{θ=θ0,θ1}L(θ∣X)=L(θ0∣X)max?{L(θ0∣X),L(θ1∣X)}\lambda(X) = \frac{\sup_{\{\theta=\theta_0\}} L(\theta|X)}{\sup_{\{\theta=\theta_0,\theta_1\}} L(\theta|X)} = \frac{L(\theta_0|X)}{\max\{L(\theta_0|X),L(\theta_1|X)\}} λ(X)=sup{θ=θ0?,θ1?}?L(θ∣X)sup{θ=θ0?}?L(θ∣X)?=max{L(θ0?∣X),L(θ1?∣X)}L(θ0?∣X)?
顯然λ(X)∈[0,1]\lambda(X) \in [0,1]λ(X)∈[0,1],用這個統計量(似然比統計量,這個檢驗叫似然比檢驗)構造拒絕域為
C?={X:λ(X)≤c}C^*=\{X:\lambda(X) \le c\} C?={X:λ(X)≤c}
其中c∈[0,1]c \in [0,1]c∈[0,1],它的選取與顯著性水平相關。這個拒絕域的定義也比較合理,如果原假設的似然相比備擇假設來說非常小的話,我們是應該拒絕原假設的。注意到如果max?{L(θ0∣X),L(θ1∣X)}=L(θ0∣X)\max\{L(\theta_0|X),L(\theta_1|X)\}=L(\theta_0|X)max{L(θ0?∣X),L(θ1?∣X)}=L(θ0?∣X),這個時候λ(X)=1\lambda(X)=1λ(X)=1,顯然不會拒絕原假設,所以對于這個簡單的假設檢驗,一般把拒絕域寫成
C?={X:L(θ0∣X)L(θ1∣X)≤cα}C^*=\{X:\frac{L(\theta_0|X)}{L(\theta_1|X)}\le c_{\alpha}\} C?={X:L(θ1?∣X)L(θ0?∣X)?≤cα?}
Neyman-Pearson Lemma
這個引理告訴我們一個非常簡單有深刻的道理:給定顯著性水平下根據似然比統計量構造的拒絕域是most power的!
證明:
思路是計算β?β?\beta-\beta^*β?β?,并證明其非負。
給定顯著性水平α\alphaα,對任一拒絕域CCC,i=0,1i=0,1i=0,1
P(X∈C∣θ=θi)=P(X∈C∩C?∣θ=θi)+P(X∈C?C?∣θ=θi)P(X∈C?∣θ=θi)=P(X∈C∩C?∣θ=θi)+P(X∈C??C∣θ=θi)P(X \in C|\theta=\theta_i) = P(X \in C\cap C^*|\theta=\theta_i) + P(X \in C\setminus C^*|\theta=\theta_i) \\ P(X \in C^*|\theta=\theta_i) = P(X \in C\cap C^*|\theta=\theta_i) + P(X \in C^*\setminus C|\theta=\theta_i) P(X∈C∣θ=θi?)=P(X∈C∩C?∣θ=θi?)+P(X∈C?C?∣θ=θi?)P(X∈C?∣θ=θi?)=P(X∈C∩C?∣θ=θi?)+P(X∈C??C∣θ=θi?)
首先這兩個拒絕域的顯著性水平是一樣的,即
α=P(X∈C?∣θ0)=P(X∈C∣θ0)\alpha=P(X \in C^*|\theta_0)=P(X \in C|\theta_0)α=P(X∈C?∣θ0?)=P(X∈C∣θ0?)
排除掉兩個拒絕域的并集,那么
P(X∈C??C∣θ0)=P(X∈C?C?∣θ0)P(X \in C^*\setminus C|\theta_0)=P(X \in C\setminus C^*|\theta_0)P(X∈C??C∣θ0?)=P(X∈C?C?∣θ0?)
計算
β?β?=P(X?C∣θ1)?P(X?C?∣θ1)=P(X∈C?∣θ1)?P(X∈C∣θ1)\beta - \beta^* = P(X \notin C|\theta_1) - P(X \notin C^*|\theta_1) \\ = P(X \in C^*|\theta_1) - P(X \in C|\theta_1) β?β?=P(X∈/?C∣θ1?)?P(X∈/?C?∣θ1?)=P(X∈C?∣θ1?)?P(X∈C∣θ1?)
同樣排除掉兩個拒絕域的并集
β?β?=P(X∈C??C∣θ1)?P(X∈C?C?∣θ1)\beta - \beta^* = P(X \in C^*\setminus C|\theta_1) - P(X \in C \setminus C^*|\theta_1) β?β?=P(X∈C??C∣θ1?)?P(X∈C?C?∣θ1?)
根據似然比檢驗的定義
L(θ0∣X)L(θ1∣X)≤cα?L(θ1∣X)≥kαL(θ0∣X),?kα,?X∈C?\frac{L(\theta_0|X)}{L(\theta_1|X)}\le c_{\alpha} \Rightarrow L(\theta_1|X) \ge k_{\alpha}L(\theta_0|X),\exists k_{\alpha},\forall X \in C^* L(θ1?∣X)L(θ0?∣X)?≤cα??L(θ1?∣X)≥kα?L(θ0?∣X),?kα?,?X∈C?
因此
P(X∈C??C∣θ1)=∫C??CL(θ1∣X)dX≥kα∫C??CL(θ0∣X)dX=kαP(X∈C??C∣θ0)P(X \in C^*\setminus C|\theta_1) = \int_{C^*\setminus C} L(\theta_1|X)dX \\ \ge k_{\alpha}\int_{C^*\setminus C} L(\theta_0|X)dX = k_{\alpha}P(X \in C^*\setminus C|\theta_0) P(X∈C??C∣θ1?)=∫C??C?L(θ1?∣X)dX≥kα?∫C??C?L(θ0?∣X)dX=kα?P(X∈C??C∣θ0?)
對于不在C?C^*C?中的XXX,
L(θ1∣X)≤kαL(θ0∣X),?kα,?X?C?L(\theta_1|X) \le k_{\alpha}L(\theta_0|X),\exists k_{\alpha},\forall X \notin C^* L(θ1?∣X)≤kα?L(θ0?∣X),?kα?,?X∈/?C?
因此
P(X∈C?C?∣θ1)=∫C?C?L(θ1∣X)dX≤kα∫C?C?L(θ0∣X)dX=kαP(X∈C?C?∣θ0)P(X \in C\setminus C^*|\theta_1) = \int_{C\setminus C^*} L(\theta_1|X)dX \\ \le k_{\alpha}\int_{C\setminus C^*} L(\theta_0|X)dX = k_{\alpha}P(X \in C\setminus C^*|\theta_0) P(X∈C?C?∣θ1?)=∫C?C??L(θ1?∣X)dX≤kα?∫C?C??L(θ0?∣X)dX=kα?P(X∈C?C?∣θ0?)
將這兩個不等式帶入到β?β?\beta - \beta^*β?β?中,
β?β?≥kα(P(X∈C?C?∣θ0)?P(X∈C?C?∣θ0))=0\beta - \beta^* \ge k_{\alpha} (P(X \in C\setminus C^*|\theta_0)-P(X \in C\setminus C^*|\theta_0))=0 β?β?≥kα?(P(X∈C?C?∣θ0?)?P(X∈C?C?∣θ0?))=0
一個例子
假設總體是正態分布N(μ,σ02)N(\mu,\sigma_0^2)N(μ,σ02?),其中σ0\sigma_0σ0?是已知的。我們猜測均值可能是μ0\mu_0μ0?或者μ1\mu_1μ1?(不失一般性假設μ1<μ0\mu_1 < \mu_0μ1?<μ0?),現在有樣本XXX,我們想要用假設檢驗的思路判斷均值是哪個:
H0:μ=μ0Ha:μ=μ1H_0:\mu = \mu_0 \\ H_a:\mu = \mu_1 H0?:μ=μ0?Ha?:μ=μ1?
構造拒絕域
計算這個假設檢驗的似然比
L(μ0∣X)L(μ1∣X)=(2πσ0)n(2πσ0)n∏i=1nexp?(?(2σ02)?1(Xi?μ0)2)∏i=1nexp?(?(2σ02)?1(Xi?μ1)2)=exp?(?(2σ02)?1∑i=1n[(Xi?μ0)2?(Xi?μ1)2])=exp?(n(2σ02)?1(μ0?μ1)(2Xˉ?μ0?μ1))\frac{L(\mu_0|X)}{L(\mu_1|X)} = \frac{(\sqrt{2\pi}\sigma_0)^n}{(\sqrt{2\pi}\sigma_0)^n} \frac{\prod_{i=1}^n \exp (-(2\sigma^2_0)^{-1}(X_i-\mu_0)^2)}{\prod_{i=1}^n \exp (-(2\sigma^2_0)^{-1}(X_i-\mu_1)^2)} \\ = \exp \left( -(2\sigma^2_0)^{-1} \sum_{i=1}^n [(X_i-\mu_0)^2- (X_i-\mu_1)^2] \right) \\ = \exp \left( n(2\sigma^2_0)^{-1} (\mu_0 - \mu_1)(2 \bar{X}-\mu_0 - \mu_1)\right) L(μ1?∣X)L(μ0?∣X)?=(2π?σ0?)n(2π?σ0?)n?∏i=1n?exp(?(2σ02?)?1(Xi??μ1?)2)∏i=1n?exp(?(2σ02?)?1(Xi??μ0?)2)?=exp(?(2σ02?)?1i=1∑n?[(Xi??μ0?)2?(Xi??μ1?)2])=exp(n(2σ02?)?1(μ0??μ1?)(2Xˉ?μ0??μ1?))
只需要找到一個滿足
α=P(X∈C?∣θ=θ0)\alpha = P(X \in C^*|\theta = \theta_0)α=P(X∈C?∣θ=θ0?)
的常數cαc_{\alpha}cα?就可以寫出似然比檢驗的拒絕域
C?={X:L(μ0∣X)L(μ1∣X)≤cα}C^*=\{X:\frac{L(\mu_0|X)}{L(\mu_1|X)}\le c_{\alpha}\} C?={X:L(μ1?∣X)L(μ0?∣X)?≤cα?}
注意到似然比與Xˉ\bar{X}Xˉ成正比,因此上面定義的拒絕域等價于
C?={X:Xˉ≤xα},?xα,α=P(X∈C?∣θ=θ0)C^*=\{X:\bar{X} \le x_{\alpha}\}, \exists x_{\alpha}, \alpha = P(X \in C^*|\theta = \theta_0) C?={X:Xˉ≤xα?},?xα?,α=P(X∈C?∣θ=θ0?)
因為Xˉ~N(μ,σ02n)\bar{X}\sim N(\mu,\frac{\sigma_0^2}{n})Xˉ~N(μ,nσ02??),對上式做標準化
P(X∈C?∣θ=θ0)=Φ(xα?μ0σ0/n)P(X \in C^*|\theta = \theta_0) = \Phi(\frac{x_{\alpha}-\mu_0}{\sigma_0/\sqrt{n}}) P(X∈C?∣θ=θ0?)=Φ(σ0?/n?xα??μ0??)
記zαz_{\alpha}zα?為標準正態分布的α\alphaα上分位點,則
xα?μ0σ0/n=?zα?xα=μ0?zασ0n\frac{x_{\alpha}-\mu_0}{\sigma_0/\sqrt{n}} = -z_{\alpha} \Leftrightarrow x_{\alpha} = \mu_0 - z_{\alpha}\frac{\sigma_0}{\sqrt{n}} σ0?/n?xα??μ0??=?zα??xα?=μ0??zα?n?σ0??
所以用似然比檢驗構造的這個檢驗的拒絕域為
C?={X:Xˉ≤μ0?zασ0n}C^*=\{X:\bar{X} \le \mu_0 - z_{\alpha}\frac{\sigma_0}{\sqrt{n}}\} C?={X:Xˉ≤μ0??zα?n?σ0??}
分析檢驗的勢
上面這個似然比檢驗的勢函數為
Power=P(X∈C?∣μ=μ1)=P(Xˉ≤μ0?zασ0n∣μ=μ1)=P(Xˉ?μ1σ0/n≤μ0?zασ0n?μ1σ0/n∣μ=μ1)=Φ(μ0?μ1σ0/n?zα)Power=P(X \in C^*|\mu=\mu_1) = P(\bar{X} \le \mu_0 - z_{\alpha}\frac{\sigma_0}{\sqrt{n}}| \mu = \mu_1) \\ = P(\frac{\bar{X}-\mu_1}{\sigma_0/\sqrt{n}}\le \frac{\mu_0 - z_{\alpha}\frac{\sigma_0}{\sqrt{n}}-\mu_1}{\sigma_0/\sqrt{n}}| \mu = \mu_1) = \Phi(\frac{\mu_0-\mu_1}{\sigma_0/\sqrt{n}}-z_{\alpha}) Power=P(X∈C?∣μ=μ1?)=P(Xˉ≤μ0??zα?n?σ0??∣μ=μ1?)=P(σ0?/n?Xˉ?μ1??≤σ0?/n?μ0??zα?n?σ0???μ1??∣μ=μ1?)=Φ(σ0?/n?μ0??μ1???zα?)
顯然這個檢驗的勢與∣μ0?μ1∣|\mu_0-\mu_1|∣μ0??μ1?∣成正比,與σ0\sigma_0σ0?成反比,與樣本量nnn成正比,與顯著性水平α\alphaα成正比。
ROC曲線
作出勢函數關于顯著性水平的圖像,即為ROC曲線:
Power=Φ(μ0?μ1σ0/n?zα)Power= \Phi(\frac{\mu_0-\mu_1}{\sigma_0/\sqrt{n}}-z_{\alpha}) Power=Φ(σ0?/n?μ0??μ1???zα?)
根據Neyman-Pearson引理,這個勢已經是給定μ1,μ0,n,α\mu_1,\mu_0,n,\alphaμ1?,μ0?,n,α的條件下最優的了。ROC曲線想展示的是給定顯著性水平下,power怎么受檢驗本身參數的影響,也就是受∣μ0?μ1∣|\mu_0-\mu_1|∣μ0??μ1?∣的影響。
總結
以上是生活随笔為你收集整理的UA MATH566 统计理论5 假设检验简介的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH574M 统计学习II 二
- 下一篇: UA MATH636 信息论5 信道编码