UA MATH566 统计理论 用点估计构造置信区间
UA MATH566 統計理論 用點估計構造置信區間
- 用點估計構造置信區間
置信區間(confidential interval,CI)也叫區間估計,是另一種做統計推斷的方法,和假設檢驗密切相關。統計量的質量一般用它的bias和variance來衡量,點估計的話不太能直觀地表示這兩個概念,所以又定義了區間估計C^(X)?Θ\hat{C}(X) \subset \ThetaC^(X)?Θ,定義
P{θ∈C^(X)}P\{\theta \in \hat{C}(X)\}P{θ∈C^(X)}
為covering probability。定義C^\hat{C}C^是γ\gammaγ-level 置信區間,如果covering probability為γ\gammaγ。記C^(X)=[θ^L(X),θ^U(X)]\hat{C}(X) = [\hat{\theta}_L(X),\hat{\theta}_U(X)]C^(X)=[θ^L?(X),θ^U?(X)],頻率派統計認為真實的參數θ\thetaθ是一個只有造物主才知道的常數,區間估計中區間的端點是基于隨機樣本的統計量,因此這個區間是隨機的,我們可以用頻率的觀點來解釋covering probability,假設我們獨立重復抽取了一百組樣本,可以計算出一百個置信區間,那么這一百個里面大概就會有100γ100 \gamma100γ個包含真實的參數θ\thetaθ。
用點估計構造置信區間
假設ggg在參數空間上是一個單調變換,存在統計量h(X)h(X)h(X)是g(θ)g(\theta)g(θ)的無偏估計,E[h(X)]=g(θ)E[h(X)] = g(\theta)E[h(X)]=g(θ),根據定義,θ\thetaθ的γ\gammaγ置信區間為
P(θ^L≤θ≤θ^U)=γP(\hat{\theta}_L \le \theta \le \hat{\theta}_U) = \gammaP(θ^L?≤θ≤θ^U?)=γ
如果g(θ)g(\theta)g(θ)是單增的變換,則
P(g(θ^L)≤g(θ)≤g(θ^U))=γP(g(\hat{\theta}_L) \le g(\theta) \le g(\hat{\theta}_U)) = \gammaP(g(θ^L?)≤g(θ)≤g(θ^U?))=γ
如果g(θ)g(\theta)g(θ)是單減的變換,則
P(g(θ^U)≤g(θ)≤g(θ^L))=γP(g(\hat{\theta}_U) \le g(\theta) \le g(\hat{\theta}_L)) = \gammaP(g(θ^U?)≤g(θ)≤g(θ^L?))=γ
因為我們構造的統計量是g(θ)g(\theta)g(θ)的無偏估計,可以根據h(X)h(X)h(X)構造出h(X)+/?m(X)h(X) +/- m(X)h(X)+/?m(X)使得
P(h(X)?m(X)≤g(θ)≤h(X)+m(X))=γP(h(X) -m(X) \le g(\theta) \le h(X) + m(X)) = \gammaP(h(X)?m(X)≤g(θ)≤h(X)+m(X))=γ
這里的構造方法通常是樞軸量法,可以參考UA MATH566 統計理論8 用Pivot構造置信區間。如果g(θ)g(\theta)g(θ)是單增的變換,則令
g(θ^L)=h(X)?m(X)?θ^L=g?1(h(X)?m(X))g(θ^U)=h(X)+m(X)?θ^U=g?1(h(X)+m(X))g(\hat{\theta}_L) = h(X) -m(X) \Rightarrow \hat{\theta}_L = g^{-1}( h(X) -m(X)) \\ g(\hat{\theta}_U) = h(X) +m(X) \Rightarrow \hat{\theta}_U = g^{-1}( h(X) +m(X)) g(θ^L?)=h(X)?m(X)?θ^L?=g?1(h(X)?m(X))g(θ^U?)=h(X)+m(X)?θ^U?=g?1(h(X)+m(X))
如果g(θ)g(\theta)g(θ)是單減的變換,則令
g(θ^L)=h(X)+m(X)?θ^L=g?1(h(X)+m(X))g(θ^U)=h(X)?m(X)?θ^U=g?1(h(X)?m(X))g(\hat{\theta}_L) = h(X) +m(X) \Rightarrow \hat{\theta}_L = g^{-1}( h(X) +m(X)) \\ g(\hat{\theta}_U) = h(X) -m(X) \Rightarrow \hat{\theta}_U = g^{-1}( h(X) -m(X)) g(θ^L?)=h(X)+m(X)?θ^L?=g?1(h(X)+m(X))g(θ^U?)=h(X)?m(X)?θ^U?=g?1(h(X)?m(X))
下面舉例說明這套流程怎么操作:
例1 {Xi}i=1n~iidEXP(λ)\{X_i\}_{i=1}^n \sim_{iid} EXP(\lambda){Xi?}i=1n?~iid?EXP(λ),求λ\lambdaλ的1?α1-\alpha1?α置信區間
先寫出樣本的聯合概率密度
f(x1,?,xn∣λ)=1λne?1/λ∑i=1nXif(x_1,\cdots,x_n|\lambda) = \frac{1}{\lambda^n} e^{-1/\lambda\sum_{i=1}^n X_i} f(x1?,?,xn?∣λ)=λn1?e?1/λ∑i=1n?Xi?
根據Neyman-Fisher定理,∑i=1nXi\sum_{i=1}^n X_i∑i=1n?Xi?是充分統計量。樣本的對數似然為
l(λ)=?nlog?λ?1λ∑i=1nXi=0l′(λ)=?nλ+1λ2∑i=1nXi=0?λ^=Xˉl(\lambda) = -n\log \lambda - \frac{1}{\lambda}\sum_{i=1}^n X_i = 0 \\ l'(\lambda) = -\frac{n}{\lambda} + \frac{1}{\lambda^2}\sum_{i=1}^n X_i = 0 \Rightarrow \hat{\lambda} = \bar{X}l(λ)=?nlogλ?λ1?i=1∑n?Xi?=0l′(λ)=?λn?+λ21?i=1∑n?Xi?=0?λ^=Xˉ
E[Xˉ]=E[X1]=1λE[\bar{X}] = E[X_1] = \frac{1}{\lambda}E[Xˉ]=E[X1?]=λ1?,說明Xˉ\bar{X}Xˉ是1/λ1/\lambda1/λ的無偏估計。這時對應的是單調遞減的情況,這里的h(X)h(X)h(X)就是Xˉ\bar{X}Xˉ,我們嘗試用Xˉ\bar{X}Xˉ構造一個1/λ1/\lambda1/λ的置信區間。根據gamma分布的可加性,∑i=1nXi~Γ(n,λ)\sum_{i=1}^n X_i \sim \Gamma(n,\lambda)∑i=1n?Xi?~Γ(n,λ),做一個尺度變換后,Xˉ~Γ(n,λ/n)\bar{X} \sim \Gamma(n,\lambda/n)Xˉ~Γ(n,λ/n),構造樞軸量
Q=nXˉ2λ~χ2n2Q = \frac{n\bar{X}}{2\lambda} \sim \chi^2_{2n}Q=2λnXˉ?~χ2n2?
記χ2n,α22\chi^2_{2n,\frac{\alpha}{2}}χ2n,2α?2?和χ2n,1?α22\chi^2_{2n,1-\frac{\alpha}{2}}χ2n,1?2α?2?分別為χ2n2\chi^2_{2n}χ2n2?的α/2,1?α/2\alpha/2,1-\alpha/2α/2,1?α/2分位點,則
P(χ2n,α22≤Q≤χ2n,1?α22)=1?αP(\chi^2_{2n,\frac{\alpha}{2}} \le Q \le \chi^2_{2n,1-\frac{\alpha}{2}}) = 1-\alphaP(χ2n,2α?2?≤Q≤χ2n,1?2α?2?)=1?α
由此可以解出
P(nXˉ2χ2n,1?α22≤λ≤nXˉ2χ2n,α22)=1?αP(\frac{n\bar{X}}{2\chi^2_{2n,1-\frac{\alpha}{2}}} \le \lambda \le \frac{n\bar{X}}{2\chi^2_{2n,\frac{\alpha}{2}}}) = 1-\alphaP(2χ2n,1?2α?2?nXˉ?≤λ≤2χ2n,2α?2?nXˉ?)=1?α
因此λ\lambdaλ的1?α1-\alpha1?α置信區間為
{λ:nXˉ2χ2n,1?α22≤λ≤nXˉ2χ2n,α22}\{\lambda:\frac{n\bar{X}}{2\chi^2_{2n,1-\frac{\alpha}{2}}} \le \lambda \le \frac{n\bar{X}}{2\chi^2_{2n,\frac{\alpha}{2}}}\}{λ:2χ2n,1?2α?2?nXˉ?≤λ≤2χ2n,2α?2?nXˉ?}
例2 {Xi}i=1n~iidU(0,θ)\{X_i\}_{i=1}^n \sim_{iid} U(0,\theta){Xi?}i=1n?~iid?U(0,θ),求θ\thetaθ的1?α1-\alpha1?α置信區間
寫出樣本的聯合似然函數
L(θ)=∏i=1nI(Xi≤θ)θ=I(X(n)≤θ)θnL(\theta) = \prod_{i=1}^n \frac{I( X_i\le \theta)}{\theta} = \frac{I(X_{(n)} \le \theta)}{\theta^n}L(θ)=i=1∏n?θI(Xi?≤θ)?=θnI(X(n)?≤θ)?
根據Neyman-Fisher定理,X(n)X_{(n)}X(n)?是充分統計量。如果根據X(n)X_{(n)}X(n)?構造置信區間的話,先分析一下它的分布,
P(X(n)≤y)=P(max?Xi≤y)=∏i=1nP(Xi≤y)=ynθnP(X_{(n)} \le y) = P(\max X_i \le y) = \prod_{i=1}^n P(X_i \le y) = \frac{y^n}{\theta^n}P(X(n)?≤y)=P(maxXi?≤y)=i=1∏n?P(Xi?≤y)=θnyn?
構造樞軸量
Q=X(n)θQ = \frac{X_{(n)}}{\theta}Q=θX(n)??
則P(Q≤y)=P(X(n)≤θy)=yn,y∈[0,1]P(Q \le y) = P(X_{(n)} \le \theta y) = y^n,y \in [0,1]P(Q≤y)=P(X(n)?≤θy)=yn,y∈[0,1],QQQ的α/2\alpha/2α/2與1?α21-\frac{\alpha}{2}1?2α?為(α2)1/n\left( \frac{\alpha}{2}\right)^{1/n}(2α?)1/n和(1?α2)1/n\left(1- \frac{\alpha}{2}\right)^{1/n}(1?2α?)1/n,即
P((α2)1/n≤Q≤(1?α2)1/n)=1?αP(\left( \frac{\alpha}{2}\right)^{1/n} \le Q \le \left(1- \frac{\alpha}{2}\right)^{1/n}) = 1-\alphaP((2α?)1/n≤Q≤(1?2α?)1/n)=1?α
所以
P(X(n)(1?α2)1/n≤θ≤X(n)(α2)1/n)=1?αP(\frac{X_{(n)}}{\left(1- \frac{\alpha}{2}\right)^{1/n}} \le \theta \le \frac{X_{(n)}}{\left(\frac{\alpha}{2}\right)^{1/n}} ) = 1-\alphaP((1?2α?)1/nX(n)??≤θ≤(2α?)1/nX(n)??)=1?α
也可以用矩估計來構造置信區間,
θ^=2n∑i=1nXi\hat{\theta} = \frac{2}{n}\sum_{i=1}^n X_iθ^=n2?i=1∑n?Xi?
這時構造的樞軸量是
Q=nθ^2θQ = \frac{n\hat{\theta}}{2\theta}Q=2θnθ^?
它服從參數為nnn的Ising-Hall分布。
總結
以上是生活随笔為你收集整理的UA MATH566 统计理论 用点估计构造置信区间的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH564 概率论 QE练习题
- 下一篇: UA MATH564 概率论 QE练习题