UA MATH564 概率论VI 数理统计基础3 卡方分布上
UA MATH564 概率論VI 數理統計基礎3 卡方分布上
- 卡方分布
- 卡方分布的分布函數
- 中心化卡方分布
- 一般的卡方分布
卡方分布
這里給出卡方分布的一般性定義。假設X1,?,XnX_1,\cdots,X_nX1?,?,Xn?互相獨立,并且Xi~N(ai,1)X_i \sim N(a_i,1)Xi?~N(ai?,1),則稱
∑i=1nXi2~χ2(n,δ)\sum_{i=1}^n X_i^2 \sim \chi^2(n,\delta)i=1∑n?Xi2?~χ2(n,δ)
其中nnn代表樣本數,δ\deltaδ是非中心化參數
δ=∑i=1nai2\delta = \sqrt{\sum_{i=1}^n a_i^2}δ=i=1∑n?ai2??
如果樣本來自標準正態總體,則δ=0\delta=0δ=0,稱之為中心化的卡方分布。這個定義不是很嚴謹,因為從統計量的構造來看它的分布應該是和aia_iai?以及nnn有關,所以要讓記號χ2(n,δ)\chi^2(n,\delta)χ2(n,δ)在數學上有意義,我們需要證明卡方分布只依賴參數nnn和δ\deltaδ,可以參考陳希孺的數理統計引論引理1.1.1到公式1.1.1部分。
卡方分布的分布函數
記k(x∣n,δ),K(x∣n,δ)k(x|n,\delta),K(x|n,\delta)k(x∣n,δ),K(x∣n,δ)為卡方分布χ2(n,δ)\chi^2(n,\delta)χ2(n,δ)的概率密度與累積分布函數,下面推導這兩個函數的表達式。
中心化卡方分布
先討論中心化的卡方分布,當x>0x>0x>0時,根據上一講講過的多元正態分布的密度函數,可以寫出:
K(x∣n,0)=P(X≤x)=∫B(2π)?n/2exp?(?12y′y)dyB={y:y′y≤x}K(x|n,0) = P(X \le x) = \int_{B}(2\pi)^{-n/2}\exp \left( -\frac{1}{2}y'y \right)dy \\ B = \{y:y'y \le x\}K(x∣n,0)=P(X≤x)=∫B?(2π)?n/2exp(?21?y′y)dyB={y:y′y≤x}
按計算正態密度函數的積分的常規套路,將這個這個積分變換到球坐標(r,θ1,?,θn?1)(r,\theta_1,\cdots,\theta_{n-1})(r,θ1?,?,θn?1?)下進行,記
D(r,θ1,?,θn?1)=?(y1,y2,?,yn)?(r,θ1,?,θn?1)D(r,\theta_1,\cdots,\theta_{n-1}) = \frac{\partial (y_1,y_2,\cdots,y_n)}{\partial (r, \theta_1,\cdots,\theta_{n-1})}D(r,θ1?,?,θn?1?)=?(r,θ1?,?,θn?1?)?(y1?,y2?,?,yn?)?
用積分換元公式,
K(x∣n,0)=(2π)?n/2∫0x∫0π?∫0π∫02πD(r,θ1,?,θn?1)e?r2/2drdθ1?dθn?1K(x|n,0) =(2\pi)^{-n/2} \int_{0}^{\sqrt{x}}\int_{0}^{\pi}\cdots \int_{0}^{\pi}\int_{0}^{2\pi} D(r,\theta_1,\cdots,\theta_{n-1})e^{-r^2/2}drd\theta_1\cdots d\theta_{n-1}K(x∣n,0)=(2π)?n/2∫0x??∫0π??∫0π?∫02π?D(r,θ1?,?,θn?1?)e?r2/2drdθ1??dθn?1?
這里簡單介紹一下nnn維的球坐標與直角坐標之間的轉換。
y1=rcos?(θ1)y2=rsin?(θ1)cos?(θ2)y3=rsin?(θ1)sin?(θ2)cos?(θ3)?yn=rsin?(θ1)?sin?(θn?2)cos?(θn?1)y_1 = r\cos(\theta_1) \\ y_2 = r \sin(\theta_1)\cos(\theta_2) \\ y_3 = r\sin(\theta_1)\sin(\theta_2)\cos(\theta_3) \\ \cdots \\ y_n = r\sin(\theta_1)\cdots\sin(\theta_{n-2})\cos(\theta_{n-1})y1?=rcos(θ1?)y2?=rsin(θ1?)cos(θ2?)y3?=rsin(θ1?)sin(θ2?)cos(θ3?)?yn?=rsin(θ1?)?sin(θn?2?)cos(θn?1?)
它的Jacobi行列式為
D(r,θ1,?,θn?1)=∣1?rsin?(θ1)0?001rcos?(θ1)cos?(θ2)?rsin?(θ1)sin?(θ2)?00?∣D(r,\theta_1,\cdots,\theta_{n-1}) = \left| \begin{matrix} 1 &-r\sin(\theta_1) & 0 & \cdots & 0 & 0 \\ 1 &r\cos(\theta_1)\cos(\theta_2) & -r\sin(\theta_1)\sin(\theta_2) & \cdots & 0 & 0 \\ \cdots\end{matrix} \right|D(r,θ1?,?,θn?1?)=∣∣∣∣∣∣?11???rsin(θ1?)rcos(θ1?)cos(θ2?)?0?rsin(θ1?)sin(θ2?)????00?00?∣∣∣∣∣∣?
(懶得打公式了)
從它的結構可以看出來,這是一個擬下三角行列式,它的值是比較好求的,最常規的方法是在第一行做Laplace展開,每一次展開都會得到更低階的擬下三角行列式,然后再用Laplace展開(其實有點難算);另一種方法是用第一列消去第二列第一個元素,然后用第二列消去第三列第二個元素,最后把這個擬下三角行列式化簡成一個對角行列式。這里直接給出結果:
D(r,θ1,?,θn?1)=rn?1∏i=1n?2[sin?(θi)]n?1?iD(r,\theta_1,\cdots,\theta_{n-1}) = r^{n-1}\prod_{i=1}^{n-2} [\sin(\theta_{i})]^{n-1-i}D(r,θ1?,?,θn?1?)=rn?1i=1∏n?2?[sin(θi?)]n?1?i
所以
K(x∣n,0)=(2π)?n/2∫0x∫0π?∫0π∫02πrn?1∏i=1n?2[sin?(θi)]n?1?ie?r2/2drdθ1?dθn?1K(x|n,0) =(2\pi)^{-n/2} \int_{0}^{\sqrt{x}}\int_{0}^{\pi}\cdots \int_{0}^{\pi}\int_{0}^{2\pi} r^{n-1}\prod_{i=1}^{n-2} [\sin(\theta_{i})]^{n-1-i}e^{-r^2/2}drd\theta_1\cdots d\theta_{n-1}K(x∣n,0)=(2π)?n/2∫0x??∫0π??∫0π?∫02π?rn?1i=1∏n?2?[sin(θi?)]n?1?ie?r2/2drdθ1??dθn?1?
現在繼續計算積分。
這個積分有個非常有趣的性質,θ1,?,θn?1\theta_1,\cdots,\theta_{n-1}θ1?,?,θn?1?的積分區域與xxx無關,因此上面的積分可以記為
K(x∣n,0)=Cn∫0xrn?1e?r2/2drK(x|n,0) =C_n\int_{0}^{\sqrt{x}} r^{n-1}e^{-r^2/2}drK(x∣n,0)=Cn?∫0x??rn?1e?r2/2dr
根據歸一性確定常數CnC_nCn?的值,
K(∞∣n,0)=1=Cn∫0∞rn?1e?r2/2dr=Cn∫0∞rn?2e?r2/2d(r2/2)=Cn2n/2∫0∞(r2/2)n/2?1e?r2/2d(?r2/2)=Cn2n/2Γ(n/2)?Cn=(1/2)n/2Γ(n/2)K(\infty|n,0) = 1 =C_n\int_{0}^{\infty} r^{n-1}e^{-r^2/2}dr = C_n\int_{0}^{\infty} r^{n-2}e^{-r^2/2}d(r^2/2) \\ = C_n2^{n/2}\int_{0}^{\infty} (r^2/2)^{n/2-1}e^{-r^2/2}d(-r^2/2) = C_n2^{n/2}\Gamma(n/2) \Rightarrow C_n = \frac{(1/2)^{n/2}}{\Gamma(n/2)}K(∞∣n,0)=1=Cn?∫0∞?rn?1e?r2/2dr=Cn?∫0∞?rn?2e?r2/2d(r2/2)=Cn?2n/2∫0∞?(r2/2)n/2?1e?r2/2d(?r2/2)=Cn?2n/2Γ(n/2)?Cn?=Γ(n/2)(1/2)n/2?
因此
K(x∣n,0)=(1/2)n/2Γ(n/2)∫0xrn?1e?r2/2drk(x∣n,0)=K′(x∣n,0)=(1/2)n/2Γ(n/2)xn2?1e?x/2K(x|n,0) =\frac{(1/2)^{n/2}}{\Gamma(n/2)}\int_{0}^{\sqrt{x}} r^{n-1}e^{-r^2/2}dr \\ k(x|n,0) = K'(x|n,0) = \frac{(1/2)^{n/2}}{\Gamma(n/2)}x^{\frac{n}{2}-1}e^{-x/2}K(x∣n,0)=Γ(n/2)(1/2)n/2?∫0x??rn?1e?r2/2drk(x∣n,0)=K′(x∣n,0)=Γ(n/2)(1/2)n/2?x2n??1e?x/2
這就是χ2(n)\chi^2(n)χ2(n)的分布與概率密度,很顯然它也是Gamma分布族的一員,χ2(n)=dΓ(n2,12)\chi^2(n) =_d \Gamma(\frac{n}{2},\frac{1}{2})χ2(n)=d?Γ(2n?,21?)。
一般的卡方分布
當δ≠0\delta \ne 0δ?=0時,用上面的方法計算做積分變換的時候會比較麻煩,為了計算簡便一點,我們考慮一些有趣的結構。記X=[X1,X2,?,Xn]′X = [X_1,X_2,\cdots,X_n]'X=[X1?,X2?,?,Xn?]′,a=[a1,a2,?,an]′a = [a_1,a_2,\cdots,a_n]'a=[a1?,a2?,?,an?]′,則X~Nn(a,In)X \sim N_n(a,I_n)X~Nn?(a,In?),假設Y=TXY = TXY=TX,構造TTT為正交矩陣,則根據上一講的性質:Y~Nn(Ta,In)Y \sim N_n(Ta,I_n)Y~Nn?(Ta,In?),假設構造的TTT滿足:Ta=[δ,0,?,0]′Ta=[\delta,0,\cdots,0]'Ta=[δ,0,?,0]′,則
∑i=1nXi2=X′X=Y′(T?1)′(T?1)Y=Y′Y=Y12+∑i=2nYi2\sum_{i=1}^n X_i^2 = X'X=Y'(T^{-1})'(T^{-1})Y = Y'Y = Y_1^2 + \sum_{i=2}^{n} Y_i^2i=1∑n?Xi2?=X′X=Y′(T?1)′(T?1)Y=Y′Y=Y12?+i=2∑n?Yi2?
記Z=∑i=2nYi2Z = \sum_{i=2}^{n} Y_i^2Z=∑i=2n?Yi2?,則Y12Y_1^2Y12?與ZZZ獨立,且Z~χ2(n?1)Z \sim \chi^2(n-1)Z~χ2(n?1),因此只要確定了Y12Y_1^2Y12?的分布就可以用卷積算出∑i=1nXi2\sum_{i=1}^n X_i^2∑i=1n?Xi2?的分布:
考慮Y12Y_1^2Y12?的分布,Y1~N(δ,1)Y_1 \sim N(\delta,1)Y1?~N(δ,1),這非常簡單,略去過程:
g(x)=122πx[exp?(?(x?δ)22)+exp?(?(x+δ)22)]g(x) = \frac{1}{2\sqrt{2\pi x}} \left[ \exp\left(-\frac{(\sqrt{x}-\delta)^2}{2} \right) + \exp\left(-\frac{(\sqrt{x}+\delta)^2}{2} \right)\right]g(x)=22πx?1?[exp(?2(x??δ)2?)+exp(?2(x?+δ)2?)]
由此可以計算
k(x∣n,δ)=g(x)?k(x∣n?1,0)=∫0xk(x?y∣n?1,0)g(y)dyk(x|n,\delta) = g(x)*k(x|n-1,0) = \int_{0}^{x} k(x-y|n-1,0)g(y)dyk(x∣n,δ)=g(x)?k(x∣n?1,0)=∫0x?k(x?y∣n?1,0)g(y)dy
我們先把被積函數寫出來欣賞一下,
k(x?y∣n?1,0)g(y)=(1/2)(n?1)/2Γ((n?1)/2)(x?y)n?12?1e?(x?y)/2122πy[exp?(?(y?δ)22)+exp?(?(y+δ)22)]k(x-y|n-1,0)g(y) = \frac{(1/2)^{(n-1)/2}}{\Gamma((n-1)/2)}(x-y)^{\frac{n-1}{2}-1}e^{-(x-y)/2}\frac{1}{2\sqrt{2\pi y}} \left[ \exp\left(-\frac{(\sqrt{y}-\delta)^2}{2} \right) + \exp\left(-\frac{(\sqrt{y}+\delta)^2}{2} \right)\right]k(x?y∣n?1,0)g(y)=Γ((n?1)/2)(1/2)(n?1)/2?(x?y)2n?1??1e?(x?y)/222πy?1?[exp(?2(y??δ)2?)+exp(?2(y?+δ)2?)]
這種東西一看就不想去求它的積分,一個更加巧妙的方法是用級數來替換g(x)g(x)g(x)中的指數函數,
g(x)=122πe?δ2+x2∑i=0∞δ2i(2i)!xi?12g(x) = \frac{1}{2\sqrt{2\pi}}e^{-\frac{\delta^2+x}{2}}\sum_{i=0}^{\infty} \frac{\delta^{2i}}{(2i)!}x^{i-\frac{1}{2}}g(x)=22π?1?e?2δ2+x?i=0∑∞?(2i)!δ2i?xi?21?
這樣被積函數就可以寫成,
k(x?y∣n?1,0)g(y)=122π(1/2)(n?1)/2Γ((n?1)/2)e?δ2+x2∑i=0∞δ2i(2i)!yi?12(x?y)n?12?1k(x-y|n-1,0)g(y)=\frac{1}{2\sqrt{2\pi}}\frac{(1/2)^{(n-1)/2}}{\Gamma((n-1)/2)}e^{-\frac{\delta^2+x}{2}}\sum_{i=0}^{\infty}\frac{\delta^{2i}}{(2i)!}y^{i-\frac{1}{2}}(x-y)^{\frac{n-1}{2}-1}k(x?y∣n?1,0)g(y)=22π?1?Γ((n?1)/2)(1/2)(n?1)/2?e?2δ2+x?i=0∑∞?(2i)!δ2i?yi?21?(x?y)2n?1??1
雖然看上去更復雜了,但這個形式其實是非常好積分的,
k(x∣n,δ)=122π(1/2)(n?1)/2Γ((n?1)/2)e?δ2+x2∑i=0∞δ2i(2i)!∫0xyi?12(x?y)n?12?1dyk(x|n,\delta) = \frac{1}{2\sqrt{2\pi}}\frac{(1/2)^{(n-1)/2}}{\Gamma((n-1)/2)}e^{-\frac{\delta^2+x}{2}}\sum_{i=0}^{\infty}\frac{\delta^{2i}}{(2i)!}\int_{0}^{x}y^{i-\frac{1}{2}}(x-y)^{\frac{n-1}{2}-1}dyk(x∣n,δ)=22π?1?Γ((n?1)/2)(1/2)(n?1)/2?e?2δ2+x?i=0∑∞?(2i)!δ2i?∫0x?yi?21?(x?y)2n?1??1dy
現在僅剩的要積分的部分很明顯就是beta函數的構造,這里更一般地表述一下這個技巧,要計算積分
∫0xya(x?y)bdy\int_0^x y^a(x-y)^b dy∫0x?ya(x?y)bdy,做換元t=y/xt=y/xt=y/x,可以得到
∫0xya(x?y)bdy=xa+b+1∫01ta(1?t)bdt=xa+b+1B(a+1,b+1)\int_0^x y^a(x-y)^b dy = x^{a+b+1}\int_0^1 t^a(1-t)^bdt = x^{a+b+1}B(a+1,b+1)∫0x?ya(x?y)bdy=xa+b+1∫01?ta(1?t)bdt=xa+b+1B(a+1,b+1)
其中B(a+1,b+1)B(a+1,b+1)B(a+1,b+1)是beta函數,
B(a+1,b+1)=Γ(a+1)(b+1)Γ(a+b+2)B(a+1,b+1) = \frac{\Gamma(a+1)(b+1)}{\Gamma(a+b+2)}B(a+1,b+1)=Γ(a+b+2)Γ(a+1)(b+1)?
利用這個技巧可以把密度函數寫出來:
k(x∣n,δ)=e?δ2+x2∑i=0∞δ2i2ii!xi+n/2?12i+n/2Γ(i+n/2)k(x|n,\delta) = e^{-\frac{\delta^2+x}{2}}\sum_{i=0}^{\infty}\frac{\delta^{2i}}{2^ii!} \frac{x^{i+n/2-1}}{2^{i+n/2}\Gamma(i+n/2)}k(x∣n,δ)=e?2δ2+x?i=0∑∞?2ii!δ2i?2i+n/2Γ(i+n/2)xi+n/2?1?
實際上這個密度函數寫出來的意義也不大,可能只是展示一下求積分的技巧?
總結
以上是生活随笔為你收集整理的UA MATH564 概率论VI 数理统计基础3 卡方分布上的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH564 概率论I 求离散型
- 下一篇: 睡眠周期的数学模型