UA MATH564 概率论VI 数理统计基础1
UA MATH564 概率論VI 數理統計基礎1
- 樣本均值與樣本方差
- 正態樣本的均值與方差的性質
樣本均值與樣本方差
樣本均值和樣本方差是經常用到的兩個統計量,大部分正態假設的統計模型均值和方差的OLS都是這兩位,所以這里單獨介紹一下。
假設X1,?,XnX_1,\cdots,X_nX1?,?,Xn?的總體分布為FX(x)F_X(x)FX?(x),總體均值為μ\muμ,總體方差為σ2\sigma^2σ2,則樣本均值定義為
Xˉ=1n∑i=1nXi\bar{X} = \frac{1}{n} \sum_{i=1}^n X_iXˉ=n1?i=1∑n?Xi?
樣本均值有兩條有用的性質:
兩條性質都比較顯然,
EXˉ=E(1n∑i=1nXi)=1n∑i=1nEXi=1n∑i=1nμ=μVar(Xˉ)=Var(1n∑i=1nXi)=1n2∑i=1nσ2=σ2nE\bar{X} = E \left( \frac{1}{n} \sum_{i=1}^n X_i \right) = \frac{1}{n} \sum_{i=1}^n EX_i = \frac{1}{n} \sum_{i=1}^n \mu = \mu \\ Var(\bar{X}) = Var\left(\frac{1}{n} \sum_{i=1}^n X_i \right) = \frac{1}{n^2} \sum_{i=1}^n \sigma^2 = \frac{\sigma^2}{n}EXˉ=E(n1?i=1∑n?Xi?)=n1?i=1∑n?EXi?=n1?i=1∑n?μ=μVar(Xˉ)=Var(n1?i=1∑n?Xi?)=n21?i=1∑n?σ2=nσ2?
樣本方差的定義是
S2=1n?1∑i=1n(X?Xˉ)2S^2 = \frac{1}{n-1}\sum_{i=1}^n(X-\bar{X})^2S2=n?11?i=1∑n?(X?Xˉ)2
除以n?1n-1n?1是因為這里面含有一個約束:Xˉ=1n∑i=1nXi\bar{X} = \frac{1}{n} \sum_{i=1}^n X_iXˉ=n1?∑i=1n?Xi?,所以自由度是n?1n-1n?1。樣本方差是σ2\sigma^2σ2的無偏估計。事實上統計量1n∑i=1n(X?Xˉ)2\frac{1}{n} \sum_{i=1}^n(X-\bar{X})^2n1?∑i=1n?(X?Xˉ)2也是經常出現的,它是σ2\sigma^2σ2的最大似然估計。為了證明無偏性,下面給出一個引理。
引理 假設SS(α)=∑i=1n(Xi?α)2SS(\alpha) = \sum_{i=1}^n (X_i-\alpha)^2SS(α)=i=1∑n?(Xi??α)2
則Xˉ=arg?min?αSS(α)\bar{X} = \argmin_{\alpha} SS(\alpha)Xˉ=αargmin?SS(α)。
證明
SS(α)=∑i=1n(Xi?α)2=∑i=1n(Xi?Xˉ+Xˉ?α)2=∑i=1n(Xi?Xˉ)2+2(Xˉ?α)∑i=1n(Xi?Xˉ)+n(Xˉ?α)2=SS(Xˉ)+n(Xˉ?α)2≥SS(Xˉ)SS(\alpha) = \sum_{i=1}^n (X_i-\alpha)^2 = \sum_{i=1}^n (X_i-\bar{X} + \bar{X}-\alpha)^2 \\ = \sum_{i=1}^n (X_i-\bar{X})^2 + 2(\bar{X}-\alpha)\sum_{i=1}^n (X_i-\bar{X}) + n(\bar{X}-\alpha)^2 \\ = SS(\bar{X}) + n(\bar{X}-\alpha)^2 \ge SS(\bar{X})SS(α)=i=1∑n?(Xi??α)2=i=1∑n?(Xi??Xˉ+Xˉ?α)2=i=1∑n?(Xi??Xˉ)2+2(Xˉ?α)i=1∑n?(Xi??Xˉ)+n(Xˉ?α)2=SS(Xˉ)+n(Xˉ?α)2≥SS(Xˉ)
注意SS(α)=SS(Xˉ)+n(Xˉ?α)2SS(\alpha)=SS(\bar{X})+n(\bar{X}-\alpha)^2SS(α)=SS(Xˉ)+n(Xˉ?α)2比這個引理的結論更常用。
現在證明S2S^2S2的無偏性,根據引理
SS(μ)=SS(Xˉ)?n(Xˉ?μ)2SS(\mu)=SS(\bar{X})-n(\bar{X}-\mu)^2SS(μ)=SS(Xˉ)?n(Xˉ?μ)2
帶入到下面的計算中
ES2=E(1n?1∑i=1n(X?Xˉ)2)=1n?1(∑i=1nE(Xi?μ)2?nE(Xˉ?μ)2)=1n?1(nσ2?nσ2n)=σ2ES^2 = E \left( \frac{1}{n-1}\sum_{i=1}^n(X-\bar{X})^2 \right) \\= \frac{1}{n-1} \left( \sum_{i=1}^nE(X_i-\mu)^2 - nE(\bar{X}-\mu)^2\right) \\ = \frac{1}{n-1} (n\sigma^2 -n\frac{\sigma^2}{n})=\sigma^2ES2=E(n?11?i=1∑n?(X?Xˉ)2)=n?11?(i=1∑n?E(Xi??μ)2?nE(Xˉ?μ)2)=n?11?(nσ2?nnσ2?)=σ2
正態樣本的均值與方差的性質
假設X1,X2,?,Xn~iidN(μ,σ2)X_1,X_2,\cdots,X_n \sim_{iid} N(\mu,\sigma^2)X1?,X2?,?,Xn?~iid?N(μ,σ2),做標準化Zi=Xi?μσZ_i = \frac{X_i-\mu}{\sigma}Zi?=σXi??μ?,則Z1,?,Zn~iidN(0,1)Z_1,\cdots,Z_n \sim_{iid} N(0,1)Z1?,?,Zn?~iid?N(0,1)。定義
Zˉ=1n∑i=1nZi,SS=∑i=1n(Zi?Zˉ)2\bar{Z}=\frac{1}{n} \sum_{i=1}^n Z_i,SS = \sum_{i=1}^n (Z_i-\bar{Z})^2Zˉ=n1?i=1∑n?Zi?,SS=i=1∑n?(Zi??Zˉ)2
以下三條性質成立:
證明
第一條性質比較簡單,首先Zˉ\bar{Z}Zˉ是一個正態隨機變量;根據樣本均值的性質
EZˉ=0,Var(Zˉ)=1nE\bar{Z}=0,Var(\bar{Z}) = \frac{1}{n}EZˉ=0,Var(Zˉ)=n1?
第三條也比較好證,因為?i\forall i?i
Cov(Zi?Zˉ,Zˉ)=Cov(Zi,Zˉ)?Var(Zˉ)=1n∑j=1nCov(Zi,Zj)?1n=0Cov(Z_i-\bar{Z},\bar{Z})=Cov(Z_i,\bar{Z})-Var(\bar{Z}) \\ = \frac{1}{n}\sum_{j=1}^n Cov(Z_i,Z_j) - \frac{1}{n} = 0Cov(Zi??Zˉ,Zˉ)=Cov(Zi?,Zˉ)?Var(Zˉ)=n1?j=1∑n?Cov(Zi?,Zj?)?n1?=0
所以Zˉ\bar{Z}Zˉ與Zi?ZˉZ_i-\bar{Z}Zi??Zˉ獨立,根據獨立性的性質,因為SSSSSS是Zi?ZˉZ_i-\bar{Z}Zi??Zˉ的函數,所以Zˉ\bar{Z}Zˉ也與SSSSSS獨立。
再看第二條,首先用前面那個引理,
SS(0)=SS(Zˉ)+nZˉ2SS=∑i=1nZi2?nZˉ2SS(0)=SS(\bar{Z})+n\bar{Z}^2 \\ SS = \sum_{i=1}^nZ_i^2 - n\bar{Z}^2SS(0)=SS(Zˉ)+nZˉ2SS=i=1∑n?Zi2??nZˉ2
其中∑i=1nZi2~χ2(n)\sum_{i=1}^nZ_i^2\sim \chi^2(n)∑i=1n?Zi2?~χ2(n),nZˉ~N(0,1)\sqrt{n}\bar{Z}\sim N(0,1)n?Zˉ~N(0,1),則nZˉ2~χ2(1)n\bar{Z}^2\sim \chi^2(1)nZˉ2~χ2(1)。卡方分布χν2\chi^2_{\nu}χν2?的矩母函數是
Mχν2(t)=(1?2t)?ν/2M_{\chi^2_{\nu}}(t)=(1-2t)^{-\nu/2}Mχν2??(t)=(1?2t)?ν/2
這個下下講再計算,這里先用一下。根據SSSSSS與Zˉ\bar{Z}Zˉ的獨立性,
MSS(t)MnZˉ(t)=M∑i=1nZi2(t)MSS(t)(1?2t)?1/2=(1?2t)?n/2MSS(t)=(1?2t)?(n?1)/2M_{SS}(t)M_{n\bar{Z}}(t) = M_{\sum_{i=1}^nZ_i^2}(t) \\ M_{SS}(t)(1-2t)^{-1/2} = (1-2t)^{-n/2} \\ M_{SS}(t) = (1-2t)^{-(n-1)/2}MSS?(t)MnZˉ?(t)=M∑i=1n?Zi2??(t)MSS?(t)(1?2t)?1/2=(1?2t)?n/2MSS?(t)=(1?2t)?(n?1)/2
因此SS~χ2(n?1)SS \sim\chi^2(n-1)SS~χ2(n?1)。
總結
以上是生活随笔為你收集整理的UA MATH564 概率论VI 数理统计基础1的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH565C 随机微分方程II
- 下一篇: UA MATH565C 随机微分方程II