R 语言与中心极限定理
                                                            生活随笔
收集整理的這篇文章主要介紹了
                                R 语言与中心极限定理
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.                        
                                中心極限定理(Central Limit Theorem)
對于一個樣本量足夠大的隨機抽樣,統計量 Xˉ 的抽樣分布近似服從一正態分布。 
 用數學語言描述:設隨機變量 X1,X2,?,Xn 互相獨立,服從同一分布,且 E(Xk)=μ,D(Xk)=σ2>0, 則隨機變量均值的標準化變量 
 
的分布函數 Fn(x) 對于任意 x 滿足
limn→∞Fn(x)=limn→∞P{Xk?μσ/n??√≤x}=∫x?∞12π??√e?t2/2dx=Φ(x)
證明略。
R 代碼模擬
首先驗證均勻分布:
library(distr) # 用到的包 par(mfrow=c(2,2)) # 創建2*2作圖界面# 均勻分布 uniform<-runif(10000, min = 0, max = 1) hist(uniform, main="Uniform Distribution") x_bar<-rep(NA,1000) # 抽樣次數 2 n<-2 for (i in 1:1000){x_bar[i]<-mean(sample(uniform,size=n,replace=F)) } hist(x_bar,main="n=2") # 抽樣次數 5 n<-5 for (i in 1:1000){x_bar[i]<-mean(sample(uniform,size=n,replace=F)) } hist(x_bar,main="n=5") # 抽樣次數 30 n<-30 for (i in 1:1000){x_bar[i]<-mean(sample(uniform,size=n,replace=F)) } hist(x_bar,main="n=30")結果如圖: 
  
 可以看到均勻分布在樣本量為 2 時就非常接近于一個正態分布。 
 然后是 Arcsine 分布和卡方分布:
結果如圖: 
  
  
 可以看到,當樣本量達到 30 時,樣本均值都趨近于一個正態分布。
下面我們通過自定義函數來測試一下中心極限定理。
par(mfrow=c(2,2)) user<-exp(c(runif(10000, 0, 1))) # 自定義函數f(x)=e^x,x服從 0 到 1 的均勻分布 hist(user)n<-2 for (i in 1:1000){x_bar[i]<-mean(sample(user,size=n,replace=F)) } hist(x_bar,main="n=2")n<-5 for (i in 1:1000){x_bar[i]<-mean(sample(user,size=n,replace=F)) } hist(x_bar,main="n=5")n<-30 for (i in 1:1000){x_bar[i]<-mean(sample(user,size=n,replace=F)) } hist(x_bar,main="n=30")結果如圖: 
  
 結果很好地驗證了中心極限定理。
總結
以上是生活随笔為你收集整理的R 语言与中心极限定理的全部內容,希望文章能夠幫你解決所遇到的問題。
                            
                        - 上一篇: SSH公钥原理(密钥,秘钥,私钥)(看了
 - 下一篇: git获取秘钥