几个基本概率定理
大數定律又稱大數法則、大數率。 在一個隨機事件中,隨著試驗次數的增加,事件發生的頻率趨于一個穩定值;同時,在對物理量的測量實踐中,大量測定值的算術平均也具有穩定性。 在數理統計中,一般有三個定理,貝努利定理和辛欽定理,如:反映算術平均值和頻率的穩定性。當n很大時,算術平均值接近數學期望;頻率以概率收斂于事件的概率。
?
?
?
中央極限定理
?
如果我們重復地從平均數μ,標準差為σ的母群中抽取樣本大小為N的許許多多樣本,得到許許多多樣本平均數,而這些樣本平均數將成為常態分配,不管原來母群的各分數之次數分配形狀如何,且這些樣本平均數的平均數將等于μ,這些樣本平均數的標準差(特稱為標準誤) 將等于σ/√n. 另一種解釋: 母群是一個有著母群平均數μ,標準差σ的母群。我們從該母群中隨機取n多個樣本。這些樣本的平均數我們用Xn表示。如果我們按上述過程做一次的話,得到的Xn是一個具體數字。但Xn實際上也是一個隨機變量。它也有自己的概率分配。我們把這個隨機變量Xn的期待值E(Xn)或平均值表達為μXn,把它的標準差表達為σXn。中央極限定理告訴我們這個隨機變量Xn的分配是常態分配。并且期待值μXn就等于原來母群的平均數μ,標準差也跟原來母群標準差有關,σXn=(σ^2)/n。 其中,常態分配, 是指正態分布。?? 馬爾科夫鏈 狀態只由當前最近一個時間點的狀態決定, 與更久之前的狀態無關 p(x(n+1)|x(n),,,,x(1)) = p(x(n+1) | x(n))?? 中央極限定理比大數定理更廣泛更重要。 高斯分布(正態分布): 通常假設隨機變量的概率密度函數符合高斯分布 pdf(x) = n(x, u, d) 混合高斯分布: 就是假設該隨機變量的概率密度函數, 是幾個不同的高斯分布之和。 pdf(x) = sigma wi * n(x, ui, di);????????? sigma wi = 1. 用通過概率實驗所求的概率來估計我們感興趣的一個量,這樣的方法稱為蒙特卡羅方法(Monte Carlo method)。總結
- 上一篇: 特征选择--文本分类: 信息增益
- 下一篇: PLSI