用贝叶斯来看看抛硬币的概率
前面介紹了貝葉斯學(xué)派的思想和先驗分布、后驗分布的相關(guān)知識,古典頻率學(xué)派認為拋硬幣的概率是常數(shù),本文從貝葉斯學(xué)派的角度看待拋硬幣的概率問題。本文詳細介紹了??分布,重述貝葉斯思想,對于拋硬幣的概率問題作各種情況的分析,最后總結(jié)全文。
目錄
1.為什么選擇??分布作為先驗分布
本節(jié)詳細介紹??分布的定義及解釋選擇??分布作為先驗分布的原因。
1.??分布
?函數(shù)的定義:
其中??,對于等式兩邊各除以??,以字母p代替x,得:
選擇積分項作為??的分布函數(shù),由積分項可知??分布已完成標(biāo)準(zhǔn)化(總積分等于1)。
因此,??分布:
?分布的期望和方差:
?
如果不清楚上面的公式怎么來的,可參考下面兩篇博客:
如何理解beta分布??
Beta 分布歸一化的證明(系數(shù)是怎么來的),期望和方差的計算?
2.??分布作為先驗分布的原因
由??分布的定義可知,??分布是概率分布的分布,??分布常作為先驗分布的原因:
(1) 貝葉斯對參數(shù)的估計與先驗分布的選擇有很重要的關(guān)系,先驗分布不同,貝葉斯對參數(shù)的估計也不同。先驗分布往往是人們根據(jù)以往經(jīng)驗去設(shè)計,??分布是概率分布的分布,涵蓋了所有參數(shù)空間出現(xiàn)的概率大小,并通過設(shè)置參數(shù)??,可以使先驗分布與你的先驗經(jīng)驗基本符合。
i)?
由上圖可知,??分布符合均勻分布,即參數(shù)空間所有取值的概率相等。
因此,當(dāng)你對參數(shù)沒有任何的先驗知識時,建議你假設(shè)先驗參數(shù)符合均勻分布,參數(shù)的后驗分布由你的實際觀測數(shù)據(jù)決定。
ii)??
由上圖可知,??,??分布符合高斯分布,且在概率為0.5時取得最大值,由??分布期望和方差的公式可知期望和方差分別等于0.5和0.01。
假設(shè)參數(shù)的先驗分布是高斯分布,設(shè)置參數(shù)??相等??使??分布成為高斯分布,??越大,方差越小。
因此,設(shè)置??使參數(shù)的先驗分布符合你對參數(shù)的先驗認知。
(2) 上節(jié)已經(jīng)提到,參數(shù)的先驗分布是??分布時,則先驗分布和后驗分布形式一樣,且可以形成先驗鏈,方便分析問題。
重述貝葉斯思想
關(guān)于頻率學(xué)派和貝葉斯學(xué)派對頻率的理解可以參考頻率學(xué)派和貝葉斯學(xué)派?
貝葉斯思想是量化事件發(fā)生的不確定性,是主觀評價。不同人評價同一事件發(fā)生的概率不同,因為不同人的生活經(jīng)歷不同,對某一事件的先驗知識很可能不同,比如一個博士生和一個小學(xué)生對某一事件的看法不同;同一個人對同一事件發(fā)生的概率也隨著自身閱歷的增加而不同,例如某個人做了九件好事,你評估他是好人的概率為0.9,當(dāng)他做了一件大逆不道的事情后,你評估他是好人的概率降到了0.1。貝葉斯評價事件發(fā)生的概率帶有主觀性,因人而異,因閱歷而不同。
凡事要講數(shù)據(jù)
我們根據(jù)自己的閱歷對某一事件作一個先驗假設(shè),先驗假設(shè)是否正確需要經(jīng)過時間的檢驗,即是否有足夠多的觀測數(shù)據(jù)符合先驗假設(shè)。先驗假設(shè)和觀測數(shù)據(jù)是影響后驗假設(shè)的兩個因素,若觀測數(shù)據(jù)不符合先驗假設(shè),則后驗假設(shè)在先驗假設(shè)的基礎(chǔ)上開始向觀測數(shù)據(jù)偏斜,若觀測的數(shù)據(jù)為無窮大時,則先驗假設(shè)可以忽略不計,直接通過觀測數(shù)據(jù)來估計后驗假設(shè)。因此,貝葉斯思想評價事件發(fā)生概率的準(zhǔn)則是凡是要講數(shù)據(jù)。
拋硬幣問題的多情況分析
拋硬幣問題的公式說明
在頻率學(xué)派和貝葉斯學(xué)派一文中已經(jīng)通過例子推導(dǎo)了拋硬幣正面向上的后驗概率,因此,這里不再推導(dǎo),只引用一些結(jié)論性的公式。?
假設(shè)硬幣正面向上的概率為u,正面向上記為1,反面向上記為0。則硬幣正面向上的先驗分布如下:
硬幣正面向上的期望:
其中a,b表示虛擬的硬幣正面向上的次數(shù)和反面向上的次數(shù),根據(jù)自己的先驗知識來設(shè)置a,b值。
若后續(xù)的觀測結(jié)果為m次正面向上,l次反面向上,共N次。
則硬幣正面向上的后驗分布如下:
?
硬幣為正面向上的概率:
?
多情況的拋硬幣問題
(1) 第1次拋硬幣為正面向上的概率;
(2) 9次硬幣正面向上,1次反面向上,第十一次硬幣正面向上的概率;
(3) 90次硬幣正面向上,10次硬幣反面向上,求101次正面向上的概率;
(4) 900次硬幣正面向上,100次硬幣反面向上,求1001次正面向上的概率;
解:
貝葉斯的后驗分布受先驗分布的影響,不同的先驗分布會有不同的后驗分布。假設(shè)硬幣正面向上的分布符合高斯分布(a=10,b=10),高斯分布符合大部分人的思想,認為硬幣為正面向上的概率在0.5達到最大,方差表示先驗分布的確定程度,若你堅信硬幣向上的概率肯定是0.5,那么可以調(diào)大a和b的值。
本文就先驗分布為高斯分布來解答拋硬幣的四個問題。其他先驗分布可通過調(diào)節(jié)a,b的值來實現(xiàn),后面的計算過程一致。
正面向上的后驗概率:
a,b,m,l分別表示先驗分布的正面向上次數(shù),反面向上次數(shù),已觀測數(shù)據(jù)的正面向上次數(shù),反面向上次數(shù)。
?
先驗分布為高斯分布:
(1) 由于沒有任何觀測數(shù)據(jù),因此第一次正面向上的分布為先驗分布,先驗分布在參數(shù)為0.5時,概率最大,記正面向上的概率為0.5。
(2) 正面向上的概率為:
(3) 計算過程與(2)一樣,正面向上的概率:0.83
(4) 正面向上的概率為:0.89
?
討論:
頻率學(xué)派認為硬幣向上的概率是0.5,與觀測數(shù)據(jù)無關(guān)。貝葉斯學(xué)派是通過數(shù)據(jù)來主觀評價硬幣向上的概率,由例子可知,即使先驗分布符合高斯分布且正面向上的概率在0.5達到最大,但是如果觀測數(shù)據(jù)傾向與正面向上,則最終的判斷結(jié)果會傾向于正面向上,貝葉斯思想有點像是風(fēng)往哪邊吹樹就往哪邊倒的意思。當(dāng)觀測結(jié)果的正面向上次數(shù)遠遠大于正面向下次數(shù),也遠遠大于先驗分布的正面向下次數(shù),則判斷下次為正面向上的概率無限接近1。
總結(jié)
本文詳細介紹了??分布,通過調(diào)節(jié)參數(shù)a和b使??分布符合假設(shè)的先驗分布,??分布使后驗分布和先驗分布為共軛分布,形成先驗鏈,便于分析問題。后面講的內(nèi)容是貝葉斯思想,貝葉斯是主觀評價事件發(fā)生的概率,根據(jù)先驗知識來假設(shè)先驗分布,若觀測的數(shù)據(jù)符合先驗分布,則后驗分布與先驗分布類似;若觀測數(shù)據(jù)不符合先驗分布,則后驗分布開始向觀測數(shù)據(jù)傾斜,若觀測數(shù)據(jù)為無窮大時,那么先驗分布可以忽略不計,最大似然函數(shù)估計參數(shù)與后驗分布估計參數(shù)相同,直接可以用最大似然函數(shù)來估計參數(shù)。
總結(jié)
以上是生活随笔為你收集整理的用贝叶斯来看看抛硬币的概率的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 快速搞懂ThreadLocal实现原理
- 下一篇: 附桂骨痛片_功效作用注意事项用药禁忌用法