机器学习知识点(二十七)先验概率和后验概率理解
對于統計學只是皮毛認識,在學校時根本不重視,如今機器學習幾乎以統計學為基礎發展起來的,頭疼的緊,如今還得琢磨基礎概念。
1、我自己的理解:
1)先驗:統計歷史上的經驗而知當下發生的概率;
2)后驗:當下由因及果的概率;
2、網上有個例子說的透徹:
1)先驗——根據若干年的統計(經驗)或者氣候(常識),某地方下雨的概率;
2)似然——下雨(果)的時候有烏云(因/證據/觀察的數據)的概率,即已經有了果,對證據發生的可能性描述;
3)后驗——根據天上有烏云(原因或者證據/觀察數據),下雨(結果)的概率;
后驗 ~ 先驗*似然 : 存在下雨的可能(先驗),下雨之前會有烏云(似然)~ 通過現在有烏云推斷下雨概率(后驗);
3、再來一例:
先驗概率可理解為統計概率,后驗概率可理解為條件概率。
------------------------------------------------------------------
設定背景:酒至半酣,忽陰云漠漠,驟雨將至。
情景一:
“天不會下雨的,歷史上這里下雨的概率是20%”----先驗概率
“但陰云漠漠時,下雨的概率是80%”----后驗概率
“飛飛別急著走啊,歷史上酒桌上死人的概率只有5%“----先驗概率
”可他是曹操啊,夢里都殺人“----后驗概率
4、吃瓜群眾的例子
用“瓜熟蒂落”這個因果例子,從概率(probability)的角度說一下,
先驗概率,就是常識、經驗所透露出的“因”的概率,即瓜熟的概率。應該很清楚。
后驗概率,就是在知道“果”之后,去推測“因”的概率,也就是說,如果已經知道瓜蒂脫落,那么瓜熟的概率是多少。后驗和先驗的關系可以通過貝葉斯公式來求。也就是:
P(瓜熟 | 已知蒂落)=P(瓜熟)×P(蒂落 | 瓜熟)/ P(蒂落)
似然函數,是根據已知結果去推測固有性質的可能性(likelihood),是對固有性質的擬合程度,所以不能稱為概率。在這里就是說,不要管什么瓜熟的概率,只care瓜熟與蒂落的關系。如果蒂落了,那么對瓜熟這一屬性的擬合程度有多大。似然函數,一般寫成L(瓜熟 | 已知蒂落),和后驗概率非常像,區別在于似然函數把瓜熟看成一個肯定存在的屬性,而后驗概率把瓜熟看成一個隨機變量。
---
再扯一扯似然函數和條件概率的關系。似然函數就是條件概率的逆反。意為:
L(瓜熟 | 已知蒂落)= C × P(蒂落 | 瓜熟),C是常數。具體來說,現在有1000個瓜熟了,落了800個,那條件概率是0.8。那我也可以說,這1000個瓜都熟的可能性是0.8C。
注意,之所以加個常數項,是因為似然函數的具體值沒有意義,只有看它的相對大小或者兩個似然值的比率才有意義,后面還有例子。
----------------------------------------------------------------------------------------------------
同理,如果理解上面的意義,分布就是一“串”概率。
先驗分布:現在常識不但告訴我們瓜熟的概率,也說明了瓜青、瓜爛的概率
后驗分布:在知道蒂落之后,瓜青、瓜熟、瓜爛的概率都是多少
似然函數:在知道蒂落的情形下,如果以瓜青為必然屬性,它的可能性是多少?如果以瓜熟為必然屬性,它的可能性是多少?如果以瓜爛為必然屬性,它的可能性是多少?似然函數不是分布,只是對上述三種情形下各自的可能性描述。
那么我們把這三者結合起來,就可以得到:后驗分布 正比于 先驗分布 × 似然函數。先驗就是設定一種情形,似然就是看這種情形下發生的可能性,兩者合起來就是后驗的概率。
至于似然估計:
就是不管先驗和后驗那一套,只看似然函數,現在蒂落了,可能有瓜青、瓜熟、瓜爛,這三種情況都有個似然值(L(瓜青):0.6、L(瓜熟):0.8、L(瓜爛):0.7),我們采用最大的那個,即瓜熟,這個時候假定瓜熟為必然屬性是最有可能的。
5、分布解:
先驗分布:根據一般的經驗認為隨機變量應該滿足的分布
后驗分布:通過當前訓練數據修正的隨機變量的分布,比先驗分布更符合當前數據
似然估計:已知訓練數據,給定了模型,通過讓似然性極大化估計模型參數的一種方法
后驗分布往往是基于先驗分布和極大似然估計計算出來的。
總結
以上是生活随笔為你收集整理的机器学习知识点(二十七)先验概率和后验概率理解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习知识点(二十六)概率图模型条件随
- 下一篇: 机器学习知识点(二十八)Beta分布和D