贝叶斯算法原理简介
1,貝葉斯簡介
貝葉斯(約1701-1761) Thomas Bayes,英國數(shù)學(xué)家,貝葉斯方法源于他生前為解決一個“逆概”問題寫的一篇文章。
2,貝葉斯要解決的問題
正向概率:假設(shè)袋子里面有N個白球,M個黑球,閉著眼睛伸手取出一個球,摸出黑球的概率是多大。
逆向概率:如果事先并不知道袋子里面黑白球的比例,而是閉著眼睛摸出一個(或好幾個)球,觀察這些取出來的球的顏色之后,那么我們可以就此對袋子里面的黑白球的比例作出什么樣的推測。
現(xiàn)實(shí)世界本身就是不確定的,人類的觀察能力有局限性的,我們?nèi)粘K^察到的只是事物表面上的結(jié)果,但是我們可以根據(jù)這些事物表面上的結(jié)果提供一個猜測
3,貝葉斯公式
以一個例子進(jìn)行說明:
學(xué)校中男生占60%,女生占40%,其中男生總是穿長褲,女生則一半穿長褲一半穿裙子。
正向概率:隨機(jī)選取一個學(xué)生,他(她)穿長褲的概率和穿裙子的概率是多大
逆向概率:迎面走來一個穿長褲的學(xué)生,你只看得見他(她)穿的是否長褲,
而無法確定他(她)的性別,你能夠推斷出他(她)是女生的概率是多大嗎?
若假設(shè)學(xué)校里面人的總數(shù)是 U 個,穿長褲的男生人數(shù):
其中,P(Boy) 是男生的概率 = 60%,P(Pants|Boy) 是條件概率,即在 Boy 這個條件下穿長褲的概率是多大,這里是 100% ,因?yàn)樗心猩即╅L褲。
同理,穿長褲的女生人數(shù):
穿長褲總?cè)藬?shù):
下一步求解,穿長褲的人里面有多少女生
也即是:
發(fā)現(xiàn)校園內(nèi)人的總數(shù)U可以消去:
其中,分母其實(shí)就是 P(Pants),分子其實(shí)就是 P(Pants, Girl),故有貝葉斯公式如下:
總結(jié)
- 上一篇: 聚类算法原理简介
- 下一篇: 求一个姓马好听男孩的名字。