人工智能数学基础--概率与统计9:概率运算、加法公理、事件的独立性、概率乘法定理、条件概率、全概率公式以及贝叶斯公式
一、概述
這大半年都很忙,學習時間太少,導致概率論的學習停滯不前,期間AI大佬herosunly推薦了陳希孺老先生的概率論教材,與最開始學習的美版M.R.斯皮格爾等著作的《概率與統計》表示差異比較大(具體請見《人工智能數學基礎–概率與統計7:學習中一些術語的稱呼或表示變化說明以及獨立事件的一些補充推論》的說明),但學習起來更容易理解一些,最近利用國慶開始學習這本教材,感覺還是有必要繼續學。
由于表示的變化,為了知識的承前啟后,基于陳老先生的教材對事件獨立性、條件概率等前面章節介紹過的內容在本文重新介紹一下。
二、事件的蘊涵、包含及相等
在同一試驗下的兩個事件A和B,如果當A發生時B必發生,則稱A蘊含B,或者說B包含A,記為A ? B。若A、B互相蘊含,即A?B且B?A,則稱A、B 兩事件相等,記為A=B。
注意:蘊涵和包含是相反關系。
三、事件的互斥和對立
四、事件的和(或稱為并)以及加法公理
五、事件的積(或稱為交)和差
如果有兩個事件A、B,定義事件C={A、B都發生},則稱事件C是事件AB的積或乘積(或交),記為:C=AB;
多個事件A1、A2、…的積A是指事件A1、A2、…都發生,記為:A=A1A2…,也可以記為:
兩個事件A、B之差記為 A-B,定義為:A-B={A發生,B不發生},A-B = ABc,因此差是可以通過積進行定義。
概率加法公理
六、事件的運算法則
假設有事件A、B、C,則有關于事件的如下運算法則:
七、條件概率
- 一般來講,條件概率是附加一定條件之后所計算出的概率;
- 在概率論中,決定試驗的基礎條件被看做已定不變的,如果不再加入其它條件或假定,則算出的概率就是無條件概率;
- 設有兩個事件A、B,且P(B)≠0,則在給定B發生的條件下A發生的概率為條件概率,記為P(A|B),定義為:P(A|B)=P(AB)/P(B)。
老猿注:為什么條件概率的計算公式是P(A|B)=P(AB)/P(B),請參考《人工智能數學基礎–概率與統計1:隨機試驗、樣本空間、事件、概率公理定理以及條件概率和貝葉斯法則》。
八、事件的獨立性和概率乘法定理
P(Aj1|Aj2…Ajn)=P(Aj1),即任意事件Aj1發生的可能性大小,不受其他事件發生的影響;
老猿注:獨立事件的積的概率等于各自概率的積,互斥事件的和的概率等于各自概率的和,這兩者的前提是不同的,即相加是互斥,相乘是獨立。
九、全概率公式
BiBj=?(不可能事件)(i≠j)
B1+B2+…=Ω(必然事件)
稱具有這樣性質的一組事件稱為“完備事件群”
P(A) = P(B1)P(A|B1)+P(B2)P(A|B2)+…
上述公式就稱為全概率公式。
老猿注:全概率公式中Bi可以看做事件A發生的原因,因此全概率公式可以看作是由原因的概率推結果的概率。
十、貝葉斯公式
10.1、貝葉斯公式的定義
設B1、B2、…為完備事件群,對任一事件A,結合條件概率的定義有:
P(Bi|A)=P(ABi)/P(A)=P(Bi)P(A|Bi) / (P(B1)P(A|B1)+P(B2)P(A|B2)+…)=P(Bi)P(A|Bi) / (ΣP(Bj)P(A|Bj))
上述公式就稱為貝葉斯公式,是英國學者T·貝葉斯提出的。
10.2、貝葉斯公式的意義
貝葉斯公式中的事件A可以看作已經發生的事件,Bi可以看做事件A發生的原因,因此貝葉斯公式可用于在A發生的情況下,去找各個原因導致事件A發生的概率,這個概率與P(Bi|A)成比例。
10.3、例1
有三個盒子C1、C2、C3,各有100個球,其中C1盒含白球80個、紅球10個、黑球10個;C2為白球10個、紅球80個、黑球10個;C3為白球10個、紅球10個、黑球80個,現從這三個盒子中隨機地抽出一個(每盒被抽的概率為1/3),然后從所抽出的盒中隨機抽出一個球(每球被抽的概率為0.01),結果抽出者為白球。問“該白球是從Ci盒中抽出”的可能性有多大(i=1,2,3)?
解:
記Bi={抽出的為Ci盒}(i=1,2,3),A={抽出白球},要求的是條件概率P(Bi|A)。按假定,有
P(B1)=P(B2)=P(B3)=1/3,
P(A|B1)=0.8,P(A|B2)=0.1,P(A|B3)=0.1
代入貝葉斯公式,算出分母:P(B1)P(A|B1)+P(B2)P(A|B2)+P(B3)P(A|B3)=1/3*(0.8+0.1+0.1)=1/3,其實從300個球中抽100個球的概率就是1/3,因此可以算得:
P(B1|A)=0.8,P(B2|A)=0.1,P(B3|A)=0.1。
因為C1盒所含白球最多,故在已知抽出白球的情況下,該球系來自C1盒的可能性也最大,理所當然??赡苋杂凶x者不完全了然于心,則可以設想這么一個試驗,準備兩張紙,把例中的試驗一次又一次地做下去:每抽出一個盒,在左邊的紙上記下其為C1或C2或C3(不管從該盒中抽出的球如何);而只有在抽出的球為白球時,才在右邊的紙上記下該盒為C,或C2或C3。在進行了極大量次數的試驗后,會發現左邊紙上C1的比例很接近1/3,而在右邊紙上C1的比例則很接近0.8。
10.4、例2
設某種病菌在人口中的帶菌率為0.03,當檢查時,由于技術及操作的不完善以及種種特殊原因,使帶菌者未必檢出陽性反應而不帶菌者也可能呈陽性反應。
假定: P(陽性|帶菌)=0.99,P(陰性|帶菌)=0.01, P(陽性|不帶菌)=0.05,P(陰性|不帶菌)=0.95。
現設某人檢出陽性,問“他帶菌”的概率是多少?
解:
此問題相當于 P(B1)=0.03,P(B2)=0.97,且P(A|B1)=0.99,P(A|B2)=0.05,所求的概率為P(B1|A),按貝葉斯公式算出:
P(B1|A) = P(B1)P(A|B1)/( P(B1)P(A|B1)+ P(B2)P(A|B2)) = (0.03)(0.99)/[(0.03)(0.99)+(0.97)(0.05)]=0.380。
也就是說,即使你檢出陽性,尚可不必過早下結論你一定帶菌了。實際上,這種可能性尚不到40%。
這個例子很值得玩味,且對其“思維定勢”中無概率成分的人來說,簡直有點難以置信.說穿了,理由簡單之極,由于帶菌率極低,在全人口中絕大部分不帶菌。由于檢驗方法的不完善,在這大批人中會檢出許多呈陽性者。另一方面,帶菌者在全人口中很少,即使檢測出陽性,在這兩部分陽性的人群中占比相對較少,屬于虛報性質,因此提高精度在這類檢驗中非常重要。
小結
本文結合陳希孺老先生的概率論教材介紹了事件的互斥、獨立的概念,概率的運算法則,互斥事件的加法定理、獨立事件的乘法定理以及條件概率的定義以及由此推導出來的完備事件群的全概率公式和貝葉斯公式,最后介紹了貝葉斯公式在解決實際問題中的應用。
更多人工智能數學基礎請參考專欄《人工智能數學基礎》。
寫博不易,敬請支持:
如果閱讀本文于您有所獲,敬請點贊、評論、收藏,謝謝大家的支持!
關于老猿的付費專欄
前兩個專欄都適合有一定Python基礎但無相關知識的小白讀者學習,第三個專欄請大家結合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python圖形圖像處理 》的學習使用。
對于缺乏Python基礎的同仁,可以通過老猿的免費專欄《https://blog.csdn.net/laoyuanpython/category_9831699.html 專欄:Python基礎教程目錄)從零開始學習Python。
如果有興趣也愿意支持老猿的讀者,歡迎購買付費專欄。
老猿Python,跟老猿學Python!
? ? 前往老猿Python博文目錄 https://blog.csdn.net/LaoYuanPython ?
總結
以上是生活随笔為你收集整理的人工智能数学基础--概率与统计9:概率运算、加法公理、事件的独立性、概率乘法定理、条件概率、全概率公式以及贝叶斯公式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数学建模:层次分析法实例以及代码
- 下一篇: 非线性规划求解器 Lingo, Matl