【数据挖掘】贝叶斯分类 ( 贝叶斯分类器 | 贝叶斯推断 | 逆向概率 | 贝叶斯公式 | 贝叶斯公式推导 | 使用贝叶斯公式求逆向概率 )
文章目錄
- I . 貝葉斯分類器
- II . 貝葉斯推斷 ( 逆向概率 )
- III . 貝葉斯推斷 應(yīng)用場(chǎng)景 ( 垃圾郵件過(guò)濾 )
- IV . 貝葉斯方法 由來(lái)
- V . 貝葉斯方法
- VI . 貝葉斯公式
- VII . 貝葉斯公式 ③ 推導(dǎo)過(guò)程
- VIII . 使用貝葉斯公式求逆向概率
I . 貝葉斯分類器
1 . 貝葉斯分類器 :
① 原理 : 基于統(tǒng)計(jì)學(xué)方法貝葉斯 ( Bayes ) 理論 , 預(yù)測(cè)樣本某個(gè)屬性的分類概率 ;
② 性能分析 : 樸素貝葉斯 分類器 , 與 決策樹 , 神經(jīng)網(wǎng)絡(luò) 分類器 性能基本相同 , 性能指標(biāo)處于同一數(shù)量級(jí) , 適合大數(shù)據(jù)處理 ;
2 . 貝葉斯分類器的類型 :
① 樸素貝葉斯分類器 : 樣本屬性都是獨(dú)立的 ;
② 貝葉斯信念網(wǎng)絡(luò) : 樣本屬性間有依賴關(guān)系的情況 ;
決策樹 , 貝葉斯 , 神經(jīng)網(wǎng)絡(luò) 都是機(jī)器學(xué)習(xí)的核心方法
II . 貝葉斯推斷 ( 逆向概率 )
1 . 貝葉斯推斷 : 是統(tǒng)計(jì)學(xué)方法 , 貝葉斯定理的應(yīng)用 , 用于估算統(tǒng)計(jì)量的性質(zhì) ;
2 . 正向概率 與 逆向概率 :
① 正向概率 : 盒子中有 NNN 個(gè)白球 , MMM 個(gè)黑球 , 摸出黑球的概率是 MN+M\rm \cfrac{M}{N + M}N+MM? ;
② 逆向概率 : 事先不知道盒子中白球和黑球的數(shù)量 , 任意摸出 XXX 個(gè)球 , 通過(guò)觀察這些球的顏色 , 推測(cè)盒子中有多少白球 , 多少黑球 ;
III . 貝葉斯推斷 應(yīng)用場(chǎng)景 ( 垃圾郵件過(guò)濾 )
1 . 傳統(tǒng)垃圾郵件過(guò)濾方法 :
① 關(guān)鍵詞法 : 識(shí)別特定詞語(yǔ) , 識(shí)別 “發(fā)票” “培訓(xùn)” 等關(guān)鍵字 ;
② 檢驗(yàn)碼法 : 計(jì)算郵件中文本的校驗(yàn)碼 , 與已知的垃圾郵件對(duì)比 ;
③ 效果 : 關(guān)鍵詞法 和 校驗(yàn)碼法 對(duì)垃圾郵件的識(shí)別效果不好 , 容易規(guī)避 ;
④ 問(wèn)題本質(zhì) : 垃圾郵件過(guò)濾是二元分類問(wèn)題 , 針對(duì)每個(gè)郵件 , 都需要判定其是否是垃圾郵件 ,
2 . 貝葉斯推斷過(guò)濾垃圾郵件 :
① 效果 : 準(zhǔn)確性很高 , 并且沒有誤判 ;
② 原理 : 貝葉斯推斷的垃圾郵件過(guò)濾器有學(xué)習(xí)能力 , 收到的郵件越多 , 訓(xùn)練集越大 , 判定越準(zhǔn)確 ;
IV . 貝葉斯方法 由來(lái)
1 . 貝葉斯方法 由來(lái) :
① 現(xiàn)實(shí)情況 : 現(xiàn)實(shí)世界本身的狀況復(fù)雜 , 不確定性很大 , 人的觀察能力也有限 ;
② 人的應(yīng)對(duì)方案 : 多數(shù)情況下 , 只能根據(jù)觀察到的結(jié)果 , 來(lái)估算實(shí)際的情況 ;
2 . 貝葉斯 處理 逆向概率 問(wèn)題示例 :
① 盒子白球黑球問(wèn)題 : 從盒子中取出白球和黑球 , 不知道盒子中有多少白球和黑球 , 只能根據(jù)從盒子中取出球的情況 , 估算盒子中的白球和黑球數(shù) ;
② 互聯(lián)網(wǎng)垃圾郵件問(wèn)題 : 互聯(lián)網(wǎng)中發(fā)送郵件 , 有多少是正常郵件 , 有多少是垃圾郵件是不知道的 , 只能根據(jù)當(dāng)前收到的垃圾郵件 , 反向估算實(shí)際情況 ;
V . 貝葉斯方法
貝葉斯方法 :
① 提出假設(shè) : 給出樣本屬性的 不同類型 的猜測(cè)的 屬性值 , 如 : 郵件是否是垃圾郵件 , 是 或者 否 ;
② 計(jì)算每種取值的可能性 : 計(jì)算每種猜測(cè)的可能性 ;
③ 確定猜測(cè) : 選取可能性最大的猜測(cè) , 作為貝葉斯推斷的結(jié)果 ;
VI . 貝葉斯公式
1 . 貝葉斯公式 :
公式 ①
P(B∣A)=P(A∣B)×P(B)P(A∣B)×P(B)+P(A∣~B)×P(~B)P ( B | A ) = \frac{P ( A | B ) \times P ( B ) }{ P ( A | B ) \times P ( B ) + P ( A | \sim B ) \times P ( \sim B ) }P(B∣A)=P(A∣B)×P(B)+P(A∣~B)×P(~B)P(A∣B)×P(B)?
簡(jiǎn)寫形式 :
公式 ②
P(B∣A)=P(AB)P(A)P ( B | A ) = \frac{P ( AB )}{P ( A )}P(B∣A)=P(A)P(AB)?
或
公式 ③
P(B∣A)=P(B)×P(A∣B)P(A)P(B|A) = \frac{P(B) \times P(A|B)}{P(A) }P(B∣A)=P(A)P(B)×P(A∣B)?
2 . 公式中的事件說(shuō)明 : 有兩個(gè)事件 , 事件 AAA , 和事件 BBB ;
3 . 概率的表示方法 :
① 事件 AAA 發(fā)生的概率 : 表示為 P(A)P(A)P(A) ;
② 事件 BBB 發(fā)生的概率 : 表示為 P(B)P(B)P(B) ;
③ ABA BAB兩個(gè)事件同時(shí)發(fā)生的概率 : 表示為 P(A,B)P(A,B)P(A,B) ;
④ 事件 AAA 發(fā)生時(shí) BBB 發(fā)生的概率 : 表示為 P(B∣A)P(B | A)P(B∣A) ;
VII . 貝葉斯公式 ③ 推導(dǎo)過(guò)程
1 . 事件 AAA 和 BBB 同時(shí)發(fā)生的概率 ( 第 111 種求法 ) :
① 先求 AAA 發(fā)生的概率 : P(A)P(A)P(A)
② 再求 AAA 發(fā)生時(shí) BBB 發(fā)生的概率 : P(B∣A)P(B | A)P(B∣A)
③ ABABAB 同時(shí)發(fā)生的概率 : P(A,B)=P(A)×P(B∣A)P(A,B) = P(A) \times P(B|A)P(A,B)=P(A)×P(B∣A)
2 . 事件 AAA 和 BBB 同時(shí)發(fā)生的概率 ( 第 222 種求法 ) :
① 先求 BBB 發(fā)生的概率 : P(B)P(B)P(B)
② 再求 BBB 發(fā)生時(shí) AAA 發(fā)生的概率 : P(A∣B)P(A | B)P(A∣B)
③ ABABAB 同時(shí)發(fā)生的概率 : P(A,B)=P(B)×P(A∣B)P(A,B) = P(B) \times P(A|B)P(A,B)=P(B)×P(A∣B)
3 . 公式 ③ 推導(dǎo)過(guò)程 :
P(A)×P(B∣A)P(A) \times P(B|A)P(A)×P(B∣A) 與 P(B)×P(A∣B)P(B) \times P(A|B)P(B)×P(A∣B) 兩個(gè)公式是等價(jià)的 , 可推導(dǎo)出如下公式 :
P(A)×P(B∣A)=P(B)×P(A∣B)P(A) \times P(B|A) = P(B) \times P(A|B)P(A)×P(B∣A)=P(B)×P(A∣B)
P(B∣A)=P(B)×P(A∣B)P(A)P(B|A) = \frac{P(B) \times P(A|B)}{P(A) }P(B∣A)=P(A)P(B)×P(A∣B)?
VIII . 使用貝葉斯公式求逆向概率
使用貝葉斯公式求逆向概率 :
知道 BBB 發(fā)生時(shí) , AAA 發(fā)生的概率 P(A∣B)P(A|B)P(A∣B) , 求其逆概率 : AAA 發(fā)生時(shí) , BBB 發(fā)生的概率 P(B∣A)P(B|A)P(B∣A) ;
可將已知的 P(A∣B)P(A|B)P(A∣B) 概率 , 和 ABABAB 單獨(dú)發(fā)生的概率 P(A)P(A)P(A) , P(B)P(B)P(B) , 代入如下公式 :
P(B∣A)=P(B)×P(A∣B)P(A)P(B|A) = \frac{P(B) \times P(A|B)}{P(A) }P(B∣A)=P(A)P(B)×P(A∣B)?
即可得到其逆概率 , BBB 發(fā)生時(shí) , AAA 發(fā)生的概率 ;
《新程序員》:云原生和全面數(shù)字化實(shí)踐50位技術(shù)專家共同創(chuàng)作,文字、視頻、音頻交互閱讀總結(jié)
以上是生活随笔為你收集整理的【数据挖掘】贝叶斯分类 ( 贝叶斯分类器 | 贝叶斯推断 | 逆向概率 | 贝叶斯公式 | 贝叶斯公式推导 | 使用贝叶斯公式求逆向概率 )的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【数据挖掘】数据挖掘建模 ( 预测建模
- 下一篇: 【数据挖掘】贝叶斯公式应用 拼写纠正示例