学习笔记:统计建模方法的比较分析
前言
本文介紹了隱馬爾可夫模型 (HMM)、最大熵馬爾可夫模型 (MEMM) 和條件隨機場 (CRF) 的比較分析。 HMM、MEMM 和 CRF 是三種流行的統計建模方法,通常應用于模式識別和機器學習問題。 讓我們更詳細地探討每種方法。
一、隱馬爾可夫模型 (HMM)
“隱藏”一詞象征著只有系統發布的符號是可觀察的,而用戶無法查看狀態之間的底層隨機游走。 該領域的許多人將 HMM 視為有限狀態機。
- HMM的優勢
HMM 具有強大的統計基礎和高效的學習算法,可以直接從原始序列數據中進行學習。 它允許以本地可學習方法的形式一致地處理插入和刪除懲罰,并且可以處理可變長度的輸入。 它們是序列概況最靈活的概括。 它還可以執行多種操作,包括多重對齊、數據挖掘和分類、結構分析和模式發現。 它也很容易組合到庫中。
- HMM 的缺點
- HMM 僅依賴于每個狀態及其對應的觀察對象: 
- 序列標注,除了與單個詞有關系外,還與觀察到的序列長度、詞上下文等方面有關。 
- 目標函數和預測的目標函數不匹配:HMM得到的是狀態和觀測序列的聯合分布P(Y, X),而在估計問題上,我們需要一個條件概率P(Y|X)。 
二、最大熵馬爾可夫模型 (MEMM)
MEMM 考慮了相鄰狀態和整個觀察序列之間的依賴關系,因此具有更好的表達能力。 MEMM不考慮P(X),減少建模工作量,學習目標函數與估計函數的一致性。
- MEMM 標簽偏差
在上圖 中,狀態 1 傾向于轉換為狀態 2,同時狀態 2 傾向于停留在狀態 2。
P(1-> 1-> 1-> 1)= 0.4 x 0.45 x 0.5 = 0.09, P(2->2->2->2)= 0.2 x 0.3 x 0.3 = 0.018,
P(1->2->1->2)= 0.6 x 0.2x 0.5 = 0.06,P(1->1->2->2)= 0.4 x 0.55 x 0.3 = 0.066。
然而,最佳狀態轉換路徑是 1 > 1 > 1 > 1。 為什么?
這是因為 State 2 的可轉換狀態比 State 1 多,從而降低了轉換概率——MEMM 傾向于選擇可轉換狀態較少的狀態。 這種選擇被稱為標簽偏差問題。 CRF 很好地解決了標簽偏差問題。
三、條件隨機場(CRF 模型)
CRF 模型解決了標注偏差問題,消除了 HMM 中兩個不合理的假設。 當然,模型也變得更復雜了。MEMM采用局部方差歸一化,CRF采用全局方差歸一化。另一方面,MEMM 無法找到滿足以下分布的相應參數,但是 CRF 可以:
1.生成模型或判別模型
假設 o 是觀測值,m 是模型。
a) 生成模型:無限樣本>概率密度模型=生成模型>預測
如果你對 P(o|m) 建模,它就是一個生成模型。 其基本思想是,首先建立樣本的概率密度模型,然后利用該模型進行推理預測。 樣本無限大或盡可能大的要求是常識。 該方法借鑒了統計力學和貝葉斯理論。
HMM直接對轉移概率和表型概率進行建模,計算共現概率。 因此,它是一個生成模型。
b) 判別模型:有限樣本>判別函數=判別模型>預測
如果你在條件概率 P(m|o) 上建模,它就是判別模型。 其基本思想是以有限樣本建立判別函數,不考慮樣本的生成模型,直接研究預測模型。 其代表理論是統計學習理論。
CRF是一種判別模型。 MEMM 不是生成模型,而是基于狀態分類的具有有限狀態的模型。
2.拓撲結構
HMM和MEMM是有向圖,而CRF是無向圖。
3.全局最優或局部最優
HMM直接對轉移概率和表型概率進行建模,計算共現概率。
MEMM 基于轉移概率和表型概率建立共現概率。 它計算條件概率,只采用局部方差歸一化,容易陷入局部最優。
CRF 在全局范圍內計算歸一化概率,而不是像 MEMM 那樣在局部范圍內計算。 它是一個最優的全局解決方案,解決了 MEMM 中的標簽偏差問題。
4.CRF的優點和缺點
(1)優點
與HMM相比:由于CRF沒有HMM那樣嚴格的獨立性假設,它可以容納任何上下文信息。 其功能設計靈活(與ME相同)。
與MEMM相比:由于CRF計算的是全局最優輸出節點的條件概率,因此克服了MEMM中label bias的弊端。
與ME相比:CRF計算的是在有待標記的觀察序列時,整個標記序列的聯合概率分布,而不是定義給定當前狀態條件下下一個狀態的狀態分布。
(2)缺點
CRF 在算法的訓練階段具有高度的計算復雜性。 當更新的數據可用時,很難重新訓練模型。
結論
這篇博客詳細介紹了隱馬爾可夫模型 (HMM)、最大熵馬爾可夫模型 (MEMM) 和條件隨機場 (CRF) 之間的比較分析。 在這篇文章中,我們明確了解到 CRF 和 MEMMS 主要是判別序列模型,而 HMM 主要是生成序列模型。 貝葉斯規則構成了 HMM 的基礎。 相反,CRF 和 MEMM 基于過渡和可觀察特征的 MaxEnt 模型。
總結
以上是生活随笔為你收集整理的学习笔记:统计建模方法的比较分析的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: ITSS是什么?申请ITSS信息技术服务
- 下一篇: SequoiaDB巨杉数据库许建辉:夯实
