从二分类到多分类的迁移策略
hit2015spring晨鳧追風
一般情況下問題研究為二分類問題,在解決多分類問題時有時可以直接推廣到多分類,有時不能,不能推廣的時候主要用三種拆分策略對問題進行研究
一對一的策略
給定數據集D這里有N個類別,這種情況下就是將這些類別兩兩配對,從而產生N(N?1)2個二分類任務,在測試的時候把樣本交給這些分類器,然后進行投票
一對其余策略
將每一次的一個類作為正例,其余作為反例,總共訓練N個分類器。測試的時候若僅有一個分類器預測為正的類別則對應的類別標記作為最終分類結果,若有多個分類器預測為正類,則選擇置信度最大的類別作為最終分類結果。
多對多分類策略
基于一種糾錯輸出碼的分類策略,分為兩個步驟
編碼:對N個類別做M次劃分,每次劃分將一部分類別劃為正類,一部分劃為反類,從而形成一個二分類訓練集,這樣一共產生M個訓練集,可訓練出M<script type="math/tex" id="MathJax-Element-13">M</script>個分類器
**解碼**M個分類器分別對測試樣本進行預測,這些預測標記組成一個編碼。將這個預測編碼與每個類別各自的編碼進行比較,返回其中距離最小的類別作為最終預測的結果
這里的類別劃分通過編碼矩陣指定,編碼矩陣主要有,二元碼(每個類別分別指定正類反類),三元碼(正,反,停用)
一般來說編碼越長則糾錯能力越強,但是意味著所需訓練的分類器越多,計算存儲的開銷越大,不一定得到越好的訓練效果,因為跟把樣本進行分組也有關系
總結
以上是生活随笔為你收集整理的从二分类到多分类的迁移策略的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Libsvm的一些说明帮助吧
- 下一篇: mysql router docker_