机器学习中的不平衡分类方法(part3)--不平衡分类学习策略
生活随笔
收集整理的這篇文章主要介紹了
机器学习中的不平衡分类方法(part3)--不平衡分类学习策略
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
學(xué)習(xí)筆記,僅供參考,有錯(cuò)必糾
參考自:《機(jī)器學(xué)習(xí)中的不平衡分類方法》-- 康琦,吳啟迪
文章目錄
- 不平衡分類學(xué)習(xí)策略
- 重采樣策略
- 代價(jià)敏感學(xué)習(xí)
- 單類別函數(shù)
- 集成學(xué)習(xí)方法
不平衡分類學(xué)習(xí)策略
重采樣策略
傳統(tǒng)的分類算法直接運(yùn)用到不平衡數(shù)據(jù)集上,分類效果不佳。重采樣策略從數(shù)據(jù)層面對(duì)整個(gè)不平衡數(shù)據(jù)集進(jìn)行研究,解決其分布不平衡的問(wèn)題,即對(duì)不平衡數(shù)據(jù)進(jìn)行重采樣,從而提高算法的分類性能。
針對(duì)原始數(shù)據(jù)的處理,有多種不同的數(shù)據(jù)重采樣方法。按照對(duì)樣本數(shù)量的影響可分為過(guò)采樣、欠采樣、混合采樣:
-
過(guò)采樣通過(guò)增加訓(xùn)練集中少數(shù)類的樣本個(gè)數(shù),使類別達(dá)到平衡。
-
欠采樣則是通過(guò)減少訓(xùn)練集中的多數(shù)類的樣本個(gè)數(shù)達(dá)到類相對(duì)平衡。
-
混合采樣則是將過(guò)采樣和欠采樣兩種方法結(jié)合起來(lái)。
代價(jià)敏感學(xué)習(xí)
代價(jià)敏感學(xué)習(xí)理論是為了處理不平衡分布數(shù)據(jù)集而發(fā)展出來(lái)的一種新型理論
總結(jié)
以上是生活随笔為你收集整理的机器学习中的不平衡分类方法(part3)--不平衡分类学习策略的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 阿里大数据分析与应用(part2)--大
- 下一篇: 魅蓝5s拆机方法教程