过拟合(原因、解决方案、原理)
生活随笔
收集整理的這篇文章主要介紹了
过拟合(原因、解决方案、原理)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1.定義
標準定義:給定一個假設空間H,一個假設h屬于H,如果存在其他的假設h’屬于H,使得在訓練樣例上h的錯誤率比h’小,但在整個實例分布上h’比h的錯誤率小,那么就說假設h過度擬合訓練數據。 —-《Machine Learning》Tom M.Mitchell
2.出現過擬合的一些原因
(1)建模樣本抽取錯誤,包括(但不限于)樣本數量太少,抽樣方法錯誤,抽樣時沒有足夠正確考慮業務場景或業務特點,等等導致抽出的樣本數據不能有效足夠代表業務邏輯或業務場景;
(2)樣本里的噪音數據干擾過大,大到模型過分記住了噪音特征,反而忽略了真實的輸入輸出間的關系;
(3)建模時的“邏輯假設”到了模型應用時已經不能成立了。任何預測模型都是在假設的基
總結
以上是生活随笔為你收集整理的过拟合(原因、解决方案、原理)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Windows下安装spark+Hado
- 下一篇: 支持向量机SVM原理(一)