gbdt子采样参数的理解
生活随笔
收集整理的這篇文章主要介紹了
gbdt子采样参数的理解
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
隨機(jī)森林的子采樣是有放回的抽樣
gbdt的子采樣是無放回的抽樣
本人的錯誤理解:
比如說原來的數(shù)據(jù)集是100個樣本;gbdt的第一棵樹是80個樣本,第二棵樹是剩下的20%,16個樣本;依此類推;
錯誤理解的根本是將抽取0.8樣本集的作為一個整體,是否放回;所以才會覺得gbdt難以理解,每棵樹都只剩下20%
而正確的理解:是否放回主要針對的是每次抽取的一個樣本;所以每棵樹抽樣的整體都是100個樣本;隨機(jī)森林抽樣是放回的,最極端的可能全部都是重復(fù),即一個樣本;無放回抽樣主要是樣本不會重復(fù);gbdt的每棵樹都會用80個樣本來訓(xùn)練;
總結(jié)
以上是生活随笔為你收集整理的gbdt子采样参数的理解的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PCA与SVD的关系
- 下一篇: svm中支持向量的理解