XGBoost的参数说明
生活随笔
收集整理的這篇文章主要介紹了
XGBoost的参数说明
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
最近在用這個算法打比賽,記錄一下
轉(zhuǎn)載博客:https://www.cnblogs.com/pengwang52/p/9623093.html、http://www.cnblogs.com/wanglei5205/p/8579244.html
模型參數(shù)
n_estimatores含義:總共迭代的次數(shù),即決策樹的個數(shù)調(diào)參: early_stopping_rounds含義:在驗(yàn)證集上,當(dāng)連續(xù)n次迭代,分?jǐn)?shù)沒有提高后,提前終止訓(xùn)練。調(diào)參:防止overfitting。 max_depth含義:樹的深度,默認(rèn)值為6,典型值3-10。調(diào)參:值越大,越容易過擬合;值越小,越容易欠擬合。 min_child_weight含義:默認(rèn)值為1,。調(diào)參:值越大,越容易欠擬合;值越小,越容易過擬合(值較大時,避免模型學(xué)習(xí)到局部的特殊樣本)。可根據(jù)公式大致計(jì)算min_child_weight=1/sqrt(ratio_rare_event) subsample含義:訓(xùn)練每棵樹時,使用的數(shù)據(jù)占全部訓(xùn)練集的比例。默認(rèn)值為1,典型值為0.5-1。調(diào)參:防止overfitting。 colsample_bytree含義:訓(xùn)練每棵樹時,使用的特征占全部特征的比例。默認(rèn)值為1,典型值為0.5-1。調(diào)參:防止overfitting。學(xué)習(xí)任務(wù)參數(shù)
learning_rate含義:學(xué)習(xí)率,控制每次迭代更新權(quán)重時的步長,默認(rèn)0.3。調(diào)參:值越小,訓(xùn)練越慢。典型值為0.01-0.2。 objective 目標(biāo)函數(shù)回歸任務(wù)reg:linear (默認(rèn))reg:logistic 二分類binary:logistic 概率 binary:logitraw 類別多分類multi:softmax num_class=n 返回類別multi:softprob num_class=n 返回概率rank:pairwise eval_metric回歸任務(wù)(默認(rèn)rmse)rmse--均方根誤差mae--平均絕對誤差分類任務(wù)(默認(rèn)error)auc--roc曲線下面積error--錯誤率(二分類)merror--錯誤率(多分類)logloss--負(fù)對數(shù)似然函數(shù)(二分類)mlogloss--負(fù)對數(shù)似然函數(shù)(多分類) gamma懲罰項(xiàng)系數(shù),指定節(jié)點(diǎn)分裂所需的最小損失函數(shù)下降值。調(diào)參: alphaL1正則化系數(shù),默認(rèn)為1 lambdaL2正則化系數(shù),默認(rèn)為1轉(zhuǎn)載于:https://www.cnblogs.com/san333/p/10803281.html
總結(jié)
以上是生活随笔為你收集整理的XGBoost的参数说明的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: QButtonGroup
- 下一篇: python小白——进阶之路——day6