第九章 组合模型在信贷风控中的应用
組合模型在信貸風控中的應用
簡介:在包括違約預測在內的諸多場景中,越來越多的建模人員將模型集成的方式應用在實際工作中,并且取得了不錯的成效。本節課將介紹三種基本的集成方式:Bagging,boosting,stacking。
目錄:
1.元模型與集成模型
2.多模型的bagging
3.多模型的boosting
4.多模型的stacking
1.元模型與集成模型
什么是集成模型:把多種單一問題組合起來共同解決一個問題
集成模型的必要性
集成模型原理:
?
單一分類器:基學習模型或稱為元模型(base learner) 相應的算法:基學習算法(base learning algorithm) 組合方法:Boosting , Bagging&Stacking
?
?
?
? 集成模型中的元模型的選擇
根據元模型之間的種類關系可以把集成模型劃分為異態集成與同態集成兩種。
異態集成
使用不同的分類、回歸算法建立單一模型并進行集成
同態集成
使用同一算法(參數不同或者建立在不同的訓練集上)建立單一模型并進行集成
單一模型需要滿足以下基本要求
? 單一模型之間的數據或者假設要求要基本相同
? 單一模型的分類錯誤率要低于0.5
? 單一模型之間要保證相互獨立
? 單一模型的復雜度也要適度
? 單一模型的數量并非越多越好
2.多模型的bagging
? 集成方式一:Bagging
Bagging的代表是隨機森林模型。這種集成方式的步驟是
?
?
案例 我們使用三種模型來作為Bagging的元模型:邏輯回歸模型、XGBoost模型和人工神經網絡模型。對于每個模型,我們都從原始訓練集中有放回地抽取樣本形成同樣大小的集合作為元模型的訓練集。得到的每一個模型的結果是概率,求平均值后作為Bagging集成的輸出。這是典型的異態集成。
在我們的案例中,元模型的AUC以及集成模型的AUC見下表。數據預處理和特征衍生參考評分卡模型的處理方法。
?
3.多模型的boosting
?
?
?
?
?
?
4.多模型的stacking
?
?
?
總結
以上是生活随笔為你收集整理的第九章 组合模型在信贷风控中的应用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 第四章 数据的预处理与特征构建(续)
- 下一篇: 政策定价风控审批策略