R语言实战应用-lightgbm 算法优化:不平衡二分类问题(附代码)
生活随笔
收集整理的這篇文章主要介紹了
R语言实战应用-lightgbm 算法优化:不平衡二分类问题(附代码)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
前言
本案例使用的數據為kaggle中“Santander Customer Satisfaction”比賽的數據。此案例為不平衡二分類問題,目標為最大化auc值(ROC曲線下方面積)。目前此比賽已經結束。
以下是我為大家準備的幾個精品專欄,喜歡的小伙伴可自行訂閱,你的支持就是我不斷更新的動力喲!
MATLAB-30天帶你從入門到精通
MATLAB深入理解高級教程(附源碼)
tableau可視化數據分析高級教程
競賽題目鏈接為:
https://www.kaggle.com/c/santander-customer-satisfaction
2.建模思路
本文檔采用微軟開源的lightgbm算法進行分類,運行速度極快。具體步驟為:
-
讀取數據;
-
并行運算:由于lightgbm包可以通過設置相應參數進行并行運算,因此不再調用doParallel與foreach包進行并行運算;
-
特征選擇:
總結
以上是生活随笔為你收集整理的R语言实战应用-lightgbm 算法优化:不平衡二分类问题(附代码)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 天池赛题解析:零基础入门语义分割-地表建
- 下一篇: 深度学习核心技术精讲100篇(六十二)-