机器学习之信用卡诈骗案例总结
生活随笔
收集整理的這篇文章主要介紹了
机器学习之信用卡诈骗案例总结
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
操作流程
首先觀察數據發現有一類特征浮動較大,我們對其進行歸一化預處理,使用sklearn庫中的函數
由于兩類樣本數目存在明顯差異,因此我們采用下采樣(從多的樣本中挑出和少的樣本一樣少的數目)和過采樣的方法(構造少的樣本,使之和多的樣本一樣多)
我們將所有樣本按照自定義比例分為訓練集和測試集,訓練集用于調參,測試集用于測試模型的可行性,在訓練集采用交叉驗證的方法
為防止過擬合,我們采用正則化懲罰(懲罰對象是參數)的方法,設置了幾個不同的懲罰力度觀察其效果
在評估模型時,我們引入了幾個判斷標準,召回率,精度,誤殺率,等來共同判斷模型的優劣
我們可以通過調整邏輯回歸的閾值(它的閾值我們一般采用的是0.5)來實現自己想要的效果
在進行過采樣方法時,我們使用了SMOTE算法進行少數樣本的擴倍
總結
從結果上看,過采樣模型的效果明顯高于下采樣模型,因為過采樣模型使用了更多的樣本,模型的訓練效果更好,更具有泛化性
沒有最好的模型,適合的才是最好的。
總結
以上是生活随笔為你收集整理的机器学习之信用卡诈骗案例总结的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 身份证验证 校验码_用户身份验证最佳做法
- 下一篇: Watering Grass UVA -