python在银行的应用案例_银行风控案例(python)
前言:
風(fēng)險控制是挖掘中最為常見的應(yīng)用,屬于監(jiān)督學(xué)習(xí)的“分類器”使用案例。我們通過以往歷史數(shù)據(jù)判斷用戶違約的概率。本文使用了Logistic Regression 方法完成案例。
首先是基于個人借貸的場景,確定“違約”的定義: 根據(jù)新的Basel II Capital Accord(巴塞爾二資本協(xié)議),一般逾期90天算作違約。
風(fēng)控模型開發(fā)流程
· 數(shù)據(jù)抽取
· 數(shù)據(jù)探索
· 建模數(shù)據(jù)準(zhǔn)備
· 變量選擇
· 模型開發(fā)與驗證
· 模型部署
· 模型監(jiān)督
import pandasas pd#pandas包
import numpy as np#numpy包
import matplotlib.pyplot as plt#畫圖包
import seaborn as sb#畫圖包
from sklearn.linear_model import LogisticRegression#隨機(jī)森林包
from sklearn.cross_validation import KFold,cross_val_score#交叉驗證包
from sklearn.metrics import confusion_matrix,recall_score,classification_report#混淆矩陣包
from sklearn.preprocessing import StandardScaler數(shù)據(jù)標(biāo)準(zhǔn)化處理
1.數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)來自Kaggle,cs-training.csv是有15萬條的樣本數(shù)據(jù),違約(1):不違約(0)=0.06:0.94),字段解釋如下。
SeriousDlqin2yrs:超過90天或更糟的逾期拖欠
RevolvingUtilization Of UnsecuredLines:無擔(dān)保放款的循環(huán)利用:除了不動產(chǎn)和像車 貸那樣除以信用額度總和的無分期付款債務(wù)的信用卡和個人信用額度總額
Age:借款人年齡
NumberOfTime30-59DaysPastDueNotWorse:30-59天逾期次數(shù)
DebtRatio:負(fù)債比例
MonthlyIncome:月收入
Number Of OpenCreditLinesAndLoans:貸款數(shù)量
NumberOfTimes90DaysLate:90天逾期次數(shù):借款者有90天或更高逾期的次數(shù)
NumberReal Estate Loans Or Lines:不動產(chǎn)貸款或額度數(shù)量:抵押貸款和不動產(chǎn)放款包 括房屋凈值信貸額度
Number Of Time 60-89Days PastDue Not Worse:0-89天逾期次數(shù)
NumberOfDependents:不包括本人在內(nèi)的家屬數(shù)量
2.數(shù)據(jù)處理
2.1缺失值分析處理
traindata=pd.read_csv("C:/Users/Administrator/Desktop/CreditCard/CreditCard/cs_training.csv")#導(dǎo)入數(shù)據(jù)
traindata.drop_duplicates()#丟棄重復(fù)列
import missingno as msno#可視化分析缺失值包
sb.set(font_scale=2.0)
msno.matrix(traindata.sample(500),figsize=(16,7))
總結(jié)
以上是生活随笔為你收集整理的python在银行的应用案例_银行风控案例(python)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 前端如何实现音乐盒胶盘的转动_干货来袭!
- 下一篇: 表达开心快乐的文案大全100个