金融风控实战——信贷评分卡
信貸評分卡介紹
風控系統業務流程
??在一個完整的風控系統中,信貸準入模型在整個體系的前半部分,下面我們了解一下一個完整的風控系統是如何構建的
獲客階段
??基本的,對于一個信貸產品來說,首先要有目標客戶愿意去使用才有構建信貸準入模型的意義,對于小型信貸公司來說,如果本身用戶的數量很少,人工信審和評估綽綽有余,則沒有太大的必要去使用人工智能技術來處理信貸審批的問題,當用戶的數量到達了較大量級之后才有意義,對于銀行來說,用戶不是問題,銀行本身用戶的量級一般都很大并且質量整體較好,對于互聯網巨頭來說,例如阿里、京東、字節等,本身的流量用戶數量非常大,這些用戶客群是天然的信貸產品的目標用戶
??信貸產品的獲客方式有很多,例如企業內積累的一些其它業務領域的用戶、渠道的引流(短信、廣告、人工電話推銷等),大家平常在日常生活中可能經常會收到XXX機構的電話,問你要不要借錢,或者是短信:“恭喜您獲得XXX機構的XXXXXX元額度,請點擊XXXX網址下載對應app進行借款,利息優惠放款快哦”,etc,關于用戶的獲客,很多機構使用的獲客方式都比較偏向純營銷一些,當然也有一些機構會使用精準營銷的方式來提高營銷的成功率,基于算法的精準營銷算是風控領域的“推薦”項目,和傳統的電商推薦存在很多相似之處但也存在較大的區別,本課程并不會在推薦相關項目上進行詳細描述。
初期的冷啟動問題
??當獲客的用戶達到一定數量之后,并且有了一定的深度和厚度的用戶數據積累,我們才可以開始構建一個風控體系,這個時候問題來了,初期沒有用戶的信貸資料的情況下我們如何防范風險?此時就涉及到了信貸準入模型的冷啟動問題,即初期只有少量甚至沒有用戶數據(例如沒有用戶的標簽因為用戶此時壓根就還沒開始借款),此時一般來說機構往往依賴于(下面按照重要程度依次展開)
??1.第三方數據:第三方機構數據可以說是機構非常重要的信息來源了,過去,互聯網信息獲取的方式處于較為灰色的地方,小貸公司可以非常自由的獲取用戶的基本身份信息,家庭住址,通訊錄等隱私信息,這也導致了非常大的公民信息泄露的隱患,這兩年國家對于互聯網信息獲取的手段管制越來越嚴格,目前許多早期重要的用戶個人信息已經不允許隨意獲取了,因此信貸機構逐漸非常依賴于第三方數據。
??目前在市面上有許多第三方數據商,這類數據商往往具有一些較為特殊的背景,例如百信金融,數美科技,永安科技等等,這類數據商往往和社保局,公安,運營商等具有一定的聯系,因此可以從公共服務部門獲取大量原始數據,典型的,例如用戶的多頭借貸數據(即用戶在幾家機構貸款),征信黑名單,設備風險評級等等,這類數據對于初期的冷啟動問題都具有極其重要的作用;
??2.風控策略:和風控算法工程師一樣,風控策略工程師也是整個風控體系中非常重要的一環,可以說,在數據的質量得到保證之前,風控體系的主力就是風控策略工程師,并且在后期也具有很重要的協調作用,主要原因在于模型是死的,而人是活的;
人工信審
??一般來說,對銀行等這類大型的機構都有專門的信審部門,當然,有的信貸公司可能信審只是走個形式甚至完全依賴于一些自動化技術,例如用戶申請貸款的時候常常需要用戶填寫身份證,地址,進行人臉識別的活體驗證等等,這些過程通過計算機視覺,自然語言處理等技術已經有非常成熟的解決方案了。
??信審部門的主要工作是對用戶的基本信息、資產信息等進行審查,其實大家在申請信貸產品的時候一般都會有一定的夸大收入、資產等自身資質水平的傾向,所以很多用戶的申請信息與相關數據等都存在一定的水分,需要通過信審部門進行調查與證實,對于資料造假或者資料不足的用戶直接進行拒絕;
風控引擎
??關于風控引擎,很多機構的叫法和用法都不盡相同,但是可以確定地一點是風控引擎的核心其實就是大量的if else規則,在風控領域,可以說萬物皆規則,無論是根據某些征信黑名單直接對黑名單用戶進行拒絕這樣簡單的規則,還是模型輸出的用戶的信用評分,確定某個閾值,接受高于閾值的用戶的申請,拒絕低于閾值的用戶的申請,其本質上都是規則。
??風控引擎是整個風控體系的主要組成部分,并且往往管理著不止一個的信貸產品,對于不同類型的產品,用戶的規則存在區別,例如針對于白領用戶的“白領貸”類型產品,會內置一些基本規則對所有申請的用戶進行查詢和篩選,例如年齡太大與太小,收入太低,沒有固定職業或從事高風險職業等用戶,在用戶數據進入信貸準入模型之前,全量申請用戶都會先經過風控引擎的“洗禮”之后然后過渡到模型階段進行用戶信用分的評估;
??這里需要額外去詳細解釋的,就是關于規則部分,整體來說,常見的規則體系可以劃分為下面幾種:
??1.前置規則:這類規則往往是定死的一些基本規則,典型的年齡限制,超過六十歲或小于十八歲的用戶一般是不受理其貸款申請的;
??2.風控規則:這類規則常常是由風控策略工程師來幫助制定的,我們前面提到的很多重要的第三方數據常常會被直接當作風控規則來使用,例如騰訊的設備評分,螞蟻的高危支付號關聯手機號等等;
??3.模型規則:需要注意的是,在整個風控體系中,模型并不一定是占據主導,很多時候,算法工程師所擔任的工作的最終輸出可以概括為用戶的評分體系,例如從用戶的行為信息,用戶的消費序列等等,相對而言較為弱的弱特征中挖掘出一定有價值的結果,并以評分的形式輸出,作為風控規則之一納入整個風控體系中。
反欺詐
??值得一提的是,反欺詐規則常見的方式也有兩種,一種是常規的基于某些第三方數據或自有的重要數據直接構建一些硬規則,例如對于平臺而言,逾期次數超過三次則用戶將被拉入黑名單不再對其進行貸款業務受理,或是命中了多條高風險的評分,例如同時命中騰訊和阿里的高風險手機號,則申請直接拒絕,另外一種形式就是反欺詐評分卡了,其實本質上也是用常見的邏輯回歸或xgb等極其學習算法,使用欺詐用戶標簽構建一個有監督模型,欺詐標簽一般來自于第三方數據或自身業務推進過程中的積累。
??反欺詐評分卡或反欺詐規則分析,反欺詐在評分卡中的應用僅僅是反欺詐領域的一個小分支,反欺詐本身所涵蓋的知識體系是非常豐富而復雜的,相對于成熟穩定,套路固定的評分卡構建來說,反欺詐的難度往往要高幾個級別,尤其是電商領域的反欺詐問題,根據不同的場景,或是同一個場景下的欺詐手法,使用的套路和模型常常是大相徑庭的;
??風控反欺詐,尤其是互聯網反欺詐業務也是目前的一個比較常見的崗位,相對于純粹的評分卡性質的風控算法來說,
信貸評分卡
申請評分卡、A卡
??這一部分就是該風控算法工程師大展身手的時候了,我們通過一些機器學習算法來構建一個健壯而泛化性能良好的模型,根據存量用戶的數據來對新用戶的信用進行評分,然后根據某個閾值來進行截斷,高于閾值的用戶進行放款,低于閾值的用戶拒絕放款,并且,用戶的信用評分作為重要的參考指標參與到后續的用戶的額度、期限、利率的定價上。關于用戶的額度、利率、期限等,其中常見的消費分期和現金分期產品的期限一般比較常見的有6和12個月。除此之外也有少部分3個月的極短期信貸產品和2~3年的較長期的信貸產品。需要注意,我們平常所說的車貸,房貸等大型貸款項目一般不屬于本課程主要涉及的部分,因為這類貸款往往是需要一定的抵押物,相對而言其用戶群體的質量較高,相對來說并沒有特別大的建模需求,因此市面上往往也比較少見這類直接對標車貸和房貸的風控崗位。
行為評分卡、B卡
??行為評分卡可以看作申請評分卡在時間上的擴展,相對于A卡的數據來說,B卡的特征更加豐富,因為我們擁有了用戶在拿到貸款之后的還款行為數據等一系列時序類數據,當然,我們前面提到過,并不是所有產品都有構建B卡的數據基礎與必要,例如7天為周期的現金分期產品,用戶貸后的數據往往是稀少的也難以反映用戶的某種潛在的不良行為模式。
??需要注意的是,行為評分卡一般是基于存量客戶上的,即“老客”,并且往往需要保證有較長周期的數據才能較好的保障B卡的模型效果,和A卡的作用一樣,行為評分卡也可以作為用戶放款(后續)的依據,并且因為擁有了更多維度的特征,行為評分卡的泛化性能往往相對于申請評分卡更高,我們可以根據行為評分卡的結果來作為參考,決定是否對老客戶的新的申請予以批準,并且在能夠動態的調整用戶的額度和利率,例如某個老客在還款期間經常出現拖欠的問題,則下次老客再來申請新的信貸產品則降低額度,提高利率或直接拒絕;
催收評分卡、C卡
??相對A和B卡而言,C卡的出場率較低,很多公司對C卡也沒有那么重視,造成這種現象的主要原因有:
??1.貸前風控是整個風控的重中之重,貸前做好了,貸中和貸后就相對容易;
??2.人的因素對貸后催收的效果影響很大,且很多公司在用戶發生M1(銀行一般是M2或M3)之后都會進行委外處理
??我們前面說過,很多公司往往在催收階段往往使用一些簡單的催收策略比如無腦給所有逾期用戶打電話消耗大量的人力和成本,或者直接委外處理,但是伴隨著目前整個信貸行業的發展趨勢,委外被慢慢的淘汰,各家公司開始重視自己的貸后催收團隊,為了提高利潤,貸后催收也越來越會向精細化的方法發展,模型+策略的優化則變得越來越重要。
??催收評分卡和A、B卡不一樣,催收評分卡往往包括了多個模型,其中有緩催模型、貸后N天響應模型、失聯修復模型等等
反欺詐評分卡、F卡
??反欺詐評分卡和我們常聽到的互聯網風控中的反欺詐的概念略微不同,反欺詐評分卡的做法其實本質仍舊是做有監督模型,其作用往往是作為反欺詐規則的補充,輸出反欺詐分,用于評估用戶是欺詐用戶的可能性是高or低
傳統信貸評分卡和大數據信用評分模型
??傳統信用評分卡基本是邏輯回歸一把梭,邏輯回歸因為其模型的輕量、易于部署、可解釋性強大、方便加入人工先驗知識,至今仍舊是很多銀行和金融機構所使用的主要模型,基本思想就是將好壞用戶的區分定義為傳統的機器學習中的線性的二分類問題,使用借款人基本信息、資產信息、征信報告等數據,預測借款人未來發生違約的概率,并根據概率對用戶的信用進行評分,比較常見的例如螞蟻的芝麻信用分、京東的小白信用分等形式都是很典型的信用評分體系(當然螞蟻和京東的評分卡不像銀行那么簡單)
大數據信用評分模型
??傳統信用評分模型使用的特征往往是嚴格限制數量的,一般主要包括了用戶的基本屬性、金融屬性、征信等強信貸類型的屬性特征,傳統的金融機構偏向于簡約型模型,即使用簡單的線性模型,并且特征的數量控制在一個較小的范圍內,這樣整個模型的可解釋性強,可控,穩定性高,便于人工進行分析和控制,然而這種做法是對大量弱特征的浪費,并對模型的精度和泛化性能有較大程度的削弱。
??大數據信用評估模型的基本思路是一切數據都和信用有關,在能夠獲取的數據中盡可能的挖掘信用信息。
??通過大數據采集技術,挖掘一個借款人的信用變得更加多元化,比如一個借款人缺乏銀行信用卡的數據,但從借款人的航旅出行數據中挖掘出具備較好的信用資質,同樣可以完成借款人的信用貸款。
??通過多源化的信息采集,一方面傳承了傳統征信體系的金融決策變量,重視深度挖掘授信對象的信貸歷史,另一方面能夠將影響用戶信貸水平的其他因素也考慮進去,如社交網絡數據、用戶地址文本信息等,從而實現深度和廣度的高度融合。
??以網絡數據為例,如設備是否蘋果,用戶申請貸款時的gps信息,用戶申請貸款的總時間等,這些數據一定程度上可以反應用戶的某些較為隱蔽的信息,有利于評估用戶當下的信貸風險。
??大數據信用評估模型通過融合多源信息,采用先進的人工智能技術進行大數據挖掘。
??這一點對于大型互聯網金來說尤其突出,例如支付寶,背靠阿里巴巴,往往擁有海量的電商數據,用戶的商品購買記錄,消費水平等對于用戶的信用評估具有重要的作用,除此之外,螞蟻自身也存在許多的理財產品例如典型的余額寶,因此,螞蟻自身的數據是非常多維而豐富的,而這類數據和銀行所擁有的信貸性質的特征不同,互聯網數據往往是海量而弱關聯的特征,這個時候就需要我們使用廣泛而前沿的技術來幫助挖掘出弱屬性特征中的magic。
信貸準入模型(A卡)的構建全流程
??一般來說,前期工作都完成妥當之后,申請用戶會被削減一部分,剩余的通過前置的各類規則之后的用戶會進入我們的建模過程,成為我們的樣本,在實際應用的過程中,我們拿到的原始數據是不直接包含標簽信息的,并且一般情況下也不太可能是直接的一張大寬表,而是不同的數據表,這些數據表的重要性各不相同,從用戶的注冊到登錄,到瀏覽,填寫資料到最終的申請等,再整個用戶的生命周期中,不同周期都對應著大量的表格,除此之外,還有第三方數據源,前置規則的預警或攔截日志等等,并且最為重要的是,初始的A卡的標簽需要我們根據用戶的還款情況記錄來進行定義。
??一般來說,我們要先根據用戶的還款情況,借助vintage分析和滾動率分析來對用戶的好壞以及表現期做出明確的定義
觀察時點的確定
??觀察期與表現期:
??觀察期:在觀察期,主要抽取用戶歷史的數據作為特征,用于后續建模
??表現期:用來定義用戶的標簽,作為模型預測的目標
??觀察點大部分時候是根據數據的完整情況+拍腦袋得到的,為了排除觀察點選擇時的隨機影響,一般會多次選擇不同的觀察點然后重復后續的建模步驟,例如我們有一段跨度為15個月的數據,一開始需要根據不同時間點或時間段的用戶數量,歷史數據的厚度和廣度等確定一個觀察時間點
??一這個時候我們需要先使用滾動率分析確定用戶的好壞定義,然后使用vintage分析來確定用戶的表現期
??補充:之所以選擇觀察時點是因為我們需要對訓練,驗證和測試集進行劃分,才能在離線階段評估模型的泛化性能,一般來說,我們線上的預測過程是使用歷史的數據建模預測未來數據,具有時間上的先后關系,所以我們需要保證模型構建階段也滿足和線上的預測過程一致的時間順序,即我們需要使用過去的數據來預測未來,而不能簡單的對全部數據繼續寧交叉驗證;
??之所以需要選擇觀察期(觀察期指觀察點往過去后推的一段時間,一般比較常見的是半年到一年的長度,太短則數據太少,太長則過于久遠的數據的分布和當前存在較大差異)和表現期,表現期的設定主要是考慮到用戶的風險需要一定的時間才能表現出來,常見的情況是用戶可能頭一兩個月正常還款,后面就開始賴賬了,因此我們需要盡量給用戶一個寬松的表現時間,將其逾期還款的無賴本質暴露出來。
滾動率分析
??在信用評分領域,一般會有一個叫客戶還款周期表的數據表來刻畫客戶的還款情況,逾期時間越長,客戶風險越高。但是,并不是客戶一旦有逾期行為就定義為’壞客戶‘,相反,逾期一定周期內的客戶的還款概率也是較高的,是有收益的,是可以接受的。因此,問題轉化為如何找到逾期周期與收益的平衡點,逾期超過多少天定義為’壞用戶‘是合理的呢?這就需要使用到滾動率分析。
??滾動率:一個時間段過渡到另一個時間段內的所有用戶逾期情況的比率變化。在信貸交易過程中,實際上是用戶的還款狀態由上個時間段向下個時間段滾動的比率計算。
??注意,前面說過,用戶的實際還款情況一般會記錄在一張單獨的還款記錄表上存放在數據庫中,我們要先根據用戶的逾期情況對用戶進行逾期周期標注,這里涉及到了逾期期數的概念,逾期期數M,指實際還款日與應還款日之間的逾期天數,并按區間劃分為不同的逾期狀態。M取自Month on Book的第一個單詞。基本上大部分機構的逾期標準定義如下:
??M0:當前未逾期(或用C表示,取自Current)
??M1: 逾期1-30日
??M2:逾期31-60日
??M3:逾期61-90日
??M4:逾期91-120日
??M5:逾期121-150日
??M6:逾期151-180日
??M7:逾期180日以上。
??此時也被稱為呆賬(Bad Debts),會予以注銷賬戶(write-off)
例如某一個用戶的逾期情況可能是這樣的:??上述為一個還款周期為14個月的信貸產品,即該信貸產品的周期為14個月,需要注意,信貸產品的周期并不一定以一個完整的自然年為定義,例如上述14期的信貸產品我們就無法以年為單位,并且不同用戶發放貸款的月份是不同的,因此實際上我們所說的用戶的還款周期實際上是按照用戶被發放貸款到產品周期結束來定義的。
??假設一個客戶在11月還款日的時候沒有及時還上錢,那么他的逾期期數就記為1,如果他在下個月仍然沒能在還款日時還上這筆款,那么他的逾期期數就記為2,期數會持續累加,直到他把這筆款還上。
??所以上表中的這個客戶,他在觀察期里11月有過1次逾期,12月還清欠款,但是在次年的3-5月連續逾期,也就是說該客戶在一個完整的還款周期里的逾期記錄應該是3期(一般我們是取用戶的最長的逾期記錄作為用戶的逾期情況的評估)。同理,在后1年里面最壞的逾期記錄是2期。
??注意這里的前1年對應上面的觀察期,后1年對應上面的表現期,因此上圖的觀察時點是前一年的8~9月份之間的某一天,往前推14個月為觀察期,往后推12個月為表現期。
??那么當我們有n個用戶的時候,就有n個上述的記錄,然后:
??1、統計客戶在觀察期(如前一年)的最長逾期期數,按最壞逾期狀態將用戶分為幾個層次,如M0、M1、M2、M3、M4.。。。。
??2、以觀察點為起始時間,統計客戶在表現期(如后一年)的最長逾期期數,按最壞逾期狀態將用戶分為幾個層次,如M0、M1、M2、M3、M4.。。。。。
??3、如果某個用戶觀察期最壞逾期狀態為m1,表現期最壞逾期狀態為m2,則滾動率表格中,(m1,m2)的計數加1,依次類推;
??4、統計客戶占比;
??5、為了排除觀察點選擇時的隨機影響,一般會選擇多個觀察點,然后重復上述步驟得到最終的較為客觀和穩定的用戶的好壞定義
滾動率分析表如下圖
??得到了滾動率分析表之后,就基本完成了滾動率分析了,可以看到,滾動率分析本質上就是分析觀察期和表現期,用戶的最壞逾期狀態的遷移情況。可以看到,上表中,(m0.m0)對應的90.81%表示的是觀察期未逾期的用戶在表現期也沒有逾期的占比,例如觀察期未逾期用戶為100人,表現期這100個人中僅僅10個人發生逾期,則(m0,m0)對應的值為1-10/100=0.9,可以看到,上圖中,觀察期逾期狀態為m7的用戶在表現期仍舊有93.07%的用戶未改變逾期狀態,即這批人
??為了更好的理解滾動率分析的過程,這里放一下大佬求是汪的知乎圖
從這張圖中,我們就可以很清楚的明白滾動率分析的具體過程了:
??1.從老客中選擇10000個用戶進行計算;
??2.統計觀察期所有用戶的逾期狀態并進行統計,可以看到,觀察期間,有9000個用戶未逾期,500個用戶發生了m1的逾期,300個用戶發生了m2的逾期,150個用戶發生了m3的逾期,50個用戶發生了m4的逾期;
??3.統計表現期的用戶的逾期情況,可以看到,觀察期未逾期的用戶中,有8640個用戶繼續保持未逾期的狀態,270個用戶逾期1個月,90個用戶逾期兩個月;依次類推
??4.可以看到,在觀察期逾期m4+的用戶中有40個仍舊處于m4+的逾期狀態,可以看到這批用戶基本上大部分無法轉化為未逾期或逾期較輕的用戶,因此我們可以初步認為,m4+就是一個壞客戶的定義,因為m4+逾期的用戶很難變成正常用戶而是繼續保持老賴狀態
vintage分析
??vintage分析是用來確定成熟期的,前面提到過,用戶的風險需要一定的時間來暴露,這個時間段就是成熟期,注意,成熟期是指觀察時點之后我們要取得表現期的時間的長度,這里比較容易和我們上面談到的表現期混淆,一個簡單的例子幫助了解,假設我們獲取了某個觀察時點,這個觀察時點前,數據有記錄的時刻開始到觀察時點的時間我們可以稱之為“歷史數據時間間隔”,但是一般來說我們不可能取所有的歷史數據,只會取最近一段時間的數據作為觀察期,比如我們不太可能取過去五年的所有數據,因為越早的數據分布情況和觀察時點的數據分布情況差異往往越大,因此,假設數據日期有5年,我們可能只會取最近一年甚至是最近半年的數據作為觀察期,同理,觀察時點到當前時間之間的數據記錄我們可以稱之為“當前日期時間間隔”,當然,我們也不一定會使用到當前的所有最新數據來建模,因為有的用戶可能距離當前時點,上個月甚至上周才放款,這類用戶壓根就沒什么充足的數據,必須驅逐在外,所以假設觀察時間點到當前時間點時間間隔為6個月,則可能我們會取4~5個月作為表現期長度,而成熟期的長度必然是小于等于表現期長度的;
??vintage涉及到賬齡MOB的概念:
??賬齡(Month of Book,MOB)、
??指資產放款月份。類似于嬰孩一出生就有了年齡,一旦申貸訂單被放款,也便擁有了賬齡和生命周期。
??MOB0:放款日至當月月底
??MOB1:放款后第二個完整的月份
??MOB2:放款后第三個完整的月份
?? 。。。依此類推
??一圖勝千言,可以看到vintage分析一般是按照月份進行統計的,需要注意,我們是先做滾動率分析確定了好壞客戶的定義之后,然后再做vintage分析確定用戶的成熟期,以上圖為例,滾動率分析確定m4+的用戶為壞客戶,因此,mob的1~3個月的占比均為0,因為此時用戶還沒有觸發逾期定義,到達第四個月之后,可以發現,所有放款用戶中的壞客戶比例開始出現,我們以2018年01月為例,第四個月壞客戶占比0.93%,第五個月1.52%,第6個月2.05%。。。第十二個月3.85%,可以看到,隨著時間的延長,整個用戶群體的風險暴露的越來越徹底,從最初的0.93%到最終的3.85%左右,并且壞用戶的占比不再發生顯著的變化,
??我們需要一個良好的成熟期長度來讓用戶的風險徹底暴露,但是成熟期又不能太長,比如你成熟期定義個12個月,則數據的分布在太長的周期下又會發生變化,并且成熟期太長則觀察期相應會縮短,建模樣本變少對模型不利,那么這里的成熟期如何定義,很簡單,根據上表和上圖,可以看到,從9月份開始,9~12月,不同月份(2018年1、2、3、4.。。。)下觀測的用戶的整體的壞客戶比例就趨于穩定了:
??可以看到,壞樣本占比在一個非常小的區間內波動,此時我們可以認為壞客戶比例“收斂”,用戶已經充分暴露風險了,那么我們就可以選擇9個月作為我們的成熟期長度。
??那么當我們確定了成熟期長度之后要做什么呢,很簡單,正式構建建模用的樣本,具體的過程是這樣的:
??1.2018年1月份放款用戶往后推9個月,凡是在這9個月之內最壞逾期情況為m4+的用戶我們打上標簽1,其它用戶則打上標簽0;
??2.2018年2月份放款用戶往后推9個月,凡是在這9個月之內最壞逾期情況為m4+的用戶我們打上標簽1,其它用戶則打上標簽0;
??3.依此類推。。。
??最后我們可以構建出許多好客戶和壞客戶的樣本
pay attention
??在實際的應用過程中,我們并不一定教科書式的完全按照上述的方法來,而是業務根據實際的產品性質,例如偏保守還是偏盈利,來對用戶的好壞定義進行選擇,比如說對于那種短周期一個月的現金分期產品,一般就直接拍腦袋,逾期就算壞客戶,所以具體情況還要結合具體實際產品分析,除此之外,好壞客戶的定義也不一定是固定的,當我們后續的建模發現模型的效果較差的時候,也常常需要對之前的分析進行一定的調整,例如m3的用戶定義為壞客戶,成熟期重定義等等
總結
以上是生活随笔為你收集整理的金融风控实战——信贷评分卡的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 电信用户流失预测案例(3)
- 下一篇: 金融风控实战——Hive详解(数据读取、