诚安聚立总裁刘志军:对标三大征信局与FICO 坚持风控能力输出
誠安聚立總裁劉志軍:對標三大征信局與FICO 堅持風控能力輸出 | 愛分析訪談
同花順?08-08?08:14調研 | 李喆 青川
撰寫 |青川
隨著監管趨緊、行業競爭加劇,P2P、消費金融最佳創業期已過,行業進入精耕細作階段。現階段無論傳統銀行還是消費金融機構,對大數據營銷、大數據風控等金融科技都愈加重視,所以圍繞金融科技的創業也就水到渠成。
誠安聚立便是一家2B的金融科技公司,主要從事風控環節的技術輸出,包含數據采集、數據清洗、大數據建模等。公司成立于2016年9月,迄今尚不足一年,成立之初便獲得凱撒世嘉9000萬元的天使投資。
誠安聚立創始人&總裁劉志軍是風控領域專家,曾任Capital One銀行統計分析部資深總監,Equifax首席統計學家,密西西比大學統計學副教授,此外,劉志軍也曾任馬上消費金融首席數據官,對國外征信、風控發展歷程和國內發展現狀認知深刻。不碰業務,堅持技術輸出
不導流、不放貸、不兜底是誠安聚立的基本原則,作為第三方技術服務公司,不觸碰業務才能保持中立性,抵消機構用戶的質疑。數據采集、數據處理、模型搭建是風控中最重要的環節,誠安聚立正在搭建一站式云審批平臺,為機構用戶提供信審服務。
信貸數據可分為三類,第一類是身份數據,用于確認用戶身份;第二類是統計學數據,例如性別等對還款行為有影響的數據;第三類是行為數據,比如征信數據、電商數據、通話行為等。
數據采集方面,誠安聚立本身覆蓋了很多第三方數據源,在獲得用戶授權后,可以從第三方數據源獲取數據,對于第三方數據源沒有覆蓋的數據,也會通過網絡爬取的方式獲得,比如公積金、通話記錄等數據。
但誠安聚立本身不會建用戶信息數據庫,而是在合作方委托的情況下去做數據查詢。舉個例子,當合作方需要用戶的銀聯數據時,誠安聚立會到銀聯內部查詢用戶的流水,將其標簽化為模型中所需的變量。
數據處理方面,美國由三大征信局完成,國內則缺乏相應的機構和統一的處理標準。所以國內金融機構接入的數據是完全沒有處理過的,除了是與非的判斷性數據,其他的都需要機構重新結構化、格式化,目前誠安聚立對主要數據源完成了這項工作。
另外,涉及到人的數據通常噪音比較大,如果沒有數據處理能力,無關變量會影響到風控結果且難以回溯,所以去噪、篩選相關變量的能力尤為重要。
模型建立上,誠安聚立集中在反欺詐和信用風險管理兩個環節,通過機器學習建模。傳統風險模型是在計算能力受到限制的情況下的基于強假定的風險評估方法,隨著技術的演進,越來越多的機構開始建立機器學習模型,美國三大征信局、Capital One十多年前便通過機器學習建模,國內一些金融機構和Fintech創業公司也在做人工智能風控。
根據合作方的需求,誠安聚立可以提供全流程的服務,也可以提供單獨提供每一模塊的服務。
從現金貸企業做起,目標客戶是銀行
大數據風控適用于2C的信用貸款,所以銀行、P2P、現金貸等企業都是誠安聚立的目標用戶。
誠安聚立在今年1月份正式開展業務,迄今僅半年,服務的機構數尚不多,大部分對接機構還處于業務驗證階段,合作機構切一部分流量到誠安聚立,通過對比違約情況確定是否采用誠安聚立的服務。
前期誠安聚立用戶以現金貸企業為主,原因是獲取現金貸企業門檻相對較低,對接周期較短。通過服務現金貸企業,誠安聚立可以較快地實現營收,預期今年能做到盈虧平衡。
由于采用按單量收費的方式,對誠安聚立來說,業務量巨大的銀行才是最有價值的用戶,目前誠安聚立正在與渤海銀行以及一些城商行建立合作,為其信用卡以及消費分期業務提供信審。
根據用戶要求不同,誠安聚立服務方式也有差別。銀行機構對數據安全性要求較高,數據、模型服務均需本地部署;現金貸公司本身對云服務接受度較高,誠安聚立對其服務也建立在公有云上。
我們認為風控技術輸出會成為新金融的下一發力點,從發展思路上看,既有從業務開始做,進而將自有風控能力輸出的公司,也有誠安聚立、氪信這類不做業務,純技術輸出的公司。
前者的優勢是模型經過自有業務驗證,具有一定的說服力,但既做運動員,又做裁判員很難讓合作方放心;相比之下,誠安聚立只要風控能力得到驗證,更容易被接受。
行業風口并不會太久,一旦頭部標桿用戶被搶占,再服務尾部用戶意義有限,所以獲客能力尤為重要。行業內已有同類型公司正在搶占標桿客戶,誠安聚立需要加強其獲客能力。
此外,誠安聚立核心團隊有多年消費信貸領域風控經驗,首席風控官、首席數據官均出身Capital One,業務經驗豐富。
近日,愛分析對誠安聚立創始人&總裁劉志軍進行了訪談,現選取部分內容如下,供讀者參考。
愛分析:誠安聚立做風控輸出有何優勢?
劉志軍:我覺得有三點優勢,第一是對行業的理解,我們團隊的主要人員——業務、技術、數據、模型負責人,都有深厚的行業經驗,能夠理解業務的本質,然后運用大數據、模型來做決策,這是我們的一個優勢。
第二是技術能力,我們把目前大數據相關的IT技術掃了一遍,找出其中可以用到我們業務上的技術,包括Hadoop、Spark、MongoDB等,用最新技術把數據流程、業務流程搞起來。
第三是數據和模型,計算機技術發展使得建模方法突破了很多傳統假設,計算能力的增強使得建模不需要基于很強的理論假定,算法可以通過優化來做。比如用X、Y軸坐標和用極坐標的函數結果簡單程度就不一樣,通過技術和經驗上的優勢,我們可以不拘泥于一種方式來解決問題。
愛分析:為何只做技術,不做業務?
劉志軍:我在美國將近30年,從業經驗讓我覺得,做風控技術輸出要完全由第三方的身份,不能有任何利益上的沖突。別人客戶申請資料拿過來,客戶的身份證號、電話我都有記錄,所以我們必須不放貸、不導流,這樣才能保持中立性。
還有,我們不做兜底,兜底沒有放貸那么嚴重的利益沖突,但至少有一些。而且我們是一家輕資產公司,如果要做兜底的話,服務一家一年放一百個億的企業,我要準備十個億的資本金,這個模式不是這么玩的。關于數據
愛分析:哪些數據效果最好?
劉志軍:直接跟征信有關的行為數據是最好的,但目前只有銀行、持牌消費金融公司能拿到央行的征信數據,別的機構只能靠替代性的行為數據,有的相關性強,有的相關性弱。完全取代是不可能的,但比沒有好很多。
比如我們在美國試過,信用卡交易行為跟征信報告關聯性就很強,預測信用風險就很接近。但是比較麻煩的是只有卡信息沒有人信息,此外中國還有微信、支付寶多種支付渠道,因此客戶交易信息會缺失。
愛分析:社交網絡數據的使用效果如何?
劉志軍:社交網絡的數據要慎重使用,因為在美國用的不是特別好。信貸行為是比較嚴肅的行為,反映的是借錢還錢的行為,像交易數據、通話數據都能反映用戶比較真實的活動特征。但社交網絡就不一定,你不確定他在里面扮演的角色是否真實。
另外一個大問題是,社交網絡數據是沒法驗證的,不像征信、電商數據,出錯了肯定會有人糾正,覺得吃虧了的人肯定要把他糾正過來,但社交網絡數據出不出錯,你是完全不知道的。
愛分析:會使用運營商的數據?
劉志軍:我們跟聯動優勢聊過,他們會整一些數據,此外我們也會使用用戶授權爬取得運營商數據。但真正比較全面的數據還是在各省運營商,我們目前沒有計劃單獨跑各省。
我們合作的銀行希望能用運營商數據做營銷,我們可以提供一些幫助,在篩選客戶時不僅考慮轉化率,同時做一些風險控制,這樣不僅轉化率高,通過率還高,效率更高。
愛分析:合作的銀行或者現金貸公司會提供一部分數據嗎?
劉志軍:沒有。這里面有個誤區,大家認為金融機構在做放貸就有會很多數據,他們有的無非就是客戶的身份信息、客戶的記錄、還款表現數據,別的也沒有了。還款表現數據很重要,我們可以據此訓練模型,但問題是他們審批時查了哪些數據,如果沒有的話很難回溯。只有Y,沒有X,依舊沒有辦法訓練模型。
此外,銀行老說自己內部有多少數據,其實都是存量的,除非做交叉營銷,否則沒有太多意義。像工行這類銀行,客戶基礎很大,內部數據處理好做交叉銷售,儲蓄客戶變信貸客戶是有意義的,但像城商戶本身客戶就沒多少,趕緊去外部獲客才有意義。
關于模型
愛分析:模型準確度有什么評價標準嗎?
劉志軍:好多類標準,一個是簡單的統計量標準,大家常用KS值。更重要的是業務標準,用新的模型做決策,跟原來的流程比較,同樣的風險層級,誰的通過率高;或者同樣的通過率誰的風險高,更好的是同樣的通過率誰貢獻的價值大,掙錢多。
愛分析:一個模型的生命周期大約多久?
劉志軍:模型和模型差異很大,很多因素包括建模方法、客戶群體、外部環境、產品都會影響模型的生命周期。中國發展這么快,外部環境變化很快,一個模型的壽命比美國要短很多。我們會設定很多指標監控模型,如何適用度降低很多,就會考慮是不是重建模型。
愛分析:機器學習算法是一個黑盒,是不是很難解釋風控結果?
劉志軍:不是通過嚴格試驗設計獲取的數據,僅僅靠觀察數據是無法科學地解釋模型的。最簡單的統計模型也很難解釋,只是大家覺得好解釋。
舉個簡單例子,我們曾建模分析小鎮的犯罪率,最后發現ATM機數量跟犯罪率相關度很大。如果ATM機數量多,犯罪率低,否則犯罪率就高。這個怎么解釋?顯然不是因果關系,如果是因果關系的話讓銀行多設幾臺ATM機就能降低犯罪率了,這個只能是相關性關系。
我們建模型是一樣的,對風險預測,就是通過能觀察到的數據對觀察不到結果的做一個預判,統計上只有這類變量跟我要預測的東西關聯度很強就可以了。運用到信貸領域,我們不管征信數據還是其他數據跟壞賬是不是因果關系,只要關聯性特別強就可以了。
愛分析:銀行對壞賬要求更高,風險劃分會更細致?
劉志軍:其實就是后期模型的設置、應用上更精細。比如我有模型分,還有別的信息,現金貸簡單粗暴做個決策就可以了,但銀行就要定信用卡額度,額度太高,風險跟額度不適配,增加了風險;額度太低用戶就不用了,要判斷最合適的額度在哪里。
愛分析:銀行和現金貸用戶的數據處理難度會有不同?
劉志軍:差不太多,現金貸雖然對風控要求低,但要處理的數據維度更大,因為要處理的信息更廣泛,其實維度不會減少。
愛分析:銀行對審核時間會有要求嗎?
劉志軍:絕對會有,只是現在模式沒做成這樣,一方面是監管有要求,得面簽;另一方面也有銀行固有思維的問題。目前技術實現上完全沒有問題,還是思維上的障礙。關于運營
愛分析:主要成本有哪些,會包括數據采集成本么?
劉志軍:數據有的時候是我們采集,有的時候是用戶收集,但成本都是客戶承擔。我們的成本其實就是建模、維護模型的人力成本,租用云服務的成本,基本沒有別的。
愛分析:所以會邊際成本遞減?
劉志軍:對,規模效應非常明顯。我們要做定制化模型,根據每個上線客戶的產品做配置,配置完了就可以上SaaS模式。申請單量的增加對我們沒有任何影響,同一個客戶同一個產品,它的單量一萬筆跟一百萬筆我們付出的成本差不多。只是客戶數增加的情況下我們的人力要增加,未來人力相比目前最多翻一倍。
愛分析:目前團隊規模如何?
劉志軍:80多人,包括技術、數據、產品、項目管理、商務BD等。其中技術是最大的團隊,數據是第二大的團隊,未來人力增長主要是數據部分的人數。
總結
以上是生活随笔為你收集整理的诚安聚立总裁刘志军:对标三大征信局与FICO 坚持风控能力输出的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 奥巴马女儿要上哈佛了!从小给女儿定下了五
- 下一篇: 【深度学习下一大突破】吴恩达对话 Hin