大数据征信应用与启示 ——以美国互联网金融公司 ZestFinance为例
大數據征信應用與啟示 ——以美國互聯網金融公司 ZestFinance為例
近期,美國互聯網金融公司ZestFinance受到國內互聯網金融專業人士的熱捧,其基于大數據的信用評估模型也越來越受到關注和效仿。本文結合美國的金融環境,對ZestFinance進行簡要介紹,分析大數據征信產生的背景,剖析大數據征信技術,并全面客觀地闡述了大數據征信技術對于中國互聯網金融和征信業未來發展的借鑒意義。
ZestFinance簡介
ZestFinance,原名ZestCash,是美國一家新興的互聯網金融公司,2009年9月成立于洛杉磯,由互聯網巨頭谷歌(Google)的前信息總監道格拉斯·梅瑞爾(Douglas Merrill)和金融機構Capital One的信貸部高級主管肖恩·卜德(Shawn Budde)(曾管理過收益超過10億美元的次級信貸業務)聯合創辦。ZestFinance的研發團隊主要由數學家和計算機科學家組成,前期的業務主要通過ZestCash平臺提供放貸服務,后來專注于提供信用評估服務,旨在利用大數據技術重塑審貸過程,為難以獲得傳統金融服務(Underbanked)的個人創造可用的信用,降低他們的借貸成本。
ZestFinance起初是為傳統的發薪日貸款(Payday Loans) 提供在線替代的產品。發薪日貸款因借款人承諾在發薪日還款而得名。由于美國傳統的信用風險評估體系無法覆蓋全部的人群,大約15%的人因沒有信用評分而被銀行排斥在外,無法獲得基本的信貸需求。除了解決傳統信用評估體系無法解決的無信用評分借貸問題,ZestFinance還主要面向傳統信用評估解決不好的領域,將信用分數低而借貸成本高的人群視為服務對象,利用大數據技術降低他們的信貸成本。與傳統信貸管理業務比較,ZestFinance的處理效率提高了將近90%,風險控制方面,ZestFinance的模型相比于傳統信用評估模型性能提高了40%。
ZestFinance目前也正在向信用風險管理的其他領域縱深擴展,2014年2月ZestFinance宣布推出基于大數據分析的收債評分(Collection Score),旨在為汽車金融、學生貸款、醫療貸款提供一種新的評分系統。ZestFinance的未來發展方向是希望把其在這種發款日的貸款上的優勢繼續拓展到其他貸款領域,包括信用卡、汽車的貸款,甚至包括房屋的貸款,在未來的10~15年,這一方法將取代現行指標,成為申請信貸的唯一評估標準。
ZestFinance引起國內的關注始于2013年7月,當時全球第三方支付平臺PayPal聯合創始人、美國知名投資人彼得·泰爾(Peter Thiel)領投了ZestFinance的2000萬美元融資。
為什么要進行大數據評估傳統的信用評估服務無法覆蓋全體人群,特別是弱勢群體
圖1展示了美國FICO評分與其對應的人口分布情況,初始每個人的分值基數為850分,信用評分模型利用征信數據從多個評分因素考察消費者的信用風險,從850分中減分。大致來看,美國個人消費者信用評分人群分布狀況呈現兩頭小中間大的形態,信用分數處于750~850的人群有40%之多,其中信用分數在800~850大約占總人數的13%,在750~799超過總人數的25%,這是整個信用社會的中間階層,對應于美國的中產階級。其中,美國個人消費者的平均FICO評分為678。從圖1可以看出,還有大量的人群遠低于平均的678分,如FICO評分在550~549的占8%,在500~549的占5%,小于499分的占2%。根據FICO的標準,如果人們未能如期還款,或者缺乏借貸經歷,他們就會自動被視為風險人士,他們的貸款也就會被懲罰性地給以更高的利率。還有一種可能,那就是他們的貸款申請會被拒,無論是否事出有因。比如,遇到了醫療緊急事故,或者最近剛剛移民美國。表1根據FICO評分將服務人群分為四個區間,并對應不同的金融服務機構。信用記錄不完整或者不夠完善的個人消費者,依據傳統信用評估體系(FICO評分),往往很難被傳統金融服務機構所覆蓋,即使在金融體系發達的美國也無法獲得常規的金融服務,或者需要付出很大的代價才能獲得常規的金融服務。
傳統信用評估模型信息維度比較單一
傳統的FICO評分模型的基本思想是比較借款人信用歷史資料與數據庫中的全體借款人的信用習慣,檢查借款人的發展趨勢跟經常違約、隨意透支,甚至申請破產等各種陷入財務困境的借款人的發展趨勢是否相似。如圖2所示,它主要從五個方面考察用戶的信貸資質。但隨著信貸業務的進一步開展,FICO信用評分由于單一的標準、嚴苛的門檻和片面的評估結果而飽受詬病。
傳統的信用評估模型雖然在進行信用風險管理過程中發揮了很大的作用,如曾經促進了美國房貸市場的飛速發展。但在大數據背景下個人消費者出現許多信息維度,如電子商務、社交網絡和搜索行為等,傳統信用評估模型解決問題的能力越來越受限。
傳統信用評估模型時間上比較滯后
雖然FICO評分仍然體現風險排序,但其預測絕對風險的能力和在2008年金融危機中的表現飽受指責,圖3展示,FICO分數從2005年到2011年在美國人口中的分布基本上沒有大的變化,這和2008年金融危機爆發之后出現大量壞賬的現實嚴重不符。
由于傳統的基于FICO評分的信用評估模型覆蓋人群窄、信息維度單一、時間上滯后,所以,在大數據時代,需要探索信用評估的新思路。國外三大征信機構和FICO公司都已經開始了如何利用大數據技術來完善傳統信用評估體系的前瞻性研究,如益百利(Experian)投入研究團隊關注社交網絡數據對信用評分的影響,FICO公司多年前就開始了在線評估的信息工具和基于互聯網的信用評估系統的項目研究。
ZestFinance大數據信用評估的實踐
ZestFinance的基本理念是認為一切數據都是和信用有關,在能夠獲取的數據中盡可能地挖掘信用信息。ZestFinance對大數據技術的應用主要從大數據采集和大數據分析兩個層面為缺乏信用記錄的人挖掘出信用。
大數據采集技術
ZestFinance以大數據技術為基礎采集多源數據,一方面繼承了傳統征信體系的決策變量,重視深度挖掘授信對象的信貸歷史。另一方面,將能夠影響用戶信貸水平的其他因素也考慮在內,如社交網絡信息、用戶申請信息等,從而實現了深度和廣度的高度融合。
ZestFinance的數據來源十分豐富,依賴于結構化數據的同時也導入了大量的非結構化數據。另外,它還包括大量的非傳統數據,如借款人的房租繳納記錄、典當行記錄、網絡數據信息等,甚至將借款人填寫表格時使用大小寫的習慣、在線提交申請之前是否閱讀文字說明等極邊緣的信息作為信用評價的考量因素。類似地,非常規數據是客觀世界的傳感器,反映了借款人真實的狀態,是客戶真實的社會網絡的映射。只有充分考察借款人借款行為背后的線索及線索間的關聯性,才能提供深度、有效的數據分析服務,降低貸款違約率。
如圖4所示,ZestFinance的數據來源的多元化體現在:首先,對于ZestFinance進行信用評估最重要的數據還是通過購買或者交換來自于第三方的數據,既包含銀行和信用卡數據,也包括法律記錄、搬家次數等非傳統數據。
再次是網絡數據,如IP地址、瀏覽器版本甚至電腦的屏幕分辨率,這些數據可以挖掘出用戶的位置信息、性格和行為特征,有利于評估信貸風險。此外社交網絡數據也是大數據征信的重要數據源。
最后,直接詢問用戶。為了證明自己的還款能力,用戶會有詳細、準確回答的激勵,另外用戶還會提交相關的公共記錄的憑證,如水電氣賬單、手機賬單等。
多維度的征信大數據可以使得ZestFinance能夠不完全依賴于傳統的征信體系,對個人消費者從不同的角度進行描述和進一步深入地量化信用評估。
大數據分析模型
圖5展示了ZestFinance的信用評估分析原理,融合多源信息,采用了先進機器學習的預測模型和集成學習的策略,進行大數據挖掘。首先,數千種來源于第三方(如電話賬單和租賃歷史等)和借貸者的原始數據將被輸入系統。其次,尋找數據間的關聯性并對數據進行轉換。再次,在關聯性的基礎上將變量重新整合成較大的測量指標,每一種變量反映借款人的某一方面特點,如詐騙概率、長期和短期內的信用風險和償還能力等。然后將這些較大的變量輸入到不同的數據分析模型中去。最后,將每一個模型輸出的結論按照模型投票的原則,形成最終的信用分數。
其中,ZestFinance開發了10個基于機器學習的分析模型,對每位信貸申請人的超過1萬條數據信息進行分析,并得出超過7萬個可對其行為做出測量的指標,在5秒鐘內就能全部完成。這10個模型以如下的方式進行投票:讓你最聰明的10個朋友坐在一張桌子旁,然后詢問他們對某一件事情的意見。這種機制的決策性能遠遠好于業界的平均水平。
近年來,這種基于大數據的信用風險評估框架(遠不能稱為主流的信用評估方法)被國內外多家互聯網金融機構采用,如德國的Kreditech、美國的Kabbage,以及國內最近獲得IDG公司A首輪4000萬元投資的閃銀(Wecash)等,對傳統的信用體系形成了沖擊。
如表2所示,將這種將基于大數據技術的信用評估體系和傳統信用評估(以美國的征信體系為例)相比,發現主要的區別有以下幾個方面。
(1)從服務的人群來說,新的信用評估體系可以服務沒有被傳統征信體系覆蓋的人群,即沒有征信記錄的人群(美國的征信體系能夠覆蓋85%的人群,覆蓋不到15%的人群)。
(2)從數據源來說,這種新的信用風險評估體系大量采用非傳統的信用數據,包括互聯網上的行為數據和關系數據,傳統的信用數據(銀行信貸數據)的比重僅占到了40%,甚至完全不用傳統的信貸信用數據進行風險評估。
(3)從關注的側重點來看,傳統的信用評估模型更關注授信對象的歷史信息,致力于深度挖掘。而新的信用評估體系更看重用戶現在的信息,致力于橫向拓展。
(4)信用量化評估的方式也發生了改變,新的信用評估體系拋棄了只用很少變量的FICO信用評分模型,基于大數據技術,不僅采用機器學習的模型,而且使用更多變量,一方面可以使信用評估的決策效率提高,另一方面還明顯降低了風險違約率。
對中國互聯網金融和信用評估的啟示
利用大數據技術的信用評估方法在現實中有著很大的市場需求,如國內快速發展的互聯網金融中的風險管理問題。目前互聯網金融處于快速的發展過程中,根據銀監會的統計,目前國內可查的P2P網貸公司已經達到1200家。信用風險評估是P2P網貸的核心問題,存在很多挑戰,如很多信貸客戶沒有或者是缺乏銀行的信貸記錄。在應對風險控制的挑戰時,ZestFinance受到了互聯網金融機構的熱捧,目前國內多家互聯網金融機構正在和ZestFinance洽談合作,認為這種利用大數據技術的信用評估方法是解決國內互聯網金融和普惠金融的信用風險管理問題的靈丹妙藥。然而對于ZestFinance的大數據征信技術,還需要有全面的認識。
(1)ZestFinance的大數據征信是完善和更新傳統征信系統的積極嘗試,而不是替代品。美國的金融體系比較健全,而且信用體系也比較健全,這是ZestFinance賴以生存的土壤。ZestFinance的服務人群定位比較清晰,并且有完善的征信體系做支撐,ZestFinance并不是完全擺脫傳統征信體系,在ZestFinance進行信用評估時,傳統征信數據要占到至少30%。中國的金融生態環境和美國還是有一定的差別,ZestFinance的經驗不能直接照抄照搬,需要進行消化吸收,結合中國的實際情況來進行大數據征信。另外,生活在互聯網時代,面對大數據技術的發展,美國三大征信機構以及FICO也已經開始大數據征信方面的研發(作為常規的數據源更新的一種方式),但截至目前,尚未形成獨立的信用評估手段。
(2)ZestFinance的體量不大,目前僅為10萬美國人提供了服務,在美國的影響力有限,真實的效果目前還很難總體評價。截至2013年7月,ZestFinance的C輪融資達到2億美元。
(3)ZestFinance的大數據分析模型也給信用風險管理帶來復雜性的挑戰。傳統的基于FICO的信用評估方法,處理的變量比較少,對每一個變量進行細致地處理,并且可以給出合適的解釋,模型的透明性可以方便地在銀行的不同部門之間進行溝通,而且便于個人消費者對分數的理解。ZestFinance的基于大數據的數以千計的變量規模和多模型使得數據的處理和模型的解釋變得比較復雜,在實際應用中會帶來許多麻煩。
(4)大數據的應用要注意個人的隱私保護。ZestFinance在利用個人消費者的大數據進行信用評估時,很多數據會涉及個人隱私,如對于個人社交網絡的數據(微信朋友圈)和電商交易的數據、通話記錄、微博的數據等應用,美國對個人隱私的保護是有明確的邊界的。而國內關于個人隱私方面的保護目前處于空白,已經出現國內一些互聯網金融公司為了進行信用評估,忽視個人消費者的知情權和隱私保護。因此在利用大數據進行信用評估的時候,要考慮使用個人隱私的合規性前提。
雖然以ZestFinance為代表的新興信用評估體系還不夠成熟,但是為征信業的變革注入了活力,特別是對于中國的征信體系的建設會有一定的啟示作用。
(1)普惠金融需要挖掘更多人的信用。國內目前真正發揮作用的征信體系主要是央行的征信系統,所覆蓋的人群還是非常有限,遠遠低于美國征信體系對人口的85%的覆蓋。目前我國個人有征信記錄的僅有約3.2億人,約占13.5億人口中的23.7%。國內數量龐大沒有被傳統征信體系覆蓋的人群同樣也需要信用服務,享受金融普惠,這就需要探索征信的新思路。
(2)互聯網上的海量信息可以成為征信體系的新數據源。ZestFinance的大數據實踐的重要方面就是大量地利用互聯網上的數據作為征信的數據源。中國目前是世界上互聯網人口最大的國家,截至2013年12月,中國網民規模達6.18億人,互聯網普及率為45.8%,其中手機網民規模達5億人,繼續穩定增長。2013年中國網絡購物用戶規模達3.02億人,網絡使用率達到48.9%。截至2013年12月,我國使用網上支付的用戶規模達到2.6億人。這些海量而且豐富的互聯網數據資源可以被國內征信體系建設很好地利用,通過分析互聯網上這些信用主體的基本信息、交易行為信息和金融或經濟關系信息,同樣可以挖掘出這些信用主體的信用模式。
(3)大數據技術可以使得“一切數據皆信用”成為可能。以大數據為代表的IT新技術的應用,給征信體系建設帶來了新的思路,原來海量龐雜、看似無用的數據,經過清洗、匹配、整合和挖掘,可以轉換成信用數據,而且信用評估的效率和準確性也得到了一定程度的提升。新的信用風險體系的一個顛覆性的基本思想是一切數據皆信用,這是需要大數據技術來支撐的。國內征信體系的建設應當關注大數據技術的應用和發展,并加大投入,勇于實踐。
總結
以上是生活随笔為你收集整理的大数据征信应用与启示 ——以美国互联网金融公司 ZestFinance为例的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 从0到1走进 Kaggle
- 下一篇: 汤晓鸥谈深度学习三大核心要素:算法设计、