从蚂蚁金服一窥人工智能在金融领域的机遇与挑战
從螞蟻金服一窺人工智能在金融領域的機遇與挑戰(zhàn)
CCAI?螞蟻金服?人工智能?金融?中國人工智能大會 閱讀2469?編者按:由中國人工智能學會、阿里巴巴以及螞蟻金服聯合主辦,CSDN、中國科學院自動化研究所承辦的第三屆中國人工智能大會(CCAI 2017)將于7月22-23日正式召開,屆時,螞蟻金服人工智能部技術總監(jiān)李小龍將在智能金融論壇上分享螞蟻金服在“人工智能+金融”的進展。在此之前,我們專訪了李小龍。
金融被譽為是人工智能的風口之一,螞蟻金服無疑是這一風口下的先行者。
螞蟻金服只做Tech(技術),用技術支持金融機構做好Fin(金融),這樣的定位和大多數試水“人工智能+金融”企業(yè)大相徑庭。
不久前,螞蟻金服把其在深度學習圖像算法研究上的最新成果開放給了保險行業(yè):開放車險定損產品——定損寶。
而這只是螞蟻金服用技術服務金融行業(yè)的冰山一角,從支付、智能風控、信貸決策、理財、保險定價、信用到智能客服,螞蟻金服正在在用人工智能來影響和助力金融行業(yè)。
這背后給技術帶來了多大的挑戰(zhàn)?
螞蟻金服人工智能部技術總監(jiān)李小龍表示,螞蟻金服所做的人工智能研究都是基于場景,而這樣的嘗試遠比單純的學術研究復雜。以定損寶為例,產品核心的技術是圖像識別,但它的實現比人臉識別、普通的圖像識別難度更高;除此之外,還需要根據不同的輸出結果來計算出保費的變化情況。
螞蟻金服人工智能部技術總監(jiān) 李小龍
問題的維度更加復雜,這是金融行業(yè)獨有的挑戰(zhàn),這種情況下算法需要怎樣的創(chuàng)新?模型是否具備可解釋性?螞蟻金服正在攻克“人工智能+金融”領域最棘手的問題。
采訪正文
您一直專注機器學習和數據挖掘等領域,這些技術在螞蟻金服業(yè)務中發(fā)揮了什么樣的價值?
李小龍:機器學習和數據挖掘在螞蟻金服很多場景上都有應用。金融行業(yè)非常關鍵的能力之一是洞察用戶,給用戶更精準的畫像,這是數據挖掘里面很重要的一環(huán),我們可以根據用戶畫像更好的進行產品推薦,或者是智能營銷。
比如支付寶線下支付的營銷活動(獎勵金),應該給什么樣的人發(fā)獎勵金?發(fā)多少獎勵金會進一步提升他消費的活躍度?這些會涉及到智能圈人和智能推薦的問題,我們用到了機器學習的模型;還有金融產品推薦,如基金推薦、保險產品的推薦也需要用到機器學習的算法;而智能客服、理財社區(qū)機器人還涉及到NLP、語義匹配、長句分析匹配等問題。
這些應用場景都需要機器學習的模型包括深度學習的模型來解決。
螞蟻金服一直希望用技術助力金融行業(yè),現在做出了哪些創(chuàng)新?
李小龍:螞蟻金服在技術上有很多的創(chuàng)新,保險產品的推薦就是其中之一,在這個產品中我們利用了多維度的用戶畫像數據。
舉個例子,我們基于大數據分析發(fā)現穿緊身牛仔褲的女孩手機比較容易碎屏。因此啟發(fā)了手機碎屏險的精準推薦,事實證明轉化成交率也比較高。
還有在智能客服里面,我們采用了基于語義匹配的大規(guī)模層次聚類算法來做用戶原始問句的聚類,然后用聚類產生的標準問題來代替原來人工定義的知識點的問題,這可以更好的反映用戶的真實訴求,也能簡化知識庫的建設過程。
另一個值得一提的是機器人問答,螞蟻金服客服機器人的解決率現在已經超過了人工(比人工高了三個百分點),這是怎么實現的呢?除了應用很多業(yè)界比較新的深度學習的算法并且結合我們的實際進行模型創(chuàng)新之外,我們還采用了問題推薦和相關問題推薦,也就是在精準匹配模型的信心分較低的情況下,把多個問題的推薦作為問答機器人的一種輸出方式,另外,即使在信心分較高的情況下,在直接輸出知識點的同時,也會輸出相關問題的推薦(一般對于比較復雜的問題,相關問題往往也是用戶關心的),然后通過點擊數據就能夠得到用戶的反饋來訓練模型,從而通過不斷自學習來提升模型效果,這在QA上是相對比較少的一種做法,但在我們的客服機器人上取得了很好的效果。
不久前,螞蟻金服向保險行業(yè)開放了“定損寶”,這其中使用了哪些人工智能技術?
李小龍:傳統保險公司的車險處理流程,一般為報案、現場查勘、提交理賠材料、審核、最終賠付。用戶完成整套鏈路獲得理賠的周期往往長達幾周甚至一個月。而定損寶可以通過技術來提升車險理賠的效率。
這其中涉及的人工智能技術種類非常多,如圖像識別、圖像分割,圖像定位以及決策模型、目標檢測,噪聲去除等等。
當然,這其中實際上存在很多挑戰(zhàn)。雖然在深度學習的成熟讓圖像識別在最近幾年取得了突飛猛進的發(fā)展,各項大賽中的識別率每年都在提升,但在圖像定損上依然有非常大的挑戰(zhàn)。這比人臉的識別、普通的圖像識別難度更高,比如光照反光程度的細微變化就會極大地增加識別難度,即便是人眼也很難分辨這其中的差異。我們基于計算機視覺算法以及多模型才能精準輸出針對各種程度的刮擦、變形、部件的開裂和脫落等損傷的定損結論。
您之前提到過深度學習的局限性,例如小樣本場景下的挑戰(zhàn)?螞蟻金服是如何解決的?
李小龍:深度學習需要克服的一個問題是不可解釋性,例如芝麻信用是需要強解釋性的,減分和加分都需要解釋,如果用深度學習則是比較難解釋的;另一個例子是信用風控,雖然目前在中國拒絕貸款不需要給理由(在美國是必須要給理由的),但實際上這會給客服帶來很大的壓力,如果不給理由,用戶會打很多電話去問客服。
另外,深度學習在樣本數量過小的場景下也比較難發(fā)揮作用,小樣本學習現在是學術界非常感興趣的問題。不過,螞蟻金服的個別場景中存在的另一個嚴重問題就是標注樣本比較少,而大部分機器學習算法以有監(jiān)督學習為主,這對樣本的標注需求比較大。例如在安全風控里面沒有標注,或者說是標注非常少的情況下怎么去做建模,我們叫做隱案挖掘,這是很大的挑戰(zhàn),目前,我們采用的是無監(jiān)督學習或者半監(jiān)督學習方法來克服這樣的難題。
針對大規(guī)模數據訓練,螞蟻金服現在在使用大規(guī)模參數服務器“鯤鵬”,介紹一下這其中的應用。
李小龍:鯤鵬是螞蟻金服和阿里巴巴一起合作研發(fā)的大規(guī)模參數服務器,我們從2014年就開始研發(fā),2015年在阿里集團正式上線。目前它的規(guī)模能夠支持百億甚至千億的特征,千億級別的樣本,以及最大萬億的參數規(guī)模,這是業(yè)界的一流水平。阿里經濟體內部包括幾乎所有BU的120多個場景都在用鯤鵬訓練模型,包括現在螞蟻很多場景也都在使這個功能,比如前面提到的智能營銷、智能推薦,還有智能客服。另外,在安全風控領域我們也用到了鯤鵬來訓練大規(guī)模的深度學習模型。借這個機會也打個廣告:今年8月份在加拿大舉行的全球頂級數據挖掘會議KDD上我們會以Oral報告的方式第一次向學術界和工業(yè)界介紹鯤鵬系統和算法的特點、我們的創(chuàng)新以及在阿里和螞蟻業(yè)務的應用,歡迎大家到時候參加和指正。
金融領域會面臨很多安全問題,螞蟻金服如何通過人工智能技術來規(guī)避這些風險?
李小龍:金融領域最核心的兩個問題就是安全風控和信用風控,針對安全風控問題,螞蟻金服人工智能部和安全業(yè)務部門正在進行緊密的合作,用先進的人工智能技術,如深度學習模型來代替代原來人工規(guī)則為主的體系,這可以大大提高效率。舉幾個例子,我們目前把深度學習用在了可信領域,即在每天的幾億筆交易中判斷是不是可信的交易,如果不可信就中斷,我們的模型能在盡可能減少用戶打擾的情況下,保持很高的安全性。第二種情況下是盜賬號模型,當一筆交易被系統判斷它是不可信的情況下,我們還要再確認是不是盜帳號,這需要更多精細的特征來描述,也需要創(chuàng)新的算法才能實現。我們采用了業(yè)界創(chuàng)新的GBDT+DNN的模型,超越了之前的單個模型以及GBDT+LR的效果,在實際業(yè)務中取得了很好的效果。
越來越多的互聯網企業(yè)和傳統金融機構都開始著手研究人工智能+金融,螞蟻金服有哪些技術特點?
李小龍:螞蟻金服的特點就是依托了阿里和螞蟻的豐富場景(安全、信用、征信、微貸、客服、保險等)來構建機器學習平臺。在實時性、安全性、穩(wěn)定性和可靠性這幾個方面,螞蟻金服的人工智能技術比常規(guī)的人工智能要求更高,換句話說就是金融級的人工智能。
因為現在有很多研究是純研究,或者純應用的,而螞蟻金服是基于場景在研究,結合了研究和應用兩個方面,它帶來的挑戰(zhàn)更大。例如,車險定損就是非常好的例子,它比一般意義上的人臉識別或者圖像識別的挑戰(zhàn)更大,因為這些都是基于真實的用戶問題出發(fā)的場景?;谡鎸嵉挠脩魡栴},基于真實的場景來研究,最終是解決這些大規(guī)模的實際問題,實現普惠金融的目標,讓金融觸達80%以上的用戶,這比單純的學術研究更具挑戰(zhàn)性,也更有價值和意義。
未來,人工智能+金融的發(fā)展方向在哪?現在最需要哪方面的人才?
李小龍:從技術角度看,共享學習、強化學習、遷移學習、無監(jiān)督學習和圖推理是業(yè)界的一個方向,雖然有些方面的基礎研究的進展并不理想,但我相信它們一定是未來的趨勢。
關于人才,懂算法又懂工程是我們最需要的,同時,算法不僅要要緊隨國際前沿,在功能上它還需要快速的落地。目前螞蟻金服非常缺的是圖像、信息安全加密算法以及大規(guī)模分布式系統的人才。
作為 CCAI 智能金融論壇的主席,組織這一論壇的出發(fā)點是什么?本次論壇將主要圍繞哪些內容展開?希望為聽眾解決哪些問題?
李小龍:組織智能金融論壇的目的是為了針對金融智能前沿的一些挑戰(zhàn),集中學術界和工業(yè)界的智慧,大家一起來碰撞然后產生更好的觀點和可能的方向,從而推進人工智能+金融的進展。
我們邀請了許多學術界和工業(yè)界的頂級專家:例如工業(yè)界的嘉賓有柳崎峰老師,他現在專注做量化交易的工具,通俗點說是通過智能的方法去判斷交易的風險,然后幫用戶做決策;學術界的嘉賓比如ACM Fellow鄧小鐵老師是專門做博弈論市場機制的,對于金融博弈下的價值學習有很好的經驗和觀點;香港中文大學計算機系的張勝譽老師,他正在研究計算復雜性理論以及AI在資源分配中的應用;王夢迪老師是普林斯頓大學的助理教授,研究的內容包括增強學習在智能金融的應用;還有佐治亞理工學院的杰出教授Sudheer Chava,專注計算金融學的研究,他將帶來對于AI應用在金融界的優(yōu)勢和挑戰(zhàn)的一些整體思考。
我們希望通過工業(yè)界和學術界的頂級專家在論壇上的思想碰撞讓聽眾了解到金融智能的熱點話題,例如有哪些比較實用的方法,學術界在探索哪些新的方法,學術界和工業(yè)界怎么更好的結合,等等。
總結
以上是生活随笔為你收集整理的从蚂蚁金服一窥人工智能在金融领域的机遇与挑战的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 以人为本的机器学习:谷歌人工智能产品设计
- 下一篇: 谷歌开源机器学习可视化工具 Facets