连毕马威也看好这家金融科技公司,面对AI不跟风、有理想!
最近一個關于金融科技公司的評獎結果出爐了,就是“畢馬威中國2017領先金融科技企業50強”。
“領先、金融、科技、畢馬威”……小編覺得這個獎項的名字真的很高(you)大(dang)上(ci)!
話說接近年關,評獎活動以及頒獎典禮還真多,但這個獎可是大大不同,這可是畢馬威牽頭組織評選的,除了名字很高端之外,在金融科技領域也相當有含金量。
先上一張2017年上榜企業“全家福”吧!
畢馬威中國2016金融科技50強
小編認真搜羅了前后兩屆的上榜企業名單,意外發現了一家公司已經二度上榜,哪家?就是天云大數據!
如果僅僅看公司名稱,妥妥的一家大數據公司,但實際上人家在AI 領域已經深耕多年,經驗和產品都很豐富,特別是在金融領域。
據悉,天云大數據的智能平臺已經在銀行貸前、貸中、貸后都建立了反欺詐、申請評分、行為評分、早晚期催收模型,此外在互聯網金融黑名單多頭貸測試、失聯修復、循環擔保等方面也有成功案例。
這么看,公司的AI金融產品真的很厲害!
其實除了產品“出挑”,小編還了解到該企業對AI 的認識看法也同樣獨到,完全是一家面對AI 大潮“不跟風、有理想”的公司。
下面聽一聽天云大數據CEO雷濤關于目前AI 發展的一些見解吧!
在頒獎典禮上,雷濤表示,目前人工智能已經出現兩輪,方向和趨勢都有所變化。
其實人們最早看到的是人機交互方向的人工智能,這也是大家目前比較熱衷追逐的,例如人臉識別、無人駕駛和自然語言處理等,這些具體的熱點都與視覺和語音相關。
這就導致目前關于人工智能的諸多應用中,例如無人駕駛、語音識別等人機交互場景更吸引人們的關注,但未來人工智能發展趨勢會更加凸顯規模化模型生產能力。
例如,最近某大型銀行推出新版手機app,功能背后是年生產600種智能推薦模型的算法支撐,是以人工智能賦能金融,實現規模化模型生產的最佳范本。
其實雷濤提到的“規模化模型生產能力”,就是谷歌在2015年著手做的AI 的PaaS化。
關于AI 的PaaS化
延續雷濤提出的問題,小編先簡單梳理下 AI PaaS化的“前世今生”。
人機交互應用發展“相對成熟化”
計算機視覺在AI 領域是最早被爆出的熱料,早期因為視覺信號比較低,只有紅綠藍像素,但通過這些低階的簡單信號,還是能夠通過循環神經網絡重復出大規模的特征來進行人臉識別,受此影響,計算機在窄場景(語音、圖像等)領域就會催生實踐力很強的算法,進而帶動了圖像識別方面的論文高產以及各類競技比賽的層出不窮。
在這個背景下,2015年、2016年相繼開放了關于圖像和自然語言的一些基礎數據訓練集,數據資源變得非常有序,在算力方面只要有足夠的資本投入,人機交互變得日漸容易;此外因為像人機交互的數據集很多是通用的公開數據,例如即便用北美人的圖片也可以序列化后用于中國臉,只不過識別率稍微低一點,個別地方需要修整,但是這個業務啟動的效率還是很高的;再比如像自然語言處理也是,谷歌10億單詞短語訓練集開放以后,門檻也會隨之迅速降低……這么看來第一波市場集中在人機交互還是有理由的。
企業級的智能應用還得靠PaaS形式?
雷濤表示,除了AI應用的層出不窮,我們還要密切關注另一個市場的發展,也就是企業級的應用市場。
由于企業級應用市場的數據主要存在于企業內部,建立模型并不現實,即便開發了一套系統也不能完全支持各種環境的通用性,所以企業級市場需要機器學習能力的時候,需要用數據驅動替代一些業務流程驅動的方式的時候,因為數據的局部性,必然導致AI的落地形態發生變化。
人臉識別、自然語言處理,通常都是以API的調用方式被應用直接獲取,但對于企業級的應用只能通過PaaS形式。
這是為什么呢?
因為企業級數據私有化程度較高,不可能在任何地方都可以用事前架構好的模型來應用;涉及算法多種多樣,不同的企業問題就有不同的算法方向,未必是卷積神經網絡一招包打天下,其中有可能用到循環神經網絡,甚至可能只是用一個基礎的分類器SVM,效果同樣好。
在多樣的業務場景下,算法的多樣性、數據的排他性,決定不可能用一個API的形態完成整體的智能化過程。
AIPaaS化或許比純粹造應用更有價值
2015年,谷歌就開始著手AI的PaaS化。
2016年,Facebook、亞馬遜等公司也開始在這方面努力著。
過去很長一段時間里,人們盯著算法來做各種AI 應用,產生了各種智能識別以及預測,確實給智能零售領域帶來了本質性的沖擊,例如無人售貨機,應用層面的百花齊放逐漸成為AI行業的“風向標”,但雷濤認為我們應該冷靜下來看一看,其實AI PaaS這個層面包含一個更廣泛的企中業級應用市場。
企業級AI應用的落地,其實已經不是看臉,聽語音那么簡單了,最核心的是替代原來的經驗規則,也就是怎么用數據表達這些非線性的、隱含的事實,通過數據科學能力重塑商業流程。所以對更廣泛的企業服務領域,AI能力的賦予絕對比看人臉,做智能語音客服價值要大。
小編大膽設想下,AI PAAS市場的到來,無疑就像為移動互聯網配置了一個安卓平臺,移動互聯能力、應用開發能力大規模被釋放出來。這個場景就像2002年只有諾基亞、摩托羅拉這些大公司才能生產一個APPs,而安卓帶來了移動應用市場的繁榮。AI to everywhere,AI PaaS會賦予更廣泛的服務智能。
關于AI人才
2017年,世界集體見識了人工智能有多么狂熱,Alphago大勝柯潔,Alphago Zero自學成才完勝Alphago……AI技術在各行各業落地應用的同時帶來了AI人才“大缺口”的凸顯。
據小編了解,截止到2017年10月,中國AI人才缺口至少在100萬人以上,AI人才平均月薪2.58萬元,遠遠高于一般的技術類崗位。
網絡用圖,具體出處不明
小編赤裸裸的羨慕AI 人才“優勢薪資”的同時,也就AI人才這個熱議話題與雷濤探討起來!
記者:您覺得我國在人工智能人才方面真的出現了“人才荒”嗎?
雷濤:坦白來說都挺荒的,我們作為一家深耕AI 的公司,如今摸索到了一些路徑,因為有了AI的PaaS化,現在開始大幅度降低人才板塊的難度。
舉個真實的例子。上周末回公司的時候,我看到一個本科畢業生正在做一個循環貸模型,看到這個循環貸模型后,給我的信心很大。我發現只要他在平臺上,通過有效的指導,在統一的AUC評估方法上得到的結果,與經驗豐富的博士沒有多大差異。
硅谷一個概念是數據科學工程,DataScienceEngineering, 將算法算力融合交付的工程。借助這種工程實踐,我們希望能夠形成一些像藍翔技校這樣的機構可以培養年輕人很多AI 方面的能力,前提是這些年輕人原來就具備數理統計的基礎,現在提供給他們一套自動化的工具就可以靈活處理數據和駕馭算力。
這種過程實際上是可以被透明化的,讓開發者完全透明化,只要灌輸數據,通過數據本身的表達來形成算法,進而降低人員對數據,和對數據科學的一些要求。
經過這樣一個過程,我們就把AI 人才的門檻兒降下來了,完成了人才的搭建。這個道理就類似于以前一個游戲只能在北美大規模實驗室里產出,因為只有摩托羅拉和諾基亞才有原生的操作系統,才能夠從底層一直寫到屏幕。
用PaaS化的工具完成對AI 人才的牽引,AI的這種能力就會快速的形成,這對整個IT人員的轉型和沖擊非常大,逐漸形成“年輕大廚”PK“年長配菜師”的局面。
同時,從這個角度出發,人才的結構也會發生很大變化,突出表現就是學數理統計這一批人的價值會凸現出來。
當有工具能力出現的時候,這類人才的市場需求量會很大,相比之下以前那種懂業務的,例如ERP流程專家會被大規模替代。
伴隨這種情況進而會出現一個新的職業,人稱人工智能產品經理。
在移動互聯網和傳統ID時代,產品經理強調流程設計,商業實踐的點子,以及用戶體驗等,例如Facebook產品經理更多的是關注用戶的感受。但AI產品經理人需要的是能夠把握不同的算法替代不同的流程,也就是商業流程的再造或重塑。
什么時候該用規劃算法,什么時候該用分類算法,什么時候該用一個預測的回歸算法……頭腦中要有清晰的技術上線與技術邊界,能夠解決什么問題等。這一類產品經理人會賦予未來更多的應用智能,這種職業人才在未來是十分稀缺的。
對于天云大數據自己的人才儲備,我們現也做了一些“產學研”的嘗試,例如開始規模化試訓,這個過程中如果政府能夠參與進來,效果會更好。
關于AI的安全
最近爆出谷歌免費開放給AI設計者的編程平臺TensorFlow其實有嚴重的安全隱患,一旦被黑客利用后果將不堪設想……由此引發的關于AI 安全的思考又登上了話題熱議榜單。
網絡用圖,具體出處不明
記者:關于機器學習框架被爆出安全隱患的問題,您是否可以聊一聊AI 的安全?
雷濤:首先TF是個交流和開放的數據科學環境,它本身不是一個企業的應用平臺,如果把Tensorflow上某個算法直接拿來去做一個企業應用的話,這個想法也太簡單了。
其實谷歌Tensorflow的目標是為了提供一個科學家相互交換能力的平臺,用數據實現一個回歸模型并釋放出來,衡量下是否好用。
如果這個框架直接拿過來在企業部署內完全使用,沒有充分考慮到安全的話,發生問題就說這個框架存在安全隱患,我覺得說法有點太片面,畢竟谷歌的出發點不是這個。
安全的問題更多在于企業自身,這需要企業去做大量的固化和防護,尤其數據方面,安全的挑戰更大。
我覺得應該關注谷歌Tensorflow2周年時提到的方向,即將打算走向分布式的問題,也就是如何將算法從單純強調精確度,到現在開始考慮算法與數據與算力的規模化融合問題。
在這個問題上,實際上Python作為解釋語言很難做到作業任務調度,所以這個時候也要開始一輪更新的更本質native的一些調動計算資源的方式。換句話說,如何解決算力的問題,部署大規模的算法,目前有效的方式就是與分布式相關聯。
是AI本身的安全性還是利用AI服務安全?這是兩個問題!
關于AI服務安全這方面,差分隱私DifferencialPrivacy就是一個很好的實踐。現在連手機上的信息輸入都會有隱私泄露的風險,用AI 保護數據隱私就是在本地這個環節進行加密,通過AI的方法將數據離散、抽樣、加噪音,進而做到將虛擬層面的個體與物理層面的個體相互分離,達成數據歸屬“不明”。
因為算法的核心就是個性化,需要解決充足性問題,就不單單是一個簡單的概率,所以必須要借助個性數據。只有經過上面的分離程序,開發者才可以利用個性化數據完成個性化服務,又可以做到不侵犯個人隱私。
個性數據保護有效方法就是從“來源”入手,所以利用這種技術概念來詮釋AI如何保護個人隱私,是每天都可以操作并切實可行的。
關于知識圖譜落地金融行業
知識圖譜最初是由谷歌提出用來優化搜索引擎的技術,在不斷發展中外延一度擴大,目前已經助力了很多熱門的人工智能場景應用,例如語音助手 Siri,聊天機器人等。
網絡用圖,具體出處不明
由于金融領域數據量以及數據類型的龐大多樣,知識圖譜也日漸成為其數據處理的主要工具之一,更成為很多大數據企業進軍金融場景的突破口。
記者:現在有很多大數據企業,提供企業級知識圖譜的解決方案并應用到金融領域,您覺得知識圖譜助力金融領域做數據分析和挖掘的工作,對此有什么看法?
雷濤:知識圖譜或者圖計算或者復雜網絡,在金融信息工程中應用越來越多。
知識圖譜的金融實踐也是逐步發展的。比如初期技術上圖計算,實體會用到一些人工定義的方式,從傳統數據庫抽取出來,例如工商數據,或者是自然語言實體抽取的方式。做一個可視化表達面向業務,或者提供基礎的頂點查詢或距離計算,這是知識圖譜經常使用的方法。高階應用會涉及到聚類分類機器學習等,更大規模網絡還會采用Encoding編碼方式的表達來降低運算規模,比如Node2Vector,deepwalk。
復雜網絡會用在很多場景,因為它提供的是一個數據基礎緯度的升維化過程,把文件一維的結構、二維的表結構做成一個高維的向量結構,它可以表達很多事物隱含的關聯關系,而且可以把關聯量化出來。
知識圖譜的表達不僅僅是可視化,更多是量化計算。例如我們在2015年給人民銀行做循環擔保的關聯系統,當時構建了6000多萬個節點的規模,當時覺得已經很大了,因為把全國范圍內所有的有組織機構代碼全覆蓋了,但隨后為一線BATJ服務的復雜網絡,已經達到百億節點規模,做更深度的風控手段,對黑名單和多頭貸做預測。
關于天云的AI之路
據記者了解,目前業界已經出現能夠將算法能力與業務人員相融合的AI平臺,其中天云大數據的MaximAI就是這樣一個平臺的形式。
這個平臺能夠將計算能力、在線數據、業務價值融合在一起,通過AI算法平臺快速建立模型。例如現金分期響應模型,預測篩選辦理此業務的高概率客戶,同時幫助銀行等貸款機構有效推送現金分期服務;建立循環授信模型,對客戶行為特征進行分類,并確立客戶對循環授信響應評分等。
記者:是否可以聊一聊,天云大數據是如何進入AI 領域的?
雷濤:其實我們一直也沒有從本質上離開過AI領域。
早在2011年團隊在云基地時做的第一個大規模分布式項目,就是運營商的上網內容基地,也就是手機報如何區分出動漫、游戲、音樂等,這是典型的NLP AI項目。
在做這個項目的時候,第一天我們碰到的問題就是分布式和算法的融合,如何面向1.2億用戶行為數據的機器學習。
其實在早期大數據領域,很多大數據的廠商屬于BI廠商,他們做報表、可視化,所以給人感覺離AI 還是有些距離的。
其實大數據是一個很廣泛的概念。
最早的UC Berkeley大數據實驗室是AMPlab,大數據的頂級項目Spark就是從這個實驗室流出的,AMP的A首先強調的就是Algorithm,也就是算法,AMP的M是指Machine算力,Hadoop/NoSQL一類計算棧;P更強調的是數據的商業化,也就是數據怎么生產和流通,通過眾包、交易、定價、流通等方式,所以大數據本身是個很廣泛的概念,而AI算法能力是其核心要素。
例如2015年,大型銀行給我們提出的要求是如何對接SAS數據挖掘平臺,泰康人壽給我們提出的要求是如何全量數據上完成一個聚類分析……其實這些都是有關機器學習的要求,畢竟AI也并不是今天才產生的新鮮事物,我們在業務中也一直滲透著做這些工作。
記者:未來會不會利用貴公司在人工智能和大數據領域的相關優勢,服務其它行業?
雷濤: PaaS本身就是跨行業的,非常基礎的賦能平臺,因為在Fintech領域用的人最多,這些EarlyAdopter容易接受機器學習的建模方法做風控定價等業務操作,所以我們在這方面先啟動了。
但同時,BI 和AI有顯著不同。BI進入一個行業中,就要做到比客戶還了解業務,才能做出KPI,進而做出儀表盤、報表這種決策支持體系。
相比之下,AI是數據驅動的,所以可以部分忽略這些因素,只要滿足對數據的的特定要求。簡單來說無論是人臉識別、無人駕駛還是下圍棋,都利用了卷積神經網絡。輸入端特征不完全依靠業務定義。
這樣來看,無論輸入黑白落子,還是RGB像素,其實對于算法描述具體業務是沒有影響的。所以在BI領域,行業背景knowhow要求非常高,做零售就做不了制造業,做醫療肯定不懂金融……但如果采用AI PaaS化平臺這種能力交互,就會發現問題回歸到了基礎數學的特征表達問題,也就跨領域的問題泛化能力更強。
作為專注于大數據基礎設施軟件平臺和分布式人工智能算法的科技創新公司,天云大數據自2013年成立即深耕金融科技,如今已經是驚喜不斷,我們期待未來繼續在AI 領域的長足進步。
總結
以上是生活随笔為你收集整理的连毕马威也看好这家金融科技公司,面对AI不跟风、有理想!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 浏览器事件模型捕获、冒泡
- 下一篇: esp8266 mixly blynk远