走向真正的人工智能
張鈸院士在CCF-GAIR 2018的大會(huì)報(bào)告
?
作者按:
2018年6月29日-7月1日,中國(guó)深圳,寶安區(qū)前海華僑城JW萬(wàn)豪酒店。在炎炎暑氣和陣陣夏雨的交織激蕩之中,在學(xué)界精英與業(yè)界領(lǐng)袖的見(jiàn)證參與之下,由中國(guó)計(jì)算機(jī)協(xié)會(huì)CCF主辦、雷鋒網(wǎng)和香港中文大學(xué)(深圳)聯(lián)合承辦的「CCF-GAIR」全球人工智能與機(jī)器人峰會(huì)順利召開(kāi)。
大會(huì)得到深圳市寶安區(qū)政府的大力指導(dǎo),是國(guó)內(nèi)人工智能和機(jī)器人學(xué)術(shù)界、工業(yè)界及投資界三大領(lǐng)域的頂級(jí)交流盛會(huì),旨在打造國(guó)內(nèi)人工智能領(lǐng)域最具實(shí)力的跨界交流合作平臺(tái)。本次大會(huì)包含AI前沿主會(huì)場(chǎng)和11個(gè)分會(huì)場(chǎng),涉及到計(jì)算機(jī)視覺(jué)、智能駕駛、機(jī)器人應(yīng)用等諸多領(lǐng)域,共吸引超過(guò)2500余位AI業(yè)界人士參會(huì),其中包含來(lái)自全球的140位在人工智能領(lǐng)域享有盛譽(yù)的頂級(jí)嘉賓。
開(kāi)幕式當(dāng)天的AI前沿主會(huì)場(chǎng)上,中國(guó)科學(xué)院院士、清華研究院院長(zhǎng)張鈸教授就當(dāng)前AI發(fā)展的技術(shù)背景和歷史階段,率先做了“走向真正的人工智能(Towards A Real Artifitial Intelligence)”大會(huì)報(bào)告。張鈸院士主要是從事人工智能理論、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、分形和小波等理論研究,以及把上述理論應(yīng)用于模式識(shí)別、知識(shí)工程、智能機(jī)器人與智能控制等領(lǐng)域的應(yīng)用研究。
?
在報(bào)告中,張鈸院士就當(dāng)前火熱的AI技術(shù)指出“我們離真正的人工智能還有很長(zhǎng)的一段路要走(We still have a long way from the real AI)”。圍繞這一點(diǎn),張鈸院士用40分鐘的時(shí)間,回答和解讀了關(guān)于“真正的人工智能”的三大問(wèn)題:
第一,什么叫做真正的人工智能?我們的目標(biāo)是什么?
第二,為什么我們需要真正的人工智能?
第三,我們?nèi)绾巫呦蛘嬲娜斯ぶ悄?#xff1f;
針對(duì)這三個(gè)問(wèn)題,張鈸院士首先評(píng)論了當(dāng)前AI技術(shù)發(fā)展取得的卓越成果,并分析了AI在5個(gè)限制條件下的主要應(yīng)用場(chǎng)景。針對(duì)這5個(gè)限制條件,張鈸院士強(qiáng)調(diào)了“有理解的人工智能”的重要性,并給出了一些可能的解決方案,比如在機(jī)器中引入“常識(shí)”等。在報(bào)告的最后,張鈸院士引用《列子湯問(wèn)》中周穆王與偃師的故事來(lái)類(lèi)比當(dāng)前AI發(fā)展的現(xiàn)狀,并總結(jié)道:
“當(dāng)前人工智能技術(shù)的發(fā)展正在起點(diǎn),正在路上,也將永遠(yuǎn)在路上,對(duì)于此每個(gè)人都要做好充分的思想準(zhǔn)備,而這就是人工智能的魅力所在。大家為什么這么重視人工智能?就是因?yàn)樗肋h(yuǎn)保持著在路上的發(fā)展?fàn)顟B(tài),永遠(yuǎn)吸引我們?nèi)ソ鉀Q不斷涌現(xiàn)的新問(wèn)題。這些問(wèn)題一旦解決,人類(lèi)的社會(huì)進(jìn)步和生活方式就將發(fā)生本質(zhì)上的改變,這就是吸引我們持續(xù)探索人工智能潛力的重要原因。”
張鈸院士如此勉勵(lì)大家道:“我們的結(jié)論是什么呢?我們的結(jié)論是人工智能剛剛起步,離真正的人工智能還很遙遠(yuǎn),大家共同努力吧,我們?nèi)沃囟肋h(yuǎn)。
下面詳細(xì)介紹張鈸院士本次報(bào)告的主要內(nèi)容。
人工智能當(dāng)前取得的卓越成就
人工智能技術(shù)發(fā)展至今取得了許多引人矚目的成就,張鈸院士指出了AI歷史長(zhǎng)河中的五個(gè)重大事件:
1、1997年,電腦“深藍(lán)”戰(zhàn)勝?lài)?guó)際象棋世界冠軍棋王“卡斯帕羅夫”;
2、2011年,IBM Watson在電視知識(shí)競(jìng)賽(Jeopardy)中打敗了美國(guó)的兩個(gè)前冠軍選手Ken Jennings和Brad Rutter;
3、2015年,微軟在ImageNet上做圖象識(shí)別任務(wù)的誤識(shí)率略低于人類(lèi),人類(lèi)為5.1%,機(jī)器為4.94%;
4、2015年,百度、訊飛在單句語(yǔ)音識(shí)別上的誤識(shí)率低于人類(lèi),人類(lèi)為4.0%,機(jī)器為3.7%;
5、2016年,AlphaGo擊敗世界圍棋頂級(jí)選手李世石。
這五件事情均為機(jī)器在一定領(lǐng)域和范圍內(nèi)超越人類(lèi),究其成功原因,目前普遍認(rèn)為主要?dú)w結(jié)于三個(gè)因素:
一是大數(shù)據(jù)(Big Data),大數(shù)據(jù)好比下鍋的米,巧婦難為無(wú)米之炊。
二是算力(Great Computing Power),算力好比鍋下的火,火候到了才能把生米做成熟飯。
三是算法(Clever AI Algorithms),算法好比鍋中的水,有水有米才好做飯。
張鈸院士認(rèn)為雖然上述三個(gè)因素不可或缺,但“合適的應(yīng)用場(chǎng)景(Appropriate Application Scenarios)”同樣是不容忽略的重要因素,這個(gè)因素是說(shuō)當(dāng)前所有取得的重要成就都必須依托于一個(gè)確定的和合適的應(yīng)用場(chǎng)景,脫離了這個(gè)特定的場(chǎng)景人工智能就無(wú)法發(fā)揮出應(yīng)有的效力。
?
二、人工智能發(fā)展存在的五條限制
上述的五件事雖然所處的領(lǐng)域和應(yīng)用場(chǎng)景不同,所面臨和解決的問(wèn)題也不同,但張鈸院士認(rèn)為它們都受到了完全一樣的五個(gè)條件的制約,或者說(shuō)它們都滿(mǎn)足5個(gè)完全一樣的條件。
1、“Having rich data or knowledge”
2、“Certain information”
3、“Perfect information”
4、“Static”
5、“Single task and finite domain”
首先你必須有豐富的數(shù)據(jù)或者豐富的知識(shí),如果這兩件東西沒(méi)有,或者很少,你不用來(lái)談人工智能,因?yàn)槟銦o(wú)法實(shí)現(xiàn)無(wú)米之炊。人工智能唯一的兩個(gè)資源,一個(gè)是數(shù)據(jù),一個(gè)是知識(shí)。其它還有確定性信息、完全信息、靜態(tài)的、單任務(wù)和有限領(lǐng)域。這五個(gè)條件里面任何一個(gè)條件不滿(mǎn)足,現(xiàn)在的人工智能做起來(lái)就會(huì)非常困難。
“在這樣五個(gè)限制條件下的人工智能,就是照章辦事,不需要任何的靈活性,顯然這樣的人工智能不是真正的人工智能。”
為了進(jìn)一步解釋上述五個(gè)限制條件下人工智能的本質(zhì),張鈸院士進(jìn)一步闡述了五個(gè)具有代表性的應(yīng)用場(chǎng)景“下象棋(Deep Blue/Chess)”、“Watson/Q-A”/、“Image recognition”、“Speech recognition”、“AlphaGo”。
1、Deep Blue:rich chess masters’ knowledge;information game;established rules
2、Watson : rich knowledge;the question is clear;the answer is only one;finite domains;
3、Image recognition: rich data-ImageNet; finite domain;
4、Speech recognition: rich data; low noise; finite domain;
5、AlphaGo: rich Data; the same as Deep Blue
下象棋是完全信息博弈,信息完全和確定,沒(méi)有問(wèn)題。其次,它遵循著完全確定的游戲規(guī)則演化,這種情況也叫做靜態(tài)。Watson機(jī)器人也是這樣,Watson?是什么樣的對(duì)話(huà)問(wèn)題呢?它為什么選擇知識(shí)競(jìng)賽呢?我們知道知識(shí)競(jìng)賽提的問(wèn)題都沒(méi)有二義性,都是明確的,它的答案總是唯一性的。所以這樣的問(wèn)答對(duì)機(jī)器人來(lái)講是非常容易的。它涉及的領(lǐng)域雖然比較寬,但也是有限的,包括大家覺(jué)得很玄乎的圍棋,也完全符合上面五個(gè)條件,所以對(duì)計(jì)算機(jī)來(lái)說(shuō)也是很容易的。目前計(jì)算機(jī)打麻將就不行,因?yàn)榕祁?lèi)是不完全信息博弈,所以比棋類(lèi)要難。
目前的人工智能技術(shù)在以下領(lǐng)域都可以找到它的應(yīng)用,它們是交通、服務(wù)、教育、娛樂(lè)等等,但需要強(qiáng)調(diào)是這些領(lǐng)域里面只有滿(mǎn)足上述五個(gè)條件的事情,計(jì)算機(jī)做起來(lái)才會(huì)容易,如果不滿(mǎn)足這些條件,計(jì)算機(jī)就做起來(lái)就很困難了。
大家常常關(guān)心什么樣的工作會(huì)被機(jī)器所替代,這里可以明確告訴大家,滿(mǎn)足這五個(gè)條件的工作,總有一天會(huì)被計(jì)算機(jī)取代。簡(jiǎn)而言之就是那些照章辦事,不需要任何靈活性的工作,比如說(shuō)出納員、收銀員等等。在座的所有工作都不可能被計(jì)算機(jī)完全代替,但不排斥你的工作中有一部分會(huì)被計(jì)算機(jī)取代,老師、企業(yè)家等的工作不可能被計(jì)算機(jī)完全代替。
?
三、真正的人工智能
“為什么會(huì)存在上述的五個(gè)限制條件?原因在于我們現(xiàn)在的人工智能是沒(méi)有理解的人工智能(AI without understanding)。”
以IBM Watson機(jī)器人為例,它是一個(gè)對(duì)話(huà)系統(tǒng),現(xiàn)在所有做的對(duì)話(huà)系統(tǒng)都跟這個(gè)差不多,但是Watson做得更好些,它的模型中有知識(shí)庫(kù),有推理機(jī)制。Watson除了專(zhuān)家知識(shí)之外,還有大量互聯(lián)網(wǎng)上大眾的知識(shí),還運(yùn)用了多推理機(jī)制。它里面有哪些知識(shí)呢?有很多,包括百科全書(shū)、有線(xiàn)新聞、文學(xué)作品等等。所有的知識(shí)用紙質(zhì)來(lái)表示有2億頁(yè),用存儲(chǔ)量表示達(dá)到了4TB。它能回答什么問(wèn)題呢?用兩個(gè)例子來(lái)說(shuō)明。
第一個(gè)問(wèn)題:1974年9月8日誰(shuí)被總統(tǒng)赦免?
答案:Nixon
這對(duì)美國(guó)人來(lái)講很好回答,同樣對(duì)計(jì)算機(jī)來(lái)講也很好回答,你用這幾個(gè)關(guān)鍵字「1974年9月8日」、「被總統(tǒng)赦免」,就能在文獻(xiàn)里頭查出來(lái)是誰(shuí),他就是尼克松(Nixon)。也就是說(shuō)根據(jù)問(wèn)題中的關(guān)鍵字,可以在已有的文獻(xiàn)里頭直接找到答案,這就是一般的網(wǎng)絡(luò)檢索方法。
第二個(gè)問(wèn)題:熒光粉受到電子撞擊以后,它的電磁能以什么方式釋放出來(lái)?
答案:光或者光子
使用「熒光粉」、「電子撞擊」、「釋放電磁能」等關(guān)鍵詞,同樣可以找到答案:「光或者光子」。這種方法就是平時(shí)網(wǎng)絡(luò)搜索的原理,應(yīng)該說(shuō)并沒(méi)有什么智能。像在維基(Wikipedia)的文檔中存在一系列根據(jù)某些確定規(guī)則來(lái)使用關(guān)鍵字或者短語(yǔ)組織起來(lái)的問(wèn)題及答案。
但是要回答下面的問(wèn)題就需要“智能”了,
第三個(gè)問(wèn)題:跟智利陸地邊界最長(zhǎng)的是哪個(gè)國(guó)家?
答案:阿根廷
跟智利有陸地邊界的國(guó)家可以檢索到,它們是阿根廷和玻利維亞,但是誰(shuí)的邊境長(zhǎng)?通常無(wú)法直接查到。Watson具備一定的推理能力,它從邊界間發(fā)生的事件、邊界的地理位置等等,經(jīng)過(guò)分析推理以后就可以找出答案,它就是阿根廷。
第四個(gè)問(wèn)題:跟美國(guó)沒(méi)有外交關(guān)系的國(guó)家中哪個(gè)最靠北?
答案:北朝鮮
第四個(gè)問(wèn)題和第三個(gè)問(wèn)題屬于同一種性質(zhì),跟美國(guó)沒(méi)有外交關(guān)系的國(guó)家有4個(gè),只要檢索就行了。但是哪個(gè)國(guó)家最靠北,并沒(méi)有直接答案,但可以從其它信息中推導(dǎo)出來(lái),比如各個(gè)國(guó)家所處的緯度、氣候寒冷的程度等等分析出來(lái),答案是北朝鮮。
“智能體現(xiàn)在推理能力上。但是很不幸,現(xiàn)在的對(duì)話(huà)系統(tǒng)推理能力都很差。Watson系統(tǒng)好一些,但也很有限。換句話(huà)說(shuō),現(xiàn)在的對(duì)話(huà)系統(tǒng)離真正的智能還很遠(yuǎn)。”
這里展示的是一個(gè)中國(guó)記者向Sophia機(jī)器人提出的四個(gè)問(wèn)題,以及Sophia給出的答案。通過(guò)索菲亞機(jī)器人的表現(xiàn)就可以看出來(lái),索菲亞的對(duì)話(huà)是面向開(kāi)放領(lǐng)域的,你可以隨便提問(wèn),但問(wèn)題也立馬就暴露出來(lái)了。大家在電視上看到索菲亞侃侃而談,問(wèn)什么問(wèn)題都能答得很好,這里面是有玄機(jī)。如果你的問(wèn)題是預(yù)先提出來(lái)的,因?yàn)槔镱^有答案,因此回答得非常好,在電視上給大家演示的都是這種情況。
如果臨時(shí)提問(wèn)題,問(wèn)題就出來(lái)了。在上面的四輪問(wèn)答中,Sophia只答對(duì)了一個(gè)。「你幾歲了」,這個(gè)問(wèn)題很簡(jiǎn)單,它答不上來(lái),它的回答是「你好,你看起來(lái)不錯(cuò)」,答非所問(wèn),因?yàn)樗焕斫饽闼鶈?wèn)的問(wèn)題。只有第二個(gè)問(wèn)題它是有準(zhǔn)備的,里面有答案,所以答得很好。「你的老板是誰(shuí)」,這個(gè)肯定它有準(zhǔn)備。第三個(gè)問(wèn)題,「你能回答多少問(wèn)題呢」?它說(shuō)「請(qǐng)繼續(xù)」,沒(méi)聽(tīng)懂!。再問(wèn)第四個(gè)問(wèn)題,「你希望我問(wèn)你什么問(wèn)題呢」?它說(shuō)「你經(jīng)常在北京做戶(hù)外活動(dòng)嗎」?這就告訴我們,現(xiàn)代的問(wèn)答系統(tǒng)基本上沒(méi)有理解,只有少數(shù)有少量的理解,像Watson已經(jīng)算是比較好的。
“為什么會(huì)這樣?因?yàn)楝F(xiàn)在的人工智能基本方法有缺陷,我們必須走向具有理解的人工智能(AI with understanding),這才是真正的人工智能。”
這里提出的概念跟強(qiáng)人工智能有什么區(qū)別?首先說(shuō)它在這點(diǎn)上是相同的,即都試圖去準(zhǔn)確地描述人類(lèi)的智能行為,希望人工智能跟人類(lèi)的智能相近。這也是強(qiáng)人工智能的一個(gè)目標(biāo),但是強(qiáng)人工智能只是從概念上提出來(lái),并沒(méi)有從方法上提出怎么解決。大家知道強(qiáng)人工智能提出了一個(gè)最主要的概念,就是通用人工智能。怎么個(gè)通用法?它沒(méi)有回答。現(xiàn)在提出來(lái)的有理解的人工智能是可操作的,不只是概念,這是其和強(qiáng)人工智能的主要區(qū)別。
?
四、如何讓機(jī)器做到“智能”
人機(jī)對(duì)話(huà)的時(shí)候,機(jī)器為什么不能理解人們提的問(wèn)題。看一個(gè)例子就知道了,我們?cè)谥R(shí)庫(kù)里把「特朗普是美國(guó)總統(tǒng)」這個(gè)事實(shí),用「特朗普-總統(tǒng)-美國(guó)」這三元組存在計(jì)算機(jī)里面。如果你提的問(wèn)題是「誰(shuí)是美國(guó)總統(tǒng)」?機(jī)器馬上回答出來(lái):「特朗普」。
但是你如果問(wèn)其它有關(guān)的問(wèn)題,如「特朗普是一個(gè)人嗎」?「特朗普是一個(gè)美國(guó)人嗎」?「美國(guó)有沒(méi)有總統(tǒng)」?它都回答不了。它太傻了,任何一個(gè)小學(xué)生,你只要告訴他特朗普是美國(guó)總統(tǒng),后面這幾個(gè)問(wèn)題他們絕對(duì)回答得出來(lái)。機(jī)器為什么回答不了后面的三個(gè)問(wèn)題呢?就是這個(gè)系統(tǒng)太笨了,沒(méi)有常識(shí),也沒(méi)有常識(shí)推理。既然特朗普是美國(guó)的總統(tǒng),美國(guó)當(dāng)然有總統(tǒng),但是它連這一點(diǎn)常識(shí)的推理能力都沒(méi)有。
所以要解決這個(gè)問(wèn)題,必須在系統(tǒng)中加上常識(shí)庫(kù)、常識(shí)推理,沒(méi)有做到這一步,人機(jī)對(duì)話(huà)系統(tǒng)中機(jī)器不可能具有理解能力。但是大家知道,建立常識(shí)庫(kù)是一項(xiàng)「AI?的曼哈頓工程」。大家想想常識(shí)庫(kù)多么不好建,怎么告訴計(jì)算機(jī),什么叫吃飯,怎么告訴計(jì)算機(jī),什么叫睡覺(jué),什么叫做睡不著覺(jué),什么叫做夢(mèng),這些對(duì)人工智能來(lái)說(shuō)都非常難,美國(guó)在1984年就搞了這樣一個(gè)常識(shí)庫(kù)的工程,做到現(xiàn)在還沒(méi)完全做出來(lái)。可見(jiàn),要走向真正的人工智能,有理解的人工智能,是一條很漫長(zhǎng)的路。
深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)主要用來(lái)模擬感性行為,感性行為是一般很難采用符號(hào)模型,因?yàn)楦行?#xff08;感覺(jué))沒(méi)法精確描述。比如「馬」,怎么告訴計(jì)算機(jī)什么叫做馬?你說(shuō)馬有四條腿,什么叫做腿?你說(shuō)細(xì)長(zhǎng)的叫做腿,什么叫細(xì)?什么叫做長(zhǎng)?沒(méi)法告訴機(jī)器,因此不能用符號(hào)模型。
目前用的辦法就是現(xiàn)在說(shuō)的神經(jīng)網(wǎng)絡(luò)或者準(zhǔn)符號(hào)模型,也就是用人類(lèi)同樣的辦法,學(xué)習(xí)、訓(xùn)練。我不告訴機(jī)器什么叫做馬,只是給不同的馬的圖片給它看,進(jìn)行訓(xùn)練。訓(xùn)練完以后,然后再用沒(méi)見(jiàn)過(guò)的馬的圖片給它看,說(shuō)對(duì)了,就是識(shí)別正確了,說(shuō)不對(duì)就是識(shí)別不正確,如果90%是對(duì)的,就說(shuō)明它的識(shí)別率是90%。
后來(lái)從淺層的神經(jīng)網(wǎng)絡(luò)又發(fā)展到多層的神經(jīng)網(wǎng)絡(luò),從淺層發(fā)展到多層有兩個(gè)本質(zhì)性的變化,一個(gè)本質(zhì)性的變化就是輸入,深層網(wǎng)絡(luò)一般不用人工選擇的特征,用原始數(shù)據(jù)就行。所以深度學(xué)習(xí)的應(yīng)用門(mén)檻降低了,你不要有專(zhuān)業(yè)知識(shí),把原始數(shù)據(jù)輸進(jìn)去就行了。第二個(gè)是它的性能提高很多,所以現(xiàn)在深度學(xué)習(xí)用得很多,原因就在這個(gè)地方。
“通過(guò)數(shù)據(jù)驅(qū)動(dòng)建立的系統(tǒng)能不能算是有智能呢?必須打一個(gè)很大的問(wèn)號(hào)。”
就是說(shuō)你做出來(lái)的人臉識(shí)別系統(tǒng)甚至識(shí)別率會(huì)比人還高,但是還不能說(shuō)它有智能,為什么呢?這種通過(guò)數(shù)據(jù)驅(qū)動(dòng)做出來(lái)的系統(tǒng),它的性能跟人類(lèi)差別非常大,魯棒性很差,很容易受干擾,會(huì)發(fā)生重大的錯(cuò)誤,需要大量的訓(xùn)練樣本。
剛才已經(jīng)說(shuō)過(guò),給定一個(gè)圖像庫(kù)我們可以做到機(jī)器的識(shí)別率比人還要高,也就是說(shuō)它可以識(shí)別各種各樣的物體,但是這樣的系統(tǒng),我如果用一種噪聲輸給它,我可以讓它識(shí)別成為知更鳥(niǎo),而用另外的噪聲輸給它,可以讓它識(shí)別成為獵豹。
“換句話(huà)講,這樣的系統(tǒng)只是一個(gè)機(jī)械的分類(lèi)器,根本不是感知系統(tǒng)。”
也就是說(shuō)它盡管把各種各樣動(dòng)物分得很清楚,但是它不認(rèn)識(shí)這個(gè)動(dòng)物,它盡管可以把獵豹跟知更鳥(niǎo)分開(kāi),但是它本質(zhì)上不認(rèn)識(shí)獵豹和知更鳥(niǎo),它只到達(dá)了感覺(jué)的水平,并沒(méi)有達(dá)到感知的水平,它只是「感」,沒(méi)有上升到「知」。
“我們的結(jié)論是,只依靠深度學(xué)習(xí)很難到達(dá)真正的智能。(It’s difficult to lead to real intelligence only based on deep learning/data-driven)”
這是很?chē)?yán)峻的結(jié)論,因?yàn)槿绻羞@樣的問(wèn)題,在決策系統(tǒng)里頭是不能用這樣的系統(tǒng)的,因?yàn)樗鼤?huì)犯大錯(cuò)。我在很多場(chǎng)合講過(guò),人類(lèi)的最大的優(yōu)點(diǎn)是「小錯(cuò)不斷、大錯(cuò)不犯」,機(jī)器最大的缺點(diǎn)是「小錯(cuò)不犯,一犯就犯大錯(cuò)」。這在決策系統(tǒng)里頭是不允許的,這就顯示了人跟機(jī)器的截然不同。
人非常聰明,所以他做什么事都很靈活,這就使得他很容易犯各種各樣的小錯(cuò)。但是他很理性,很難發(fā)生大錯(cuò)。計(jì)算機(jī)很笨,但是很認(rèn)真,小錯(cuò)誤絕對(duì)不會(huì)犯,但是它一犯就是天大的錯(cuò)誤。剛才把那個(gè)把噪聲看成知更鳥(niǎo),這不是大錯(cuò)嗎?你把敵人的大炮看成一匹馬,不是大錯(cuò)嗎?但是人類(lèi)不會(huì)發(fā)生這種錯(cuò)誤,人類(lèi)只會(huì)把騾看成驢,但是計(jì)算機(jī)的識(shí)別系統(tǒng)會(huì)把驢看成一塊石頭。
“原因在哪兒?原因還是AI的理解能力問(wèn)題。”
人工智能現(xiàn)在有兩種基本方法,一種是用符號(hào)模型來(lái)模擬理性行為,符號(hào)模型可以表達(dá)信息的內(nèi)容,所以它是在一個(gè)語(yǔ)義的符號(hào)空間里頭,但是非常不幸,這個(gè)離散的符號(hào)表示,數(shù)學(xué)工具很難用,很多數(shù)學(xué)工具用不上去,所以它發(fā)展很慢。在模擬感性行為的時(shí)候,常用的是特征空間的向量,向量就是數(shù),可以把所有的數(shù)學(xué)工具都用上,優(yōu)化的工具、概率統(tǒng)計(jì)的工具全部用上。
所以數(shù)據(jù)驅(qū)動(dòng)方法這幾年發(fā)展非常快,再難的問(wèn)題,下圍棋非常難吧,計(jì)算機(jī)也可以「算」出來(lái)。但是它有一個(gè)非常大的缺陷,它是在特征空間里,缺乏語(yǔ)義。用數(shù)據(jù)去訓(xùn)練一個(gè)模型,也就是所謂「黑箱學(xué)習(xí)法」,如果數(shù)據(jù)質(zhì)量不高,很難學(xué)出有用的東西。什么叫概率統(tǒng)計(jì)?重復(fù)多了就是真理。如果數(shù)據(jù)質(zhì)量差,充滿(mǎn)了「謊言」。謊言重復(fù)多了,就變成真理了。
現(xiàn)在想出的解決辦法是這樣的,就是把這兩個(gè)空間投射到一個(gè)空間去,這個(gè)空間叫做語(yǔ)義的向量空間。也就是說(shuō)把符號(hào)變成向量,同時(shí)把特征空間的向量變成語(yǔ)義空間的向量。怎么做?
第一是通過(guò)Embedding(嵌入)把符號(hào)變成向量,盡量保持語(yǔ)義不變,可惜現(xiàn)在的方法都會(huì)引起語(yǔ)義的丟失,只能在投射的過(guò)程中讓語(yǔ)義丟失得少。
第二方面做的工作比較少,就是Raising(提升),把特征空間提升到語(yǔ)義空間去,這主要靠學(xué)科交叉,靠跟神經(jīng)科學(xué)的結(jié)合。
只有這些問(wèn)題解決以后,才能夠建立一個(gè)統(tǒng)一的理論,因?yàn)檫^(guò)去的感知和認(rèn)知是不同的處理方法,大家說(shuō)不到一塊,如果能夠投射到同一空間去,就可以建立一個(gè)統(tǒng)一的理論框架,這是我們的目標(biāo)。
“在語(yǔ)義空間處理就可以解決理解問(wèn)題,但是這項(xiàng)工作是非常艱巨的。”
?
五、周穆王與偃師
“周穆王西巡狩,路遇匠人名偃師。翌日偃師謁見(jiàn)王,偕來(lái)一個(gè)假人。「趨步俯仰,信人也」。「領(lǐng)其顱,則歌合律;捧其手,則舞應(yīng)節(jié)。千變?nèi)f化,惟意所適。王以為實(shí)人也,與盛姫內(nèi)御并觀之,技將終,倡者瞬其目而招王之左右侍妾。王大怒,要?dú)⑦@個(gè)偃師。偃師大懾,立剖其倡者以示王,皆傅會(huì)革、木、膠、漆、白、黑、丹、青之所為。穆王始悅,詔貳車(chē)載之以歸。”
——《列子湯問(wèn)》
這段話(huà)描述了3000?年前古人對(duì)機(jī)器人的想象,看看現(xiàn)在的人工智能做得怎么樣呢?索菲亞是現(xiàn)在能夠達(dá)到的水平,可是她不會(huì)唱歌、不會(huì)跳舞,只會(huì)說(shuō)英文,周王也聽(tīng)不懂,肯定沒(méi)有好印象。
現(xiàn)在假設(shè)索菲亞「瞬其目而招王之左右侍妾」,向周王的姨太太們送去秋波,王會(huì)如何呢?我認(rèn)為沒(méi)反應(yīng),因?yàn)樗鞣苼喪桥?#xff0c;他用不著吃醋。但是假設(shè)索菲亞「瞬其目而招王」,向大王送去秋波,王會(huì)大悅,立即神魂顛倒,墜入愛(ài)河?我認(rèn)為不會(huì),因?yàn)樗鞣苼喐静幌袢?#xff0c;它最近才剛剛安上手腳,走路都不利索,怎么行呢?
所以我的結(jié)論是,「索菲亞通不過(guò)穆王的測(cè)試,當(dāng)然它更通不過(guò)圖靈測(cè)試」。
最后,用一段話(huà)勉勵(lì)大家。
“當(dāng)前人工智能技術(shù)的發(fā)展正在起點(diǎn),正在路上,也將永遠(yuǎn)在路上,對(duì)于此每個(gè)人都要做好充分的思想準(zhǔn)備,而這就是人工智能的魅力所在。大家為什么這么重視人工智能?就是因?yàn)樗肋h(yuǎn)保持著在路上的發(fā)展?fàn)顟B(tài),永遠(yuǎn)吸引我們?nèi)ソ鉀Q不斷涌現(xiàn)的新問(wèn)題。這些問(wèn)題一旦解決,人類(lèi)的社會(huì)進(jìn)步和生活方式就將發(fā)生本質(zhì)上的改變,這就是吸引我們持續(xù)探索人工智能潛力的重要原因。”
總結(jié)
- 上一篇: 数学结果告诉你足球的赛程安排并不能做到完
- 下一篇: 从北大到耶鲁博士,一个山城走出女孩的留学