谈论AI之前,你搞懂人类了吗?(颠覆认知)
導讀:當前,人工智能應用在中國又一次火爆。無獨有偶,美國電視劇《西部世界》第二季的第一集一經播出就引起熱議。一時間,人和人工智能這個話題又重新被辯論。
在討論人和人工智能的關系及其差別之前,我們先看看人類知識的構成。作者并沒有哲學專業背景,這里介紹的概念不一定能和哲學概念一一對應,具有哲學專業背景的讀者可以建立一個對照轉換。
作者:馮雷 姚延棟 高小明 楊瑜
如需轉載請聯系大數據(ID:hzdashuju)
01?經驗和邏輯作者認為,人的知識由經驗和邏輯兩個層面構成。第一類知識是邏輯知識,可以通過分析得出新知識。下面是典型的邏輯知識:
所有人都會死,蘇格拉底是人,所以蘇格拉底會死。
根據勾股定理,直角三角形的三邊關系滿足x2 + y2 + = z2(其中x和y是兩條直角邊,z是斜邊)。如果三角形的兩條直角邊長度分別是3和4,那么根據勾股定理可以得到z的長度是5。
另一類知識就是經驗知識。經驗通常是沒有經過邏輯推理或者無法通過邏輯推理而根據過去的經驗建立起來的知識。下面是兩個過去的經驗知識:
“地球是宇宙的中心”在哥白尼之前一直是人類社會的基本經驗知識。
“地球是平的”在哥倫布之前一直是大部分人的經驗知識。
太陽從東邊升起,到今天為止還是大部分人的經驗知識。
要觀察人的知識體系的建立過程,可以觀察小孩子的學習過程。如果把一個算盤豎起來給小孩子玩,小孩子可能會把珠子往上撥,然后珠子會掉下去。但是孩子會重復,因為他們不知道珠子總是會往下掉。為什么大人不再重復這個動作?
因為學過物理的大人從邏輯上會知道珠子會因重力的作用往下掉,沒有學過物理的人根據過去的經驗也會知道這樣做珠子會往下掉,所以不會做無用功。蘋果為何總是從樹上掉下來?在牛頓發明萬有引力定律之前,這對于所有人來說都是經驗知識。在萬有引力定律發明以后,對于知曉力學的人則是邏輯知識,對于不知曉力學的人依然是經驗知識。
學過物理的讀者先不要得意,因為經驗和邏輯的關系不是絕對的,而是相對的。邏輯知識到一定層次不能再往下推理的時候,人又會依賴經驗(有時候甚至是直覺或情感)。有時候,人懶得推理,也會停留在經驗知識層面上。讀者也不要笑話“懶得推理”這個行為,因為人類沉淀下來的經驗知識實在太多,如果要試圖邏輯化所有的經驗知識,在人有限的生命里是很難完成的。
這就是極端聰明的人在無法邏輯化他們想邏輯化的知識的時候,他們的幽默感會訴諸一些最基本的經驗(以表示無奈)。此前的文章在介紹機器(計算機或者人工智能)的時候,我們會看到很多不可計算數,這是有限的人腦和機器在無極限的知識體系面前表現出的一種無奈。
為了解釋邏輯和經驗的相對性,我們再來回顧一下萬有引力定律的建立過程。萬有引力定律和牛頓三定律主要是用來解釋開普勒觀察到的天體運動規律。圖1-8所示是用古典力學解釋的開普勒觀察到的太陽系各大行星的天體運動:
▲圖1-8 牛頓力學描述的太陽系天體運動,來源:維基百科
萬有引力定律和牛頓三定律本身是基于一系列假設的一個數學模型,有效擬合了開普勒觀察到的天體運動。這種處理方法和神經網絡模型一樣,都是把標注過的數據集合輸入模型,調整模型的參數以擬合這些數據集。
牛頓三定律和萬有引力定律的參數經過擬合以后,物體間的作用力變量(F)和距離變量(r)系數關系是-2(也就是平方成反比)。所有學習過物理的人對這個結果不會有太多質疑,但是哲學家們則需要經過邏輯化才能認可這個結果。所以他們會問,為何系數是-2,而不是-1.999999…9(中間間隔足夠多的9)或者-2.00000…01(中間間隔足夠多的0)?這樣的系數一樣能夠擬合所有可以觀察到的數據。
當然,牛頓選擇-2而不是那兩個長數字主要是為了處理方便,或者他相信簡單的總是好的(作者沒有機會用混有吳語口音的美式英語和牛頓的皇家口音英語隔著時空對話,但“簡單是好”是大部分做模型的人的一個情感選擇而不是邏輯選擇)。當然,牛頓沒有心情和這些哲學家費一番口舌,他的回答有點類似于“你們拿去用,一定屢試不爽,有問題再回來找我。”
事實上,哲學家們對于牛頓萬有引力定律在內的古典力學體系的質疑是有一定道理的,因為后來古典力學在描述微觀世界的時候不再成立。這時就需要量子力學了。
如果把古典力學運用到原子核和它的電子,我們無法解釋為何電子不掉進原子核,這就意味著古典力學的模型無法對某些數據進行擬合。經過不斷的探索,物理學家們建立了量子力學。
和古典物理不同,量子力學的模型有很大一部分建立在概率基礎上。例如,在量子力學中,人們無法預測電子在原子核外的固定位置,只能預測它出現在某個位置的概率。圖1-9描述了氫原子的電子的波動方程。軌道的顏色深淺代表了電子出現的概率。
▲圖1-9 量子力學描述的氫原子波動,來源:維基百科
綜合前面的討論,萬有引力實際上是根據人類在更高層次和更廣范圍的觀察得到的經驗總結。蘋果下落對于沒有學過物理的人而言是經驗知識,而對于學習過物理的人而言,他們的知識雖然在邏輯上往上走了一層,但最終還是要依賴于一個經驗數學模型。
Tips:這個模型的參數不是通過邏輯推理出來的,而是根據過去數據匹配出來的一個經驗值。現在人工智能領域的模型正是這種情況。
作者具有理學和經濟兩個學科背景,所以對文科和理科的交叉、融合深有體會,因為當我們的認知達到一定邊界的時候所做的模型和假設不得不訴諸于情感(或者直覺),就像牛頓為了簡潔選擇-2作為模型里面距離的系數,歐幾里得的平行公理訴諸于世界是方方正正的情感(后面會詳細討論)。
當然,文藝青年也不要總是陷入情感中,因為大部分的感性認知遠沒有到人類認知的邊界,它們很容易邏輯化而上升到另外一個高度的感性認知。
Tips:這可能也是一些知名高校會要求理科生必須選修一定數量的文科課程才能畢業,文科生也必須要選修一定數量的理科課程才能畢業的原因。大家熟悉的太極拳和五禽戲也蘊含著這樣的道理,前者是一套陰陽平衡邏輯,后者是一套樸素的希望像猛禽一樣強健的情感表達。
實際上,作者想說的是,讀者可以審視一下自己的知識系統,邏輯和內化它們是非常耗神的,所以大部分知識還處于非常樸素的經驗層面。
雖然文/理科學生受到的邏輯和經驗的訓練可能不太一樣,但是AI和人比起來如何呢?因為強大的計算能力,機器學習看上去要勝人一籌。
例如,在判斷貸款申請的風險系數時,AI能夠把所有人的所有貸款歷史讀一遍來調校風險控制模型的參數,從而利用這些經驗參數來判斷當前一筆申請的風險。任何一個有豐富經驗的貸款專員也只能根據自己過去看到過的壞賬貸款的模糊圖景來判斷當前交易的風險。
如果說人算不過AI,那么人在邏輯推理方面是否比AI高出一等呢?我們需要在一個更為廣闊的數學和計算機的知識體系框架下討論這個問題。
02 公理化的邏輯系統
上一節談到了人類的經驗知識是分層次的。我們總結一下蘋果落地的兩個層次。
第一個層次,因為我們看到蘋果總是往下落地,沒有往上飛過,所以我們認為蘋果是落地的;
第二個層次,我們建立牛頓古典力學模型,因為物體受力要朝受力方向加速前進,所以蘋果脫離樹枝以后,受到地心引力作用要朝地表方向前進。
在這個層面,古典力學的很多模型的選擇(例如,萬有引力和距離平方成反比;再例如,不同參考系下,時間流逝是一樣的)也是基于經驗的。人類把知識一層層往上邏輯化到認知邊界,依賴幾個感性的假設便建立了一個認知體系。
很多偉大的科學家則從相反的角度來考慮:能否依賴幾個基本的公理假設(感性選擇)來建立整套認知體系?從歐幾里得到希爾伯特,哲學、數學和物理學科的先賢們分別對幾何知識和代數知識進行邏輯化。
在這個過程中,人類開始構想,能否讓機器從幾個公理和規則出發,通過計算推演列出所有人類知識?這一構想直接導致了以圖靈機為代表的機器智能的產生。圖靈在他的經典論文《論可計算數》中構造了一個機器(后人稱為圖靈機)來模仿人類數學工作者。
學術界普遍認為物理計算機的發明是受到圖靈機的啟發。馮·諾依曼等人在發明物理計算機后,給原本清貧的數學工作人員創造了高薪的編程崗位。今天的AI技術建立在計算機之上。從理論上講,AI學科只是圖靈機系統的一個模型化算法子集。
在這個子集里面討論AI和人的關系必然是不完整的,所以在討論AI和人的關系時,我們需要再往上追溯到公理化數學的過程。正是在這個過程中,邱奇、圖靈和哥德爾等人對于機器和人的探討遠比今天大眾對這個話題的討論深入。
第一個建立公理化的邏輯系統是歐幾里得的《幾何原本》。如果追溯到數學的源頭,歐幾里得是個不得不提的人。他的著作《幾何原本》對于人類影響非常深刻,據說《幾何原本》在西方的發行量僅次于《圣經》。歐幾里得的整個幾何體系建立在如下5條公理之上:
過相異兩點,能作且只能作一直線(直線公理)。
線段(有限直線)可以任意地延長。
以任一點為圓心、任意長為半徑,可作一個圓(圓公理)。
凡是直角都相等(角公理)。
兩直線被第三條直線所截,如果同側兩內角和小于兩個直角,則兩直線會在該側相交(平行公理)。
其中,第五條公理可以用另一種方式表述為:在一平面內,過直線外一點,可作且只可作一條直線與此直線平行。
歐幾里得平面幾何(歐氏幾何)的所有定理可以最終追溯到這五個公理,所以這五個公理構成了歐氏幾何的邊界。作者在開始學習這些公理的時候也難以理解邊界這個問題,后來也就放棄追問歐幾里得為何如此定義這五個公理。
后來我才知道,很多學霸都不喜歡歐幾里得的看上去像“主觀臆斷”定義出來的第五公理。其中,俄羅斯人羅巴切夫斯基(后面簡稱羅氏)認為第五公理應該可以通過前面四個公理推導出來。
為了推導這個公理,羅氏使用了反證法。在反證法中的第一步,他假設“過直線外一點有兩條平行線”,然后試圖通過這個反證假設來結合前面4條公理推導出邏輯矛盾。如果推導出矛盾,那么假設錯誤。
但是,羅氏基于他的假設并沒有推導出任何矛盾,反而推導出一個和歐氏幾何完全平行的幾何體系——羅氏幾何體系,也就是雙曲幾何。為幫助讀者直觀地理解羅氏雙曲幾何,圖1-10給出了一個圖形,這是一個三角形位于一個雙曲拋物面上,另外右下方有兩條在歐氏幾何中應平行的分流線。
▲圖1-10 羅氏幾何中的三角形和平行線,來源:維基百科羅氏幾何體系完全不同于歐式幾何,開創了非歐幾何的先河。一方面,這意味著歐幾里得的選擇并不是隨意的,他必須選擇第五公理才能建立起歐氏幾何體系。另一方面,這也意味著羅氏可能惹上了和哥白尼一樣的大麻煩。
羅氏理論標志著兩個幾何世界的出現:一個是歐氏幾何描述的方方正正的世界,另外一個是羅氏幾何描述的彎彎曲曲的世界。由于顛覆了當時大眾廣為認知的體系,羅氏的理論因此遭到很多非議,他個人也遭受了很多不公正待遇。
這時,羅氏向另外一位學霸、有“數學王子”之稱的高斯求助,希望高斯能夠公開支持他的理論。高斯雖然提供了很多力所能及的幫助,但是最終沒有公開站出來支持多個幾何體系的存在。盡管高斯自己也感覺到第五公理的選擇不是唯一的,但是他深知公眾面對具有顛覆性的新事物時的恐懼。
Tips:這里插一句,其實某種程度上今天對于AI的恐懼也只是歷史重現。
羅氏的晚年在不幸中度過,他的理論一直沒有公開得到支持。直到1868年,意大利數學家貝爾特拉米發表了一篇著名論文《非歐幾何解釋的嘗試》,證明非歐幾何可以在歐幾里得空間的曲面(例如擬球曲,pseudosphere)上實現。也就是說,非歐幾何命題可以“翻譯”成相應的歐氏幾何命題,如果歐氏幾何沒有矛盾,非歐幾何也自然沒有矛盾。
直到這時,長期無人問津的非歐幾何才開始獲得學術界的普遍關注并被深入研究,羅巴切夫斯基的獨創性研究也由此得到學術界的高度評價和一致贊美,他本人則被后人贊譽為“幾何學中的哥白尼”。
自貝爾特拉米解除了非歐幾何的束縛以后,來自德國哥廷根大學的高斯和黎曼對非歐幾何進行了大刀闊斧的拓展。黎曼對于歐式幾何的第五公理做了另外一個相反的假定:過直線外一點,不能做直線和已知直線不相交。由此產生了非歐幾何的另一個分支—橢圓幾何。
關于高斯和黎曼在非歐幾何領域的突破性進展,可以參考陳省身先生1987年發表的演講《什么是幾何學》。
總結來說,通過對歐幾里得第五公理做出的不同假設,最終衍生出三種邏輯自洽的幾何學:羅氏幾何、歐式幾何和黎曼幾何。在三種幾何中,垂直于同一線段的兩條直線如圖1-11所示。
▲圖1-11 三種幾何中垂直于同一線段的兩條直線的圖像,來源:維基百科
到這里,讀者可能會問:計算機(人工智能)和幾何有何關系?因為非歐幾何的公理化體系的討論,激發了自然數算數體系公理化的類似討論,從而推動圖靈機定義的出現。這里我們還要介紹哥廷根大學的另外一位學霸——希爾伯特。
在高斯和黎曼之后,非歐幾何在哥廷根大學盛行,影響了不少數學家。哥廷根大學迎來了希爾伯特,希爾伯特提出了公理化幾何體系并出版了《幾何基礎》。整個體系從一組公理出發,層層推導。希爾伯特的公理化方式也標志著數學方式開始轉移到現代的公理系統。
公理系統可以擺脫現實世界,就像非歐幾何的不同第五公理可以創造出不同于生活直覺的幾何世界。如果說幾何學是探討幾何元素的關系,那么點、直線、平面等可以用桌子、椅子等物體所取代。更為重要的是,在希爾伯特的概念里面,一個從公理系統構造出來的完整的數學系統應該具有以下特性:
獨立性:系統里的各個公理相互獨立,任何一個公理都不能從其他公理推導出來。例如歐幾里得的第五公理并不能從其他四個公理推導出來。
一致性:從公理出發,不能推導出兩個互相矛盾的定理。假設B是A的反命題,則不能從公理系統中同時推導出A和B成立。
完備性:從公理出發,可以推導出所有真命題。假設B和A是反命題,但是從公理系統不能證明A或者B,那么系統是不完備的。因為A和它的反命題都可能是正確的,不完備的系統像知識世界存在黑洞一樣,讓人不安。
可判定性:即給定一個數學命題,是否可以從公理出發,通過有限計算步驟來判定這個命題的可證明性。這個可以列舉的計算步驟就是現在所說的算法(Algorithm)。
完備性和可判定性可能會讓人混淆。如果一個系統是不完備的,那么存在命題不可被證明。可判斷性則探討是否能找到一個步驟,計算出一個命題能否被證明。
希爾伯特的偉大之處在于使公理化系統的思考方法影響到代數體系。在1900年8月舉行的國際數學家大會上,希爾伯特將可判定性問題列為當時數學面臨的23個問題中的第10位。
這個問題被描述為:“是否可以推導出一個過程(算法),通過有限步驟判定不定方程(也叫丟番圖方程)是否存在有整數解的命題?”
希爾伯特的座右銘是“我們必須知道,我們必將知道。”因此,在他眼里,無論不定方程是否有解,都應該存在一個判定過程來判定它是否可以被證明。
例如,費馬方程xn + yn = zn作為一種特定形式的不定方程,在數學家們試圖證明命題“費馬方程在自然數n > 2的情況下不存在整數解”之前,希望有個判定過程(算法)來判定它是否可以被證明。
事實上,費馬定理的證明花費了數學家300年的努力,幸運的是它是可證明的。從費馬定理證明史這個例子可以看到,代數命題通用判定過程(算法)的意義重大。要討論通用的可判定性,首先需要清晰地定義什么是算法。為此,邱奇和圖靈分別提出了不同構造和定義。圖靈構造了圖靈機,算法就定義在圖靈機的操作之上。
《從圖靈機、圖靈測試到人工智能:什么決定了AI能否取代人類?》討論了圖靈構造圖靈機的過程,但是很遺憾,圖靈也證明了基于自然數算術的公理化體系的通用判斷過程并不存在。
關于作者:馮雷(Ray Feng),Pivotal中國常務董事(Managing Director)兼研發中心總經理。馮雷曾在500強企業甲骨文(Oracle)總部從事云計算產品研發。作為云計算早的一批從業人員,幫助甲骨文云計算資源調度領域成為意見領袖。擁有多項云計算專利。姚延棟,Pivotal中國研發中心副總裁,在Pivotal公司全球范圍內為Greenplum技術發展路線提供戰略輸入。聯合創建了Pivotal中國研發中心,發起了Greenplum中國開源社區,奠定了包括阿里云、騰訊云和百度云在內的廣大開源Greenplum用戶群。高小明,Pivotal中國研發中心Greenplum產品總監,先后參與和負責數據分析協作平臺Chorus、開源PaaS云平臺Cloud Foundry、MPP數據庫Greenplum等產品的開發、運維和技術推廣。楊瑜,Pivotal中國研發中心Greenplum工程技術總監,長期從事 Greenplum 內核的研發和管理工作,先后參與和負責基于Greenplum內核的機器學習庫MADlib的研發、Greenplum 內核和PostgreSQL內核持續歸并等工作。
本文摘編自《Greenplum:從大數據戰略到實現》,經出版方授權發布。
延伸閱讀《Greenplum:從大數據戰略到實現》
點擊上圖了解及購買轉載請聯系微信:DoctorData推薦語:本書由Greenplum核心研發團隊精心編寫,融入了團隊十余年來對云計算、大數據和人工智能驅動的企業數字化轉型、先進技術發展趨勢以及產品研發的深刻思考,對Greenplum這款快速成長的開源大數據平臺進行了全方位深度解讀,無論是企業決策者,還是大數據相關的技術人員,都能從本書中獲益。「大數據」內容合伙人之「鑒書小分隊」上線啦!
最近,你都在讀什么書?有哪些心得體會想要跟大家分享?
數據叔最近搞了個大事——聯合優質圖書出版商機械工業出版社華章公司發起鑒書活動。
簡單說就是:你可以免費讀新書,你可以免費讀新書的同時,順手碼一篇讀書筆記就行。詳情請在大數據公眾號后臺對話框回復合伙人查看。
有話要說?
Q:?跟AI相比,人類的優勢在哪?
歡迎留言與大家分享
猜你想看?玩數據必備Python庫:Numpy使用詳解
數據分析與數據化運營的關鍵知識點,全在這里了
如何在 Apache Flink 中使用 Python API?
解讀人工智能、大數據和云計算的關系,大佬們賭AI竟都輸了?
更多精彩?
在公眾號對話框輸入以下關鍵詞
查看更多優質內容!
PPT?|?報告?|?讀書?|?書單?|?干貨?
大數據?|?揭秘?|?Python?|?可視化
AI?|?人工智能?|?5G?|?區塊鏈
機器學習?|?深度學習?|?神經網絡
合伙人?|?1024?|?段子?|?數學?|?高考
據統計,99%的大咖都完成了這個神操作
?
覺得不錯,請把這篇文章分享給你的朋友
轉載 / 投稿請聯系:baiyu@hzbook.com
更多精彩,請在后臺點擊“歷史文章”查看
點擊閱讀原文,了解更多
總結
以上是生活随笔為你收集整理的谈论AI之前,你搞懂人类了吗?(颠覆认知)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 漫画:数据中台中台建设的十大误区(建议收
- 下一篇: 图灵奖得主Bengio:深度学习让AI得