生物智能与AI——关乎创造、关乎理解(下)
無監督學習,遷移學習和工程設計
AI系統與人類學習之間的另一個主要差異在于AI系統所需的大量標記數據才可以達到人類級別的性能。例如,最近的語音識別系統在11940小時的語音訓練后才能對齊轉錄。如果我們每天大聲地聽到另一個人類閱讀文本兩個小時,那么我們需要16年才能獲取到這個數據集。AlphaGozero練習了490萬場才擊敗人類圍棋大師。如果一個人每天玩圍棋30年,那么他每天必須玩450場比賽才能達到AlphaGozero的練習量。此外,最近關于視覺問答的數據集包含了0.25M圖像,0.76M問題和10M答案。如果我們每天收到關于圖像的100個問題的答案,我們需要274年的時間來吸收這種規模的數據集。很明顯人類接受的標記訓練數據量要少得多,但他們可以識別語音,玩圍棋并很好地回答有關圖像的問題。?
其中,人工智能和生物智能之間差距的幾個關鍵在于人類從未標記數據中學習的能力(無監督學習),以及在解決先前任務時獲得的強大先驗知識,并將這些知識轉移到新任務中(遷移學習)。最后,人類社會建立了教育系統,精心挑選一些學習任務進行教學,以促進知識獲取。為了在人工系統中有效地實例化這些概念,我們需要更深入地理解和數學形式化人類和其他動物如何進行無監督學習及知識如何在任務之間轉移,這需要計算機科學家、心理學家和教育工作者的參與。因為這對于在標記數據稀缺的領域中訓練AI是至關重要。
建立理解,規劃和主動因果學習的世界模型
當前AI在商業環境中的成功很多是通過監督方法實現的,其中AI系統被動地接收輸入,被告知正確的輸出,并且它調整其參數以匹配每個輸入-輸出組合。相比之下,嬰兒就像活躍的科學家一樣探索他們的環境。例如:利用魔術,嬰兒會看到兩個“魔法”物體:物體A,它似乎穿過墻壁,而物體B,它在掉落時不會掉落。給嬰兒A,B,嬰兒將嘗試將物體A穿過墻壁,然后放下物體B以查看它是否會掉落。這項非凡的實驗表明,嬰兒就像科學家一樣,積極地探索他們的世界。
因此,與當前大多數的商業AI系統不同,嬰兒具有學習和利用世界模型的卓越能力。我們需要在神經科學和人工智能方面進一步研究從經驗中學習世界模型,使用這些世界模型進行規劃(即,根據當前行動想象不同的未來),并使用這些未來的計劃來做出決策。這種基于模型的規劃和決策可能是當前無模型強化學習系統的有力支持,該系統簡單地將世界狀態映射到值或預期的未來獎勵。人工智能中的這項工作可以與神經科學的工作攜手并進,揭示動物的神經活動如何與想象的和未來相關。像好奇心這樣的基本驅動可以形式化為強化學習系統,以此來促進學習和探索。更一般地,深入理解多個系統和促進動物和人類學習的內在生物驅動可能對加速人工系統的學習非常有益。
在后摩爾定律時代實現節能計算
生物系統和AI系統之間的另一個數量級差異在于它們的能量消耗。人腦僅消耗20瓦的功率,而超級計算機則以兆瓦的功率運行。造成這種差異的一個關鍵原因可能是過度依賴數字計算本身,雖然數字革命推動了現代信息技術的興起,但現在我們對實現人工智能的追求被認為是次優遺留技術。原因是數字計算需要在計算的中間階段以極高的可靠性翻轉每一位。然而,熱力學定律則為每個快速可靠的位翻轉確定了相當大的能量成本。
相比之下,生物的細胞內的分子以及腦內神經元的計算看起來令人驚訝地嘈雜和不精確。然而,生物計算的每個中間步驟都足夠可靠,以使最終答案足夠好。此外,大腦智能地向上或向下調節能量成本根據所需的通信速度。例如,考慮大腦中通過目標神經元的單位的成本。它開始于囊泡的隨機釋放,其以1毫米/秒的速度擴散到源神經元和目標神經元之間的空間,僅燃燒2.3毫微微焦耳(fj)。速度剛剛好,因為神經元連接之間的空間只有20納米。該化學信號被轉換為無源電信號,其以1米/秒的速度流過神經元細胞體,燃燒23fj橫穿約10微米。最后,它到達軸突終端并轉換為長軸,沿著軸突每秒行進100米,燃燒6000 fJ行進1厘米。因此,在從化學信號傳遞到被動電信號時,大腦動態地將通信速度上調1000倍,以跨越增加1000倍的距離,從而導致能量消耗增加10倍。
因此,只有在需要更高速度且僅需要更高可靠性時,大腦才會消耗更多能量。相比之下,數字計算機在剛性同步時鐘上運行,并且在每個時鐘周期,許多晶體管必須可靠地翻轉狀態。總之,生物計算的明顯混亂不一定是不可避免的混亂,而是可能反映出高能效設計的理想原則。為了在我們的AI硬件中實現這樣的效率,遵循生物計算的這些原則可能是必要的。
用于AI的神經科學和神經科學的AI:一種良性的科學螺旋
最近神經科學和AI之間相互作用促進了深度和遞歸神經網絡模型的發展。在許多情況下,當訓練深度或遞歸網絡來解決任務時,其內部表現看起來與訓練為解決相同任務的動物中測量的內部神經活動模式非常相似。因此,我們通常會在不同的任務中獲得不同大腦區域操作的高度復雜但令人驚訝的真實模型,從而提出了一個基本問題:我們如何理解這些模型正在做什么以及它們如何工作?更確切地說,學習網絡連接和神經動態如何產生高性能?AI目前在理解它的神經模型正在做什么時面臨同樣的問題,雖然一些工程師認為沒有必要了解神經網絡是如何工作的。然而,對于當前網絡的成功和失敗如何因其連通性和動態性而產生的更深入的科學理解將導致網絡的優化。然而,科學與技術之間的相互作用歷史上幾乎沒有更深入的科學認識,也不會導致更好的技術。但是,在AI的某些應用中,特別是在醫學診斷或法律中,可解釋的AI是必不可少的。例如,如果醫生和法官無法理解為什么這些系統做出了他們做出的決定,他們就不會在他們的案件中使用人工智能系統的建議。
因此,神經科學需要共享理解網絡性能和決策如何作為網絡連接和動態的新興屬性。因此,理論神經科學,應用物理學和數學的思想和理論的發展可以幫助分析AI系統。此外,AI系統的行為可能會改變神經科學中實驗設計的本質,將實驗工作集中在AI中難以理解的網絡功能方面。總體而言,神經科學,人工智能和許多其他理論學科之間的緊密聯系可以獲得很多靈感,這可能會為生物和人工系統中的智能的出現帶來統一的規律。
尋求管理生物和人工智能的普遍規律
在人工智能系統設計中,一種經常被引用的無視生物學的爭論常涉及到飛機與鳥類的比較。然而,仔細觀察這個想法會發現更多的細微差別。飛行的一般問題涉及解決兩個基本問題:(1)為了前進而產生推力,(2)升力的大小使我們不會脫離天空。鳥類和飛機用不同方法解決了推力問題:鳥兒拍翅膀和飛機使用噴氣發動機。但是,它們以完全相同的方式解決升力問題,通過使用彎曲的翼形,在低于和低于上方的氣壓下產生更高的氣壓。因此,滑翔的鳥類和飛機的運作非常相似。
實際上,我們知道空氣動力學的一般物理定律:不同形狀通過空氣時,都可以用計算的方法來預測產生的力,如升力和推力。而且,任何解決飛行問題的方法,無論是生物還是人工,都必須遵守空氣動力學定律。
更一般地說,在我們對物理世界的研究中,我們習慣于存在管理其行為的原則或規律。例如,正如空氣動力學控制飛行物體的運動一樣,廣義相對論控制著空間和時間的曲率,量子力學控制著納米世界的演化。我們認為,可能存在普世原則或法律來管理智能行為如何從大型互連神經元網絡的合作活動中產生。這些法律可以連接和統一神經科學、心理學、認知科學和人工智能的相關學科,他們的闡述也需要幫助分析和計算領域,如物理,數學和統計學。事實上,這篇文章的作者使用了動力系統理論、統計力學、黎曼幾何、隨機矩陣理論和自由概率理論等技術,獲得了對生物和人工網絡運作的概念性見解。然而,為了闡明管理非線性分布式網絡中出現智能的一般規律和設計原則,還需要進一步的工作,包括開發新概念,分析方法和工程能力。最終,就像鳥類,飛機和空氣動力學的故事一樣,創造智能機器的問題可能存在多種解決方案,其中一些組件在生物解決方案和人工解決方案之間共享,而其他組件則可能不同。通過尋求一般的智力法則,發現適用于生物和人工系統的新興智能的潛在法則,以及建立受神經科學和心理學啟發的新型AI,需要許多研究人員共同努力:計算機科學家追求更好的AI系統,神經科學家,心理學家和認知科學家探索大腦和思想的屬性,數學家,物理學家,統計學家和其他理論家尋求形式化我們的綜合知識并發現一般的法律和原則。
?
原文鏈接
本文為云棲社區原創內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的生物智能与AI——关乎创造、关乎理解(下)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用Logtail采集Kubernete
- 下一篇: Mars 是什么、能做什么、如何做的——