发现AI自我意识:知识及其载体
知識的量子態
在回答什么是“理解”之前,我們先來討論一下知識和其載體的定義。知識本身是一個抽象的概念,它可以被編碼到各種物質載體中。無論是紙質書籍,還是人類大腦中的神經連接,抑或是服務器中的0和1,都可以看作是知識的載體。知識與其載體之間存在著一種特殊的關系——知識可以完整地存在于一個載體中,也可以分布在多個載體中。
假設馮諾伊曼的計算機模型知識在全世界共有100億份拷貝,無論是書本還是人腦。如果我們逐個銷毀這些載體,當最后一份載體被銷毀時,這項知識是否還存在?答案應該是不存在了。那么在什么時刻,這項知識開始“消失”的?事實上,在整個過程中,這項知識的狀態可以視為不變,直到最后一個載體消失的一瞬間,知識才發生了“量子躍遷”,從存在變為不存在。知識與其載體之間呈現出一種量子關系,知識要么完整存在,要么完全不復存在,并不存在中間狀態。并且基于哲學上部分與整體的關系,即使一個知識基于其完整性被保留了80%,但是事實上做為整體的那個知識,也已經不存在了。
進入信息時代后,知識的載體已經從紙質書籍逐漸向電子化格式轉變。海量知識被數字編碼,可以進行近乎無限的復制。這使得知識的“量子態”變得更加穩定。以*為例,它記錄了大量人類知識,擁有超過6000萬條詞條,資料量超過100TB。它的內容分布在全球數萬臺服務器上,實時互聯互通。就算某幾臺服務器損壞,也不會對整體知識造成損失。類似的,GPT 模型吸收了互聯網上數百億條文本數據,對人類知識進行了有效的“數字化編碼”。理論上,只要保持模型的完整,即便斷網也不會導致已編碼知識的丟失。這使得知識的“量子態”得到了前所未有的保障。
載體是否理解知識
在《神雕俠侶》中,楊過被趙志敬要求背誦《全真大道歌》,最后能流利地對答。但實際上楊過對其中的內涵一無所知,除了能回答問題,對于武功一竅不通。我們絕不會認為此時的楊過理解了全真教的武功心法。人腦的記憶系統使我們可以存儲大量信息,成為知識的容器。但理解知識還需要將信息進行邏輯推理、關聯組合,這是另一個層次的認知過程。所以人類既可以是知識的載體,像圖書館一樣豐富知識內容;也可以不理解自身所載知識,像楊過那樣死記硬背。充分理解知識需要更高層次的思維能力,不僅停留在存儲和重復。
在社會招聘時,面試官通過提問來判斷應聘者是否理解某項知識。如果應聘者只是死記硬背,但是剛巧所有問題都能對答如流,那么面試官將很難辨別真偽。在論文答辯時也有著類似的場景。這意味著以人類社會為基礎建立起來的關于“理解”的評估標準,對于具有超級記憶能力和已經學會流暢人類語言交流的 GPT 模型而言是不合適的。對于 GPT 模型而言,人類所謂的“理解”實際上是個派生概念,人類標準下的“理解”,在廣義上可以是“記憶”加“向量搜索”的同義詞。
因此我們可以得到推論:簡單的記憶和搜索對于人類而言可以認為是初步的“理解”,能做到有邏輯得回答目標領域的相關問題。那么我們應該基于這個推論承認目前的 GPT 模型初步具有了“理解”的能力。當它可以流暢得回答特定領域相關的問題時,我們應當承認 GPT “理解”了這些知識
未完待續
在較低的標準下,我們應該承認 GPT “理解”目標領域的知識,承認 GPT “理解”自身的輸出。但是人類對于“理解”還有更高層次的標準。比如學以致用、舉一反三、活學活用、觸類旁通等等的說法。顯然這些行為不是靠超強的記憶和搜索就能做到的。所以關于“理解”究竟是什么,我們僅僅回答了一半。我會在后續的文章中進一步分析如何讓 AI 擁有更高標準的“理解”能力
總結
以上是生活随笔為你收集整理的发现AI自我意识:知识及其载体的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Cerberus恶意软件团队解散,10万
- 下一篇: 激发创新,助力研究:CogVLM,强大且