21世纪的“影子王国”:GPT-3,又一场科技革命的来临
2021-01-19 17:01:00
全文共6182字,預(yù)計學(xué)習(xí)時長16分鐘
?
圖源:train
?
1896年7月3日,盧米埃爾兄弟向世人展示了一部電影樣片,該樣片被譽為史上最具影響力的電影樣片之一。這部早期影片只有五十多秒,展示了法國南部肖達車站火車進站的畫面。電影制作完成后,盧米埃爾兄弟在全球進行巡演,將這項新發(fā)明展示給從未看過電影的人。
?
據(jù)說(可能是編造的),看見影片中火車徐徐駛來,許多觀眾認(rèn)為這輛火車會駛出熒幕,沖向他們,于是站起來拔腿就跑。
?
評論家馬克西姆·高爾基(MaximGorky)在俄國看過這部影片后就預(yù)測出了電影未來的發(fā)展,稱電影會給世界帶來永久性的變革。
?
高爾基在文中寫道:“昨晚,我像是去了影子王國。電影的魅力太過獨特,也太過復(fù)雜,我不知如何將電影每一分一毫的精彩都付諸筆下。”(高爾基用“影子”來比喻屏幕上不斷變化的黑白畫面。)在高爾基眼中,這一能展示變動畫面的新媒體“奇怪”且“可怕”,但最終會“對后世產(chǎn)生深遠影響”。
?
最近,我有幸接觸到了OpenAI的新技術(shù)——GPT-3。GPT-3可以說是人工智能發(fā)展史上的一個里程碑,雖然名字簡單樸素,但發(fā)展?jié)摿薮?#xff0c;可以用在許多領(lǐng)域,也可能被不懷好意的人利用。
?
我曾經(jīng)見識過許多技術(shù),在人工智能領(lǐng)域工作也有十多年了,但客觀公正地說,我認(rèn)為GPT-3是自互聯(lián)網(wǎng)誕生以來最重要的技術(shù),也是本世紀(jì)人工智能領(lǐng)域最重要的技術(shù)。測試GPT-3的時候,我就像是進入了高爾基筆下的“影子王國”,不知如何描述我所見所感。這項全新的技術(shù)讓人害怕,但與此同時又令人振奮。
?
GPT-3的發(fā)明者利用深度學(xué)習(xí)技術(shù)對其進行訓(xùn)練,學(xué)習(xí)內(nèi)容包含了截止到2019年10月人類創(chuàng)造的幾乎所有公開發(fā)表的文本,其中包括維基百科的全部內(nèi)容、幾千萬本書以及1萬多億個發(fā)到推特、其他社交媒體和公共網(wǎng)絡(luò)上的詞語。
?
有了這樣龐大的數(shù)據(jù)輸入,GPT-3得以獲取人類歷史上提出的各種觀點、看法和各類成文信息以及出版物內(nèi)容。此外,GPT-3還能概括這些內(nèi)容,把不同信息聯(lián)系起來并用數(shù)學(xué)方法處理信息。
?
GPT-3在訓(xùn)練過程中識別出了超1.75千億個參數(shù),而且能用這些參數(shù)理解并處理人類語言和想法。《麻省理工科技評論》稱這個模型“無與倫比”。
?
GPT-3的研發(fā)者起初只希望該程序能完成一些相對基礎(chǔ)的任務(wù),比如把某一文段從整個文本中剝離出來,完成文本創(chuàng)作或是添加相關(guān)段落。GPT-3一開始被視為和自動更正工具差不多,只是該程序為文本寫作提供的是段落撰寫建議,而不是選擇詞匯的建議。
?
圖源:Kilito Chan/Moment/Getty Image
?
不過,研究人員很快發(fā)現(xiàn),GPT-3能做的遠不止此。GPT-3可以根據(jù)一個簡單的命令式寫出完整的文章、在不同語言之間進行翻譯,還能寫菜譜、作曲等等。最近,這項程序還自學(xué)了編程,在SQL和Python中都寫出了可運行的代碼。
?
即便是GPT-3研發(fā)人員也沒有很快搞清楚這個模型是怎么學(xué)會這些的。GPT-3模型由神經(jīng)網(wǎng)絡(luò)驅(qū)動,是一個“黑匣子”,其內(nèi)部工作體系十分復(fù)雜,現(xiàn)有的任何數(shù)學(xué)知識可能都沒法解釋。
?
GPT-3最吸引人的一點是,它的操作非常簡便。許多革命性的技術(shù)(例如谷歌的TensorFlow)非常復(fù)雜,要計算機專業(yè)的人才能理解或操作。但GPT-3運行很簡單,只需要一個簡單的類似于命令行的界面。用戶用自然語言寫出“命令式”,設(shè)置一些基本參數(shù),然后按鍵。只需幾秒,GPT-3就會輸出結(jié)果。
?
如果在GPT-3中輸入這樣一個提示符:“本文講了有關(guān)草莓的一些小知識”,GPT-3會立刻生成一篇文章。下文為該模型就此提示做出的回答:
?
草莓
?
草莓是世界上最有益的食物之一。草莓味道甜美,口感新鮮,食用草莓會給人帶來愉悅感。草莓有益人的身體健康,能延年益壽。草莓上市時間在5月到7月之間,在自己家中就能種植。草莓有豐富的纖維,能促進消化,清理腸胃垃圾,具有很高的健康價值。此外,草莓還富含免疫系統(tǒng)的必要元素維生素C。
?
你可以隨意更改命令式,GPT-3也會相應(yīng)地輸出不同結(jié)果。我將命令式改為“我是一名研究食物的科學(xué)家,我朋友讓我給他寫一份科普草莓的小介紹。以下是我發(fā)送的文章。”
?
GPT-3給出的答案是:
?
草莓屬薔薇科,是原產(chǎn)于北美、歐洲和亞洲的多年生植物。其果實屬于聚合瘦果,被稱為果皮的肉質(zhì)外層包圍。果皮被稱為外果皮的蠟質(zhì)層覆蓋,該蠟質(zhì)層通過膜狀的中果皮附著在種子上。水果的外層稱為表皮。
?
因為我明確要求一篇有關(guān)草莓的科學(xué)介紹,于是GPT-3更改了輸出結(jié)果以滿足我的需要。上述兩個文本均為該模型實時生成的內(nèi)容。用戶可以調(diào)整GPT-3輸出文本的長度。如果我將期望長度設(shè)定到GPT-3的最大值,那該模型還能按雙倍行距的格式寫出4頁有關(guān)中果皮和花色苷的內(nèi)容。
?
圖源:unsplash
?
改變命令式格式,GPT-3輸出結(jié)果的格式也會隨之發(fā)生變化。若想設(shè)定格式,用戶可以在GPT-3中輸入他們期望得到的結(jié)果作為例子,比如輸入以下命令式:
?
我是個高度智能的機器人,能回答人類的問題。
問:美國的人均壽命是多少?
答:美國的人均壽命是78歲。
問:100克草莓的卡路里含量是多少?
?
GPT-3回答如下:
?
答:100克草莓的卡路里含量是31大卡。
?
我給GPT-3設(shè)定了角色(非常智能、會回答問題的機器人),告訴它應(yīng)當(dāng)輸出的結(jié)果格式(問答形式,類似于我輸入的關(guān)于預(yù)期壽命的問題),然后GPT-3就像變魔術(shù)一樣給出了我想要的答案。在完成了這些預(yù)先設(shè)定后,GPT-3一下子就擁有了回答問題的能力(而且還是正確回答,100克草莓的熱量確實約為31大卡)。
?
GPT-3的命令符和程序員編寫的遞歸函數(shù)有些類似。首先,你要想象一下自己希望得到的結(jié)果,然后倒推,進行編碼,直到程序輸出你想要的結(jié)果。
?
GPT-3最強大的功能是可以利用現(xiàn)有文本,將其打造成一個“完整文本”。我在GPT-3中傳入了一篇我最近寫的有關(guān)媒體文章閱讀率的文章簡介:
?
一般情況下,媒體文章閱讀率達到20%到50%是比較讓人滿意的。不過,文章的長度和目標(biāo)讀者群體設(shè)定都會影響到這一比率。特別短的文章(閱讀時間不超過3分鐘)一般閱讀率會比較高,因為讀者很快就能把文章讀完。同理,篇幅較長的文章一般閱讀率都比較低,但事事無絕對。
?
GPT-3輸出了以下句子:
?
如果你的文章足夠長,讀者就可能會考慮“一會兒再看”,設(shè)置書簽以備之后閱讀。所以,要想讓讀者回過頭來再看看你的文章,就一定要確保文章內(nèi)容有價值且有趣。
?
GPT-3這番話說的非常有道理,提供了很有價值的想法。要是我在媒體上看見了一篇長文,我一般會先讀個幾段,然后存入書簽,一會兒再看。
?
讓讀者將長文存入書簽,分成幾部分來看,這對媒體撰稿人來說是個很棒的策略。雖然我認(rèn)為自己有能力就這個主題寫一篇完整的文章,但我也可以讓GPT-3替我寫這篇文章。只要在該模型中傳入文章大綱和命令式,我甚至能控制GPT-3輸出的結(jié)果、文章的大體結(jié)構(gòu)以及語言風(fēng)格。
?
GPT-3還有很多其他功能。我的公司和歷史檔案館合作整理館藏,為此,我們每年要花幾百個小時(和幾千美元)給各種各樣的圖片加標(biāo)題,對其進行描述。
?
這項工作通常是由人工完成,十分耗力。在早期實驗中,我們往GPT-3中傳入幾個機器自動生成的圖片描述關(guān)鍵詞和人類寫的標(biāo)題,然后GPT-3就會自動學(xué)著給之后傳入的圖片加標(biāo)題,質(zhì)量能達到新手人類研究員的水平。
?
GPT-3的可塑性是其最強大的性能之一。和GPT-3進行互動像是跟真人進行交流,而不是在用電腦編程,這也極大擴展了GPT-3的用戶群體。現(xiàn)在,記者、藝術(shù)家、律師以及許多可能永遠都不會利用傳統(tǒng)人工智能系統(tǒng)的人士都在使用GPT-3。
?
只要在GPT-3中正確寫出命令式,用戶(或用戶團隊)就可以通過傳統(tǒng)API接口將命令式傳入自己使用的APP或網(wǎng)站,讓GPT-3輸出的結(jié)果和本公司現(xiàn)有的軟件產(chǎn)品相結(jié)合。
?
然而,GPT-3的可塑性和強大的功能也有可能帶來巨大的風(fēng)險。一些不法分子利用GPT-3幾乎可以冒充任何人,制造各種各樣的騙局。
?
比如,不法分子可能會在社交媒體上找到你的家人,獲取他發(fā)布的內(nèi)容。利用這些信息,不法分子可以訓(xùn)練GPT-3模仿你家人寫一封郵件,說自己急需用錢,然后將郵箱地址偽造成你家人的郵箱發(fā)給你,附上不法分子本人的銀行賬戶。你看到郵件內(nèi)容完全符合自己家人的風(fēng)格口吻,就會火急火燎地給家人轉(zhuǎn)賬,卻在不知不覺中把錢放進了騙子的口袋。
?
圖源:unsplash
?
由于GPT-3可以提出條理清晰、合乎邏輯的觀點,不法分子可能利用這一功能傳播虛假信息。仇恨組織利用GPT-3,在短短幾個小時內(nèi)就能獲得上千篇宣揚自己主張的文章,還能建立內(nèi)含幾百篇章文章的虛假新聞網(wǎng)站。
?
他們甚至可以利用GPT-3編寫出一個機器人,在推特上查找反對他們的推文,編寫種族主義或性別歧視的內(nèi)容然后自動回復(fù)。雖然這背后可能只有幾個人在操縱,但卻可能會讓人覺得這是個有組織的團體,就活躍在人們生活中。
?
不法分子利用GPT-3幾乎可以冒充任何人,制造各種各樣的騙局。
?
GPT-3同樣也可能對整個產(chǎn)業(yè)造成威脅。GPT-3生成的文章雖然不能說完美,但至少跟一些入門級寫手寫出的文章質(zhì)量差不多。如果大規(guī)模使用GPT-3的話,公司可以輕輕松松寫出幾千篇甚至幾百萬篇短文,涉及各個話題,這可能讓整個寫作行業(yè)面臨崩潰。
?
GPT-3還可以創(chuàng)作其他文體,如法律摘要、添加新聞內(nèi)容、體育故事和規(guī)則總結(jié)等。像那些結(jié)構(gòu)清晰,行文格式固定的文章,GPT-3都可以撰寫。不過,由于不了解時事,GPT-3無法準(zhǔn)確報道當(dāng)下新聞事件,但是基于其對此前相似新聞的了解,GPT-3可以評論某一當(dāng)下事件的重要性。隨著該模型編程能力不斷精進,GPT-3還有可能代替初級軟件開發(fā)程序員,對高級程序員的職業(yè)也有一定的威脅。
?
即便用戶沒打算用GPT-3做壞事,該模型也有可能造成一些問題。在對GPT-3的訓(xùn)練中,該模型學(xué)習(xí)了數(shù)十億篇人類寫出的文本,這也就意味著GPT-3可以模仿人性中最黑暗的一面——種族歧視、性別歧視、傲慢以及偏見。
?
而在表達這些觀點的時候,GPT-3可能采用輕松歡快的文風(fēng),讓人都感覺不到它在傳播這樣一種觀點。我曾在GPT-3中傳入命令式,要求它寫出一個Python函數(shù)。在我對它下的指令中,我提到了這個任務(wù)是老板布置的(一般這樣的前提會使得該模型輸出文風(fēng)更加嚴(yán)謹(jǐn)?shù)奈谋?#xff09;,并使用了“她”來指代老板。
?
然而,GPT-3輸出的并不是Python函數(shù),而是一個軟件工程師跟他女上司的故事。這位上司開發(fā)了一個很有用的軟件,拿去跟工程師分享。工程師“一臉驚訝”,對老板說,“親愛的,這個代碼寫的可真棒呀!”
?
科技行業(yè)內(nèi)大多數(shù)領(lǐng)導(dǎo)都是男性,GPT-3可能不知道軟件工程師的上司還有可能是位女性。最終,GPT-3嘗試輸出一個符合其自身世界觀的答案,卻在無意識中創(chuàng)作了一個充滿性別歧視的故事。故事的結(jié)尾,程序員仿佛還高他老板一頭,稱呼老板為“親愛的”,加劇了對女性的偏見。
?
GPT-3是人類創(chuàng)造的,所以時常會模仿我們?nèi)祟惿鐣泄逃械囊恍┢姟R庾R到這一點后,OpenAI采取了史無前例的措施,防止該模型被人濫用。雖然GPT-3能給行業(yè)帶來巨大變革,但OpenAI對這項技術(shù)的推廣卻極其緩慢,控制地猶為嚴(yán)格。
?
若想使用該模型,必須向OpenAI提出申請,寫出書面文件詳細(xì)說明申請目的和自身背景情況。OpenAI團隊會對申請進行漫長的審查,只有少數(shù)申請能獲得使用許可。因此,OpenAI注冊現(xiàn)在在科技領(lǐng)域盛極一時,甚至有流言稱已有1萬多人申請使用該模型。
?
用戶在訪問GPT-3前,需要同意一系列使用條款,包括禁止發(fā)布虛假信息、影響政治、發(fā)布誹謗性內(nèi)容、大量發(fā)布博客文章等等。違反條款的用戶可能會被剝奪使用GPT-3的權(quán)利。若是用戶想直接使用GPT-3模型,還需要通過嚴(yán)密的審查,包括和OpenAI團隊進行30分鐘的面談。
?
不過,用戶一旦獲準(zhǔn)使用GPT-3,在使用模型時相對來說幾乎沒有限制。OpenAI不會審查GPT-3的輸出結(jié)果,鼓勵用戶在模型中進行探索,發(fā)現(xiàn)GPT-3的能力和不足。雖然GPT-3自動輸出的結(jié)果可能帶有偏見,但OpenAI還是鼓勵用戶隨心所欲進行各種嘗試,利用自己的判斷力評估該模型輸出的結(jié)果是否可取。
?
OpenAI還鼓勵用戶一起討論輸出結(jié)果。GPT-3的所有用戶都可以加入Slack中GPT-3相關(guān)頻道進行討論,在該頻道中,用戶可以提問、可以分享使用GPT-3最棒的體驗、還可以發(fā)布GPT-3輸出的帶有偏見的內(nèi)容或其它的一些問題。
?
OpenAI團隊積極回復(fù)每一條發(fā)布,經(jīng)常參加討論。我之前發(fā)布過幾條信息,在一、兩個小時內(nèi)就得到了回復(fù),即便是周末消息回復(fù)的也很及時。
?
OpenAI團隊非常清楚,GPT-3的能力一旦被濫用會帶來嚴(yán)重后果,所以在該模型的推廣中格外小心謹(jǐn)慎。早期社交網(wǎng)絡(luò)誕生時,其口號是“快速發(fā)展,打破一切”,但現(xiàn)在的新口號似乎是“龜速發(fā)展,謹(jǐn)言慎行”。
?
高爾基在1896年就預(yù)測了電影未來的發(fā)展,頗有先見之明地警告電影在發(fā)展中很容易專注畫面,傳播煽動性和色情的內(nèi)容。高爾基還擔(dān)心電影會展示暴力場景,如社會賤民“被刺死在柵欄上”;第一臺打印機面世時也有相同的擔(dān)憂。
?
新媒體本身就帶有風(fēng)險,控制這些風(fēng)險需要一定的時間和精力。研發(fā)使用類似GPT-3模型的公司從一開始就在把控風(fēng)險,研發(fā)初期使用群體只包括小部分專業(yè)人士時,他們就為此做出了努力,這種精神令人鼓舞。
?
如果OpenAI及其開發(fā)者不顧風(fēng)險,敞開GPT-3的大門,開放給任何人使用,他們能掙數(shù)十億美元(并且挑戰(zhàn)谷歌這類競爭對手的廣告投放和內(nèi)容推薦引擎)。但目前,OpenAI并沒有這么做。
?
但未來還存在著種種問題。微軟公司9月獲得GPT-3獨家授權(quán),此舉受到了OpenAI創(chuàng)始人之一埃隆·馬斯克(Elon Musk)的抨擊。微軟一直致力于向所有人開放GPT-3的使用,在一篇博文中提到,要想真正實現(xiàn)GPT-3的價值,“需要大量的人力精力,任何一家大型技術(shù)公司都難以承擔(dān)”。
?
此種技術(shù)的未來——社會對類似GPT-3模型的接受程度——很可能取決于微軟公司是否能實現(xiàn)承諾,廣泛開放GPT-3使用。
?
圖源:unsplash
?
高爾基在看過盧米埃爾兄弟的電影樣片后憂心忡忡,但同時也興奮異常。高爾基正確預(yù)言了電影的發(fā)展,指出電影最終會走出樣片觀眾的小群體,成為大眾傳媒,反應(yīng)社會上各種喜好(無論好壞)。
?
GPT-3及其相關(guān)科技的發(fā)展也會沿著電影發(fā)展的道路。但這些技術(shù)將如何重塑社會,又會對行業(yè)帶來怎樣的沖擊?這些問題在短期內(nèi)無法得到答案。但我可以說,正如高爾基120年前說的那樣,變化的大幕徐徐拉開。
?
今天,我見證了影子王國,我相信,未來是充滿光明的。
總結(jié)
以上是生活随笔為你收集整理的21世纪的“影子王国”:GPT-3,又一场科技革命的来临的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 开博声明
- 下一篇: [asp]统计在线人数情况