當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

21世纪的“影子王国”：GPT-3，又一场科技革命的来临

發(fā)布時間：2023/12/10 编程问答 36 豆豆

生活随笔收集整理的這篇文章主要介紹了 21世纪的“影子王国”：GPT-3，又一场科技革命的来临小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

2021-01-19 17:01:00

全文共6182字，預(yù)計學(xué)習(xí)時長16分鐘

圖源：train

1896年7月3日，盧米埃爾兄弟向世人展示了一部電影樣片，該樣片被譽為史上最具影響力的電影樣片之一。這部早期影片只有五十多秒，展示了法國南部肖達車站火車進站的畫面。電影制作完成后，盧米埃爾兄弟在全球進行巡演，將這項新發(fā)明展示給從未看過電影的人。

據(jù)說（可能是編造的），看見影片中火車徐徐駛來，許多觀眾認(rèn)為這輛火車會駛出熒幕，沖向他們，于是站起來拔腿就跑。

評論家馬克西姆·高爾基（MaximGorky）在俄國看過這部影片后就預(yù)測出了電影未來的發(fā)展，稱電影會給世界帶來永久性的變革。

高爾基在文中寫道：“昨晚，我像是去了影子王國。電影的魅力太過獨特，也太過復(fù)雜，我不知如何將電影每一分一毫的精彩都付諸筆下。”（高爾基用“影子”來比喻屏幕上不斷變化的黑白畫面。）在高爾基眼中，這一能展示變動畫面的新媒體“奇怪”且“可怕”，但最終會“對后世產(chǎn)生深遠影響”。

最近，我有幸接觸到了OpenAI的新技術(shù)——GPT-3。GPT-3可以說是人工智能發(fā)展史上的一個里程碑，雖然名字簡單樸素，但發(fā)展?jié)摿薮?#xff0c;可以用在許多領(lǐng)域，也可能被不懷好意的人利用。

我曾經(jīng)見識過許多技術(shù)，在人工智能領(lǐng)域工作也有十多年了，但客觀公正地說，我認(rèn)為GPT-3是自互聯(lián)網(wǎng)誕生以來最重要的技術(shù)，也是本世紀(jì)人工智能領(lǐng)域最重要的技術(shù)。測試GPT-3的時候，我就像是進入了高爾基筆下的“影子王國”，不知如何描述我所見所感。這項全新的技術(shù)讓人害怕，但與此同時又令人振奮。

GPT-3的發(fā)明者利用深度學(xué)習(xí)技術(shù)對其進行訓(xùn)練，學(xué)習(xí)內(nèi)容包含了截止到2019年10月人類創(chuàng)造的幾乎所有公開發(fā)表的文本，其中包括維基百科的全部內(nèi)容、幾千萬本書以及1萬多億個發(fā)到推特、其他社交媒體和公共網(wǎng)絡(luò)上的詞語。

有了這樣龐大的數(shù)據(jù)輸入，GPT-3得以獲取人類歷史上提出的各種觀點、看法和各類成文信息以及出版物內(nèi)容。此外，GPT-3還能概括這些內(nèi)容，把不同信息聯(lián)系起來并用數(shù)學(xué)方法處理信息。

GPT-3在訓(xùn)練過程中識別出了超1.75千億個參數(shù)，而且能用這些參數(shù)理解并處理人類語言和想法。《麻省理工科技評論》稱這個模型“無與倫比”。

GPT-3的研發(fā)者起初只希望該程序能完成一些相對基礎(chǔ)的任務(wù)，比如把某一文段從整個文本中剝離出來，完成文本創(chuàng)作或是添加相關(guān)段落。GPT-3一開始被視為和自動更正工具差不多，只是該程序為文本寫作提供的是段落撰寫建議，而不是選擇詞匯的建議。

圖源：Kilito Chan/Moment/Getty Image

不過，研究人員很快發(fā)現(xiàn)，GPT-3能做的遠不止此。GPT-3可以根據(jù)一個簡單的命令式寫出完整的文章、在不同語言之間進行翻譯，還能寫菜譜、作曲等等。最近，這項程序還自學(xué)了編程，在SQL和Python中都寫出了可運行的代碼。

即便是GPT-3研發(fā)人員也沒有很快搞清楚這個模型是怎么學(xué)會這些的。GPT-3模型由神經(jīng)網(wǎng)絡(luò)驅(qū)動，是一個“黑匣子”，其內(nèi)部工作體系十分復(fù)雜，現(xiàn)有的任何數(shù)學(xué)知識可能都沒法解釋。

GPT-3最吸引人的一點是，它的操作非常簡便。許多革命性的技術(shù)（例如谷歌的TensorFlow）非常復(fù)雜，要計算機專業(yè)的人才能理解或操作。但GPT-3運行很簡單，只需要一個簡單的類似于命令行的界面。用戶用自然語言寫出“命令式”，設(shè)置一些基本參數(shù)，然后按鍵。只需幾秒，GPT-3就會輸出結(jié)果。

如果在GPT-3中輸入這樣一個提示符：“本文講了有關(guān)草莓的一些小知識”，GPT-3會立刻生成一篇文章。下文為該模型就此提示做出的回答：

草莓

草莓是世界上最有益的食物之一。草莓味道甜美，口感新鮮，食用草莓會給人帶來愉悅感。草莓有益人的身體健康，能延年益壽。草莓上市時間在5月到7月之間，在自己家中就能種植。草莓有豐富的纖維，能促進消化，清理腸胃垃圾，具有很高的健康價值。此外，草莓還富含免疫系統(tǒng)的必要元素維生素C。

你可以隨意更改命令式，GPT-3也會相應(yīng)地輸出不同結(jié)果。我將命令式改為“我是一名研究食物的科學(xué)家，我朋友讓我給他寫一份科普草莓的小介紹。以下是我發(fā)送的文章。”

GPT-3給出的答案是：

草莓屬薔薇科，是原產(chǎn)于北美、歐洲和亞洲的多年生植物。其果實屬于聚合瘦果，被稱為果皮的肉質(zhì)外層包圍。果皮被稱為外果皮的蠟質(zhì)層覆蓋，該蠟質(zhì)層通過膜狀的中果皮附著在種子上。水果的外層稱為表皮。

因為我明確要求一篇有關(guān)草莓的科學(xué)介紹，于是GPT-3更改了輸出結(jié)果以滿足我的需要。上述兩個文本均為該模型實時生成的內(nèi)容。用戶可以調(diào)整GPT-3輸出文本的長度。如果我將期望長度設(shè)定到GPT-3的最大值，那該模型還能按雙倍行距的格式寫出4頁有關(guān)中果皮和花色苷的內(nèi)容。

圖源：unsplash

改變命令式格式，GPT-3輸出結(jié)果的格式也會隨之發(fā)生變化。若想設(shè)定格式，用戶可以在GPT-3中輸入他們期望得到的結(jié)果作為例子，比如輸入以下命令式：

我是個高度智能的機器人，能回答人類的問題。

問：美國的人均壽命是多少？

答：美國的人均壽命是78歲。

問：100克草莓的卡路里含量是多少？

GPT-3回答如下：

答：100克草莓的卡路里含量是31大卡。

我給GPT-3設(shè)定了角色（非常智能、會回答問題的機器人），告訴它應(yīng)當(dāng)輸出的結(jié)果格式（問答形式，類似于我輸入的關(guān)于預(yù)期壽命的問題），然后GPT-3就像變魔術(shù)一樣給出了我想要的答案。在完成了這些預(yù)先設(shè)定后，GPT-3一下子就擁有了回答問題的能力（而且還是正確回答，100克草莓的熱量確實約為31大卡）。

GPT-3的命令符和程序員編寫的遞歸函數(shù)有些類似。首先，你要想象一下自己希望得到的結(jié)果，然后倒推，進行編碼，直到程序輸出你想要的結(jié)果。

GPT-3最強大的功能是可以利用現(xiàn)有文本，將其打造成一個“完整文本”。我在GPT-3中傳入了一篇我最近寫的有關(guān)媒體文章閱讀率的文章簡介：

一般情況下，媒體文章閱讀率達到20%到50%是比較讓人滿意的。不過，文章的長度和目標(biāo)讀者群體設(shè)定都會影響到這一比率。特別短的文章（閱讀時間不超過3分鐘）一般閱讀率會比較高，因為讀者很快就能把文章讀完。同理，篇幅較長的文章一般閱讀率都比較低，但事事無絕對。

GPT-3輸出了以下句子：

如果你的文章足夠長，讀者就可能會考慮“一會兒再看”，設(shè)置書簽以備之后閱讀。所以，要想讓讀者回過頭來再看看你的文章，就一定要確保文章內(nèi)容有價值且有趣。

GPT-3這番話說的非常有道理，提供了很有價值的想法。要是我在媒體上看見了一篇長文，我一般會先讀個幾段，然后存入書簽，一會兒再看。

讓讀者將長文存入書簽，分成幾部分來看，這對媒體撰稿人來說是個很棒的策略。雖然我認(rèn)為自己有能力就這個主題寫一篇完整的文章，但我也可以讓GPT-3替我寫這篇文章。只要在該模型中傳入文章大綱和命令式，我甚至能控制GPT-3輸出的結(jié)果、文章的大體結(jié)構(gòu)以及語言風(fēng)格。

GPT-3還有很多其他功能。我的公司和歷史檔案館合作整理館藏，為此，我們每年要花幾百個小時（和幾千美元）給各種各樣的圖片加標(biāo)題，對其進行描述。

這項工作通常是由人工完成，十分耗力。在早期實驗中，我們往GPT-3中傳入幾個機器自動生成的圖片描述關(guān)鍵詞和人類寫的標(biāo)題，然后GPT-3就會自動學(xué)著給之后傳入的圖片加標(biāo)題，質(zhì)量能達到新手人類研究員的水平。

GPT-3的可塑性是其最強大的性能之一。和GPT-3進行互動像是跟真人進行交流，而不是在用電腦編程，這也極大擴展了GPT-3的用戶群體。現(xiàn)在，記者、藝術(shù)家、律師以及許多可能永遠都不會利用傳統(tǒng)人工智能系統(tǒng)的人士都在使用GPT-3。

只要在GPT-3中正確寫出命令式，用戶（或用戶團隊）就可以通過傳統(tǒng)API接口將命令式傳入自己使用的APP或網(wǎng)站，讓GPT-3輸出的結(jié)果和本公司現(xiàn)有的軟件產(chǎn)品相結(jié)合。

然而，GPT-3的可塑性和強大的功能也有可能帶來巨大的風(fēng)險。一些不法分子利用GPT-3幾乎可以冒充任何人，制造各種各樣的騙局。

比如，不法分子可能會在社交媒體上找到你的家人，獲取他發(fā)布的內(nèi)容。利用這些信息，不法分子可以訓(xùn)練GPT-3模仿你家人寫一封郵件，說自己急需用錢，然后將郵箱地址偽造成你家人的郵箱發(fā)給你，附上不法分子本人的銀行賬戶。你看到郵件內(nèi)容完全符合自己家人的風(fēng)格口吻，就會火急火燎地給家人轉(zhuǎn)賬，卻在不知不覺中把錢放進了騙子的口袋。

圖源：unsplash

由于GPT-3可以提出條理清晰、合乎邏輯的觀點，不法分子可能利用這一功能傳播虛假信息。仇恨組織利用GPT-3，在短短幾個小時內(nèi)就能獲得上千篇宣揚自己主張的文章，還能建立內(nèi)含幾百篇章文章的虛假新聞網(wǎng)站。

他們甚至可以利用GPT-3編寫出一個機器人，在推特上查找反對他們的推文，編寫種族主義或性別歧視的內(nèi)容然后自動回復(fù)。雖然這背后可能只有幾個人在操縱，但卻可能會讓人覺得這是個有組織的團體，就活躍在人們生活中。

不法分子利用GPT-3幾乎可以冒充任何人，制造各種各樣的騙局。

GPT-3同樣也可能對整個產(chǎn)業(yè)造成威脅。GPT-3生成的文章雖然不能說完美，但至少跟一些入門級寫手寫出的文章質(zhì)量差不多。如果大規(guī)模使用GPT-3的話，公司可以輕輕松松寫出幾千篇甚至幾百萬篇短文，涉及各個話題，這可能讓整個寫作行業(yè)面臨崩潰。

GPT-3還可以創(chuàng)作其他文體，如法律摘要、添加新聞內(nèi)容、體育故事和規(guī)則總結(jié)等。像那些結(jié)構(gòu)清晰，行文格式固定的文章，GPT-3都可以撰寫。不過，由于不了解時事，GPT-3無法準(zhǔn)確報道當(dāng)下新聞事件，但是基于其對此前相似新聞的了解，GPT-3可以評論某一當(dāng)下事件的重要性。隨著該模型編程能力不斷精進，GPT-3還有可能代替初級軟件開發(fā)程序員，對高級程序員的職業(yè)也有一定的威脅。

即便用戶沒打算用GPT-3做壞事，該模型也有可能造成一些問題。在對GPT-3的訓(xùn)練中，該模型學(xué)習(xí)了數(shù)十億篇人類寫出的文本，這也就意味著GPT-3可以模仿人性中最黑暗的一面——種族歧視、性別歧視、傲慢以及偏見。

而在表達這些觀點的時候，GPT-3可能采用輕松歡快的文風(fēng)，讓人都感覺不到它在傳播這樣一種觀點。我曾在GPT-3中傳入命令式，要求它寫出一個Python函數(shù)。在我對它下的指令中，我提到了這個任務(wù)是老板布置的（一般這樣的前提會使得該模型輸出文風(fēng)更加嚴(yán)謹(jǐn)?shù)奈谋?#xff09;，并使用了“她”來指代老板。

然而，GPT-3輸出的并不是Python函數(shù)，而是一個軟件工程師跟他女上司的故事。這位上司開發(fā)了一個很有用的軟件，拿去跟工程師分享。工程師“一臉驚訝”，對老板說，“親愛的，這個代碼寫的可真棒呀！”

科技行業(yè)內(nèi)大多數(shù)領(lǐng)導(dǎo)都是男性，GPT-3可能不知道軟件工程師的上司還有可能是位女性。最終，GPT-3嘗試輸出一個符合其自身世界觀的答案，卻在無意識中創(chuàng)作了一個充滿性別歧視的故事。故事的結(jié)尾，程序員仿佛還高他老板一頭，稱呼老板為“親愛的”，加劇了對女性的偏見。

GPT-3是人類創(chuàng)造的，所以時常會模仿我們?nèi)祟惿鐣泄逃械囊恍┢姟Ｒ庾R到這一點后，OpenAI采取了史無前例的措施，防止該模型被人濫用。雖然GPT-3能給行業(yè)帶來巨大變革，但OpenAI對這項技術(shù)的推廣卻極其緩慢，控制地猶為嚴(yán)格。

若想使用該模型，必須向OpenAI提出申請，寫出書面文件詳細(xì)說明申請目的和自身背景情況。OpenAI團隊會對申請進行漫長的審查，只有少數(shù)申請能獲得使用許可。因此，OpenAI注冊現(xiàn)在在科技領(lǐng)域盛極一時，甚至有流言稱已有1萬多人申請使用該模型。

用戶在訪問GPT-3前，需要同意一系列使用條款，包括禁止發(fā)布虛假信息、影響政治、發(fā)布誹謗性內(nèi)容、大量發(fā)布博客文章等等。違反條款的用戶可能會被剝奪使用GPT-3的權(quán)利。若是用戶想直接使用GPT-3模型，還需要通過嚴(yán)密的審查，包括和OpenAI團隊進行30分鐘的面談。

不過，用戶一旦獲準(zhǔn)使用GPT-3，在使用模型時相對來說幾乎沒有限制。OpenAI不會審查GPT-3的輸出結(jié)果，鼓勵用戶在模型中進行探索，發(fā)現(xiàn)GPT-3的能力和不足。雖然GPT-3自動輸出的結(jié)果可能帶有偏見，但OpenAI還是鼓勵用戶隨心所欲進行各種嘗試，利用自己的判斷力評估該模型輸出的結(jié)果是否可取。

OpenAI還鼓勵用戶一起討論輸出結(jié)果。GPT-3的所有用戶都可以加入Slack中GPT-3相關(guān)頻道進行討論，在該頻道中，用戶可以提問、可以分享使用GPT-3最棒的體驗、還可以發(fā)布GPT-3輸出的帶有偏見的內(nèi)容或其它的一些問題。

OpenAI團隊積極回復(fù)每一條發(fā)布，經(jīng)常參加討論。我之前發(fā)布過幾條信息，在一、兩個小時內(nèi)就得到了回復(fù)，即便是周末消息回復(fù)的也很及時。

OpenAI團隊非常清楚，GPT-3的能力一旦被濫用會帶來嚴(yán)重后果，所以在該模型的推廣中格外小心謹(jǐn)慎。早期社交網(wǎng)絡(luò)誕生時，其口號是“快速發(fā)展，打破一切”，但現(xiàn)在的新口號似乎是“龜速發(fā)展，謹(jǐn)言慎行”。

高爾基在1896年就預(yù)測了電影未來的發(fā)展，頗有先見之明地警告電影在發(fā)展中很容易專注畫面，傳播煽動性和色情的內(nèi)容。高爾基還擔(dān)心電影會展示暴力場景，如社會賤民“被刺死在柵欄上”；第一臺打印機面世時也有相同的擔(dān)憂。

新媒體本身就帶有風(fēng)險，控制這些風(fēng)險需要一定的時間和精力。研發(fā)使用類似GPT-3模型的公司從一開始就在把控風(fēng)險，研發(fā)初期使用群體只包括小部分專業(yè)人士時，他們就為此做出了努力，這種精神令人鼓舞。

如果OpenAI及其開發(fā)者不顧風(fēng)險，敞開GPT-3的大門，開放給任何人使用，他們能掙數(shù)十億美元（并且挑戰(zhàn)谷歌這類競爭對手的廣告投放和內(nèi)容推薦引擎）。但目前，OpenAI并沒有這么做。

但未來還存在著種種問題。微軟公司9月獲得GPT-3獨家授權(quán)，此舉受到了OpenAI創(chuàng)始人之一埃隆·馬斯克（Elon Musk）的抨擊。微軟一直致力于向所有人開放GPT-3的使用，在一篇博文中提到，要想真正實現(xiàn)GPT-3的價值，“需要大量的人力精力，任何一家大型技術(shù)公司都難以承擔(dān)”。

此種技術(shù)的未來——社會對類似GPT-3模型的接受程度——很可能取決于微軟公司是否能實現(xiàn)承諾，廣泛開放GPT-3使用。

圖源：unsplash

高爾基在看過盧米埃爾兄弟的電影樣片后憂心忡忡，但同時也興奮異常。高爾基正確預(yù)言了電影的發(fā)展，指出電影最終會走出樣片觀眾的小群體，成為大眾傳媒，反應(yīng)社會上各種喜好（無論好壞）。

GPT-3及其相關(guān)科技的發(fā)展也會沿著電影發(fā)展的道路。但這些技術(shù)將如何重塑社會，又會對行業(yè)帶來怎樣的沖擊？這些問題在短期內(nèi)無法得到答案。但我可以說，正如高爾基120年前說的那樣，變化的大幕徐徐拉開。

今天，我見證了影子王國，我相信，未來是充滿光明的。

總結(jié)

以上是生活随笔為你收集整理的21世纪的“影子王国”：GPT-3，又一场科技革命的来临的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

21世纪的“影子王国”：GPT-3，又一场科技革命的来临

總結(jié)