ChatGPT 被起诉索赔 30 亿,「未经允许收集并泄露个人信息」,16 人匿名状告 OpenAI
一天吃兩起官司,ChatGPT 現(xiàn)在有大麻煩了。
原因都和數(shù)據(jù)有關(guān)。
先是 16 人匿名起訴 OpenAI 及微軟,認(rèn)為他們在未經(jīng)允許的情況下使用并泄露了個(gè)人隱私數(shù)據(jù),索賠金額高達(dá) 30 億美元。
緊接著,2 位全職作者提出,OpenAI 未經(jīng)允許使用了他們的小說訓(xùn)練 ChatGPT,構(gòu)成侵權(quán)。
而且兩邊的原告都表示,OpenAI 從互聯(lián)網(wǎng)上搜刮的數(shù)據(jù)可太多了,除了他們以外還有非常多人的數(shù)據(jù)正在被違規(guī)使用。
網(wǎng)上的討論很多,有人表示作家就是應(yīng)該維權(quán),并且獲得適當(dāng)?shù)膱?bào)酬。
但也有人認(rèn)為,生成式 AI 學(xué)習(xí)互聯(lián)網(wǎng)數(shù)據(jù)就像是學(xué)生去參觀藝術(shù)作品一樣,應(yīng)該選擇開放。
現(xiàn)在這兩起訴訟都被遞交到了加利福尼亞舊金山聯(lián)邦法院。
被告方 OpenAI 暫時(shí)沒有做出公開回應(yīng)。
16 人索賠 30 億
先來看第一起訴訟。
6 月 28 日,16 位匿名人士向 OpenAI 及微軟發(fā)起訴訟,他們認(rèn)為基于 ChatGPT 的 AI 產(chǎn)品在沒有告知或獲得本人同意的情況下,收集且泄露了他們的個(gè)人信息。
這種行為違反了 AI 模型數(shù)據(jù)相關(guān)的法律政策,而且沒有付費(fèi)。
他們從互聯(lián)網(wǎng)、書籍、文章、網(wǎng)站和帖子中抓取了 3000 億個(gè)單詞,其中包括未經(jīng)允許獲取的個(gè)人信息。
這其中包含賬戶信息、姓名、聯(lián)系方式、電子郵件、支付信息、交易記錄、瀏覽器數(shù)據(jù)、社交媒體信息、聊天數(shù)據(jù)、cookie 等等。
這使得個(gè)人信息被嵌入到了他們的 AI 產(chǎn)品中,而這些信息可以反映出個(gè)人愛好、觀點(diǎn)、工作履歷甚至家庭照片等。
原告認(rèn)為 OpenAI 沒能充分將這些敏感信息進(jìn)行過濾,會(huì)導(dǎo)致數(shù)百萬人面臨信息被泄露的風(fēng)險(xiǎn)。
而且他們指控如上抓取數(shù)據(jù)的行為,OpenAI 是“秘密進(jìn)行”的,沒有按照適用法律要求的那樣注冊為數(shù)據(jù)代理商。
負(fù)責(zé)這次起訴的律師事務(wù)所 Clarkson,此前曾負(fù)責(zé)過數(shù)據(jù)泄露和虛假廣告等問題的大規(guī)模集體訴訟。
但能否勝訴目前還很不確定。
知識(shí)產(chǎn)權(quán)律師凱瑟琳?加德納(Katherine Gardner)表示,當(dāng)用戶將內(nèi)容上傳到社交平臺(tái)或者其他網(wǎng)站時(shí),他們都會(huì)授予平臺(tái)廣泛許可,允許平臺(tái)使用他們的內(nèi)容。
因此,普通用戶想要就 AI 模型的數(shù)據(jù)獲取問題獲得賠償,具有比較高的挑戰(zhàn)性。
以及有人發(fā)現(xiàn)在這份長達(dá) 157 頁的訴訟書中,大量引用了媒體及學(xué)界在 AI 倫理道德方面的討論和警告,但是對于造成實(shí)際影響的具體案例列舉不多。
另一邊,兩位美國作家也在同一天起訴 OpenAI,認(rèn)為他們的作品被拿去訓(xùn)練 ChatGPT。
具體的證據(jù)是,ChatGPT 能為他們的書生成“非常準(zhǔn)確”的摘要,這足以說明這些書被收錄在數(shù)據(jù)庫中。
保羅?特朗布萊(Paul Tremblay)和莫娜?阿瓦德(Mona Awad)表示,ChatGPT 未經(jīng)許可就從數(shù)千本書中拷貝數(shù)據(jù),這侵犯了作者們的版權(quán)。
起訴書中預(yù)估,OpenAI 的訓(xùn)練數(shù)據(jù)中至少包含 30 萬本書,其中很多來自侵權(quán)網(wǎng)站。
比如 OpenAI 在披露 GPT-3 訓(xùn)練數(shù)據(jù)情況時(shí),就表示其中包含兩個(gè)互聯(lián)網(wǎng)圖書語料庫,大概占比為 15%。起訴作者認(rèn)為這些數(shù)據(jù)就是來自影子圖書館網(wǎng)站的,比如 Library Genesis、Sci-Hub 等。
以及在 2018 年,OpenAI 透露他們給 GPT-1 喂的數(shù)據(jù)中包含 7000 + 本小說。起訴方認(rèn)為這些書是研究人員從一些盜版網(wǎng)站上復(fù)制下來的,而沒有獲得作者的同意或授權(quán)。
目前 OpenAI 方面沒有進(jìn)行公開回應(yīng)。
實(shí)際上,從生成式 AI 大火以來,AI 公司吃版權(quán)、數(shù)據(jù)隱私官司,也真的不稀奇了。
OpenAI 一直深陷數(shù)據(jù)風(fēng)波
早在去年 11 月時(shí),OpenAI 和 GitHub 一起推出的代碼助手 Copilot,就被程序員們告上了法庭。
原告?zhèn)冋J(rèn)為 Copilot 侵犯了眾多原創(chuàng)代碼作者的版權(quán),同時(shí)還泄露了用戶隱私,因此向法院提起訴訟,索賠達(dá) 90 億美元。
但到目前為止,這個(gè)案件還沒有最終定論。
AI 畫畫那邊,Stability AI、Midjourney 等也同樣官司纏身。
因?yàn)榘l(fā)現(xiàn)只要輸入自己的名字,就能生成個(gè)人風(fēng)格的畫作,畫家凱利?麥柯南(Kelly McKernan)聯(lián)合另外兩位創(chuàng)作者一起提起訴訟。
律師團(tuán)隊(duì)和上面起訴 Copilot 的都是同一家。
以及網(wǎng)站平臺(tái)方也不愿意被白嫖數(shù)據(jù)。
這不最近馬斯克給推特限流,給出的理由就是“不想讓 AI 白嫖數(shù)據(jù)了”。目前限制措施還在實(shí)行中,還不知道之后會(huì)有怎么樣的變化。
Reddit 則表示自家平臺(tái)上的數(shù)據(jù)非常有價(jià)值,所以推出了付費(fèi) API,價(jià)格并不低,這個(gè)操作導(dǎo)致不少第三方應(yīng)用被迫關(guān)閉。
總之,AI 在網(wǎng)絡(luò)上大規(guī)模抓取數(shù)據(jù)訓(xùn)練后,帶來的隱私安全問題、版權(quán)問題層出不窮,被牽扯進(jìn)來的人也越來越多。
但目前版權(quán)問題該怎么算,業(yè)內(nèi)還沒有形成確定的規(guī)范。
只有日本方面?zhèn)鞒鲞^消息,不會(huì)對訓(xùn)練 AI 所使用的數(shù)據(jù)實(shí)施版權(quán)保護(hù),因?yàn)檫@能加速 AI 發(fā)展。
參考鏈接:
-
[1]https://www.theregister.com/2023/06/28/microsoft_openai_sued_privacy/
-
[2]https://www.reuters.com/legal/lawsuit-says-openai-violated-us-authors-copyrights-train-ai-chatbot-2023-06-29/
-
[3]https://www.washingtonpost.com/technology/2023/06/28/openai-chatgpt-lawsuit-class-action/
本文來自微信公眾號(hào):量子位 (ID:QbitAI),作者:明敏
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,所有文章均包含本聲明。
總結(jié)
以上是生活随笔為你收集整理的ChatGPT 被起诉索赔 30 亿,「未经允许收集并泄露个人信息」,16 人匿名状告 OpenAI的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: superset可视化-Bar Char
- 下一篇: superset出现unhashable