當(dāng)前位置：首頁 > 编程资源 > 综合教程 >内容正文

综合教程

ChatGPT 被起诉索赔 30 亿，「未经允许收集并泄露个人信息」，16 人匿名状告 OpenAI

發(fā)布時(shí)間：2023/12/31 综合教程 54 生活家

生活随笔收集整理的這篇文章主要介紹了 ChatGPT 被起诉索赔 30 亿，「未经允许收集并泄露个人信息」，16 人匿名状告 OpenAI 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

一天吃兩起官司，ChatGPT 現(xiàn)在有大麻煩了。

原因都和數(shù)據(jù)有關(guān)。

先是 16 人匿名起訴 OpenAI 及微軟，認(rèn)為他們在未經(jīng)允許的情況下使用并泄露了個(gè)人隱私數(shù)據(jù)，索賠金額高達(dá) 30 億美元。

緊接著，2 位全職作者提出，OpenAI 未經(jīng)允許使用了他們的小說訓(xùn)練 ChatGPT，構(gòu)成侵權(quán)。

而且兩邊的原告都表示，OpenAI 從互聯(lián)網(wǎng)上搜刮的數(shù)據(jù)可太多了，除了他們以外還有非常多人的數(shù)據(jù)正在被違規(guī)使用。

網(wǎng)上的討論很多，有人表示作家就是應(yīng)該維權(quán)，并且獲得適當(dāng)?shù)膱?bào)酬。

但也有人認(rèn)為，生成式 AI 學(xué)習(xí)互聯(lián)網(wǎng)數(shù)據(jù)就像是學(xué)生去參觀藝術(shù)作品一樣，應(yīng)該選擇開放。

現(xiàn)在這兩起訴訟都被遞交到了加利福尼亞舊金山聯(lián)邦法院。

被告方 OpenAI 暫時(shí)沒有做出公開回應(yīng)。

16 人索賠 30 億

先來看第一起訴訟。

6 月 28 日，16 位匿名人士向 OpenAI 及微軟發(fā)起訴訟，他們認(rèn)為基于 ChatGPT 的 AI 產(chǎn)品在沒有告知或獲得本人同意的情況下，收集且泄露了他們的個(gè)人信息。

這種行為違反了 AI 模型數(shù)據(jù)相關(guān)的法律政策，而且沒有付費(fèi)。

他們從互聯(lián)網(wǎng)、書籍、文章、網(wǎng)站和帖子中抓取了 3000 億個(gè)單詞，其中包括未經(jīng)允許獲取的個(gè)人信息。

這其中包含賬戶信息、姓名、聯(lián)系方式、電子郵件、支付信息、交易記錄、瀏覽器數(shù)據(jù)、社交媒體信息、聊天數(shù)據(jù)、cookie 等等。

這使得個(gè)人信息被嵌入到了他們的 AI 產(chǎn)品中，而這些信息可以反映出個(gè)人愛好、觀點(diǎn)、工作履歷甚至家庭照片等。

原告認(rèn)為 OpenAI 沒能充分將這些敏感信息進(jìn)行過濾，會(huì)導(dǎo)致數(shù)百萬人面臨信息被泄露的風(fēng)險(xiǎn)。

而且他們指控如上抓取數(shù)據(jù)的行為，OpenAI 是“秘密進(jìn)行”的，沒有按照適用法律要求的那樣注冊為數(shù)據(jù)代理商。

負(fù)責(zé)這次起訴的律師事務(wù)所 Clarkson，此前曾負(fù)責(zé)過數(shù)據(jù)泄露和虛假廣告等問題的大規(guī)模集體訴訟。

但能否勝訴目前還很不確定。

知識(shí)產(chǎn)權(quán)律師凱瑟琳?加德納（Katherine Gardner）表示，當(dāng)用戶將內(nèi)容上傳到社交平臺(tái)或者其他網(wǎng)站時(shí)，他們都會(huì)授予平臺(tái)廣泛許可，允許平臺(tái)使用他們的內(nèi)容。

因此，普通用戶想要就 AI 模型的數(shù)據(jù)獲取問題獲得賠償，具有比較高的挑戰(zhàn)性。

以及有人發(fā)現(xiàn)在這份長達(dá) 157 頁的訴訟書中，大量引用了媒體及學(xué)界在 AI 倫理道德方面的討論和警告，但是對于造成實(shí)際影響的具體案例列舉不多。

另一邊，兩位美國作家也在同一天起訴 OpenAI，認(rèn)為他們的作品被拿去訓(xùn)練 ChatGPT。

具體的證據(jù)是，ChatGPT 能為他們的書生成“非常準(zhǔn)確”的摘要，這足以說明這些書被收錄在數(shù)據(jù)庫中。

保羅?特朗布萊（Paul Tremblay）和莫娜?阿瓦德（Mona Awad）表示，ChatGPT 未經(jīng)許可就從數(shù)千本書中拷貝數(shù)據(jù)，這侵犯了作者們的版權(quán)。

起訴書中預(yù)估，OpenAI 的訓(xùn)練數(shù)據(jù)中至少包含 30 萬本書，其中很多來自侵權(quán)網(wǎng)站。

比如 OpenAI 在披露 GPT-3 訓(xùn)練數(shù)據(jù)情況時(shí)，就表示其中包含兩個(gè)互聯(lián)網(wǎng)圖書語料庫，大概占比為 15%。起訴作者認(rèn)為這些數(shù)據(jù)就是來自影子圖書館網(wǎng)站的，比如 Library Genesis、Sci-Hub 等。

以及在 2018 年，OpenAI 透露他們給 GPT-1 喂的數(shù)據(jù)中包含 7000 + 本小說。起訴方認(rèn)為這些書是研究人員從一些盜版網(wǎng)站上復(fù)制下來的，而沒有獲得作者的同意或授權(quán)。

目前 OpenAI 方面沒有進(jìn)行公開回應(yīng)。

實(shí)際上，從生成式 AI 大火以來，AI 公司吃版權(quán)、數(shù)據(jù)隱私官司，也真的不稀奇了。

OpenAI 一直深陷數(shù)據(jù)風(fēng)波

早在去年 11 月時(shí)，OpenAI 和 GitHub 一起推出的代碼助手 Copilot，就被程序員們告上了法庭。

原告?zhèn)冋J(rèn)為 Copilot 侵犯了眾多原創(chuàng)代碼作者的版權(quán)，同時(shí)還泄露了用戶隱私，因此向法院提起訴訟，索賠達(dá) 90 億美元。

但到目前為止，這個(gè)案件還沒有最終定論。

AI 畫畫那邊，Stability AI、Midjourney 等也同樣官司纏身。

因?yàn)榘l(fā)現(xiàn)只要輸入自己的名字，就能生成個(gè)人風(fēng)格的畫作，畫家凱利?麥柯南（Kelly McKernan）聯(lián)合另外兩位創(chuàng)作者一起提起訴訟。

律師團(tuán)隊(duì)和上面起訴 Copilot 的都是同一家。

以及網(wǎng)站平臺(tái)方也不愿意被白嫖數(shù)據(jù)。

這不最近馬斯克給推特限流，給出的理由就是“不想讓 AI 白嫖數(shù)據(jù)了”。目前限制措施還在實(shí)行中，還不知道之后會(huì)有怎么樣的變化。

Reddit 則表示自家平臺(tái)上的數(shù)據(jù)非常有價(jià)值，所以推出了付費(fèi) API，價(jià)格并不低，這個(gè)操作導(dǎo)致不少第三方應(yīng)用被迫關(guān)閉。

總之，AI 在網(wǎng)絡(luò)上大規(guī)模抓取數(shù)據(jù)訓(xùn)練后，帶來的隱私安全問題、版權(quán)問題層出不窮，被牽扯進(jìn)來的人也越來越多。

但目前版權(quán)問題該怎么算，業(yè)內(nèi)還沒有形成確定的規(guī)范。

只有日本方面?zhèn)鞒鲞^消息，不會(huì)對訓(xùn)練 AI 所使用的數(shù)據(jù)實(shí)施版權(quán)保護(hù)，因?yàn)檫@能加速 AI 發(fā)展。

參考鏈接：

[1]https://www.theregister.com/2023/06/28/microsoft_openai_sued_privacy/
[2]https://www.reuters.com/legal/lawsuit-says-openai-violated-us-authors-copyrights-train-ai-chatbot-2023-06-29/
[3]https://www.washingtonpost.com/technology/2023/06/28/openai-chatgpt-lawsuit-class-action/

本文來自微信公眾號(hào)：量子位（ID：QbitAI），作者：明敏

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，所有文章均包含本聲明。

總結(jié)

以上是生活随笔為你收集整理的ChatGPT 被起诉索赔 30 亿，「未经允许收集并泄露个人信息」，16 人匿名状告 OpenAI的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： superset可视化-Bar Char
下一篇： superset出现unhashable