一些視覺(jué)藝術(shù)家已經(jīng)就使用他們的圖像作為文本到圖像生成器的訓(xùn)練數(shù)據(jù)提起訴訟。現(xiàn)在,兩位知名小說(shuō)家對(duì)OpenAI提起了他們自己的集體訴訟,指控ChatGPT和Bing Chat背后的公司侵犯了版權(quán),因?yàn)樵摴旧嫦邮褂盟麄兊臅?shū)作為訓(xùn)練數(shù)據(jù)。這似乎是第一個(gè)因使用文本(而不是圖像或代碼)作為訓(xùn)練數(shù)據(jù)而提起的訴訟。
(相關(guān)資料圖)
七彩虹(Colorful)iGame GeForce RTX 4060 Ultra W DUO 8GB DLSS 3 電競(jìng)光追游戲設(shè)計(jì)電腦顯卡
進(jìn)入購(gòu)買(mǎi)
在加州北區(qū)美國(guó)地方法院提起的訴訟中,原告Paul Tremblay和Mona Awad指控OpenAI及其子公司侵犯了版權(quán),違反了《數(shù)字千年版權(quán)法》,還觸犯了加州和普通法對(duì)不公平競(jìng)爭(zhēng)的限制。這兩位作家由Joseph Saveri律師事務(wù)所和Matthew Butterick代理,他們也是最近對(duì)Diffusion AI和GitHub(關(guān)于GitHub copilot)提起訴訟的團(tuán)隊(duì)。
投訴稱(chēng),特倫布萊的小說(shuō)《世界盡頭的小屋》和阿瓦德的兩部小說(shuō):《看待胖女孩的13種方式》和《兔子》被用作GPT-3.5和GPT-4的訓(xùn)練數(shù)據(jù)。雖然OpenAI沒(méi)有披露這些受版權(quán)保護(hù)的小說(shuō)在其訓(xùn)練數(shù)據(jù)中(這是保密的),但原告得出結(jié)論,它們一定是,因?yàn)镃hatGPT能夠提供詳細(xì)的情節(jié)摘要并回答關(guān)于這些書(shū)的問(wèn)題,這一壯舉需要它能夠獲得完整的文本。
"由于OpenAI語(yǔ)言模型在沒(méi)有從原告(和其他人)的作品中提取并保留在其中的表達(dá)信息的情況下無(wú)法運(yùn)作,因此OpenAI語(yǔ)言模型本身就是侵權(quán)的衍生作品,未經(jīng)原告許可而制作,侵犯了原告在《版權(quán)法》下的專(zhuān)屬權(quán)利,"申訴說(shuō)。
這三本書(shū)還帶有版權(quán)管理信息(CMI),如ISBN和版權(quán)登記號(hào)。數(shù)字千年版權(quán)法》(DMCA)規(guī)定,刪除或偽造CMI是非法的,由于ChatGPT的輸出不包含這些信息,原告指控OpenAI在常規(guī)版權(quán)侵權(quán)的基礎(chǔ)上還違反了DMCA。
雖然該訴訟目前只有兩名原告,但律師們正在尋求集體訴訟地位,這將使其他被OpenAI使用過(guò)版權(quán)作品的作者也能獲得賠償。律師們正在尋求貨幣賠償、法庭費(fèi)用和強(qiáng)制令,以迫使OpenAI改變其軟件和圍繞版權(quán)材料的商業(yè)行為。
我們向Butterick征求對(duì)該訴訟的意見(jiàn),他向我們介紹了他的網(wǎng)站--LLM訴訟,該網(wǎng)站對(duì)原告的立場(chǎng)和他們起訴的原因有詳細(xì)的解釋。
"我們對(duì)OpenAI提起集體訴訟,質(zhì)疑ChatGPT及其底層的大型語(yǔ)言模型GPT-3.5和GPT-4,它們?cè)跊](méi)有同意、補(bǔ)償或信用的情況下,重新混合了數(shù)千名圖書(shū)作者和許多其他作者的版權(quán)作品,"律師們寫(xiě)道。
他們還批評(píng)了生成性人工智能的概念,寫(xiě)道:""生成性人工智能"只是人類(lèi)智能,經(jīng)過(guò)重新包裝,脫離了其創(chuàng)造者"。
就像Saveri和Butterick對(duì)穩(wěn)定性人工智能使用受版權(quán)保護(hù)的圖像作為訓(xùn)練數(shù)據(jù)的訴訟一樣,這起訴訟的關(guān)鍵是相信從開(kāi)放的互聯(lián)網(wǎng)上抓取文本來(lái)為法律碩士提供動(dòng)力是不公平的使用。這是一個(gè)尚未在法庭上得到答案的問(wèn)題。
七彩虹(Colorful)iGame GeForce RTX 4060 Ultra W DUO 8GB DLSS 3 電競(jìng)光追游戲設(shè)計(jì)電腦顯卡
進(jìn)入購(gòu)買(mǎi)
在2006年的一個(gè)案件中,Blake vs Google,一位作家起訴搜索引擎緩存了他的作品并通過(guò)搜索提供緩存版本。然而,美國(guó)地區(qū)法院駁回了該訴訟,認(rèn)為谷歌對(duì)數(shù)據(jù)的緩存是合理使用。Robert C. Jones法官寫(xiě)道,將文件保存在緩存中是一種轉(zhuǎn)換性使用(用于確定合理使用的四個(gè)因素之一),而且它不會(huì)損害作品的潛在市場(chǎng)(另一個(gè)因素)。因此,僅僅是在其服務(wù)器上以緩存的形式存儲(chǔ)受版權(quán)保護(hù)的數(shù)據(jù)并不能使谷歌承擔(dān)責(zé)任。
然而,使用受版權(quán)保護(hù)的創(chuàng)意作品作為訓(xùn)練數(shù)據(jù),與為搜索編制索引的內(nèi)容有相當(dāng)大的不同。人們可以說(shuō),如果法律碩士能夠重復(fù)書(shū)中的關(guān)鍵細(xì)節(jié),那就是損害了這些作品的市場(chǎng),它不是真正的轉(zhuǎn)化。另一方面,如果一個(gè)人寫(xiě)了一本書(shū)的情節(jié)摘要,這一般不會(huì)觸犯版權(quán)法。最終,這些問(wèn)題將因?yàn)橄襁@樣的訴訟案而得到?jīng)Q定。
OpenAI并不是唯一一家使用受版權(quán)保護(hù)的材料進(jìn)行培訓(xùn)甚至輸出的公司。谷歌SGE,該公司的新搜索體驗(yàn),經(jīng)常一字不差地剽竊整個(gè)句子和段落的版權(quán)。
關(guān)鍵詞: