多位作家指控ChatGPT侵犯版權OpenAI:你們誤解了版權的範圍
OpenAI本週回應了兩起幾乎相同的集體訴訟,原告包括多位作家。他們聲稱ChatGPT非法使用盜版書籍進行訓練,侵犯了他們的作品版權。OpenAI反駁稱原告誤解了版權的範圍。OpenAI在駁回動議中要求美國加州的地區法院駁回所有指控,只保留與直接侵犯版權相關的指控。
參與訴訟的作家包括莎拉·西爾弗曼(Sarah Silverman)、保羅·特倫布萊(Paul Tremblay)、莫娜·阿瓦德(Mona Awad)、克里斯·戈登(Chris Golden)和理查德·卡德雷(Richard kadrey)。
OpenAI認為,原告的其他指控,包括間接侵犯版權、違反《數字千年版權法》(DMCA)、不正當競爭、疏忽和不當得利等,應從訴訟中剔除。
OpenAI聲稱原告誤解了版權的範圍,未考慮到限制和例外情況,而這些限制和例外適當地為人工智能領域的創新留出了空間,比如現在處於人工智能前沿的大語言模型。
OpenAI表示,即使原告的書籍只是ChatGPT龐大數據集的一小部分,創新者以變革方式使用受版權保護的材料並不侵犯版權,與那些試圖通過分發受版權保護的材料直接獲利的剽竊者不同。OpenAI辯稱,它的目標是“教會其大模型推導出人類語言背後的規則”,以此來幫助人們“節省工作時間”、“讓日常生活變得更輕鬆”,或者通過在ChatGPT中輸入提示來自娛自樂。
OpenAI認為,版權法的目的是促進科學和實用藝術的進步,保護作者表達思想的方式,而不是保護思想本身、作者所表達的信息中的事實,或其他創造性的組成部分。OpenAI引用了一起涉及谷歌圖書的著名版權案件,提醒法院,統計信息如詞頻、句法模式和主題標記超出了版權保護的範疇。
OpenAI寫道:“根據由此產生的司法先例,在創作一種新的、不侵權的作品之前,’批量複製某件作品’並不構成侵權,即使新作品與原作品存在競爭關係。”
OpenAI特別希望讓法院相信,原告的間接侵犯版權指控屬於“錯誤的法律結論”。原告們認為,ChatGPT的每個輸出都是衍生作品,“無論輸出與培訓作品之間是否有任何相似之處”。
OpenAI在駁回動議中舉例說明為何ChatGPT的每一個輸出都不應視為衍生作品。該公司辯稱,與作者作品相關的ChatGPT輸出類似於圖書報告或書評。
OpenAI還反駁稱,原告未能證明OpenAI在涉嫌侵犯其作品版權方面獲得了直接經濟利益。
OpenAI聲稱原告指控自相矛盾
OpenAI還試圖駁回ChatGPT的訓練模型違反《數字千年版權法》(DMCA)的指控。
根據作者的說法,任何復制他們作品但不包括版權管理信息(CMI)(如作者姓名或出版年份)的ChatGPT輸出,都違反了版權法。原告指控OpenAI故意刪除了作品中的版權管理信息。
對此,OpenAI反駁稱,作者的投訴屬於“陳詞濫調”,並且“完全沒有給出任何合理解釋”,比如“OpenAI如何在其訓練數據中刪除作者姓名和出版年份”,“OpenAI為什麼會這樣做” ,或者“原告相信這種情況發生的基礎是什麼”。
OpenAI表示,沒有證據表明公司故意刪除了版權管理信息,原告的指控中存在許多自相矛盾的事實,包括原告的書籍被OpenAI完整復制的指控。
OpenAI指出,如果從訓練數據中刪除版權管理信息,可能是技術過程的意外副產物,類似於搜索引擎從互聯網上獲取圖像時未獲取相關版權管理信息的情況。OpenAI認為,這種偶然刪除版權管理信息的做法不應承擔責任,並不能支持OpenAI掩蓋不法行為或隱瞞侵權行為的指控。
最後,OpenAI認為,原告依據DMCA提出的指控應該被駁回。即使假設ChatGPT的每個輸出都是衍生作品,DMCA也不禁止在沒有原始作品附帶版權管理信息的情況下發布衍生作品。相反,DMCA只禁止在分發原始作品或其副本時刪除版權管理信息。
OpenAI還表示,原告對OpenAI提出的不正當競爭、疏忽和不當得利等指控也應被駁回,因為這些指控都被聯邦版權法所覆蓋。
如果OpenAI成功推翻了大部分原告的指控,法院只需決定OpenAI的訓練模型是否直接侵犯了版權法。這可能意味著,ChatGPT的訓練數據違反了法律,要么涉及復制和分發原始作品,要么在未經授權或未進行充分修改的情況下發布了衍生作品。
然而,原告們不太可能輕易放棄這場鬥爭。約瑟夫·薩維里律師事務所(Joseph Saveri Law Firm)在總結他們指控的網站上寫道,對他們來說,生成式人工智能是一個巨大的騙局,無助於人類智能的進一步發展,而是代表了人類智能的副本,已經被重新打包並與其創造者分離。