兩位作家起訴OpenAI 稱ChatGPT侵犯版權
近日,兩位美國作家對ChatGPT母公司OpenAI提起訴訟,聲稱OpenAI在沒有獲得版權授權的情況下,就利用他們的作品來訓練其人工智能。起訴書中提到,美國馬薩諸塞州作家保羅·特倫布萊和莫娜·阿瓦德表示,ChatGPT未經他們同意,直接複製了書籍的數據來進行訓練,這侵犯了作者的版權。
特倫布萊的作品有《世界盡頭的小屋》,阿瓦德的代表作為《看待胖女孩的13種方式》和《兔子》。
這兩位作家稱,ChatGPT寫出的書籍簡要,和他們發表的文章一模一樣,這說明訓練ChatGPT的數據庫,是包含了他們的作品的。
聊天機器人是在大量的文本數據上進行訓練的,OpenAI沒有透露訓練ChatGPT具體使用了哪些數據,但該公司表示,它通常會抓取網絡數據,包括使用檔案圖書和維基百科等。
書籍是訓練人工智能的理想選擇,因為它們往往包含“高質量、精心編輯的長篇文章”,儲存了人類思想的精華。
根據起訴書顯示,OpenAI的訓練數據超過30萬本書,其中包括本就備受爭議、版權歸屬不明晰的“影子圖書館”。
但要證明ChatGPT是如何以及在哪裡收集到這些信息的,以及這些作者是否遭受了經濟損失,可能是一個挑戰。因為ChatGPT也利用了大量的互聯網信息進行訓練,包括互聯網用戶對這些書的討論。
該訴訟代表美國全國范圍內的版權所有者,尋求一筆數額不詳的賠償金。目前,OpenAI的代表沒有對此事進行回應。
薩塞克斯大學知識產權法專業的ndres Guadamuz表示,這是針對ChatGPT的第一起涉及版權的訴訟。他補充說,這起訴訟將探討生成式人工智能領域“合法性邊界”的問題。
而就在幾天之前,OpenAI在加利福尼亞州同樣被多方提起集體訴訟,起訴書稱OpenAI在未經允許的前提下,在互聯網上竊取和挪用了大量私人數據來訓練ChatGPT。