版權問題如何解決?OpenAI被控非法使用圖書數據訓練AI系統
兩名作者在美國舊金山聯邦法院起訴OpenAI,他們認為OpenAI濫用其作品,用作品訓練ChatGPT。來自美國馬薩諸塞州的作家Paul Tremblay和Mona Awad說,ChatGPT未經許可從大量圖書中復制提取數據,侵犯了作者的版權。
訓練先進的AI系統需要用到大量數據材料,這種使用方式在法律上面臨諸多挑戰。比如,源代碼所有者將矛頭指向OpenAI和微軟旗下GitHub,視覺藝術家起訴Stability AI、Midjourney和DeviantArt等AI工具。被告則認為,系統合理使用了有著作權的作品。
當用戶向ChatGPT給出提示語時,AI會快速回應,雖然這種回應充滿爭議。ChatGPT僅僅開放兩個月,1月時活躍用戶便達到了1億。
ChatGPT及其它生成式AI系統會用海量數據創造內容,很多數據來自互聯網。作家Paul Tremblay和Mona Awad認為書本是關鍵數據材料,因為它們是高質量長文寫作的典範。
訴狀估計,OpenAI的訓練數據包含了至少30萬本圖書,當中有許多是沒有獲得許可、非法獲取的有版權圖書。
兩名原告稱ChatGPT可以對他們寫的書作出非常精準的總結,也就是說他們的書被吸納進數據庫。