OpenAI在畫餅?媒體管理器遲遲未能推出
早在2024年5月份,OpenAI 就表示正在開發一款工具,讓創作者可以指定他們希望自己的作品如何納入或排除在其AI 訓練資料中。但7 個月過去了,這項功能仍未面世。 OpenAI 當時表示,該工具名為媒體管理器(Media Manager),可以“識別受版權保護的文字、圖像、音訊和視訊”,以反映創作者“跨多個來源”的偏好。它旨在避開公司一些最激烈的批評者,並可能保護OpenAI 免受與智慧財產權相關的法律挑戰。
但知情人士透露,該工具在內部很少被視為重要發布。 「我不認為這是優先事項,」一位前OpenAI 員工說。 “說實話,我不記得有人在開發它。”
一位負責協調公司工作的非員工去年12 月透露,他們過去曾與OpenAI 討論過這款工具,但最近沒有任何進展。
而OpenAI 法律團隊中一位曾擔任媒體經理的Fred von Lohmann 則於10 月轉任兼職顧問。
OpenAI 尚未公佈媒體管理器的進展情況,該公司錯過了自己設定的「2025 年之前」推出該工具的最後期限。
智慧財產權問題
OpenAI等人工智慧模型會學習資料集中的模式。 ChatGPT可以寫出令人信服的電子郵件和文章,而OpenAI 的影片產生器Sora可以製作相對逼真的鏡頭。
能夠借鏡寫作、電影等範例創作新作品,讓人工智慧變得異常強大。但它也有反芻性。以某種方式提示時,模型(其中大多數是在無數網頁、視訊和圖像上進行訓練的)會產生這些資料的近似副本,儘管這些資料是“公開的”,但並不適合以這種方式使用。
這自然會讓那些作品未經許可就被納入人工智慧訓練的創作者感到不安。許多人已經聘請了律師。
OpenAI 正在應對藝術家、作家、 YouTube 用戶、電腦科學家和新聞機構提起的集體訴訟,所有這些人都聲稱這家新創公司非法訓練他們的作品。原告包括作家Sarah Silverman 和Ta Nehisi-Coates、視覺藝術家以及《紐約時報》和加拿大廣播公司等媒體集團。
OpenAI 已與精選合作夥伴達成授權協議,但並非所有創造者都認為這些條款具有吸引力。
媒體管理器
OpenAI 為創作者提供了幾種「退出」其AI 訓練的臨時方式。去年9 月,該公司推出了一個提交表單,允許藝術家標記他們的作品,以便從其未來的訓練集中刪除。而且OpenAI 長期以來一直允許網站管理員阻止其網路爬蟲程式在其網域中抓取資料。
但創作者批評這些方法雜亂無章,不夠充分。對於書面作品、錄影或錄音,沒有具體的退出機制。而對於圖像的退出表格則要求提交每張要刪除的圖像的副本以及說明,這是一個繁瑣的過程。
今天,媒體管理器被宣傳為OpenAI 退出解決方案的徹底改進和擴展。
OpenAI 在5 月的公告中表示,媒體管理器將使用“尖端機器學習研究”,使創作者和內容所有者能夠“告訴[OpenAI] 他們擁有什麼”。 OpenAI 聲稱在開發該工具時正在與監管機構合作,並表示希望媒體管理器能夠「為整個AI 行業樹立標準」。
從那以後,OpenAI 再也沒有公開提及媒體管理器。
清算
在沒有媒體管理器的情況下,OpenAI 實作了過濾器(儘管並不完善),以防止其模型重複訓練範例。在它所面臨的訴訟中,該公司繼續聲稱享有合理使用保護,聲稱其模型創造的是變革性作品,而不是抄襲作品。
OpenAI 很有可能在版權糾紛中獲勝。
法院可能會判定該公司的人工智慧具有“變革性目的”,這是大約十年前出版業起訴谷歌的先例。在那起案件中,法院裁定谷歌複製數百萬本圖書用於谷歌圖書(一種數位檔案)是允許的。
OpenAI 曾公開表示,如果不使用受版權保護的資料(無論是否授權),訓練具有競爭力的人工智慧模式是「不可能的」。該公司在1 月提交給英國上議院的文件中寫道:「將訓練資料限制在一個多世紀前創作的公共領域書籍和圖畫上可能會產生一個有趣的實驗,但不會提供滿足當今公民需求的人工智慧系統。
如果法院最終宣布OpenAI 勝訴,那麼媒體管理器就沒有什麼法律意義了。 OpenAI 似乎願意下這個賭注——或者重新考慮其退出策略。