價值15億美元的AI影片公司被指使用從YouTube採集影片製作模型
來自404 Media 的一份報告稱,基於人工智慧的影片生成軟體Jupiter 一直在使用從YouTube 和其他來源廣泛搜刮的影片資料庫來訓練其模型。 Jupiter 由Runway AI 公司經營,這是一家市值15 億美元的新創公司,獲得了Google和英偉達等業內巨頭的資金支持。
Runway AI 的共同創辦人
404 收集的資料包括一份電子表格,其中列出了全球最大的一些媒體集團和內容創作者的YouTube 頻道,以及託管盜版內容的網站和指向特定影片的連結。
一位匿名人士告訴本刊,該電子表格是”全公司”從互聯網上搜刮內容的努力的一部分,該報道是有關公司在不支付任何費用的情況下使用創作者數據進行模型訓練的一系列爭議中的最新事件。
消息來源稱,電子表格被用於向透過代理商下載影片的爬蟲提供資料。詳情顯示,所謂的電子表格包含Netflix、迪士尼、索尼、皮克斯、Vice News 和其他知名媒體的YouTube 頻道連結。它也關注內容創作者,如流行的蘋果影片部落客馬克斯-布朗利(Marques Brownlee)和生活部落格部落客凱西-尼斯塔特(Casey Neistat)。
除了電子表格,404 媒體也聯繫了一位自稱曾在《Runway》工作的消息人士。雖然此人的身份是保密的,但他們提供了公司內部如何使用電子表格來訓練影片生成人工智慧模型的關鍵細節。
據他們稱,Runway 使用電子表格為一個開源軟體提供內容,該軟體可以從YouTube 採集內容。除了頻道之外,電子表格還鏈接了特定視頻的鏈接,作為”全公司努力尋找優質視頻來構建模型”的一部分。
Runway沒有回應404的置評請求,Google則將該刊物轉到了其今年早些時候的聲明上,當時Google在4月份評論說,OpenAI的Sora視頻生成器使用YouTube視頻來訓練其模型違反了YouTube的規則。
消息來源稱,據稱Runway 還讓員工透過關鍵字篩選出視頻,這些關鍵字專注於特定類型的內容。影片也根據主題進行分類,例如動畫短片和學生影片。搜尋範圍不僅限於YouTube,經營盜版內容的網站也是目標。
Jupiter 是Runway Gen-3 模型的內部代號,404 的Gen-3 測試提示產生的內容與據稱從YouTube 搜來的影片類似。該出版物補充說,在聯繫Runway 徵求意見後,該模型停止產生這些影片。
Runway 是較受歡迎的人工智慧影片產生公司之一。其最新一輪融資是去年6 月的C 輪融資,公司估值達15 億美元。同月,它還入選了美國《時代》周刊”最具影響力的100 家公司”,該榜單上有超過12 家人工智慧公司。