蘋果稱其OpenELM模型不支援YouTube採集爭議中的Apple Intelligence
本週早些時候,一項調查詳細指出,蘋果和其他科技巨頭曾使用YouTube 字幕來訓練他們的人工智慧模型。其中包括來自MKBHD、MrBeast等的17 萬多個影片。然後,蘋果公司使用這個資料集來訓練其開源的OpenELM 模型,這些模型早在四月就已經發布了。
不過,蘋果現在已證實,OpenELM 並不支援其任何人工智慧或機器學習功能,包括Apple Intelligence。
蘋果表示,它創建OpenELM 模型的目的是為研究社群做出貢獻,並推動開源大型語言模型的開發。過去,蘋果公司的研究人員曾將OpenELM 描述為”最先進的開放式語言模型”。據蘋果公司稱,OpenELM 僅用於研究目的,而非用於支援其任何Apple Intelligence功能。該模型以開源方式發布,可廣泛獲取,包括在蘋果的機器學習研究網站上。
由於OpenELM 並未作為Apple Intelligence 的一部分使用,這意味著”YouTube 字幕”資料集並未被用於Apple Intelligence 的訓練工作。過去,蘋果曾表示,Apple Intelligence模型是”在授權資料(包括為增強特定功能而選擇的資料)以及我們的網路爬蟲收集的公開資料”上訓練出來的。
最後,蘋果也表示,它沒有計劃建立任何新版本的OpenELM 模型。
正如《連線》本週稍早報道的那樣,包括蘋果、Anthropic 和英偉達在內的公司都使用了這個”YouTube 字幕”資料集來訓練它們的人工智慧模型。這個資料集是非營利組織EleutherAI 的一個名為”The Pile”的大型資料集的一部分。