蘋果推出300億參數多模態大模型全面轉向生成式AI

相較於英偉達、微軟等大型科技股，蘋果今年的表現令人失望不已，股價年內跌逾10%，且失去了「全球市值最高公司」的寶座。背後原因很簡單，蘋果在這場人工智慧（AI）競賽中過時了。為了擺脫窘境，蘋果近期放棄了造車項目，正在全面轉向生成式AI領域，並且很快有了新動作。

就在近日，蘋果研發團隊發布了一篇論文《MM1： Methods， Analysis & Insights from Multimodal LLM Pre-training》，首次公佈了多模態大模型MM1，展示了該公司在AI方面的進展與實力。

據悉，MM1最高參數量為300億，該模型支援增強的上下文學習和多圖像推理，在一些多模態基準測試中有較好表現。

研究人員使用這些模型進行實驗，找出影響大模型表現的關鍵因素。有趣的是，影像解析度和影像標籤數量比視覺語言連接器的影響更大，不同的預訓練資料集會顯著影響模型的有效性。

MM1的獨特之處在於其龐大的規模和架構創新，包括密集的模型和混合專家模型。這些模型證明了研究人員方法的有效性，將大規模預訓練與策略性資料選擇相結合，以增強模型的學習能力。

研發團隊稱，MM1不僅在預訓練指標中是“最先進的”，並且在一系列已建立的多模態基準測試中，經過微調後也保持了“有競爭力的”性能。

MM1可以支援增強的上下文學習和多圖像推理，使得少數樣本的思維鏈提示成為可能。

然而，目前MM1的整體表現還沒有完全超過Google的Gemini和OpenAI的GPT-4，雖然MM1可能還不是絕對的領導者，但它仍然是蘋果在AI方面的重大飛躍。

同時，蘋果也出手收購了AI新創公司DarwinAI。DarwinAI以創建更小、更快的AI系統見長，這是實現設備上高效處理的關鍵因素。收購完成後，DarwinAI的網站和社群媒體帳號已悄悄下線。

據悉，數十名DarwinAI員工已經加入了蘋果的AI部門，作為交易的一部分，滑鐵盧大學的AI研究員Alexander Wong已加入蘋果，擔任AI團隊的總監。

WONGCW 網誌