蘋果推出300億參數多模態大模型全面轉向生成式AI
相較於英偉達、微軟等大型科技股,蘋果今年的表現令人失望不已,股價年內跌逾10%,且失去了「全球市值最高公司」的寶座。背後原因很簡單,蘋果在這場人工智慧(AI)競賽中過時了。為了擺脫窘境,蘋果近期放棄了造車項目,正在全面轉向生成式AI領域,並且很快有了新動作。
就在近日,蘋果研發團隊發布了一篇論文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》,首次公佈了多模態大模型MM1,展示了該公司在AI方面的進展與實力。
據悉,MM1最高參數量為300億,該模型支援增強的上下文學習和多圖像推理,在一些多模態基準測試中有較好表現。
研究人員使用這些模型進行實驗,找出影響大模型表現的關鍵因素。有趣的是,影像解析度和影像標籤數量比視覺語言連接器的影響更大,不同的預訓練資料集會顯著影響模型的有效性。
MM1的獨特之處在於其龐大的規模和架構創新,包括密集的模型和混合專家模型。這些模型證明了研究人員方法的有效性,將大規模預訓練與策略性資料選擇相結合,以增強模型的學習能力。
研發團隊稱,MM1不僅在預訓練指標中是“最先進的”,並且在一系列已建立的多模態基準測試中,經過微調後也保持了“有競爭力的”性能。
MM1可以支援增強的上下文學習和多圖像推理,使得少數樣本的思維鏈提示成為可能。
然而,目前MM1的整體表現還沒有完全超過Google的Gemini和OpenAI的GPT-4,雖然MM1可能還不是絕對的領導者,但它仍然是蘋果在AI方面的重大飛躍。
同時,蘋果也出手收購了AI新創公司DarwinAI。DarwinAI以創建更小、更快的AI系統見長,這是實現設備上高效處理的關鍵因素。收購完成後,DarwinAI的網站和社群媒體帳號已悄悄下線。
據悉,數十名DarwinAI員工已經加入了蘋果的AI部門,作為交易的一部分,滑鐵盧大學的AI研究員Alexander Wong已加入蘋果,擔任AI團隊的總監。