微軟推出數款Phi 4「開放式」人工智慧模型
微軟週三推出了幾款新的「開放式」人工智慧模型,其中功能最強大的模型至少在一個基準測試上可與OpenAI 的o3-mini 相媲美。所有新的授權模型——Phi 4 mini reasoning、Phi 4 reasoning 和Phi 4 reasoning plus——都是「推理」模型,這意味著它們能夠花更多時間對複雜問題的解決方案進行事實核查。
它們擴展了微軟一年前推出的Phi「小型模型」系列,為在邊緣建立應用程式的AI 開發者提供了基礎。
Phi 4 mini 推理機基於中國人工智慧新創公司DeepSeek 的R1 推理模型產生的約100 萬道綜合數學題進行訓練。微軟表示,Phi 4 mini 推理機的參數規模約為38 億,專為教育應用而設計,例如輕量級設備上的「嵌入式輔導」。
參數大致對應於模型解決問題的能力,具有更多參數的模型通常比具有較少參數的模型表現更好。
Phi 4 推理模型擁有140 億個參數,使用「高品質」網路資料以及OpenAI 之前提到的o3-mini 的「精選演示」進行訓練。微軟表示,它最適合數學、科學和程式應用。
至於Phi 4 Reasoning Plus是微軟先前發布的Phi-4 模型的改進版,旨在提高特定任務的準確性。微軟聲稱,Phi 4 Reasoning Plus 的效能已接近R1 模型,而R1 模型的參數數量顯著增加(6,710 億)。該公司的內部基準測試結果也顯示,Phi 4 Reasoning Plus 在數學技能測驗OmniMath 的表現與o3-mini 相當。
Phi 4 mini reasoning、Phi 4 reasoning、Phi 4 reasoning plus 已在AI 開發平台Hugging Face上線,並附有詳細的技術報告。
微軟在一篇部落格文章中寫道:「透過提煉、強化學習和高品質數據,這些新模型在規模和性能之間取得了平衡。它們足夠小,適合低延遲環境,同時又保持著可與更大模型相媲美的強大推理能力。這種融合使得即使是資源有限的設備也能高效地執行複雜的推理任務。”
