微軟:Phi-2模型效能優於競爭對手 可在裝置上運行
微軟週二表示,其人工智慧模型Phi-2的效能優於Meta(MTEA.US)等其他公司的競爭產品,並且能夠在設備上運作。微軟在一篇部落格中表示:「Phi-2模型僅有27億個參數,但在各種綜合基準測試中,它的表現超過了歐洲AI新創公司Mistral旗下擁有70億個參數的大語言模型( LLM)Mistral 7B、以及Meta發布的參數達130億個的AI模型Llama 2。 」
「值得注意的是,Phi-2模型在多步驟推理任務(即編碼和數學)上的表現優於參數達700億的Llama 2(Llama 2模型系列包含70億、130億和700億三種參數變體)。”
微軟補充說:「此外,Phi-2模型的性能與最近發布的GoogleGemini Nano 2相當、甚至更好,儘管模型規模較小。」微軟表示,Phi-2模型將在Azure Studio中推出。
據悉,微軟今年6月發表只有13 億參數的Phi-1模型,適用於QA問答、聊天格式和程式碼等等場景。該模型完全基於高品質資料進行訓練,在基準測試中的表現比同類模型高出10倍。
微軟今年9 月更新發布了Phi-1.5版本,同樣為13億參數,可以寫詩、寫電子郵件和故事,以及總結文字。在常識、語言理解和推理的基準測試中,該模型在某些領域能夠跟上多達100億個參數的模型。
微軟在11月更新發布的Phi-2規模雖然比之前版本翻番,但相比較其它主流語言模型依然小很多。微軟表示,Phi-2在邏輯推理和安全性方面顯示出顯著的改進,透過正確的微調和定制,小型語言模型是雲端和邊緣應用程式的強大工具。