Mistral 宣布Large 2 旗艦LLM 已擁有1230 億個參數
法國新創公司Mistral AI 今天宣布推出Large 2,這是其新的旗艦機型,在程式碼生成、數學和推理方面的能力大大增強。 Mistral 在Large 2 中也增加了更好的多語言支援和進階函數呼叫功能。
Mistral Large 2 型號有1230 億個參數,可在單一H100 節點上以高吞吐量運作。它支援法語、德語、西班牙語、義大利語、葡萄牙語、阿拉伯語、印地語、俄語、中文、日語和韓語。在編碼方面,它支援80 多種編碼語言,包括Python、Java、C、C++、JavaScript 和Bash。
Mistral Large 2 現已開放權重,但只能免費用於研究和非商業用途。商業用途需取得模型許可。
在程式設計基準測試中,Mistral Large 2 (123B) 的效能可與OpenAI 的GPT-4o、Claude Opus 3 和最近發布的Meta 的Llama 3.1 405B相媲美。在Wild Bench、Arena Hard 和MT Bench 基準測試中,Large 2 的表現優於Llama 3.1 405B 和Claude 3 Opus。在流行的MMLU 基準測試中,這款新型號的表現優於Llama 3.1 70B,與Llama 3.1 405B 不相上下。
對於開發人員來說,Mistral Large 2 現在具有改進的函數呼叫和檢索技能。現在它可以執行並行和順序函數調用,使開發人員能夠建立複雜的商業人工智慧應用。
隨著Large 2 的發布,Mistral 正在整合其模型組合。它將擁有兩個通用機型Mistral Nemo 和Mistral Large,以及兩個專業機型Codestral 和Embed。未來,Mistral 將停產Apache 型號(Mistral 7B、Mistral 8x7B 和8x22B、Codestral Mamba、Mathstral)。
微軟和Mistral 已經建立了合作關係,在Azure 上提供Mistral 模型。今天,Mistral 將其合作夥伴關係擴展到Google,在Google雲端上提供Mistral 模型。
Mistral Large 2 和Llama 3.1 的連續發布標誌著開放人工智慧生態系統的一個重要里程碑,為研究和開發提供了兩個強大的GPT-4 級模型。這一突飛猛進的進展推動了人工智慧朝向更開放和協作的方向發展。
了解更多: