Mistral 宣布Large 2 旗艦LLM 已擁有1230 億個參數

2024-07-25 Comments 0 Comment

法國新創公司Mistral AI 今天宣布推出Large 2，這是其新的旗艦機型，在程式碼生成、數學和推理方面的能力大大增強。 Mistral 在Large 2 中也增加了更好的多語言支援和進階函數呼叫功能。

Mistral Large 2 型號有1230 億個參數，可在單一H100 節點上以高吞吐量運作。它支援法語、德語、西班牙語、義大利語、葡萄牙語、阿拉伯語、印地語、俄語、中文、日語和韓語。在編碼方面，它支援80 多種編碼語言，包括Python、Java、C、C++、JavaScript 和Bash。

Mistral Large 2 現已開放權重，但只能免費用於研究和非商業用途。商業用途需取得模型許可。

在程式設計基準測試中，Mistral Large 2 (123B) 的效能可與OpenAI 的GPT-4o、Claude Opus 3 和最近發布的Meta 的Llama 3.1 405B相媲美。在Wild Bench、Arena Hard 和MT Bench 基準測試中，Large 2 的表現優於Llama 3.1 405B 和Claude 3 Opus。在流行的MMLU 基準測試中，這款新型號的表現優於Llama 3.1 70B，與Llama 3.1 405B 不相上下。

對於開發人員來說，Mistral Large 2 現在具有改進的函數呼叫和檢索技能。現在它可以執行並行和順序函數調用，使開發人員能夠建立複雜的商業人工智慧應用。

隨著Large 2 的發布，Mistral 正在整合其模型組合。它將擁有兩個通用機型Mistral Nemo 和Mistral Large，以及兩個專業機型Codestral 和Embed。未來，Mistral 將停產Apache 型號（Mistral 7B、Mistral 8x7B 和8x22B、Codestral Mamba、Mathstral）。

微軟和Mistral 已經建立了合作關係，在Azure 上提供Mistral 模型。今天，Mistral 將其合作夥伴關係擴展到Google，在Google雲端上提供Mistral 模型。

Mistral Large 2 和Llama 3.1 的連續發布標誌著開放人工智慧生態系統的一個重要里程碑，為研究和開發提供了兩個強大的GPT-4 級模型。這一突飛猛進的進展推動了人工智慧朝向更開放和協作的方向發展。

了解更多：

https://mistral.ai/news/mistral-large-2407

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

WONGCW 網誌

記錄生活經驗與點滴

Mistral 宣布Large 2 旗艦LLM 已擁有1230 億個參數

2024-07-25 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆