微軟入股、數值碾壓Meta AI新貴Mistral發表旗艦大模型

北京時間週一深夜，創業未滿一年已成歐洲人工智慧龍頭的Mistral AI連發數條消息——發布最新大模型Mistral Large、推出首個聊天機器人產品Le Chat，以及與微軟達成更加深入的合作協定.

Mistral AI正式成立於2023年5月。去年這個時候，創辦這家公司的三個法國年輕人還分別在GoogleDeepMind、Facebook上班。

到去年12月，隨著英偉達、賽富時以及一眾華爾街資本揮舞支票，趕緊參與公司價值超4.5億歐元（接近4.9億美元）的融資，Mistral AI的市值已然超過20億美元。

（Mistral AI的三位創辦人Guillaume Lample， Arthur Mensch， Timothée Lacroix都只有30多歲）

發布最新大模型&首個聊天機器人

Mistral AI週一宣布，正式推出最新旗艦模型Mistral Large。公司聲稱該模型具有“頂級的推理能力”，可用於處理複雜的多語言推理任務，包括文字理解、轉換和程式碼生成。

在AI理解能力測試基準MMLU的對比中，Mistral Large的得分僅次於GPT-4，略優於Anthropic開發的Claude 2。至於Google的Gemini Pro以及Meta的LLaMA 2 70B模型，則被甩開了一個身位。

（圖片來源：Mistral AI）

據悉，這個模型擁有3.2萬tokens的上下文視窗。依照一個token約等於0.75個英文單字的慣用演算法，Mistral Large能夠一次從接近2.4萬個英文單字的文檔中精確提取資訊。

該公司介紹稱，該模型對英語、法語、西班牙語、德語和義大利語具有母語級流利程度，並對文法和文化背景有細緻的理解。不過與一眾大模型一樣，實測下來中文也是能用的（後面有測試案例）。

當然，最重要的是Mistral AI的開源屬性——除了使用雲端服務部署外，還能直接下載部署到本地端。與封閉AI模型的龍頭OpenAI不同，Mistral AI的大模型可以在「抱抱臉」等程式碼平台上下載，不過目前還沒看到Large模型的文件。

（資料來源：公司官網）

該公司也在周一發布首個聊天機器人LE CHAT，可以選用剛發布的Large模型，以及對延遲、成本進行優化的Mistral Small，還有一個名為Next的下一代原型模型。總而言之，提供了一個試用的視窗。

從短暫的上手實測來看，這個模型就算使用中文，回答簡單的推理題完全沒有問題。

（圖片來源：LE CHAT）

對於美國歷史和法國歷史，這個模型也能回答。

不過在追加測試中，這個模型對中國文化歷史的了解可以說是．．．．慘不忍睹，不過Mistral本身也沒說這個模型懂中國歷史。這也是國外開源AI模型存在的通病。

（資料來源：LE CHAT、文心一言）

微軟收購公司部分股權

同樣在周一，Mistral AI與微軟宣布達成了新的合作關係。從公告來看，雙方的合作主要包含三個面向：1、微軟向Mistral AI提供開發和營運模式所需的算力；2、Mistral AI的大模型上架微軟雲端服務，供全球用戶部署；3、雙方將探索合作，為特定客戶製作特定模型。

除了提供算力和雲端服務客戶外，這份合作協議也使得微軟持有Mistral AI「一小部分股權」。

值得一提的是，Mistral這個法文單字的原意指的是“法國吹來的強風”，公司創立的願景是搞AI其實不需要那麼多錢，許多公司白白浪費了非常多的資金。創辦人兼執行長Arthur Mensch直言，公司要做AI世界裡資本效率最高的。

Mensch透露，週一發布的Large模型，整個開發成本低於2000萬歐元。作為對比，奧爾特曼去年提到GPT-4的開發成本可能超過1億美元。

對微軟而言，不管是代表封閉生態的OpenAI，或是開源社群的Mistral或Meta跑贏，公司都會是AI賽道的大贏家。這三家的AI模型都已經上架Azure的雲端服務，現在美股「股王」還持有前兩家公司的股權。

WONGCW 網誌