微軟入股、數值碾壓Meta AI新貴Mistral發表旗艦大模型
北京時間週一深夜,創業未滿一年已成歐洲人工智慧龍頭的Mistral AI連發數條消息——發布最新大模型Mistral Large、推出首個聊天機器人產品Le Chat,以及與微軟達成更加深入的合作協定.
Mistral AI正式成立於2023年5月。去年這個時候,創辦這家公司的三個法國年輕人還分別在GoogleDeepMind、Facebook上班。
到去年12月,隨著英偉達、賽富時以及一眾華爾街資本揮舞支票,趕緊參與公司價值超4.5億歐元(接近4.9億美元)的融資,Mistral AI的市值已然超過20億美元。
(Mistral AI的三位創辦人Guillaume Lample, Arthur Mensch, Timothée Lacroix都只有30多歲)
發布最新大模型&首個聊天機器人
Mistral AI週一宣布,正式推出最新旗艦模型Mistral Large。公司聲稱該模型具有“頂級的推理能力”,可用於處理複雜的多語言推理任務,包括文字理解、轉換和程式碼生成。
在AI理解能力測試基準MMLU的對比中,Mistral Large的得分僅次於GPT-4,略優於Anthropic開發的Claude 2。至於Google的Gemini Pro以及Meta的LLaMA 2 70B模型,則被甩開了一個身位。
(圖片來源:Mistral AI)
據悉,這個模型擁有3.2萬tokens的上下文視窗。依照一個token約等於0.75個英文單字的慣用演算法,Mistral Large能夠一次從接近2.4萬個英文單字的文檔中精確提取資訊。
該公司介紹稱,該模型對英語、法語、西班牙語、德語和義大利語具有母語級流利程度,並對文法和文化背景有細緻的理解。不過與一眾大模型一樣,實測下來中文也是能用的(後面有測試案例)。
當然,最重要的是Mistral AI的開源屬性——除了使用雲端服務部署外,還能直接下載部署到本地端。與封閉AI模型的龍頭OpenAI不同,Mistral AI的大模型可以在「抱抱臉」等程式碼平台上下載,不過目前還沒看到Large模型的文件。
(資料來源:公司官網)
該公司也在周一發布首個聊天機器人LE CHAT,可以選用剛發布的Large模型,以及對延遲、成本進行優化的Mistral Small,還有一個名為Next的下一代原型模型。總而言之,提供了一個試用的視窗。
從短暫的上手實測來看,這個模型就算使用中文,回答簡單的推理題完全沒有問題。
(圖片來源:LE CHAT)
對於美國歷史和法國歷史,這個模型也能回答。
不過在追加測試中,這個模型對中國文化歷史的了解可以說是....慘不忍睹,不過Mistral本身也沒說這個模型懂中國歷史。這也是國外開源AI模型存在的通病。
(資料來源:LE CHAT、文心一言)
微軟收購公司部分股權
同樣在周一,Mistral AI與微軟宣布達成了新的合作關係。從公告來看,雙方的合作主要包含三個面向:1、微軟向Mistral AI提供開發和營運模式所需的算力;2、Mistral AI的大模型上架微軟雲端服務,供全球用戶部署;3、雙方將探索合作,為特定客戶製作特定模型。
除了提供算力和雲端服務客戶外,這份合作協議也使得微軟持有Mistral AI「一小部分股權」。
值得一提的是,Mistral這個法文單字的原意指的是“法國吹來的強風”,公司創立的願景是搞AI其實不需要那麼多錢,許多公司白白浪費了非常多的資金。創辦人兼執行長Arthur Mensch直言,公司要做AI世界裡資本效率最高的。
Mensch透露,週一發布的Large模型,整個開發成本低於2000萬歐元。作為對比,奧爾特曼去年提到GPT-4的開發成本可能超過1億美元。
對微軟而言,不管是代表封閉生態的OpenAI,或是開源社群的Mistral或Meta跑贏,公司都會是AI賽道的大贏家。這三家的AI模型都已經上架Azure的雲端服務,現在美股「股王」還持有前兩家公司的股權。