Google最新的Gemini模型在AI聊天機器人競技場中奪回頭名
OpenAI 與Google之間的競爭日趨白熱化。 這兩家公司的大型語言模式正輪流登上人工智慧基準榜首。在較權威的Chatbot Arena 排行榜上,ChatGPT-4o (20241120) 於11 月21 日超越11 月15 日發布的Gemini-EXP-1114 模型,成為排名第一的模型。 Google 今天宣布發布Gemini-EXP-1206 實驗機型,該機型在聊天機器人競技場中再次反超了ChatGPT-4o (20241120)。
Gemini-Exp-1206 是整體表現排名第一的模型,在編碼類別中與OpenAI 的o1 並列第一。 Gemini-EXP-1206 現在在以下類別中排名第一:
- 整體風格控制
- 硬提示
- 帶樣式控制的硬提示
- 編碼
- 數學
- 創意寫作
- 指導跟蹤
- 長查詢
- 多輪對話
現在,Gemini-exp-1206 模型可在Google AI Studio 和開發人員導向的Gemini API 中使用。
與此相關的是,Meta 今天發布了Llama 3.3 70B 開源模型,該模型可為基於文字的使用案例提供一流的效能。 Meta 聲稱,與其他同類閉源模型相比,Llama 3.3 70B 的推理成本非常低。
Meta 聲稱,Llama 3.3 的改進主要歸功於新的配準流程和線上RL 技術的進步。 值得注意的是,這個新的70B 模型的性能與Llama 3.1 405B 相似,但它甚至可以在普通開發人員工作站上本地運行。
Hugging Face提供了這款全新的Llama 3.3 70B 型號。 不久,它將可透過Azure 和其他領先的雲端平台進行部署。 有了像Llama 3.3 這樣強大、價格低廉的開源模型,人工智慧開發的未來將充滿希望,並向更廣泛的開發者社群開放。