OpenAI的新AI機器人gpt-4o-latest在LMSYS跑分中重新奪回第一名
上週,OpenAI 發布了其最新的前沿模型,正式命名為gpt-4o-2024-08-06,該新模型在API中支援結構化輸出。昨天,OpenAI出人意料地宣布了另一個名為chatgpt-4o-latest的新前沿模型。雖然OpenAI仍建議開發人員將gpt-4o-2024-08-06用於大多數API使用,但chatgpt-4o-latest模型將允許開發人員測試OpenAI在聊天用例方面的最新改進。
根據OpenAI的官方文件頁面,chatgpt-4o-latest將是一個動態模型,將不斷更新到ChatGPT中GPT-4o的最新版本。新的chatgpt-4o-latest模型支援128000個標記和16384個輸出標記的上下文。該模型僅用於研究和評估。
上週,Google在LMSYS聊天機器人跑分系統中上架了一款新的實驗性Gemini 1.5 Pro模型,以1297分的成績奪得第一名。這是自聊天機器人競技場發布以來,Google首次登頂。憑藉最新的聊天gpt-4o模型,OpenAI以1314分的創紀錄成績重新奪回競技場第一的位置。根據得分,新的ChatGPT-4o在編程、指令執行和硬提示方面都有顯著提升。
LMSYS聊天機器人競技場中新的ChatGPT-4o類別排名:
綜合:第一名
數學:第1-2名
編程:第一名
硬提示:第一名
指令遵循:第一名
較長的查詢:第一名
多輪:第一名
這款最新的聊天gpt-4o模型自上週以來一直在為OpenAI的ChatGPT提供支援。如果您注意到ChatGPT的響應在過去一周有所改進,可以肯定地說,這是因為有了新的模型。
OpenAI最近宣布了2024年開發者大會(DevDay 2024)的消息,該大會將在全球三個城市舉行。在宣布消息時,OpenAI明確表示不會在這些活動中透露他們今年早些時候開始訓練的下一個重大前沿模型。相反,這些開發者活動將專注於API和開發工具的改進。