OpenAI 發布更新版GPT-4o 模型奪回聊天機器人基準測試頭名
今天,OpenAI 宣布了改进后的 GPT-4o 模型,并进行了一些显著的改进。 最新的 GPT-4o 模型改进了创意写作能力,可以提供更自然、更吸引人、更有针对性的写作,并具有更好的相关性和可读性。 OpenAI 还声称,这个新模型能更好地处理上传的文件,提供更深入的见解和更全面的回复。
全球的ChatGPT 用戶已經可以使用這種新模式。 對於開發人員來說,新的GPT-4o 型號有以下名稱:
- GPT-4O-2024-11-20(API)
- chatgpt-4o-最新 (API)
上述兩個模型仍然具有128,000 個字元的上下文視窗、16384 個最大輸出詞元以及截至2023 年10 月的訓練資料。
憑藉這個新模型,OpenAI 也奪回了眾包人工智慧基準測試開放平台Chatbot Arena 的第一名。 過去一周,ChatGPT-4o(20241120)作為”匿名聊天機器人”在聊天機器人競技場進行了測試,並收集了約8000+ 張社區選票。
根据排名,ChatGPT-4o (20241120) 超过了上周刚刚发布的Gemini-Exp-1114模型,得分1361。 根据社区评分,最新的 GPT-4o 在创意写作方面取得了显著的进步;其得分从 1365 分上升到了 1402 分。 总排名变化如下。
- 總成績: #2 → #1
- 整體(StyleCtrl): #2 → #1
- 創意寫作: #2 → #1
- 編碼: #2 → #1
- 數學#4 → #3
- 硬提示: #2 → #1
OpenAI 更新的GPT-4o 模型標誌著他們從先前的o1 系列的轉變,該系列專注於邏輯推理。 GPT-4o 優先考慮創意寫作,這表明OpenAI 致力於探索人工智慧模型的各種能力。 這與業界目前對數學和編碼的關注相比,是一個令人耳目一新的變化。