OpenAI王炸新一波：向第三方開發者開放最強推理模型o1 更低價GPT-4o進入API

2024-12-18 Comments 0 Comment

OpenAI透過API向在OpenAI消費至少1000美元的開發者推出正式版o1，替代API中已有的o1預覽版，o1擁有視覺輸入推理能力等新功能，使用的推理token比預覽版平均少60%，但收費較高，每分析約75萬個字收費15 美元，相當於GPT-4o收費的三到四倍；OpenAI同時更新Realtime API，新API支援WebRTC，納入收費更低的新版GPT-4o和4o mini模型，GPT-4o音訊定價降低了60%。

在為期12個工作日的線上新品和新技術發布活動中，OpenAI的王炸又來了一波：將OpenAI的最強推理模型o1向開發者開放，用於開發語音類App的API中納入了收費更低的先進模型GPT-4o版本。

美東時間12月17日週二進行的第九日線上分享中，OpenAI宣布，從週二開始，透過應用程式介面（API）向第三方開發者推出o1。但OpenAI並非向所有開發者開放使用o1，而是以「第五層」使用類別的形式提供，要獲得第五層的使用資格，開發者必須在OpenAI的產品上花費至少1000 美元，並且擁有的帳戶自首次成功付款以來已使用超過30天。

雖然OpenAI只是向部分開發者推出了o1，但此舉已經標誌著開發者在AI領域的最新進步，他們將有機會打造新的高級AI 應用程式App，或將最先進的OpenAI 技術整合到他們現有的App和工作流程中，無論是面向企業或面向消費者。

今年9月，OpenAI 發布了o1的預覽版o1 preview，稱o1是第一個具備真正通用推理能力的大模型，它的核心能力推理在測試化學、物理和生物學專業知識的基準GPQA-diamond上得到了充分體現。

根據OpenAI的評估，o1在該測試中全面超過了人類博士專家，準確率達到78.3%，而人類專家的得分為69.7%。 OpenAI稱，「通用人工智慧（AGI）之路，已經沒有任何阻礙」。此外，o1在多個高難度的推理基準測試中表現優異，例如在美國數學邀請賽（AIME）中，o1的正確率達到了83.3%，遠超其前身GPT-4o的表現。

本月5日，OpenAI在預告的連續12日王炸發布活動首日就推出了正式版的o1，所謂滿血o1，它被納入ChatGPT Plus套餐。正式版o1支援多模態輸入，具備視覺推理能力。相較於o1 preview版本，正式版o1的平均反應速度快了60%，OpenAI也發現正式版o1在推理時犯重大錯誤的頻率比o1 preview減少34%。

在包括編碼、數學和視覺推理任務在內的一系列基準測試中，正式版o1都相比預覽版取得了明顯進步。例如在SWE-bench Verified基準的編碼測試中，o1的評分從o1 preview的41.3 提高到48.9，而以數學為重點的AIME 測試中的評分甚至從42 躍升至79.2。

O1的新功能為開發者提供更多幫助。例如結構性輸出Structured Outputs功能讓回應可靠地匹配自訂格式，如JSON模式，從而確保與外部系統互動時的一致性；函數呼叫Function calling功能簡化了將o1 連接到API 和資料庫的過程；對視覺輸入進行推理的能力Vison capabilities發掘了製造、科學和編碼方面用例的前景。

開發人員也可以使用新的reasoning_effort參數微調o1的行為，該參數控制模型在任務上花費的時間，以此平衡效能和反應時間。

本週二推出的API中，正式版o1取代了API中已有的o1 preview版。因為需要大量計算資源才能運行o1，OpenAI對o1 API的收費也較高，o1每分析約75萬個字收取15 美元，模型每生成約75萬個字收取60 美元，相當於OpenAI最新非推理模型GPT-4o收費的三到四倍。

同時，o1的延遲更低，對於給定的請求，o1使用的推理token比o1-preview 平均少60%。

更新Realtime API，納入收費較低的新版GPT-4o和4o mini模型，支援WebRTC

本週二OpenAI也更新了支援語音助理、即時翻譯工具等低延遲自然對話體驗的Realtime API。 Realtime API目前仍處於測試階段，用於打造低延遲的AI 產生語音回應的App，此更新包括GPT-4o 和GPT-4o mini模型各自的新版本，新版本的資料效率更高、可靠性提高，用起來也更便宜。

更新後Realtime API擁有一些新功能，例如並髮帶外回應，它可以讓內容審核等後台任務在不中斷互動的情況下運作。該API現在還支援WebRTC，它是為基於瀏覽器的客戶端、智慧型手機和物聯網設備建立即時語音應用程式的開放標準。

在Realtime API中結合WebRTC意味著，API可以直接支援音訊串流、雜訊抑制和擁塞控制，從而簡化打造基於語音的App。開發者現在可以以最少的設定整合即時功能，即使在多變的網路條件下也是如此。借助WebRTC，開發者現在只需幾行Javascript程式碼即可新增Realtime功能。

OpenAI同時降低了Realtime API的收費，將GPT-4o音訊的定價降低了60%，降至每100 萬個輸入token收費40 美元，每100 萬個輸出token收費80 美元。

快取音訊輸入定價降低了87.5%，現在定價為每100 萬個輸入token收費2.50 美元。 OpenAI將要增加的更小模型GPT-4o mini定價更便宜，每100 萬個輸入token收費10 美元，每100 萬個輸出token收費20 美元。

GPT-4o mini 的文字token費率也大幅下調，輸入token起價0.60 美元，輸出token起價2.40 美元。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

WONGCW 網誌

記錄生活經驗與點滴

OpenAI王炸新一波：向第三方開發者開放最強推理模型o1 更低價GPT-4o進入API

2024-12-18 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆