OpenAI王炸新一波:向第三方開發者開放最強推理模型o1 更低價GPT-4o進入API
OpenAI透過API向在OpenAI消費至少1000美元的開發者推出正式版o1,替代API中已有的o1預覽版,o1擁有視覺輸入推理能力等新功能,使用的推理token比預覽版平均少60%,但收費較高,每分析約75萬個字收費15 美元,相當於GPT-4o收費的三到四倍;OpenAI同時更新Realtime API,新API支援WebRTC,納入收費更低的新版GPT-4o和4o mini模型,GPT-4o音訊定價降低了60%。
在為期12個工作日的線上新品和新技術發布活動中,OpenAI的王炸又來了一波:將OpenAI的最強推理模型o1向開發者開放,用於開發語音類App的API中納入了收費更低的先進模型GPT-4o版本。
美東時間12月17日週二進行的第九日線上分享中,OpenAI宣布,從週二開始,透過應用程式介面(API)向第三方開發者推出o1。但OpenAI並非向所有開發者開放使用o1,而是以「第五層」使用類別的形式提供,要獲得第五層的使用資格,開發者必須在OpenAI的產品上花費至少1000 美元,並且擁有的帳戶自首次成功付款以來已使用超過30天。
雖然OpenAI只是向部分開發者推出了o1,但此舉已經標誌著開發者在AI領域的最新進步,他們將有機會打造新的高級AI 應用程式App,或將最先進的OpenAI 技術整合到他們現有的App和工作流程中,無論是面向企業或面向消費者。
今年9月,OpenAI 發布了o1的預覽版o1 preview,稱o1是第一個具備真正通用推理能力的大模型,它的核心能力推理在測試化學、物理和生物學專業知識的基準GPQA-diamond上得到了充分體現。
根據OpenAI的評估,o1在該測試中全面超過了人類博士專家,準確率達到78.3%,而人類專家的得分為69.7%。 OpenAI稱,「通用人工智慧(AGI)之路,已經沒有任何阻礙」。此外,o1在多個高難度的推理基準測試中表現優異,例如在美國數學邀請賽(AIME)中,o1的正確率達到了83.3%,遠超其前身GPT-4o的表現。
本月5日,OpenAI在預告的連續12日王炸發布活動首日就推出了正式版的o1,所謂滿血o1,它被納入ChatGPT Plus套餐。正式版o1支援多模態輸入,具備視覺推理能力。相較於o1 preview版本,正式版o1的平均反應速度快了60%,OpenAI也發現正式版o1在推理時犯重大錯誤的頻率比o1 preview減少34%。
在包括編碼、數學和視覺推理任務在內的一系列基準測試中,正式版o1都相比預覽版取得了明顯進步。例如在SWE-bench Verified基準的編碼測試中,o1的評分從o1 preview的41.3 提高到48.9,而以數學為重點的AIME 測試中的評分甚至從42 躍升至79.2。
O1的新功能為開發者提供更多幫助。例如結構性輸出Structured Outputs功能讓回應可靠地匹配自訂格式,如JSON模式,從而確保與外部系統互動時的一致性;函數呼叫Function calling功能簡化了將o1 連接到API 和資料庫的過程;對視覺輸入進行推理的能力Vison capabilities發掘了製造、科學和編碼方面用例的前景。
開發人員也可以使用新的reasoning_effort參數微調o1的行為,該參數控制模型在任務上花費的時間,以此平衡效能和反應時間。
本週二推出的API中,正式版o1取代了API中已有的o1 preview版。因為需要大量計算資源才能運行o1,OpenAI對o1 API的收費也較高,o1每分析約75萬個字收取15 美元,模型每生成約75萬個字收取60 美元,相當於OpenAI最新非推理模型GPT-4o收費的三到四倍。
同時,o1的延遲更低,對於給定的請求,o1使用的推理token比o1-preview 平均少60%。
更新Realtime API,納入收費較低的新版GPT-4o和4o mini模型,支援WebRTC
本週二OpenAI也更新了支援語音助理、即時翻譯工具等低延遲自然對話體驗的Realtime API。 Realtime API目前仍處於測試階段,用於打造低延遲的AI 產生語音回應的App,此更新包括GPT-4o 和GPT-4o mini模型各自的新版本,新版本的資料效率更高、可靠性提高,用起來也更便宜。
更新後Realtime API擁有一些新功能,例如並髮帶外回應,它可以讓內容審核等後台任務在不中斷互動的情況下運作。該API現在還支援WebRTC,它是為基於瀏覽器的客戶端、智慧型手機和物聯網設備建立即時語音應用程式的開放標準。
在Realtime API中結合WebRTC意味著,API可以直接支援音訊串流、雜訊抑制和擁塞控制,從而簡化打造基於語音的App。開發者現在可以以最少的設定整合即時功能,即使在多變的網路條件下也是如此。借助WebRTC,開發者現在只需幾行Javascript程式碼即可新增Realtime功能。
OpenAI同時降低了Realtime API的收費,將GPT-4o音訊的定價降低了60%,降至每100 萬個輸入token收費40 美元,每100 萬個輸出token收費80 美元。
快取音訊輸入定價降低了87.5%,現在定價為每100 萬個輸入token收費2.50 美元。 OpenAI將要增加的更小模型GPT-4o mini定價更便宜,每100 萬個輸入token收費10 美元,每100 萬個輸出token收費20 美元。
GPT-4o mini 的文字token費率也大幅下調,輸入token起價0.60 美元,輸出token起價2.40 美元。