OpenAI 的 o3 模型運行成本可能比最初估計的更高
當 OpenAI 於 12 月推出其o3“推理”AI 模型時,該公司與 ARC-AGI(旨在測試高性能 AI 的基準)的建立者合作,以展示 o3 的能力。 幾個月後,結果經過修改,現在看起來比最初略顯遜色。

上周,負責維護和管理ARC-AGI的Arc Prize Foundation更新了 o3 的近似計算成本。 該組織最初估計,其測試的最佳性能配置 o3 high 解決單個 ARC-AGI 問題的成本約為 3000 美元。 現在 Arc Prize Foundation 認為成本要高得多——可能約為每項任務 30000 美元。
此次修訂值得注意,因為它表明,至少在早期階段,當今最複雜的人工智慧模型在某些任務上的成本可能非常高昂。 OpenAI 尚未對 o3 進行定價,甚至尚未發佈。 但 Arc Prize Foundation 認為 OpenAI 的o1-pro 模型定價是一個合理的參考。
就背景而言,o1-pro 是 OpenAI 迄今為止最昂貴的模型。
Arc Prize Foundation 聯合創始人之一 Mike Knoop 表示:“我們認為 o1-pro 與真正的 o3 成本更接近…… 因為測試時使用的計算量很大。 但這仍然是一個代理,我們在排行榜上將 o3 標記為預覽,以反映在官方定價公佈之前的不確定性。 ”
考慮到該模型據稱使用的計算資源量,o3 high 的高價並非不可能。 據 Arc Prize Foundation 稱,在解決 ARC-AGI 問題時,o3 high 使用的計算量是 o3 low(o3 的最低計算配置)的 172 倍。
此外,關於OpenAI正考慮為企業客戶推出高價計劃的傳聞已經流傳了一段時間。 3 月初,The Information 報導稱,該公司可能計劃向專業 AI“代理”(如軟體開發人員代理)收取每月高達 2 萬美元的費用。
有些人可能會說,即使是 OpenAI 最昂貴的模型,其成本也遠低於典型的人類承包商或員工的收費。 但正如人工智慧研究員 Toby Ord在 X 上的一篇文章中指出的那樣,這些模型可能效率不高。 例如,o3 high 需要在 ARC-AGI 中的每個任務上嘗試 1024 次才能獲得最佳成績。