OpenAI上架推理模型o3-mini 首次向免費用戶開放推理功能
面對「東方AI力量」的壓力,美國OpenAI公司週五正式上線競品推理模型o3-mini,並首次向免費用戶開放推理模型。輕量級推理大模型o3-mini最早於去年12月的直播活動中亮相,一同亮相的還有「滿血版」的o3模型。
(圖片來源:OpenAI)
公司宣稱,o3具備更先進、近似人類的推理能力,在解決程式設計、數學、科學等理工科問題方面均超越現役的o1模型。公司曾表示,o3-mini會在1月底先上架,o3則「會在不久後推出」。
OpenAI介紹稱,o3-mini支援開發者調整「AI推理努力程度」的選項-分為低、中、高三個等級。這種靈活性使得o3-mini可以在面對難題時“更努力思考”,而需要效率時優先考慮回應速度。
在周五的新聞稿中,OpenAI披露,在2024年美國數學邀請賽(AIME 2024)的測試中,低推理努力的o3-mini準確率(60%)與o1-mini差不多,但速率更快;而在中等努力下,o3-mini準確率能夠提升到79.6%,與o1模型相當。在最高努力水準時,o3-mini的準確率則能進一步提升至87.3%。

在博士級科學問題(GPQA Diamond)方面,三種努力程度模型的準確率分別為70.6%、76.8%和79.7%。

橫向對比,DeepSeek-R1模型在AIME 2024測試中的準確率為79.8%,而在GPQA Diamond測試中的準確率為71.5%。
當然,DeepSeek的一大功勞,就是讓OpenAI突然之間變大方了。
OpenAI宣布,從週五開始,免費ChatGPT用戶也能透過在編輯器中選擇「推理」來嘗試o3-mini模型,這也是該公司的推理模型首次向免費用戶開放。
對於付費用戶,o3-mini將在模型選擇器中取代o1-mini。作為升級的一部分,每月花費20美元左右的ChatGPT Plus和Team用戶,速率限制也從o1-mini的每天50條,提升到o3-mini的150條。每月支付200美元的ChatGPT Pro用戶,能無限制地存取o3-mini。