Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

OpenAI推出o3和o3 Mini推理模型明年初對外開放

OpenAI推出o3和o3 Mini推理模型明年初對外開放

2024-12-22 Comments 0 Comment

在”12 Days of OpenAI”活動的最後一天,OpenAI 今天宣布即將推出o3 系列推理模型。 與現有的o1 系列類似,o3 系列將包括o3 和o3 mini 型號。 OpenAI 也分享了o3 型號的一些基準數據。

螢幕截圖_2024_12_20_at_10.02.14_AM.webp

OpenAI 聲稱,o3 在程式設計基準測試中的表現優於其他推理模型

  • o3 在ARC-AGI 半私密評估中的得分突破了75.7%。 採用高計算配置的o3 在半私密評估中獲得了87.5% 的分數。
  • 在EpochAI 前沿數學基準測試中,o3 解決了25.2% 的問題,而現有模型只解決了2%。
  • 在SWE-Bench Verified 測試中,o3 獲得了71.7 分,比o1 高出22.8 分。
  • 在Codeforces 上,o3 的Elo 評分為2727。
  • 在AIME 2024 中,o3 獲得了96.7% 的分數。 相比之下,o1 的得分是83.3。
  • 在GPQA Diamond 中,o3 得分為87.7%。 相比之下,o1 的得分為78%。

ARC 獎團隊就OpenAI 的新o3 模型評價如下:

OpenAI 的新o3 模型代表了人工智慧適應新任務能力的重大飛躍。 這不僅僅是漸進式的改進,而是真正的突破,標誌著人工智慧的能力與先前的LLM 限制相比發生了質的轉變。 o3 是一個能夠適應從未遇到過的任務的系統,可以說在ARC-AGI 領域中接近人類水準。

o3 Mini模型將為使用者提供在三個推理等級之間進行選擇的選項: 高、中、低三個推理等級。 低等級速度最快,但準確度較低,而高等級速度最慢,但準確度較高。

近來推理一詞已成為人工智慧產業的常用流行語,但它基本上是指機器將指令分解成更小的任務,從而產生更強的結果。 這些模型通常會展示它是如何得出答案的,而不是不加解釋地給出最終答案。 該公司還宣布了關於慎重調整的新研究,這要求人工智慧模型逐步處理安全決策。 因此,這種模式要求人工智慧模型主動推理使用者的請求是否符合OpenAI 的安全策略,而不是簡單地給出”是/否”規則。 該公司聲稱,在對o1 進行測試時,它在遵守安全準則方面比以前的模型(包括GPT-4)要好得多。

OpenAI 尚未發布o3 模型。 不過,從今天開始,它已開始共享o3 模型,用於安全測試。 有興趣的安全和安保研究人員也可以申請在公開發布之前使用o3 模型。 o3 模型預計於2025 年對外開放。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
馬斯克發文支持德國極右翼政黨新選擇黨
NEXT
違規訓練ChatGPT 義大利對OpenAI處以1500萬歐元罰款

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
赫思醫美
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2024 年 12 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
« 11 月   1 月 »

分類

  • 網站公告
  • 赫思醫美
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 嫦娥七號明年前後將發射也將帶一件重要儀器上月球 2025-07-10
  • 三星首款三折疊已就緒但仍在觀望市場是否真有需求 2025-07-10
  • 地表最貴AI誕生年費2.1萬,自稱學術能力超人類博士 2025-07-10
  • 中車長客設計師:CR450BF爭取明年見 2025-07-10
  • 儲存空間越來越不夠用1%的PC玩家設備可用不足10G 2025-07-10
  • 跳票6年後特斯拉Semi電動半掛終於完成貨運測試 2025-07-10
  • 主產帕薩特和速派存世17年的上汽大眾南京工廠正式關閉 2025-07-10
  • 歐洲高效能運算處理器「Rhea1」流片上市時間延至2026年 2025-07-10
  • 烏克蘭將在2026年推出星鏈行動服務 2025-07-10
  • 美國機器人自主完成膽囊切除手術表現堪比資深醫生 2025-07-10

熱門文章與頁面︰

  • 無3C行動電源禁止登機一文看懂到底什麼是3C認證、如何分辨真偽
  • Photon Matrix:針對蚊子的“防空系統”
  • 曝鈴木汽車因中國稀土管制全面停產主力車型雨燕
  • TIM for Windows v2.3.0.20979 正式版发布
  • 百度地圖新增攤位上傳綠色通道用戶使用地圖可直接導航至地攤前
  • 完整驅動程序解決方案Treexy Driver Fusion v8.1.0 + v1.7.0 Premium
  • ABC/CBS/Fox/NBC紛紛向免費電視流媒體應用Locast發起訴訟
  • 您可以在Windows 11 24H2 中找回WordPad
  • CorelDRAW Graphics Suite 2020 v22.1.0.517
  • 微信調整新裝置登入驗證功能可以人臉辨識取代先前兩位好友驗證碼

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

赫思醫美

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.