Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

OpenAI的最新AI模型擁有新的保護措施來預防生物風險

OpenAI的最新AI模型擁有新的保護措施來預防生物風險

2025-04-17 Comments 0 Comment

OpenAI 表示,它部署了一個新系統來監控其最新的AI 推理模型o3 和o4-mini ,以檢測與生物和化學威脅相關的提示。根據OpenAI 的安全報告,該系統旨在防止這些模型提供可能指導某人實施潛在有害攻擊的建議。

OpenAI 表示,O3 和o4-mini 的效能較之前的車型有了顯著提升,因此也為惡意攻擊者帶來了新的風險。根據OpenAI 的內部基準測試,o3 在回答特定類型的生物威脅相關問題方面表現得更為熟練。基於這個原因,同時也為了降低其他風險,OpenAI 創建了新的監控系統,該公司將其描述為「以安全為中心的推理監控器」。

監視器基於o3 和o4-mini 運行,經過客製化訓練,能夠推理OpenAI 的內容政策。它旨在識別與生物和化學風險相關的提示,並指示模型拒絕提供這些主題的建議。

為了建立基準,OpenAI 讓紅隊成員花費大約1000 小時標記o3 和o4-mini 中與生物風險相關的「不安全」對話。 OpenAI 表示,在一項模擬其安全監視器「阻止邏輯」的測試中,這些模型98.7% 的時間拒絕回應風險提示。

OpenAI 承認,其測試沒有考慮到那些在被監視器阻止後可能會嘗試新提示的人,這就是為什麼該公司表示將繼續部分依賴人工監控。

OpenAI 表示,O3 和o4-mini 並未超出OpenAI 設定的生物風險「高風險」門檻。然而,OpenAI 表示,與o1 和GPT-4 相比,o3 和o4-mini 的早期版本在解答有關開發生物武器的問題方面更有幫助。

o3 和o4-mini 系統卡的圖表(截圖:OpenAI)

根據OpenAI 最近更新的防範框架,該公司正在積極追蹤其模型如何使惡意用戶更容易開發化學和生物威脅。

OpenAI 越來越依賴自動化系統來降低其模型的風險。例如,為了防止GPT-4o 的原生影像產生器創建兒童性虐待內容(CSAM),OpenAI 表示它使用了與該公司為o3 和o4-mini 部署的類似的推理監視器。

然而,一些研究人員擔心OpenAI 並未將安全性放在應有的位置。該公司的紅隊合作夥伴之一Metr 表示,他們幾乎沒有時間在基準測試o3 的欺騙行為上。同時,OpenAI 決定不發布其本週稍早發布的GPT-4.1 模型的安全報告。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
前CISA主任Chris Krebs稱將反擊川普下令的聯邦調查
NEXT
育碧Chroma幫助開發人員在所有遊戲引擎中模擬色盲

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2025 年 4 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
282930  
« 3 月   5 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 全面推動「凋零骷髏塔」標準化建設的網路大狂歡是怎麼開啟的? 2025-05-23
  • Windows記事本不再「簡單」 微軟為其新增AI寫作功能 2025-05-23
  • 基於Sora的微軟新工具Bing Video Creator挑戰Veo 各平台均可免費用 2025-05-23
  • 科學家發明結合紅外線和可見光的夜視鏡片 2025-05-23
  • Bluesky 將開始驗證「知名」用戶 2025-05-23
  • Anthropic CEO稱人工智慧模式產生的幻覺其實比人類少 2025-05-23
  • 這些韓國老年海女已擁有基因層面的“超能力” 2025-05-23
  • 防止顯示卡接口燒熔玩家給RTX 4090電源線裝上保險絲還有更狠的 2025-05-23
  • BMWSpeedtop概念車官圖發表售價超過400萬的雙門獵裝轎跑 2025-05-23
  • 馬雲上榜《時代》全球百大慈善人物榜單 2025-05-23

熱門文章與頁面︰

  • 您可以在Windows 11 24H2 中找回WordPad
  • z-sms – 在線免費云短信臨時手機號接碼平台網頁版
  • 電影《尋秦記》宣布2025賀歲檔上映古天樂等原班人馬回歸
  • 彩虹-YH1000無人物流機首飛成功一口氣能飛1500公里
  • 微軟員工再次擾亂Satya Nadella 的主題演講
  • ROG NUC 2025迷你遊戲PC上市:Ultra 9 275HX+RTX 5080首發24999元
  • ASUS 華碩 RT-AX86U AX5700規格電競路由器 開箱拆解評測
  • 上海兩大機場直通地鐵虹橋到浦東只要40分鐘全程26元
  • 戴森展示新款超薄吸塵器PencilVac 與吹風機一樣纖薄
  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.