Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

OpenAI增強安全團隊授予其董事會否決危險AI的權力

OpenAI增強安全團隊授予其董事會否決危險AI的權力

2023-12-20 Comments 0 Comment

生產中的模型由「安全系統」團隊管理。開發中的前沿模型有「準備」團隊,該團隊會在模型發布之前識別和量化風險。然後是「超級對齊」團隊,他們正在研究「超級智慧」模型的理論指南。當地時間12月18日,OpenAI在官網中宣布,正在擴展內部安全流程,以抵禦有害人工智慧的威脅。一個新的「安全顧問小組」將位於技術團隊之上,向領導層提出建議,並且董事會被授予否決權。

這項更新引起注意很大程度上是因為,此前OpenAI首席執行官山姆·奧特曼(Sam Altman)被董事會罷黜的一個緣由似乎與大模型安全問題相關。而在高層人事混亂後,OpenAI董事會的兩名「減速主義」成員伊爾亞·蘇茨克維(Ilya Sutskever)和海倫·托納(Helen Toner)就失去了董事會席位。

在文章中,OpenAI討論了其最新的“準備框架”,即OpenAI追蹤、評估、預測和防範日益強大的模型帶來災難性風險的流程。如何定義災難性風險?OpenAI表示,“我們所說的災難性風險是指,任何可能導致數千億美元經濟損失或導致許多人嚴重傷害或死亡的風險——包括但不限於生存風險。”

三組安全團隊涵蓋不同的時間框架和風險。

根據OpenAI官網訊息,生產中的模型由「安全系統」團隊管理。開發中的前沿模型有「準備」團隊,該團隊會在模型發布之前識別和量化風險。然後是「超級對齊」(superalignment)團隊,他們正在研究「超級智慧」(superintelligent)模型的理論指南。

OpenAI的團隊將根據四個風險類別對每個模型進行評級:網路安全、「說服」(例如虛假資訊)、模型自主性(即自行行動)和CBRN(化學、生物、放射性和核威脅,例如創造新病原體的能力)。

OpenAI假定了各種緩解措施:例如,模型對於描述製作凝固汽油或管式炸彈的過程保持合理的保留態度。在考慮已知的緩解措施後,如果一個模型仍然被評估為具有「高」風險,它將無法部署,如果一個模型有任何「關鍵」風險,將不會進一步開發。

而製作模型的人不一定是評估模型和提出建議的最佳人選。正是由於這個原因,OpenAI正在組建一個“跨職能安全諮詢小組”,該小組將位於技術層面,審查研究人員的報告並從更高的角度提出建議,希望為其發現一些“未知的未知”。

這個過程要求這些建議同時發送給董事會和領導層,領導層將決定是繼續還是停止運行,但董事會將能夠撤銷這些決定。這有望避免在董事會不知情的情況下讓高風險產品或流程獲得批准。

不過,依然令外界擔心的是,如果專家小組提出建議,執行長根據該資訊做出了決策,那麼OpenAI目前這個董事會真的會感到有權反駁並踩下煞車嗎?如果他們這樣做了,外界的公眾會聽到相關的聲音嗎?目前除了OpenAI將徵求獨立第三方審計的承諾之外,其透明度問題實際上並沒有真正解決。

OpenAI「準備框架」五個關鍵要素:

1.評估和評分

我們將運行評估並不斷更新我們模型的「記分卡」。我們將評估所有前沿模型,包括在訓練運行期間增加兩倍的有效計算量。我們將把模型推向極限。這些發現將有助於我們評估前沿模型的風險,並衡量任何建議的緩解措施的有效性。我們的目標是探測不安全的特定邊緣,以有效地減輕暴露的風險。為了追蹤我們模型的安全水平,我們將製作風險「記分卡」和詳細報告。

「記分卡」將評估所有前沿模型。

2.設定風險閾值

我們將定義觸發安全措施的風險閾值。我們根據以下初始追蹤類別定義了風險等級閾值:網路安全、CBRN(化學、生物、放射性、核威脅)、說服和模型自主。我們指定了四個安全風險級別,只有緩解後得分為「中」或以下的模型才能部署;只有緩解後得分為「高」或以下的模型才能進一步開發。我們還將針對具有高風險或嚴重風險(緩解前)的模型實施額外的安全措施。

風險等級。

3.設定新的監督技術工作和安全決策營運結構

我們將建立一個專門的團隊來監督技術工作和安全決策的營運結構。準備團隊將推動技術工作來檢查前沿模型能力的極限,進行評估並綜合報告。這項技術工作對於OpenAI安全模型開發和部署的決策至關重要。我們正在創建一個跨職能的安全諮詢小組來審查所有報告並將其同時發送給領導層和董事會。雖然領導階層是決策者,但董事會擁有推翻決定的權利。

新的監督技術工作和安全決策營運結構。

4.增加安全性和外部問責制

我們將制定協議以提高安全性和外部責任。「準備團隊」將定期進行安全演習,以針對我們的業務和自身文化進行壓力測試。一些安全問題可能會迅速出現,因此我們有能力標記緊急問題以進行快速回應。我們認為,這項工作從OpenAI外部人員那裡獲得回饋並希望由合格的獨立第三方進行審核是很有幫助的。我們將繼續讓其他人組成紅隊並評估我們的模型,並且我們計劃與外部分享更新。

5.減少其他已知和未知的安全風險

我們將協助減少其他已知和未知的安全風險。我們將與外部各方以及安全系統等內部團隊密切合作,以追蹤現實世界中的濫用。我們還將與「Superalignment」(超級對齊)合作追蹤緊急的錯位風險。我們也開創了衡量風險如何隨著模型規模擴展而演變的新研究,以幫助提前預測風險,這類似於我們早期在規模法則方面的成功。最後,我們將運行一個連續的過程來嘗試解決任何新出現的「未知的未知」。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
研究發現在醫療實踐中使用數位支持演算法可顯著減少抗生素處方
NEXT
美國紐約華裔議員被指使用AI回答媒體問題

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2023 年 12 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 11 月   1 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 索尼又鎖區過百國家無法遊玩《星刃》 2025-05-16
  • 育碧將下架多款經典遊戲公司稱其有權這麼做 2025-05-16
  • 川普急簽中東AI大單惹惱對華強硬派 2025-05-16
  • 美教授AI講義漏洞百出大學生怒討8000美元學費 2025-05-16
  • 奧特曼嘲諷馬斯克AI翻車:追求真相的AI卻在輸出陰謀論 2025-05-16
  • 東南亞人群基因體研究領域取得里程碑突破 2025-05-16
  • 雷軍最新演講曝光:一場意外給小米帶來巨大質疑不再是產業新人 2025-05-16
  • “中東矽谷”?美國、阿聯酋宣布將聯手打造5吉瓦超級AI園區 2025-05-16
  • Google One訂閱服務的用戶數量達1.5億 2025-05-16
  • 巴菲特第一季大幅減持銀行股蘋果仍是最大重倉股 2025-05-16

熱門文章與頁面︰

  • 您可以在Windows 11 24H2 中找回WordPad
  • 川普希望蘋果停止將iPhone生產轉移到印度轉而提高美國產量
  • 科學家發現人類能發出的微弱的可見光但死後會消失
  • AI破解遠古密碼:消失百萬年的巨型蜥蜴曾稱霸北美
  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法
  • “中東矽谷”?美國、阿聯酋宣布將聯手打造5吉瓦超級AI園區
  • 印度批准蘋果供應商富士康4.33億美元晶片合資項目
  • 全球最大汽車運輸船入列一次能拉9500台
  • 星巴克據悉考慮出售中國業務股份正與私募及科技領域公司接觸
  • 東京電玩展2025主視覺圖正式公開主題“玩無止境”

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.