Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

微軟的新安全系統可捕捉客戶人工智慧應用程式中的幻覺

微軟的新安全系統可捕捉客戶人工智慧應用程式中的幻覺

2024-03-30 Comments 0 Comment

微軟負責人工智慧的首席產品長莎拉-伯德(Sarah Bird)表示,她的團隊設計了幾項新的安全功能,對於那些沒有僱用紅隊來測試他們構建的人工智慧服務的Azure 客戶來說,這些功能將非常容易使用。微軟表示,這些由LLM 驅動的工具可以檢測潛在漏洞,監控”可信任但不支援”的幻覺,並為使用託管在平台上的任何模型的Azure AI 客戶即時阻止惡意提示。

“我們知道客戶並不都精通提示注入攻擊或仇恨內容,因此評估系統會產生模擬這些類型攻擊所需的提示。然後,客戶可以獲得評分並看到結果,」她說。這有助於避免人工智慧生成器因不良或意外反應而引發的爭議,例如最近出現的明顯偽造名人(微軟的Designer 圖像生成器)、歷史上不準確的圖像(Google Gemini)或馬裡奧駕駛飛機撞向雙子星大樓(Bing)等事件。三項功能:提示屏蔽(Prompt Shields)可阻止提示注入或來自外部文件的惡意提示,這些提示會指示模型違反其訓練;基礎檢測(Groundedness Detection)可發現並阻止幻覺;安全評估(Safety evaluations)可評估模型的漏洞。用於引導模型實現安全輸出和追蹤提示以標記潛在問題用戶的其他兩個功能即將推出。無論是使用者輸入的提示訊息,還是模型正在處理的第三方數據,監控系統都會對其進行評估,看是否會觸發任何禁用字詞或有隱藏提示,然後再決定是否將其發送給模型回答。之後,系統會查看模型的回答,並檢查模型是否幻覺了檔案或提示中沒有的資訊。videoframe_77964.jpeg在Google Gemini圖片的案例中,為減少偏見而製作的濾鏡產生了意想不到的效果,微軟表示,在這一領域,其Azure AI 工具將允許更多的客製化控制。伯德承認,有人擔心微軟和其他公司可能會決定什麼適合或不適合人工智慧模型,因此她的團隊為Azure客戶添加了一種方法,可以切換過濾模型看到並阻止的仇恨言論或暴力。未來,Azure 用戶還可以獲得試圖觸發不安全輸出的用戶報告。伯德說,這可以讓系統管理員找出哪些使用者是自己的紅隊成員,哪些可能是懷有更多惡意的人。伯德說,這些安全功能會立即”附加”到GPT-4 和其他流行的模型(如Llama 2)上。不過,由於Azure 的模型花園包含許多人工智慧模型,使用較小、較少使用的開源系統的使用者可能需要手動將安全功能指向這些模型。微軟一直在利用人工智慧來加強其軟體的安全性,尤其是隨著越來越多的客戶開始對使用Azure 存取人工智慧模型感興趣。該公司還努力擴大其提供的強大人工智慧模型的數量,最近與法國人工智慧公司Mistral 簽訂了獨家協議,在Azure 上提供Mistral Large 模型。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
FuryGPU – 一個由愛好者從零開始構建的開源GPU硬體
NEXT
美撞橋貨船黑盒子已找到將有助調查人員制定事件時間表

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2024 年 3 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 2 月   4 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 全面推動「凋零骷髏塔」標準化建設的網路大狂歡是怎麼開啟的? 2025-05-23
  • Windows記事本不再「簡單」 微軟為其新增AI寫作功能 2025-05-23
  • 基於Sora的微軟新工具Bing Video Creator挑戰Veo 各平台均可免費用 2025-05-23
  • 科學家發明結合紅外線和可見光的夜視鏡片 2025-05-23
  • Bluesky 將開始驗證「知名」用戶 2025-05-23
  • Anthropic CEO稱人工智慧模式產生的幻覺其實比人類少 2025-05-23
  • 這些韓國老年海女已擁有基因層面的“超能力” 2025-05-23
  • 防止顯示卡接口燒熔玩家給RTX 4090電源線裝上保險絲還有更狠的 2025-05-23
  • BMWSpeedtop概念車官圖發表售價超過400萬的雙門獵裝轎跑 2025-05-23
  • 馬雲上榜《時代》全球百大慈善人物榜單 2025-05-23

熱門文章與頁面︰

  • z-sms – 在線免費云短信臨時手機號接碼平台網頁版
  • 您可以在Windows 11 24H2 中找回WordPad
  • 電影《尋秦記》宣布2025賀歲檔上映古天樂等原班人馬回歸
  • 彩虹-YH1000無人物流機首飛成功一口氣能飛1500公里
  • 微軟員工再次擾亂Satya Nadella 的主題演講
  • 鳥寶寶有多內捲?為了讓父母投餵自己長出恐怖的嘴巴
  • ROG NUC 2025迷你遊戲PC上市:Ultra 9 275HX+RTX 5080首發24999元
  • ASUS 華碩 RT-AX86U AX5700規格電競路由器 開箱拆解評測
  • Saildrone的首艘鋁製Surveyor自主駕駛勘測船下水參加海軍測試
  • 上海兩大機場直通地鐵虹橋到浦東只要40分鐘全程26元

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.