Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
    • WordPress 插件及主題下載
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

微軟開源多項工具和數據集讓語言模型更和諧

微軟開源多項工具和數據集讓語言模型更和諧

2022-05-24 Comments 0 Comment

今天微軟宣布多項工具和數據集開源,這些工具旨在審計AI 驅動的內容審核系統,以及自動編寫突出顯示AI 模型中潛在錯誤的測試。微軟表示AdaTest 和(De)ToxiGen 項目可以產生更可靠的大型語言模型(LLMs),或者類似於OpenAI 的GPT-3 的模型,用於分析和生成具有人類水平復雜性的文本。

目前LLMs 存在諸多風險。因為這些模型經過了大量來自於互聯網(包括社交媒體)的數據培訓,因此它們在訓練過程中可能會遇到有毒文本(toxic text)。由於重新訓練模型的成本以及存在的大量錯誤,發現和修復這些模型中的缺陷仍然是一個挑戰。

為了解決毒性問題,Microsoft Research 團隊開發了ToxiGen,這是一個用於訓練可用於標記有害語言的內容審核工具的數據集。據微軟稱,ToxiGen 包含274,000 個“中性”(neutral)和“有毒”(toxic)陳述的示例,使其成為最大的公開仇恨言論數據集之一。

Microsoft Research 合作夥伴研究領域經理、AdaTest 和(De)ToxiGen 項目負責人Ece Kamar ToxiGen 表示

我們認識到任何內容審核系統都會存在差距,這些模型需要不斷改進。(De)ToxiGen 的目標是讓AI 系統的開發人員能夠更有效地發現任何現有內容審核技術中的風險或問題。

我們的實驗表明,該工具可用於測試許多現有系統,我們期待從社區中學習將從該工具中受益的新環境。

為了生成樣本,Microsoft Research 團隊提供了一個針對13 個少數群體的“中性”陳述和仇恨言論的LLM 示例,這些群體包括黑人、身體和認知障礙者、穆斯林、亞洲人、拉丁裔、LGBTQ+ 和美洲原住民。這些陳述來自現有的數據集以及新聞文章、觀點文章、播客記錄和其他類似的公共文本來源。

微軟團隊解釋說,用於創建ToxiGen 語句的過程被稱為(De)ToxiGen,旨在通過指導LLM 生成工具可能錯誤識別的語句來揭示特定審核工具的弱點。通過對三個人工編寫的毒性數據集的研究,該團隊發現從一個工具開始並使用ToxiGen 對其進行微調可以“顯著”提高該工具的性能。

微軟團隊認為,用於創建ToxiGen 的策略可以擴展到其他領域,從而產生更多“微妙”和“豐富”的中立和仇恨言論示例。但專家警告說,這並不是萬能的。

分享此文:

  • 分享到 Twitter(在新視窗中開啟)
  • 按一下以分享至 Facebook(在新視窗中開啟)
  • 分享到 WhatsApp(在新視窗中開啟)
  • 按一下以分享到 Telegram(在新視窗中開啟)
  • 分享到 Pinterest(在新視窗中開啟)
  • 分享到 Reddit(在新視窗中開啟)
  • 按一下即可分享至 Skype(在新視窗中開啟)
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟)
  • 點這裡列印(在新視窗中開啟)

相關


網絡資訊

Post navigation

PREVIOUS
研究揭示三個突變如何共同刺激新的COVID-19變體
NEXT
尋找地外生命的新目標:雙星系統的行星或是外星生命的家園

發表迴響 取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
ESET NOD32
WINDOWS 10 &11 INSIDER PREVIEW
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
金融資訊
WhatsApp Stickers教學
WordPress資訊
WeChat資訊
PHP資訊
Plesk資訊
TensorFlow
教學資源
開源程序
網頁工具
SEO工具
醫療健康
旅遊及消閒
其他資訊
Content from
Content to
2022 年 5 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
« 4 月   6 月 »

分類

  • 網站公告
  • 限時免費
  • ESET NOD32
  • WINDOWS 10 &11 INSIDER PREVIEW
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WhatsApp Stickers教學
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • Plesk資訊
  • TensorFlow
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 旅遊及消閒
  • 其他資訊

彙整

近期文章

  • 博主硬核拆解特斯拉Model 3剎車助力泵展示工作原理 2023-03-25
  • 小彭汽車向小鵬汽車道歉盤點那些神級模仿的老年代步車 2023-03-25
  • 氣候變化在全球範圍內增加了人類與野生動物的衝突 2023-03-25
  • 《聖鬥士星矢》真人電影預告5月12日北美上映 2023-03-25
  • 《三體》動畫今日正式完結豆瓣評分僅獲3.8分 2023-03-25
  • 美妝品牌露詩聯動任天堂推出馬里奧兄弟主題沐浴露 2023-03-25
  • GPT-4滿分第一名通過大廠模擬面試微軟154頁研究刷屏 2023-03-25
  • 微軟警告:新推AI工具不得使用必應數據庫否則限制訪問! 2023-03-25
  • 聯網之後的ChatGPT 已經遠不止“iPhone時刻”那麼簡單 2023-03-25
  • 時隔9年賈躍亭的FF91終於要開始生產了 2023-03-25

熱門文章與頁面︰

  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法
  • 貝貝BiliBili – 在線一鍵下載B站視頻,可解析播放!
  • DP vs HDMI 誰才是遊戲玩家最佳選擇?
  • ESET NOD32 LICENSE KEY (UPDATED 2023-01-17)
  • Explorer Patcher:讓Windows 11恢復Windows 10的行為特徵
  • 世界上有多少個國家
  • Google Chrome瀏覽器意外出現Status_Access_Violation錯誤而崩潰
  • Win10休眠檔案hiberfil.sys怎麼徹底刪除?
  • Office 2013-2019 C2R Install v7.0.4 正式版-Office 2013/2016/2019自定義組件安裝工具
  • Windows及OFFICE激活密鑰+電話激活教程–自用

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2023   All Rights Reserved.