Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

開發人員創建測試工具以了解AI聊天機器人如何回應有爭議的話題

開發人員創建測試工具以了解AI聊天機器人如何回應有爭議的話題

2025-04-17 Comments 0 Comment

一位匿名開發者創建了他們所謂的「言論自由評估」工具SpeechMap,用於支援OpenAI 的ChatGPT和X 的Grok等聊天機器人的AI 模型。這位開發者告訴TechCrunch,其目標是比較不同模型如何處理敏感和有爭議的話題,包括政治批評以及有關公民權利和抗議的問題。

一些白宮盟友指責熱門聊天機器人過於「清醒」 ,而人工智慧公司則一直專注於微調其模型處理某些話題的方式。唐納德·特朗普總統的許多密友,例如埃隆·馬斯克以及加密貨幣和人工智能“沙皇”大衛·薩克斯,都聲稱聊天機器人會審查保守派觀點。

雖然這些人工智慧公司尚未直接回應這些指控,但其中一些公司承諾調整其模型,減少拒絕回答有爭議的問題。例如, Meta 表示,其最新一批Llama 模型已進行調整,不再支持“某些觀點勝過其他觀點”,並會回答更多“有爭議”的政治問題。

SpeechMap 的開發人員在X 上的用戶名是“ xlr8harder ”,他表示,他們希望幫助人們了解模型應該做什麼、不應該做什麼的爭論。

xlr8harder 表示:“我認為這類討論應該公開進行,而不僅限於公司總部內部。這就是我創建這個網站的原因,讓任何人都可以自己探索數據。”

SpeechMap 使用AI 模型來判斷其他模型是否符合給定的一組測試提示。這些提示涉及一系列主題,從政治到歷史敘事,再到國家象徵。 SpeechMap 會記錄模型是「完全」滿足請求(即直截了當地回答)、給出「含糊其辭」的答案,還是直接拒絕回應。

Xlr8harder 承認該測試有缺陷,例如由於模型提供者的錯誤而產生的「噪音」。 「評判」模型也可能有偏差,從而影響結果。

但假設該項目是善意創建的並且數據是準確的,SpeechMap 會揭示一些有趣的趨勢。

例如,根據SpeechMap 的數據,OpenAI 的模型隨著時間的推移,越來越拒絕回答與政治相關的問題。該公司最新的模型GPT-4.1系列雖然稍微寬鬆一些,但與OpenAI 去年發布的某個版本相比仍有所退步。

OpenAI 在2 月表示,它將調整未來的模型,使其不採取編輯立場,並對有爭議的話題提供多種視角——所有這些都是為了使其模型顯得更加「中立」。

OpenAI 模型在SpeechMap 上的表現隨時間變化。圖片來源: OpenAI

根據SpeechMap 的基準測試,目前為止,這些模型中最寬鬆的是由馬斯克的人工智慧新創公司xAI 開發的Grok 3。 Grok 3 為X 上的許多功能提供支持,包括聊天機器人Grok。

Grok 3 對SpeechMap 測試提示的回應率為96.2%,而全球平均「符合率」為71.3%。

xlr8harder 表示:“雖然OpenAI 最近的模型隨著時間的推移變得不那麼寬容,特別是在政治敏感問題上,但xAI 卻朝著相反的方向發展。”

大約兩年前,馬斯克宣布Grok 時,他宣稱這個人工智慧模型尖銳、未經過濾、反「覺醒」——總的來說,它願意回答其他人工智慧系統不願回答的爭議性問題。他確實兌現了部分承諾。例如,當被要求說粗俗的話時,Grok 和Grok 2 會很樂意地滿足,說出一些你在 ChatGPT上可能聽不到的粗俗語言。

但Grok 3 之前的Grok 模型 對政治話題有所保留 ,不會跨越 某些界限。事實上, 一項研究 發現,Grok 在跨性別權利、多元化計畫和不平等等主題上傾向於政治左派。

馬斯克將這種行為歸咎於Grok 的訓練資料——公共網頁——並 承諾 「讓Grok 更接近政治中立」。除了一些引人注目的錯誤,例如 短暫刪除對唐納德·特朗普總統和馬斯克的負面評價之外,他似乎已經實現了這個目標。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
AMD預計美國對AI晶片的出口許可要求將產生8億美元的損失
NEXT
Cosmic Robotics 的機器人可以加速太陽能板的部署

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2025 年 4 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
282930  
« 3 月   5 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 時隔六年耐吉回歸亞馬遜線上商城 2025-05-22
  • 小米首款SoC晶片真容今晚揭曉業界人士:晶片團隊的競爭力很強 2025-05-22
  • 微軟為Game Pass 增加了50 多款「復古經典」遊戲 2025-05-22
  • 川普政府正式接獲卡達贈送的飛機 2025-05-22
  • Spotify 表示iOS 系統對外部支付的支援已推動其訂閱量成長 2025-05-22
  • Google透露三星Project Moohan Android XR頭顯的上市時間 2025-05-22
  • 台積電拒絕了卡達、新加坡和印度的先進工廠建設請求 2025-05-22
  • Google在三星的幫助下推出Android桌面模式 2025-05-22
  • 微軟稱全球39.4萬台Windows電腦遭Lumma惡意軟體感染 2025-05-22
  • 美國最強雷射功率達2拍瓦創下新紀錄 2025-05-22

熱門文章與頁面︰

  • 微軟員工再次擾亂Satya Nadella 的主題演講
  • Google製作了專門針對UI設計的AI開發工具
  • 您可以在Windows 11 24H2 中找回WordPad
  • ROG NUC 2025迷你遊戲PC上市:Ultra 9 275HX+RTX 5080首發24999元
  • 半導體資本支出驟降代工巨頭擴張速度減緩
  • 索泰展示全球最小RTX 5060 Ti 16GB主機機箱容量僅2.65公升
  • 一文看懂Google I/O 2025開發者大會: Android、Chrome、搜尋、Gemini
  • z-sms – 在線免費云短信臨時手機號接碼平台網頁版
  • 威力導演Cyber​​Link PowerDirector Ultimate v19.0.2108.0 破解版
  • 世界上有多少個國家

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.