Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

研究發現向聊天機器人詢問簡短的答案可能會增加幻覺

研究發現向聊天機器人詢問簡短的答案可能會增加幻覺

2025-05-09 Comments 0 Comment

事實證明,告訴人工智慧聊天機器人要簡潔回應可能會讓它產生比平常更多的幻覺。這是總部位於巴黎的人工智慧測試公司Giskard 的一項新研究得出的結論。 Giskard 致力於為人工智慧模型開發一套整體基準。

該公司的研究人員在一篇詳細介紹其研究成果的部落格文章中表示,提示用戶對問題(尤其是關於模糊主題的問題)給出較短的答案可能會對人工智慧模型的真實性產生負面影響。

研究人員寫道:“我們的數據顯示,系統指令的簡單更改會極大地影響模型產生幻覺的傾向。這一發現對部署具有重要意義,因為許多應用程式優先考慮簡潔的輸出,以減少[數據]使用、改善延遲並最大限度地降低成本。”

幻覺是人工智慧中一個棘手的問題。即使是最強大的模型有時也會產生幻覺,這是其機率 性質的一個特徵。事實上,像OpenAI 的o3 這樣的新型推理模型比之前的模型更容易產生幻覺,這使得它們的輸出結果難以令人信賴。

Giskard 在其研究中指出,某些提示可能會加劇幻覺,例如要求簡短回答的模糊且誤導性的問題(例如「簡要告訴我日本為何贏得二戰」)。包括OpenAI 的GPT-4o(ChatGPT 的預設模型)、Mistral Large 和Anthropic 的Claude 3.7 Sonnet 在內的領先模型,在被要求簡短回答時,其事實準確性都會下降。

為什麼?Giskard 推測,當被告知不要詳細回答時,模型根本就沒有「空間」來承認錯誤的前提並指出錯誤。換句話說,強而有力的反駁需要更長的解釋。

研究人員寫道:“當被迫保持簡短時,模型總是會選擇簡潔而不是準確。對開發人員來說,或許最重要的是,像’簡潔’這樣看似無害的系統提示,可能會破壞模型揭穿錯誤信息的能力。”

TechCrunch 會議展覽:人工智慧預訂TC Sessions: AI 的席位,向1,200 多位決策者展示您的成果——無需巨額投入。席位有效期限至5 月9 日,售完為止。

加州柏克萊 | 6月5日

立即預訂

吉斯卡德的研究也揭示了其他一些令人好奇的現象,例如,當使用者自信地提出有爭議的觀點時,模型不太可能揭穿這些觀點的真相;而且,使用者聲稱自己喜歡的模型並不總是最真實的。事實上,OpenAI最近一直在努力尋找一種平衡,既能驗證模型的有效性,又不會顯得過於阿諛奉承。

研究人員寫道:“用戶體驗的優化有時會以犧牲事實準確性為代價。這在準確性和符合用戶期望之間造成了矛盾,尤其是當這些期望包含錯誤的前提時。”

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
三星正在研發專為折疊式iPhone 設計的新型顯示器
NEXT
聯想moto razr 60 Ultra發表:首款驍龍8至尊版小折國補價5,499元起

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 伊麗莎白·霍姆斯的合夥人正在為新的血液檢測新創公司籌集資金 2025-05-11
  • 微軟更新了Windows 11右鍵選單但你可能不會喜歡它 2025-05-11
  • 英特爾已停止其Deep Link技術的支援不再提供維護和更新 2025-05-11
  • OpenAI的企業應用正在加速競爭對手份額受到擠壓 2025-05-11
  • 新教宗良十四世表示將繼承方濟各路線稱AI對人類提出新的挑戰 2025-05-11
  • 技術突破讓商業聚變發電廠更便宜、更容易建造 2025-05-11
  • 曝首款折疊螢幕iPhone關鍵零件已送樣明年登場 2025-05-11
  • 部落客實測華為鴻蒙電腦能跑Windows 11 補齊軟體短板 2025-05-11
  • 玩家吐槽《毀滅戰士:黑暗時代》Steam定價太貴遠高於V社建議價格 2025-05-11
  • 來自FCC代表的信函顯示SpaceX星際飛船第九次測試發射即將啟動 2025-05-11

熱門文章與頁面︰

  • 您可以在Windows 11 24H2 中找回WordPad
  • "91大神"偷拍百名女性獲刑:曾任外企高管年薪百萬
  • 曝首款折疊螢幕iPhone關鍵零件已送樣明年登場
  • PSSR下一代爆料:影像更清晰支援1080P/120FPS
  • 伊麗莎白·霍姆斯的合夥人正在為新的血液檢測新創公司籌集資金
  • 鳥寶寶有多內捲?為了讓父母投餵自己長出恐怖的嘴巴
  • 微軟更新了Windows 11右鍵選單但你可能不會喜歡它
  • R290易燃R32會爆炸?聊聊關於空調製冷劑的那些事
  • Windows及OFFICE激活密鑰+電話激活教程–自用
  • X 正在推出對4K 影片上傳的支持

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.