Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

GPT-4、Llama 2比人類更懂「人類心理」?最新研究登上Nature子刊

GPT-4、Llama 2比人類更懂「人類心理」?最新研究登上Nature子刊

2024-05-21 Comments 0 Comment

一項新的研究發現,人工智慧(AI)或許具備了人類特有的能力之一,即「心智理論」(Theory of Mind,ToM)。也就是說,在追蹤人類的心理狀態方面,例如「發現錯誤想法」「理解間接言語」識別失禮」等,GPT(GPT-4、GPT-3.5)和Llama 2 在特定情況下的表現,已被證明接近甚至超過了人類。

這些發現不僅表明大型語言模型(LLMs)展示了與人類心理推理輸出一致的行為,而且還突出了系統測試的重要性,從而確保在人類智慧和人工智慧之間進行非表面的比較。

相關研究論文以「Testing theory of mind in large language models and humans」為題,已發表在Nature 子刊Nature Human Behaviour 上。

GPT 更懂“誤導”,Llama 2 更懂“禮貌”

心智理論,是一個心理學術語,是一種能夠理解自己以及周圍人類的心理狀態的能力,這些心理狀態包括情緒、信仰、意圖、慾望、假裝等,自閉症通常被認為是患者缺乏這一能力所導致的。

以往,心智理論這項能力被認為是人類特有的。但除了人類之外,包括多種靈長類動物,如黑猩猩,以及大象、海豚、馬、貓、狗等,都被認為可能具備簡單的心智理論能力,目前仍有爭議。

最近,像ChatGPT 這樣的大型語言模型(LLMs)的快速發展引發了一場激烈的爭論,即這些模型在心智理論任務中表現出的行為是否與人類行為一致。

在這項工作中,來自德國漢堡-埃彭多夫大學醫學中心的研究團隊及其合作者,反覆測試了兩個系列的LLMs(GPT 和Llama 2)的不同心智理論能力,並將它們的表現與1907 名人類參與者進行比較。

他們發現,GPT 模型在識別間接要求、錯誤想法和誤導三方面的表現,可以達到甚至超越人類的平均水平,而Llama 2 的表現還不如人類。

圖|人類(紫色)、GPT-4(深藍色)、GPT-3.5(淺藍色)和LLaMA2-70B(綠色)在心智理論測試中的表現。

在辨識失禮方面,Llama 2 要強於人類,但GPT 表現不佳。

研究團隊認為,Llama 2 表現好是因為回答的偏見程度較低,而不是因為真的對失禮敏感,GPT 表現較差其實是因為對堅持結論的超保守態度,而不是因為推理錯誤。

AI 的心智理論已達人類層次?

在論文的討論部分,研究團隊對GPT 模型在識別不當言論任務中的表現進行了深入分析,實驗結果支持了GPT 模型在識別不當言論方面存在過度保守的假設,而不是推理能力差。當問題以可能性的形式提出時,GPT 模型能夠正確識別並選擇最可能的解釋。

同時,他們也透過後續實驗揭示了LLaMA2-70B 的優越性可能是由於其對無知的偏見,而不是真正的推理能力。

此外,他們還指出了未來研究的方向,包括進一步探索GPT 模型在即時人機互動中的表現,以及這些模型的決策行為如何影響人類的社會認知。

他們提醒道,儘管LLM 在心智理論任務上的表現堪比人類,但這並不意味著它們具有人類般的能力,也代表它們能掌握心智理論。

儘管如此,他們也表示,這些結果是未來研究的重要基礎,並建議進一步研究LLM 在心理推論上的表現會如何影響個體在人機互動中的認知。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
Adobe終於開始重視Windows on Arm平台將推出原生版Ai和Pr等套件
NEXT
受以太坊ETF獲批傳言刺激數位幣全線走高比特幣突破7萬美元

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2024 年 5 月
一 二 三 四 五 六 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 4 月   6 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 歐盟提議對兩家中國小型銀行實施制裁 2025-06-13
  • 川普稱馬斯克支持廢除電動車強制令兩人鬧翻是因為其他事情 2025-06-13
  • Google Cloud服務嚴重宕機致OpenAI、Spotify等多項服務中斷 2025-06-13
  • 黃仁勳:未來十年將是機器人與自動駕駛汽車的時代 2025-06-13
  • 矽谷觀察:馬斯克服軟低頭認錯了全球首富還是拗不過美國總統 2025-06-13
  • AMD與OpenAI首席執行官山姆·奧特曼共同發布下一代AI晶片 2025-06-13
  • 蘋果計劃於2026 年春季發布延遲的Siri Apple Intelligence 功能 2025-06-13
  • Meta 與XGS Energy 合作興建150 兆瓦地熱發電廠 2025-06-13
  • AMD認為受推理需求推動到2028年AI加速器市場規模將達到5,000億美元 2025-06-13
  • Google和許多其他網路服務都遭遇了短暫中斷 2025-06-13

熱門文章與頁面︰

  • 您可以在Windows 11 24H2 中找回WordPad
  • 華為12000mAh 40W超級快充移動電源CP12S拆解
  • 華為麒麟9600 CPU現真身神秘數字「2035」再次出現
  • Mondoze : 馬來西亞伺服器/ AS152742/純淨 IP/雙ISP住宅伺服器/$8.33/月/2C/2G記憶體/60G/100M
  • 一汽豐田開卷電動車全新bZ5開啟預售:入門版價格不超13萬
  • Office Tab Enterprise 13.10 x86/x64(含:註冊機序列號)
  • 韓國遊戲公司Nexon出售價格或可高達150億美元
  • Windows 11 KB5055523更新導致部分使用者無法透過PIN或臉部辨識登入
  • 上海兩大機場直通地鐵虹橋到浦東只要40分鐘全程26元
  • 廣汽首款量產飛行汽車開啟預定:售價168萬元封頂比小鵬便宜39萬

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.