Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

GPT-4通過圖靈測試

GPT-4通過圖靈測試

2024-06-17 Comments 0 Comment

在圖靈測試中,越來越多的人無法再將GPT-4 與人類區分開來。這是美國加州大學聖迭戈分校認知科學家本傑明-伯根和卡梅隆-瓊斯的研究成果。在turingtest.live網站上進行的線上模擬測試中,近500 名參與者中有54% 的人將ChatGPT 背後的人工智慧(AI)模型評為人類。上一版本的GPT-3.5 成功率為50%。 67%的測試者正確確認了自己是人類。

1_okwE7055troJRsk6plFEhQ.jpg

電腦科學家約瑟夫-韋曾鮑姆(Joseph Weizenbaum)於1966 年開發的電腦程式Eliza表現最差,只有22% 的人將其歸類為人類。

據科學家稱,這些結果首次提供了人工智慧系統透過雙人互動圖靈測試的確鑿證據,而且這很可能適用於未來幾乎所有最先進的聊天機器人。英國數學家和電腦科學家阿蘭-圖靈於1950 年首次提出了以他的名字命名的”模仿遊戲”對話強度測試。

從那時起,它就成了確定機器模仿人類對話能力的一個著名但有爭議的基準。在該測試的現代變體中,人類”評委”會在不知道誰是誰的情況下與另一個人類或聊天機器人對話。如果面試官在50% 的情況下無法可靠地區分電腦系統和人類,那麼機器就被認為通過了測試。

在目前的研究中,人類審訊者與代表其他人類、大型語言模型GPT-4 和GPT-3.5 以及基於對稱列表處理器(SLIP) 的簡易對話系統Eliza 的各種”證人”進行了互動,研究結果可在預印本伺服器Arxiv上找到。研究者隨機分配人類參與者扮演法官或證人的角色。樣本包括101 個人類和GPT-3.5 遊戲,以及100 個GPT 4 和Eliza 遊戲,所有遊戲均透過一種訊息應用程式進行,每個遊戲持續五分鐘。在402 位審問者中,168 人為女性,212 人為男性,9 人為非二元。 13人不想提供任何資訊。參與者的平均年齡為35 歲。

在2023 年的上一次研究中,Eliza 的表現明顯較好,沒有一個模型通過測試。這次,科學家們採用了表現最好的GPT-4 指令集(提示),並對其進行了修改。提示的第一部分指示模型表現得像一個年輕人,不要太認真地對待遊戲,使用口語,不要出現拼字和文法錯誤。此外,它還不能提供太多的知識,尤其是語文和數學方面的知識。

每輪測試開始時,都會添加一些額外的信息,例如姓名、地點和時間戳記。二人解釋說,人類之所以不能百分之百地辨識出同類,是因為提問者認為人工智慧的效率越來越高。這增加了他們將人類錯誤地識別為機器的可能性。

為了深入了解影響審訊者做出決定的定性因素,研究小組對他們使用的策略和做出判斷的理由進行了分類。 36%的人詢問證人的個人細節或日常活動。第二和第三類最常見的是社會和情感問題(25%)–例如,有關意見、經驗和幽默的問題。

審問者就其決定給出的最常見理由(43%)與基於拼字、文法、大小寫和語氣的語言風格有關。 24%的人關注社會情緒因素,如幽默感或個性。研究人員警告說,這些結果表明”當前人工智慧系統的欺騙行為可能不會被發現”。能夠成功模仿人類的機器人可能會產生”深遠的經濟和社會影響”。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
哈伯的震撼視角窺探變革中的RCW 7恆星工廠
NEXT
馬斯克表示將在幾個月內推出迷你版星鏈終端設備

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
赫思醫美
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2024 年 6 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 5 月   7 月 »

分類

  • 網站公告
  • 赫思醫美
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • Firefox新版本將支援Chrome已有多年的WebGPU功能 2025-07-17
  • 彩虹正式上架統信UOS 直接運行Windows應用 2025-07-17
  • 美團高層承諾:將保證美團騎士收入永遠站穩藍領第一梯隊 2025-07-17
  • 科尼賽克CEO直言:電動超跑沒有靈魂我們不造 2025-07-17
  • HTC預告VIVE神秘新品或為首款智慧眼鏡 2025-07-17
  • 據傳PS5 Pro將在明年5月進行性能升級推測為《GTA6》做準備 2025-07-17
  • 德國玩家偏愛A卡銷量佔65%超NV:RX9070XT賣最好 2025-07-17
  • 三星和SK海力士因意外需求推遲DDR4記憶體淘汰計劃 2025-07-17
  • 特斯拉Model YL外觀正式公佈:預估售價40萬尾標亮了 2025-07-17
  • 巴西一11歲女孩長了81顆牙齒醫師直呼活久見 2025-07-17

熱門文章與頁面︰

  • 無3C行動電源禁止登機一文看懂到底什麼是3C認證、如何分辨真偽
  • 氣像模型預測澳洲將面臨史無前例、長達20年的大洪災
  • 您可以在Windows 11 24H2 中找回WordPad
  • 科學家開發新型“智能”繃帶將利用光來指示感染情況
  • CCleaner全家桶激活密鑰
  • 色斑的成因、類型與防治:全面解析皮膚色素沉積問題
  • 三星在針對中國京東方的OLED商業機密侵權案中取得決定性勝利
  • 抖音首次公開演算法原理:推薦系統不打標籤只預估行為動作
  • WinZip Pro v24.0 Build 14033 x86/x64 正式註冊版附註冊碼Key
  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

赫思醫美

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.