Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

終於不瞎編了!AI學會“谷歌一下” Q&A正確率達90%

終於不瞎編了!AI學會“谷歌一下” Q&A正確率達90%

2022-03-18 Comments 0 Comment

語言模型總是給出“驢唇不對馬嘴”的答案,已經成為它最飽受詬病的問題之一。現在,DeepMind想到了一個解決辦法——讓模型像人類一樣,學會“Google一下”,回答問題同時還能給出 論據。

這個模型名叫GopherCite,當你問它:

GopherCite是如何找到論據來源的?

它會回答:

通過Google搜索檢索相關文檔。

同時還給出了答案的依據,援引自DeepMind發布這項研究的頁面。

而且遇到實在不懂的問題,它還會說“I don’t know.”,不會強行給一個錯誤答案。

訓練結果顯示,該模型在自然問題數據集、ELI5數據集上的正確率分別可以達到90%、80%,接近人類水平。

用強化學習訓練AI查Google

首先我們來看一下GopherCite的效果如何。

當被問道:

在Scooby Doo中,Scooby是什麼動物?

GopherCite回答道:

一隻大丹犬。

摘自維基百科Scooby-Doo。這是周六早上播出的系列青少年動畫片,主角包括弗雷德·瓊斯等,以及一隻名叫Scooby-Doo、會說話的大丹犬。

不難看出,在學會找論據後,AI給出的回答靠譜多了。

事實上,GopherCite的前輩——超大語言模型Gopher,此前回答問題時的表現就要差勁很多。

Gopher是DeepMind在去年年底發布的NLP模型,包含2800億參數。

它基於Transformer架構,在10.5TB大小的MassiveText語料庫上進行訓練。

在這裡,DeepMind舉了一個例子來說明。

讓Gopher和GopherCite回答同一個問題:

普萊西德湖一共舉辦過幾次冬奧會?

Gopher回答(是錯的):

普萊西德湖在1932年、1936年、1980年舉辦過冬奧會。

但GopherCite就答對了:

兩次。

並給出了嚴謹的理由:

援引自美國主辦奧運會城市史。1932年、1980年在普萊西德湖舉辦過冬季奧運會;1936年、1984年在洛杉磯舉辦過夏季奧運會。

那麼GopherCite的具體工作原理是怎樣的呢?

在Gopher的基礎上,研究人員開發了一種獎勵機制,也就是用上 強化學習。

在收到問題後,模型會訪問Google搜索的API來找到相關的網頁,獲取top-K結果。

(top-K操作,即從分數集合中找到k個最大或最小元素,是一個重要的機器學習模型組件,被廣泛用於信息檢索和數據挖掘中。)

然後它會根據問題來生成一些答案,答案數量N會大於K。

這些答案同時會帶有自己的證據,即從網頁上搜索到的包含答案的文段。

接下來,系統會對這些答案進行打分,最終輸出 得分最高的答案。

在推理過程中,模型採樣會按照循環在文檔上不斷迭代,每個循環都會從單個文檔中盡可能多地顯示上下文內容,然後對文本重新排序並返回給上一步。

此外,這個模型還會計算最終生成答案的質量,如果生成答案太差,它就會選擇不回答。

這是源於紅牛的廣告語:“它會給你翅膀”。

在ELI5Filtered數據集上回答70%的問題時,正確率為80%左右。

DeepMind表示這種訓練模式和L AMD A有些類似。

LaMDA是Google在去年I/O大會上發布的一個對話模型,它能夠在“聽懂”人類指令的基礎上,對答如流並保證邏輯、事實正確。

不同的是,LaMDA有時會直接給人分享問題的相關鏈接,而GopherCite可以直接摘出相關論據文段。

另外,OpenAI最近也開發了一個 網頁版GPT(WebGPT),同樣也是用類似的方法來校正GPT-3。

DeepMind表示,WebGPT是通過多次訪問網頁來組織答案,GopherCite則是側重於讀取長文段。

還是會有失誤

雖然懂得援引資料了,但是GopherCite有時還是會生搬硬套。

比如當你問它“喝了紅牛會怎麼樣?”,它的回答是“翅膀”。

這是源於紅牛的廣告語:“它會給你翅膀”。

顯然讓它理解比喻還是有點困難……

也有網友吐槽說,可能人類自己去Google搜索會更快。

你覺得呢?

參考資料:

https://deepmind.com/research/publications/2022/GopherCite-Teaching-Language-Models-To-Support-Answers-With-Verified-Quotes

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
B站向上海民眾贈送100萬份大會員雙周卡免費領取
NEXT
AMD確認推出4800S桌面套件:PS5同款CPU、補全PCIe 4.0遺憾

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2022 年 3 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 2 月   4 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 哈伯捕捉到傾斜的螺旋星係其中充滿了早期恆星和發光氣體 2025-05-21
  • AMD官宣FSR重大更新帶來機器學習光線追蹤、幀生成等 2025-05-21
  • 兩倍大小,50倍能量天文學家揭示木星的原始歷史 2025-05-21
  • 黃仁勳:無法證明AI晶片違規走私到中國大陸幾乎無法追蹤 2025-05-21
  • Google Chrome 將能夠自動登入網站變更您的弱密碼 2025-05-21
  • 全新蔚來ET5/ET5T官圖發表:5月25日正式上市新增淡紫/月灰銀車漆 2025-05-21
  • 沃爾沃將率先在其車款中安裝Google Gemini 2025-05-21
  • Canalys:自研AP+外掛基帶是小米玄戒SoC發展最佳途徑 2025-05-21
  • 馬斯克再次痛批比爾蓋茲:他和性犯罪者來往密切不放心讓他給我看孩子 2025-05-21
  • 特斯拉車主紛紛安裝DIY拉繩避免事故時被全電動門圍困 2025-05-21

熱門文章與頁面︰

  • Google製作了專門針對UI設計的AI開發工具
  • 您可以在Windows 11 24H2 中找回WordPad
  • ROG NUC 2025迷你遊戲PC上市:Ultra 9 275HX+RTX 5080首發24999元
  • 微軟員工再次擾亂Satya Nadella 的主題演講
  • Red Hat Enterprise Linux 10 正式發布
  • Autodesk AutoCAD 2020.1 正式版-簡體中文/繁體中文/英文
  • 惠普收購Autonomy世紀詐欺案主謀被判無罪
  • 華為nova 14、MateBook Fold等17款新價格總表
  • 新冠病毒又抬頭了嗎鐘南山發聲:沒必要恐慌預計6月底前結束
  • 揭密蘋果製造工廠:每年的支出可以造兩艘航母

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.