Google解釋人工智慧概述的離譜錯誤和更新為其準確性辯護

Google今天下午發表了一篇關於人工智慧概述及其準確性的長篇回應。該搜尋功能於2024 年在美國I/O 大會上推出，曾因一些備受矚目的荒唐錯誤而飽受批評。

Google首先解釋了人工智慧概述的運作方式，包括它們”與聊天機器人和其他樂虎國際手機版下載產品的工作方式有很大不同”。

它們不是簡單地根據訓練資料產生輸出結果。雖然人工智慧概述由定制的語言模型驅動，但該模型與我們的核心網路排名系統集成，旨在執行傳統的”搜尋”任務，例如從我們的索引中識別相關的高品質結果。這就是為什麼人工智慧概述不僅僅提供文字輸出，還包括相關鏈接，以便人們進一步探索。

Google試圖將人工智慧概述與更廣泛的LLM幻覺問題區分開來，有些人認為LLM不適合搜尋。

這意味著人工智慧概述一般不會像其他LLM產品那樣”產生幻覺”或胡編亂造。

相反，當人工智慧概述出錯時，Google表示常見的問題是”誤解了查詢，誤解了網路語言的細微差別，或者沒有很多有用的信息”。

Google強調了一些病毒式傳播的例子。在”我應該吃多少石頭”的案例中，Google承認它沒有很好地處理諷刺性內容。它還指出《洋蔥新聞》的文章是如何”被一家地質軟體供應商的網站轉載的”。

因此，當有人在搜尋中輸入這個問題時，就會出現一個人工智慧概述，忠實地連結到解決這個問題的唯一網站之一。

Google強調的另一個案例是”用膠水讓奶酪粘在披薩上”，並將論壇（該案例中為Reddit）作為可靠的第一手知識來源進行了過度索引。

最後

在少數情況下，我們發現人工智慧概述會曲解網頁上的語言並提供不準確的資訊。我們透過改進演算法或透過既定流程刪除不符合我們政策的回复，迅速解決了這些問題。

就下一步措施而言，Google已經”限制包含諷刺和幽默內容”，作為”更好的無意義查詢檢測機制”的一部分。另外

“我們更新了系統，以限制在可能提供誤導性建議的回覆中使用使用者產生的內容”。
“我們為人工智慧概述證明不那麼有用的查詢添加了觸發限制”。
“對於新聞和健康等主題，我們已經制定了強有力的防護措施。例如，我們的目標是不顯示硬新聞話題的人工智慧概述，因為這些主題的新鮮度和事實性非常重要。在健康方面，我們推出了額外的觸發改進措施，以加強我們的品質保護。

該公司先前曾表示，”絕大多數人工智慧概述都能提供高品質的資訊”。 Google今天援引自己的測試結果稱，人工智慧概述和基於引用的精選片段的準確率”不相上下”。但遺憾的是，Google並沒有分享任何數據來證明這一點。

WONGCW 網誌