OpenAI再推新智能體Deep Research 在「人類的最後考試」中表現突出
OpenAI發布了一款新的人工智慧工具“Deep Research”,旨在為用戶執行耗時的線上研究任務,涵蓋從複雜科學問題到汽車推薦等眾多領域。這項新工具進一步豐富了這家新創公司的人工智慧代理陣容。
Deep Research可能需要5 到30 分鐘來完成其工作——在你離開或處理其他任務時深入挖掘網路。最終輸出以報告的形式出現在聊天中,很快用戶還將看到嵌入的圖像、數據視覺化和其他分析輸出,以增強清晰度。這次的時間大大提升了它的能力。例如,在「人類的最後考試」中,Deep Research取得了令人印象深刻的26.6% 的準確率——遠遠超過了其最接近的競爭對手DeepSeek R1,後者的得分低於10%。這一飛躍凸顯了系統的迭代優化和結構化綜合能力,證明了在人工智慧快速發展的步伐中,有些任務確實需要時間。

在上週日的部落格文章中,OpenAI宣布,這項名為「Deep Research」的服務將透過其ChatGPT線上聊天機器人向特定付費客戶開放。該工具能夠根據用戶的指令,在線上搜尋文字、圖像、PDF文件以及用戶上傳的文件,進而產生一份詳盡的報告。 OpenAI將這項功能比作研究分析師,並強調它能夠在「幾十分鐘」內完成通常需要一個人「數小時」才能完成的工作。
不過,OpenAI也提醒用戶,「Deep Research」仍處於早期階段,可能會將虛構資訊誤認為事實,且在區分謠言和準確資訊方面可能存在困難。此外,這款研究工具“非常耗費運算資源”,初期用戶每月僅能提交100次查詢。