分析師的黃昏? OpenAI推出AI Agent主打金融、科學、政策和工程等領域
OpenAI推出AI Agent“深度研究”,分析師要失業了?當地時間2月2日,OpenAI在直播中宣布推出一款全新的AI代理(AI agent),名稱稱為「深度研究」(Deep Research),旨在幫助用戶利用ChatGPT進行深入、複雜的研究。

OpenAI表示,該功能專為「在金融、科學、政策和工程等領域從事高強度知識工作的人員」設計,提供全面、精準、可靠的研究支持,並且,該功能同樣適用於需要進行細緻調查的大宗消費決策,例如汽車、家電、家具購買等。
簡單來說,ChatGPT的「深度研究」功能適用於那些不只想要快速獲取答案或摘要,而是需要綜合考慮多個網站及其他資訊來源,不斷深入挖掘直到找到最合適的答案的任務。

Altman寫道:
“它可以去互聯網,做複雜的研究和推理,然後給你一份報告。它真的很好,可以完成需要數小時/數天且花費數百美元的任務。”
“它計算量很大且速度很慢,但它是第一個可以執行如此廣泛複雜、有價值的任務的AI系統。”

對此,網友們躍躍欲試,有人“已經準備好使用它了”,還有人自報帳號請求先一步用上ChatGPT的“深度研究”功能:


也有人提出疑問,ChatGPT的「深度研究」功能比Google的「深度研究」功能更強嗎?會不會有隱私問題?能不能把報告中每句話的首字母大寫?



限定發布,未來將拓展至更多用戶
Altman表示,ChatGPT的“深度研究”功能目前仅向ChatGPT Pro订阅用户开放,每月限额100次查询,随后将逐步推广至Plus和Team用户,最终扩展至企业级(Enterprise)用户。预计Plus版本将在约一个月后推出,并且未来付费用户的查询限制将“显著提高”。

對此,許多網友表示,200美元/月的ChatGPT Pro訂閱費用太貴了:
不是免費的誰在意啊。

還有網友猜測道,等之後實現了AGI,是不是要每月收取2000美金,限額使用10次?

其實,Altman表示,免費用戶也能使用,但額度非常少。

需要注意的是,「深度研究」功能目前僅在特定地區推出,OpenAI尚未公佈該功能何時向英國、瑞士及歐洲經濟區(EEA)用戶開放。
目前,ChatGPT 深度研究的輸出僅限於文字格式。不過,OpenAI計劃在未來增加嵌入式影像、資料視覺化及其他「分析型」輸出。此外,OpenAI還表示,未來將支援存取“更多專業化的資料來源”,包括“訂閱制”資料庫和內部資源。
研究精度如何? AI仍存局限
分析師要大面積失業了嗎?關鍵在於,ChatGPT「深度研究」功能的精準度能否滿足專業研究需求?畢竟,AI並不完美,仍然存在「幻覺」(hallucination)問題,即產生錯誤或虛假訊息的可能性。
考慮到這一點,OpenAI透露,每次深度研究的輸出都將「完整記錄,附帶清晰的引用來源及推理摘要,便於用戶參考和驗證資訊」。
不过,分析认为,这一举措是否足以避免AI误导用户仍待观察——此前,OpenAI在ChatGPT内推出的AI搜索功能(ChatGPT Search)已被曝出存在错误回答的问题。TechCrunch评测发现,ChatGPT Search在某些查询上甚至不如Google搜索可靠。
增強精準度:使用專門優化的o3版本AI模型
為了提高深度研究的準確性,OpenAI採用了一種特殊版本的o3「推理」AI 模型,該模型經過強化學習(reinforcement learning)訓練,專門針對「需要使用瀏覽器和Python工具的實際任務」。
OpenAI表示,該版本的o3模型“針對網頁瀏覽和數據分析進行了優化”,可以“利用推理能力搜索、解讀和分析互聯網海量文本、圖片及PDF,並根據新獲取的信息靈活調整策略。”
模型還可以瀏覽使用者上傳的文件,繪製並迭代調整圖表,在回答中嵌入生成的圖表及網頁圖片,並引用來源中的具體句子或段落。
為了測試該模型的效果,OpenAI採用了一項名為「人類終極考試」(Humanity’s Last Exam)的評估方法,該測試涵蓋3000多道高難度學術問題,遠超其他AI評估基準,以確保測試難度始終領先於模型的進步水準。
ChatGPT「深度研究」功能所使用的o3模型在測試中的準確率為26.6%——這一成績看似不高,但相比之下,已經遠超其他AI模型的得分:
Google雙子思維:6.2%
xAI Grok-2:3.8%
OpenAI GPT-4o:3.3%
不過,儘管如此,OpenAI仍然承認,ChatGPT「深度研究」功能存在局限性,可能會出現錯誤推斷、誤解權威資訊與謠言的情況,並且,在面對不確定性時往往無法明確表述。