OpenAI的「深度研究」工具對科學家有幫助嗎?
去年12月,Google推出了人工智慧(AI)工具Gemini Deep Research,旨在幫助使用者有效率地整理和分析學術資訊。緊隨其後,OpenAI也發布了一款類似的付費存取工具-Deep Research(深度研究)。該工具能夠綜合數十甚至數百個網站的信息,並在數十分鐘內產生幾頁長的引用報告,完成通常需要數小時的文獻綜述工作。

許多使用過Deep Research 的科學家對其撰寫文獻綜述、整理研究綜述,甚至識別知識空白的能力感到印象深刻。資料科學家指出,如果由人類完成同樣的任務,將需要大量時間。
這些AI 工具被視為邁向自主智能代理(AI Agents)的重要一步,能夠處理更複雜的研究任務。許多用戶認為,Google的Deep Research 充分利用了Google在搜尋和計算方面的優勢,使用戶能快速掌握某個主題,而OpenAI 最新的大型語言模型(LLM)o3則增強了Deep Research 的推理能力,使其報告更加精準和復雜。
然而,研究人員也警告稱,所有基於LLM 的工具都存在一定的不準確性,甚至可能產生誤導資訊。 OpenAI 官網也承認,Deep Research 仍處於早期階段,存在局限性,可能會引用錯誤、產生事實幻覺,無法區分權威資訊和謠言,也無法準確表達其不確定性。該公司希望,隨著用戶的不斷使用和時間的推移,這些問題將會得到改善。而Google的Gemini Deep Research 也附帶免責聲明:“Gemini 會犯錯,因此用戶需要仔細核查。”
德國馬克斯普朗克光科學研究所人工科學家實驗室的負責人指出,這些工具目前仍無法取代科學家真正的研究。他說:“科學家通常需要花費數年時間專注於某一研究領域,並在此過程中不斷產生新的想法。這種能力,AI 目前尚未證明可以實現,未來是否可能做到,仍然未知。”