OpenAI首推三大功能ChatGPT正從會話助理變身“AI代理人”
OpenAI發布了MacOS桌面應用程式及其與各類應用程式的互通性功能,將為「代理式人工智慧」的未來奠定基礎,使ChatGPT變得更加強大,並無縫整合到使用者的日常工作流程中。
12月20日,OpenAI為期12天的發表會已步入第11天,即倒數第二天,該公司發布了MacOS桌面應用程式及其與各類應用程式的互通性功能。這將為「代理式人工智慧」(Agentic AI,或稱為智能體)的未來奠定基礎,使ChatGPT變得更加強大,並無縫整合到使用者的日常工作流程中。
在第11天的發表會上,OpenAI首席產品長凱文·韋爾(Kevin Weil)攜手兩位身著聖誕主題西裝的同事,共同探討了公司最新推出的MacOS桌面應用程式。他們著重強調了ChatGPT從單純的會話助理轉向更強大的代理工具的轉變,這意味著ChatGPT現在能夠代表用戶執行更多任務,為用戶帶來前所未有的便捷體驗。
首推三大功能
目前,用戶已能透過MacOS桌面應用程式來查看和自動化他們的ChatGPT工作。儘管2025年還將有更多類似版本問世,但在此之前,OpenAI已率先推出了以下三大功能:
第一,借助“Work with Apps”功能,用戶現在能夠將ChatGPT接入更多編碼應用程序,涵蓋BBEdit、MatLab、Nova、Script Editor、TextMate、Android Studio、AppCode、CLion、DataGrip、GoLand、IntelliJ IDEA、 PHPStorm、PyCharm、RubyMine、RustRover、WebStorm、Prompt以及Warp等。
在MacOS桌面應用的演示中,OpenAI展示了人工智慧如何深入一個應用程序,獲取並理解其上下文資訊。一旦用戶透過「Work with Apps」功能選定某個應用,ChatGPT便能立即接入,洞察應用程式內部,提供即時協助。
當然,ChatGPT不僅僅是一個簡單的檢視工具,它依賴強大的人工智慧模型,能夠執行多種功能。在Warp的展示中,ChatGPT不僅能捕捉使用者螢幕上的內容,還能深入應用內部,瀏覽更多資訊。例如,在處理長串程式碼時,ChatGPT能夠實現無滾動瀏覽,大大提升了工作效率。
與Windows Recall功能相比,ChatGPT更著重於與應用程式的即時協同工作,而非僅僅記錄和建立回憶庫。在另一場演示中,OpenAI團隊將ChatGPT與XCode緊密結合,使得它可以在蘋果的開發應用程式中運作。使用者只需簡單提出請求,ChatGPT就能產生程式碼或解決程式設計難題。
值得注意的是,OpenAI也展示了ChatGPT的一項新技能:它將產生的程式碼直接嵌入XCode中,這項功能有望大幅簡化工作流程。儘管在即時演示中,ChatGPT的程式碼嘗試遭遇了兩次失敗,但在第三次嘗試時,OpenAI團隊成功地讓程式碼運作起來。
第二,對於利用ChatGPT進行寫作的用戶,OpenAI宣布MacOS桌面應用程式現已實現對Apple Notes、Quip和Notion的支援。在現場演示中,OpenAI團隊正瀏覽一份文檔,該文檔旨在為Notion中的徒步旅行活動制定指南。
有了這個新功能,ChatGPT得以與Notion無縫協作。現場演示聚焦於文件中的特定文本段落,並設定任務為「補充這些對話要點」。此外,用戶還可利用ChatGPT的搜尋功能來產生回應。例如,在演示中,它根據所選文本產生了關於“諾頓皇帝(諾頓一世)”的對話要點,並附上引用及來源。
第三,除了文字選擇、複製貼上的傳統操作外,MacOS桌面應用程式支援進階語音模式,同時能與其他應用程式協同工作。在此模式下,用戶可在Apple Notes中設定“節日派對歌單”,並透過ChatGPT徵詢聖誕老人對候選歌曲的意見。 ChatGPT甚至能指出用戶的錯誤,例如將聖誕歌曲《Frosty the Snowman》誤寫為《Freezy the Snowman》。
這些功能現已正式發布,用戶只需確保擁有最新版本的MacOS應用程序,並訂閱了ChatGPT Plus、ChatGPT Pro、ChatGPT Team、ChatGPT Enterprise或ChatGPT Edu中的任一服務,即可立即體驗。
在隱私保護方面,OpenAI特別強調,ChatGPT僅會在用戶手動觸發的情況下與應用程式互動。一旦該功能被激活,用戶將明確知曉哪些內容將被附加到訊息中,從而有效緩解隱私方面的擔憂。
又曝AGI彩蛋
自美國當地時間12月5日起,OpenAI開啟了一個密集的新功能發布週期,計劃在接下來的12天內透過12場直播活動陸續推出新產品和功能。在此之前,OpenAI已經陸續發布了多項創新,包括ChatGPT Pro計畫、強化微調技術、Sora、互動介面Canvas,高階語音視覺功能、Projects功能、ChatGPT搜尋、滿血版o1模型、透過API向第三方開發者開放大模型o1系列以及透過電話和WhatsApp與ChatGPT互動等。
隨著發表會接近尾聲,人們對於AGI(通用人工智慧)的關注也愈發高漲。 OpenAI在第11天發布會最後表示:“在第12天,我們準備了極其特別的內容,千萬不要錯過哦!”
在示範畫面的一角,可以看到名為「AGI_Interface.swift」的資料夾。這已經不是過去12天首次出現這類驚喜了。幾天前,OpenAI還揭曉了一個名為「超級秘密AGI」的日曆活動彩蛋,這無疑進一步提升了人們對這12天系列公告的期待,大家紛紛猜測這些公告是否在共同描繪一幅通往通用智能的宏偉藍圖。
OpenAI也透露,ChatGPT的Windows應用程式也將很快發布。但更令人震驚的消息是,他們確認了一個新智能體的存在,並預計在2025年發布。 OpenAI表示:“隨著我們的模型變得越來越強大,ChatGPT將展現出越來越強的自主性。”
幾週前,有傳聞指出OpenAI正在研發一款名為「Operator」的代理式人工智慧,而該公司在第11天的發布活動上僅對此計畫進行了確認。或許,這項舉動背後有著來自競爭對手的壓力影響。
近期,Google宣布了Project Mariner項目,該智能體能夠代表用戶在網頁瀏覽器標籤上進行導航並執行操作。同樣,微軟也推出了Copilot Vision功能,它能在使用者的網頁瀏覽器中查看內容並提供相關資訊。當然,Anthropic更早之前發布了Computer Use功能,它在時間上領先其他同類工具。
現在,OpenAI的12天系列活動僅剩最後一天,而他們似乎將最精彩的部分留到了最後——一個全新且強大的前沿模型即將亮相。我們將拭目以待,看看OpenAI究竟帶來了什麼新產品,以及這個新模型與之前的o1模型有何不同。
值得一提的是,一些基準測試已經表明,o1模型是迄今為止最強大的人工智慧模型之一,甚至在編碼任務方面超越了Claude 3.5。近日,X平台的一位用戶據稱發現了GPT-4.5模型,儘管該模型目前僅提供有限的預覽功能。
現在,所有的目光都聚焦在OpenAI身上,大家都翹首以待,看他們在發布會活動的最後一天將會帶來怎樣的驚喜。