OpenAI推出可自主執行任務的人工智慧代理Operator
OpenAI 執行長Sam Altman 在一篇部落格文章中表示,2025 年將是人工智慧代理的重要一年,這些代理商可以自動執行任務並代表您採取行動。現在,我們看到了OpenAI 的第一次真正嘗試。
OpenAI 週四宣布,它將推出Operator 的研究性預覽,Operator 是一種通用人工智慧代理,可以控制網頁瀏覽器並獨立執行某些操作。
Operator 將首先透過ChatGPT 的200 美元Pro 訂閱方案向美國用戶推出。 OpenAI 表示,它計劃最終將此功能推廣給其Plus、Team 和Enterprise 級別的更多用戶。
此初步研究預覽可透過operator.chatgpt.com 取得,但OpenAI 表示很快就會希望將Operator 整合到ChatGPT 中。
Operator 的主屏
據OpenAI 稱,新的Operator 功能有望自動執行預訂旅行住宿、預訂餐廳或線上購物等任務。用戶可以在Operator 中選擇多個任務類別,包括購物、送貨、餐飲和旅行,所有這些類別都支援不同類型的自動化。
當ChatGPT 使用者啟動Operator 代理程式時,會彈出一個小窗口,顯示代理程式使用的專用Web 瀏覽器,以及用於解釋代理正在執行的任務的文字。用戶在Operator 工作時仍然可以控制他們的螢幕。
OpenAI 表示,Operator 由電腦使用代理(CUA) 提供支持,它將公司的GPT-4o 模型的視覺功能與OpenAI 更高級模型的推理能力相結合。 CUA 經過訓練可以與網站的前端進行交互,這意味著它不需要使用開發人員導向的API 來利用不同的服務。
換句話說,CUA 可以使用按鈕、瀏覽選單並在網頁上填寫表格——就像人類一樣。
「CUA 模型經過訓練,可以在完成具有外部副作用的任務之前(例如在提交訂單、發送電子郵件等之前)要求用戶確認,以便用戶可以在模型的工作永久生效之前對其進行仔細檢查,」OpenAI 在介紹中寫道。 “[它] 已經在各種情況下證明是有用的,我們的目標是將這種可靠性擴展到更廣泛的任務中。”
OpenAI 表示,它正在與DoorDash、Instacart、Priceline、StubHub 和Uber 等公司合作,以確保營運商尊重這些企業的規範。
但OpenAI 警告說,CUA 並不完美。該公司表示,“不要期望CUA 在所有情況下都能可靠地運行。”
出於謹慎考慮,OpenAI 還要求對某些任務進行監督,例如銀行交易,CUA 和Operator 可能能夠完全獨立執行。
「在特別敏感的網站上,例如電子郵件,Operator 需要主動的用戶監督,確保用戶能夠直接發現並解決模型可能犯的任何潛在錯誤,」OpenAI 在其資料中表示。
Operator 似乎是OpenAI 迄今為止在創建AI 代理方面最大膽的嘗試。上週,OpenAI 發布了Tasks,為ChatGPT 提供了簡單的自動化功能,例如設定提醒和安排提示在每天的固定時間運行的能力。 Tasks 為ChatGPT 使用者提供了一些熟悉但必要的功能,使ChatGPT 像Siri 或Alexa 一樣實用。然而,Operator 展示了上一代虛擬助理永遠無法做到的功能。
AI 代理被認為是繼ChatGPT 之後AI 領域的下一個重大事件:一項將改變我們使用網路方式的新技術。代理不應該只是傳遞和處理訊息,而應該真正採取行動並做事。隨著OpenAI 發布其第一個真實版本,我們也許開始看到這個願景是否會實現。