Agent重大突破:OpenAI智能體支援MCP 已開源
今天凌晨2點,OpenAI對Agent SDK進行了重大更新支援MCP服務,可以統一介面標準解鎖無限工具。現在Agent可以快速整合網路搜尋、專業分析、本地查詢、網路追蹤等各式各樣的工具,這對於開發超複雜自動化智慧體來說幫助龐大。
例如,在開發一個需要同時進行文件處理、資料查詢和網路資訊收集的智慧體時,開發者可以透過MCP 伺服器分別整合檔案系統工具、資料庫查詢工具和網路爬蟲工具,更有效率地完成複雜任務。

連OpenAI聯合創辦人兼執行長Sam Altman也刻意發文大讚MCP,可見其對Agent的重要性。

開源位址:https://github.com/openai/openai-agents-python
MCP簡單介紹
可能很多人會對MCP比較陌生,「AIGC開放社群」先為大家簡單介紹一下技術概念。 MCP全稱為Model Context Protocol,是一種專為大模型開放的統一開放介面。
更直白一點,你可以把MCP看成大模型的“USB接口”,任何符合接口的工具,例如,U盤、移動硬碟、網絡適配器、外置網卡都能插在上面,這下知道為啥是解鎖無限工具了吧。

MCP的核心架構共由模型、脈絡、協定三個關鍵部分組成:模型是系統的邏輯核心,定義了資料的結構、決策的邏輯、系統如何解釋資訊。在傳統軟體開發中,模型可以透過物件導向程式設計模型、資料庫架構或AI/ML模型來實現。在AI應用中,模型可能是理解語言的神經網路、處理影像的深度學習模型,或是進行預測分析的機器學習演算法。
在企業軟體中,模型可能是指導客戶互動的實體關係模型。總之模型是系統的基礎,決定了系統如何處理和理解資料。
上下文為模型提供了運行的環境,決定了模型在不同條件下的行為。包括使用者互動、環境因素和系統狀態等變數。例如,一個AI聊天機器人會根據對話的上下文產生不同的回答,就像金融預測模型會根據經濟趨勢調整預測結果一樣。沒有適當的上下文,模型可能會產生不相關或錯誤的輸出。情境的動態性,能幫助系統能夠根據即時數據和環境變化調整其行為。

協定是通訊的橋樑定義了系統內不同組件之間的互動規則。確保了模型和上下文之間的通信,使得上下文的變化能夠正確影響模型,反之亦然。
在實際應用中,協定管理微服務之間的資料交換、AI元件之間的交互,甚至是Web應用中的API通訊。協定確保了分散式環境中的資料一致性、安全性和效率。
MCP對Agent有哪些好處
首先MCP為Agent提供了標準化的方式來接入各種工具和資料來源,無論是本地運行的工具,例如透過stdio伺服器,還是遠端託管的服務HTTP over SSE服務, Agent都可以透過統一的介面與它們進行交互,極大地擴展了第三方工具庫。
例如,在金融領域,Agent 可以連接股票分析的MCP工具。當用戶詢問某檔股票的詳細資訊時,Agent 可以調用該工具,快速取得股票的即時價格、歷史走勢、財務指標等數據,並進行深入分析,為用戶提供專業的投資建議。
這種標準化的存取方式極大地減少了Agent與不同工具整合時的複雜性,並且由於MCP定義了清晰的協議,Agent可以輕鬆地連接到新的工具和服務,而無需對Agent的核心邏輯進行大量的修改,這使得Agent能夠快速適應新的應用場景和需求。
此外,MCP也為Agent帶來了動態工具發現的能力。每次Agent執行時,SDK會呼叫MCP伺服器的方法,動態取得目前可用的工具清單。幫助Agent可以即時了解哪些工具是可用的,而無需在程式碼中硬編碼工具資訊。

這種動態發現機制賦予了Agent極高的靈活性和適應性,使其能夠適應工具的變化,例如工具的新增、刪除或更新。如果工具清單發生變化,Agent可以立即感知並調整其行為,從而更好地應對動態的環境和需求。
在效能優化方面,MCP同樣表現優異。支援對工具列表進行緩存,Agent可以在多次運行中復用工具列表,從而減少每次運行時調用工具的延遲,能夠顯著提升Agent的自動化效率。
同時Agent僅在需要時呼叫MCP伺服器的工具,而不是在初始化時載入所有工具。這種按需呼叫的方式可以減少資源消耗,並提高系統的整體效能。

在開發方面,MCP也大大簡化了開發工作。開發者可以透過簡單的配置將MCP伺服器新增到Agent中,而無需編寫大量的程式碼來實現工具的存取邏輯。這大大簡化了開發流程,縮短了開發週期。
由於工具的存取是透過MCP協定標準化的,開發者可以更容易地對工具進行調試和測試。同時,工具的獨立性也使得問題定位更加方便,進一步提升了開發效率。
MCP也實作了解耦與模組化的設計。它將工具和資料來源的實作細節與Agent的邏輯分離,Agent不需要關心工具的具體實現,只需要透過MCP協定與工具互動。這種解耦設計讓Agent的程式碼更加簡潔、易於維護。
同時,工具可以作為獨立的模組透過MCP伺服器提供給Agent。開發者可以獨立開發和部署工具,而無需修改Agent的程式碼。這種模組化方式使得系統的各個部分可以獨立昇級和最佳化,進一步提升了系統的靈活性和可維護性。
MCP服務展示
說了那麼多枯燥技術,咱直接看下實際的MCP服務吧。
FirecrawlMCP服務:提供資料抓取、網頁爬蟲、深度研究、擷取結構化資料等。
BrowserbaseMCP服務:建立瀏覽器會話、導航至指定URL、截取螢幕截圖等。
OpikMCP服務:啟用追蹤、取得追蹤統計資料等。
BraveMCP:本地搜尋、網路搜尋等。
目前,OpenAI已經在開源的Agent SDK中支援MCP,API和桌面版ChatGPT也將很快提供。