Agent 的熱潮還在繼續(xù)。OpenAI 以 " 構(gòu)建 Agent 的新工具 " 為標(biāo)題發(fā)布了一系列新的 API 平臺功能,直指下一代 AI 應(yīng)用開發(fā)標(biāo)準(zhǔn)。
一個(gè)特別重要的變化是引入了新的 Responses API。全新的 Responses API,提供了 Agent 的構(gòu)建模塊,這些 Agent 能夠幫用戶進(jìn)行搜索、查閱文件并在電腦上執(zhí)行任務(wù)。
Responses API 配備了一個(gè)網(wǎng)頁搜索工具,使用的是和 ChatGPT 相同的搜索模型。開發(fā)者在使用 GPT-4o 和 GPT-4o mini 時(shí),可以通過這個(gè)工具獲取實(shí)時(shí)的網(wǎng)絡(luò)信息和引用內(nèi)容。
Responses API 還具備 Computer Use 功能,可以使用 OpenAI 的 Operator 模型來能夠分析屏幕,代替用戶執(zhí)行任務(wù)。此外還提供了一個(gè)文檔搜索工具,能夠快速檢索大量文檔。OpenAI 將其定位為幫助客服人員快速查找常見問題解答,或者幫助律師助理檢索歷史案例。
對于開發(fā)者而言,Responses 意味著只需要很少代碼就能向 AI 提出更復(fù)雜的問題。比如一些原本需要一百行代碼的工作,現(xiàn)在只需三行即可完成。通過 Responses API,開發(fā)者還能更清楚地了解模型在做什么——它調(diào)用了哪些工具,為何調(diào)用它們,以及在調(diào)用前后做出了哪些決策。
該 API 現(xiàn)已面向所有開發(fā)者開放,按 OpenAI 的標(biāo)準(zhǔn) token 和工具費(fèi)率計(jì)費(fèi)。
Responses API 是使用模型和工具來完成特定任務(wù)的基本單元,而 Agents SDK 讓多個(gè)這樣的基本單元協(xié)同工作,以解決更復(fù)雜的任務(wù)。
目前有超過三百萬開發(fā)者在使用 OpenAI 的 API,被開發(fā)者廣泛使用的是 Chat Completions API 將類似 ChatGPT 的功能嵌入到自己的應(yīng)用中。Responses API 和 Agents SDK 是對 OpenAI 現(xiàn)有開發(fā)者工具的補(bǔ)充。Completions 主要涉及文本對話,這次的 Responses API 可以理解為 Chat Completion API 的升級版。
Responses 與基于 Chat Completions 構(gòu)建的軟件是向后兼容的。OpenAI 也將繼續(xù)支持 Completions API。新模型的能力不依賴于內(nèi)置工具或多次模型調(diào)用時(shí),Chat Completions 會(huì)繼續(xù)更新,但要想使用那些便捷的工具,需要升級到 Responses。OpenAI API 團(tuán)隊(duì)表示,未來大多數(shù)開發(fā)者會(huì)選擇 Responses。
即將被淘汰的是 Assistants API,這是一個(gè)在 2023 年 OpenAI DevDay 推出測試版,OpenAI 還計(jì)劃在 2026 年年中用 Responses API 取代現(xiàn)有的 Assistants API。
API 需要預(yù)見開發(fā)者未來幾年可能需要的功能,不難拆解出 OpenAI 關(guān)于未來功能的核心側(cè)重點(diǎn),新的 API 極大地?cái)U(kuò)展了開發(fā)者構(gòu)建 Agent 的能力,為 AI 工程師、AI 設(shè)計(jì)師、AI 審計(jì)員、AI 會(huì)計(jì)師鋪平道路,這些新工具不僅提供了技術(shù)便利,更體現(xiàn)了 OpenAI 的平臺戰(zhàn)略。
在 AI 市場,OpenAI 的 Chat Completions API 已成為事實(shí)上的行業(yè)標(biāo)準(zhǔn),眾多公司為了降低開發(fā)者切換成本,紛紛提供與之兼容的接口,使其成為 AI 應(yīng)用開發(fā)的通用基準(zhǔn)。
然而競爭并未停歇,隨著 Agent 的崛起,市場競爭格局正在重塑——谷歌和 Anthropic 等巨頭也已進(jìn)軍 AI Agent 賽道。
Anthropic 在 2024 年 11 月推出了 MCP 開放協(xié)議,幫助 AI Agent 無縫訪問工具和數(shù)據(jù)庫,而無需為每個(gè)系統(tǒng)編寫代碼。其核心目標(biāo)是解決 AI 模型與數(shù)據(jù)孤島的隔離問題,通過提供統(tǒng)一協(xié)議替代碎片化的自定義集成。MCP 使用客戶端 - 服務(wù)器架構(gòu),AI 應(yīng)用(如 Claude Desktop 或 IDE)通過 MCP 客戶端連接到 MCP 服務(wù)器,前者提供數(shù)據(jù)源或工具的訪問。
MCP 的獨(dú)特之處在于其專注于 AI Agent 與外部系統(tǒng)的工具和數(shù)據(jù)源的調(diào)用,而 OpenAI Responses API 更側(cè)重集成化開發(fā),直接提供封裝完善的功能模塊。
對比來看,OpenAI 的 API 是專有解決方案,MCP 是開放標(biāo)準(zhǔn)。兩者都致力于增強(qiáng) AI 系統(tǒng)的功能,但它們在實(shí)現(xiàn)方式和應(yīng)用層次上有所不同。使用 OpenAI 的 Agent 工具開發(fā),就好像在特定游戲引擎中開發(fā)游戲擴(kuò)展包 ,功能強(qiáng)大但只能在該生態(tài)系統(tǒng)內(nèi)運(yùn)行;而 MCP 則像開放的網(wǎng)絡(luò)協(xié)議,任何遵循這個(gè)標(biāo)準(zhǔn)的系統(tǒng)都能互相通信,不論使用什么編程語言或運(yùn)行在什么平臺上。這更像是兩家公司在同一行業(yè)趨勢下的平行發(fā)展。
OpenAI 通過引入 Responses API,簡化工具使用、代碼執(zhí)行和狀態(tài)管理的工作流程,憑借這些功能,OpenAI 設(shè)想 Responses API 成為 Agent 應(yīng)用的基礎(chǔ),消除了對多個(gè)外部集成的需求。
面對來自本土乃至中國競爭對手的競爭,OpenAI 需要讓開發(fā)者持續(xù)留在自己平臺上構(gòu)建應(yīng)用。技術(shù)優(yōu)勢不再絕對的 OpenAI,似乎已將打造開發(fā)者生態(tài)系統(tǒng)提升為核心戰(zhàn)略重點(diǎn)。
這只是 OpenAI 全面構(gòu)建 AI Agent 平臺的第一步,公司表示計(jì)劃在未來幾個(gè)月內(nèi)推出更多工具和集成,以幫助開發(fā)者更有效地部署、評估和擴(kuò)展 Agent 應(yīng)用。
十幾年前,應(yīng)用開發(fā)需要大量技術(shù)投資。隨后,蘋果和谷歌將其平民化,引爆了數(shù)百萬應(yīng)用的市場爆發(fā)。如今,這一劇本正在 AI 領(lǐng)域重演—— MCP 和 Agent SDK 等技術(shù)正在大幅降低 Agent 應(yīng)用的開發(fā)門檻,或許類似的爆發(fā)即將到來。