文 | 參商,作者 | 西梅汁,編輯 | 星奈
MCP 成共識,AI 智能體爆發加速
通用 Agent 正從 " 工具 " 躍遷為 " 智能伙伴 ",成為 AI 大模型落地的重要載體。在 Manus AI 以高融資與估值引爆市場后,百度、字節等大廠迅速入局:字節推出 B 端辦公產品 " 扣子空間 ",深度整合飛書生態;百度則瞄準 C 端用戶推出 " 心響 ",通過生活化模板降低使用門檻。二者路徑分化,但目標一致——將 AI Agent 嵌入現有生態,激活用戶粘性與商業增長。
在這樣的行業趨勢下,MCP 作為 " 萬能插座 " 的技術突破,正在重塑 AI Agent 的產業。眾多開發者和企業紛紛將目光聚焦于 MCP,將其視為推動 Agent 生態開放的重要力量。一方面,MCP 的特性使得開發者能夠更加自由地在上面構建和創新各類 Agent 應用,不再受制于特定的封閉生態,激發了整個行業的創造力和活力。另一方面,對用戶而言,MCP 的廣泛應用意味著他們可以更加輕松地獲取和使用來自不同開發者和平臺的 Agent 服務,享受更加豐富多彩的智能化體驗,進一步促進了 AI Agent 在各領域的普及和應用。
那么,隨著 MCP 的浪潮興起,AI Agent 的發展也將引來新的高潮。開發者的創新熱情被充分點燃,他們在 MCP 的基礎上不斷優化和拓展 Agent 的功能與應用場景,使其能夠更好地滿足市場和用戶需求。同時,MCP 的開放性也吸引了更多的資源和資本涌入這一領域,為 AI Agent 的研發和推廣提供了強有力的支持。
在市場競爭的推動下,Agent 的性能將不斷提升,用戶體驗也會越來越出色,從而形成一個良性循環,加速推動整個 AI Agent 生態的爆發式增長。
AI 暗戰進行時:大廠組織架構頻頻調整
近期,國內大廠在 AI 大模型領域的組織架構調整,反映出行業從 " 算力堆砌 " 向 " 效率優化 + 場景適配 " 的戰略轉向。
例如,騰訊將混元大模型研發體系重組為語言與多模態兩大部門,強化垂直場景協同;阿里開源 Qwen3 系列模型,并全面支持 MCP 協議,推動模型與支付寶、高德地圖等生態工具的深度整合,凸顯低成本與開源策略的技術普惠性;字節跳動則通過合并 AI Lab 與 Seed 部門,集中資源突破強化學習與稀疏模型架構,將推理成本降低 83%。這無疑不表明,企業正通過技術路徑分化(像模型輕量化、端側部署)降低商業化門檻,同時加速 AI 在多維度場景下的滲透。
不僅如此,各家通過開源協議與跨行業合作重構生態話語權。例如,百度、阿里等推動的 MCP 協議標準化接口,打破數據孤島并吸引開發者共建工具鏈;騰訊云與比亞迪合作企業級知識庫,字節 " 扣子空間 " 支持自定義插件接入,百度地圖 API 兼容 MCP 后,日均處理千萬級導航請求,均體現生態協同的深化。同時,云服務商以低價策略搶占市場,手機與車企則借助 Deepseek 實現差異化功能升級,形成 " 技術 - 場景 - 商業 " 閉環。這種開放生態不僅降低同質化風險,還推動硬件創新。
而面對 AI 人才爭奪白熱化,大廠從規模擴張轉向精準布局。字節跳動引入 Google DeepMind 前高管吳永輝,取消季度考核以支持長期研究;快手成立獨立可靈 AI 事業部,通過靈活架構保持視覺模型競爭力;阿里校招 80% 崗位傾斜 AI,并啟動 " 反選項目 " 機制打破層級限制。同時,復合型人才需求激增,倒逼企業內部重組,以提升研發與產品化協同效率。也在揭示,組織架構的敏捷性與人才質量正成為 AI 競賽的核心變量。
一場馬拉松,跑出人形機器人產業加速度
前段時間,2025 年北京亦莊半程馬拉松中的人形機器人參賽事件,雖因機器人的 " 翻跟斗 " 和跑錯方向引發一眾網友調侃,卻真實反映了行業在現實場景中的技術探索與挑戰。這場活動不僅是對機器人續航、穩定性與耐力的測試,更成為具身智能技術落地的試金石。
隨著國內大模型技術的快速發展,多模態與預訓練模型的突破為機器人提供了更強大的感知與交互能力,使其在復雜環境中的自主決策與適應性顯著提升,而這場馬拉松恰是技術迭代與場景驗證的關鍵節點,推動行業從實驗室走向真實世界。
目前,國內人形機器人產業正呈現年輕化與創新驅動的趨勢,以宇樹科技、智元機器人為代表的初創企業迅速崛起,依托大模型技術優化動作流暢度與環境反饋能力。例如,宇樹機器人通過春晚表演與商業落地展示了技術成熟度,而智元機器人千臺量產下線則標志著規模化應用的初步嘗試。這些進展背后,是 AI 大模型與具身智能的深度融合——生成式 AI 賦予機器人更自然的人機交互能力,多模態模型則強化其物理世界的理解與響應,為制造業、服務業等場景的實用化奠定基礎。
盡管人形機器人仍面臨技術瓶頸與公眾認知偏差的雙重挑戰,但其發展前景與戰略價值不容忽視。當前展示的 " 馬拉松 "" 跳舞 " 等場景僅是技術驗證的起點,未來需依托大模型驅動的持續創新,攻克動作穩定性、能源效率等核心難題。國內政策支持與資本投入加速了產學研協同,而真實場景的反復測試將倒逼技術迭代。隨著 AI 技術與機器人硬件的深度融合,人形機器人有望從 " 科技秀場 " 走向工業生產線、家庭服務等廣泛領域,成為新一輪科技革命的重要載體。
國內主要大模型進展
百度
4 月 25 日,Create2025 百度 AI 開發者大會在武漢舉辦,大會以 " 模型的世界,應用的天下 " 為主題,聚焦大模型技術突破與產業應用落地。百度創始人李彥宏出席大會并發表了題為《模型的世界應用的天下》的演講,發布了兩大模型和多款熱門 AI 應用,強調了應用在 AI 發展中的核心地位。
具體來看,百度發布了文心大模型 4.5 Turbo 和深度思考模型 X1 Turbo。文心 4.5 Turbo 相比文心 4.5 效果更佳、成本更低,基于文心 4.5 Turbo,文心 X1 升級到 X1 Turbo,性能提升的同時,具備更先進的思維鏈,問答、創作、邏輯推理、工具調用和多模態能力進一步增強。
據稱,這兩款新模型的價格僅為 DeepSeek 的 25%。這一價格優勢,將有助于百度在大模型市場中獲得更大的市場份額,特別是在企業級應用領域。
上線通用超級智能體產品 " 心響 "APP,其以 "AI 任務完成引擎 " 為核心,已覆蓋知識解析、旅游規劃、學習辦公等十大場景超 200 個任務類型,未來計劃將任務類型擴展至 10 萬種以上。
在數字人領域,百度推出高說服力數字人,可實時調整表情與動作,應用于電商直播、游戲等領域。同時發布的滄舟 OS 是全球首個內容領域操作系統,包括 Chatfile plus 和三大庫三器。
從宣布文心一言全面免費和文心大模型 4.5 開源,到舉辦 Create2025 百度 AI 開發者大會發布文心大模型 4.5 Turbo 和 X1 Turbo 兩款新模型,以及多款 AI 應用和扶持計劃,百度正在找回自己的主場。
阿里
4 月 29 日凌晨,阿里 Qwen3 王炸發布,殺瘋海外,一舉登頂全球最強開源模型。
此次,Qwen3 開源模型包含 8 款不同尺寸,包括兩款 MoE 模型:Qwen3-235B-A22B(2350 多億總參數、 220 多億激活參數),以及 Qwen3-30B-A3B(300 億總參數、30 億激活參數);以及六個 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。
Qwen3 支持思考模式和非思考模式,根據不同任務進行控制模型進行 " 思考 " 的程度,成為國內首家實現 " 混合推理 " 的模型。
4 月 27 日,夸克 AI 超級框發布全新 AI 相機,上新 " 拍照問夸克 " 功能。基于視覺理解與思考推理的強大模型能力,夸克 AI 超級框從視覺出發創新下一代搜索體驗,進一步理解和回答物理世界中的各類問題。作為阿里巴巴 AI 旗艦應用,夸克 AI 超級框持續快速迭代,提升超級智能體的多模態能力,打造用戶生活、工作、學習的 AI 超級入口。
4 月 17 日,阿里通義萬相「首尾幀生視頻模型」開源,該模型參數量為 14B,是業界首個百億參數規模的開源首尾幀視頻模型。它可根據用戶指定的開始和結束圖片,生成一段能銜接首尾畫面的 720p 高清視頻,此次升級將能滿足用戶更可控、更定制化的視頻生成需求。
用戶可在通義萬相官網直接免費體驗該模型,或在 Github、Hugging Face、魔搭社區下載模型本地部署后進行二次開發。
4 月 14 日,阿里云百煉上線業界首個全生命周期 MCP(模型連接協議)服務,這是阿里云在 AI 基礎設施領域的重要布局。該服務無需用戶管理資源、開發部署、工程運維等工作,僅需 5 分鐘即可快速搭建一個專屬 MCP Agent,大幅降低了 AI Agent 的開發門檻。
另外,百煉平臺預置了 MCP 廣場、MCP 管理、MCP 調用三大能力,大幅降低 Agent 開發的門檻和成本,只需 5 分鐘,就能搭建出企業級 MCP Agent。
自今年全面押注 AI 技術以來,阿里巴巴一直以極快的節奏推出 AI 產品。從計劃發布通義千問 3.0,到召開 AI 勢能大會展示 AI 基礎設施和應用成果,再到正式發布并開源新一代通義千問模型 Qwen3,阿里巴巴展示了其在 AI 領域的領導力和開放合作的態度。
DeepSeek
4 月 30 日,DeepSeek 在 Hugging Face 平臺發布其最新超大規模數學定理證明模型 DeepSeek-Prover-V2-671B,參數量高達 6710 億,是前代版本 V1.5 的近百倍,刷新開源數學推理模型體量上限。該模型專注于形式化數學證明任務,適用于自動定理驗證、邏輯推理訓練、Lean4 教學等場景,基于 DeepSeek-V3 架構,采用混合專家設計,支持超長 163K tokens 上下文處理。
字節跳動
4 月份,字節跳動主要圍繞大模型技術、AI 智能設備、組織架構調整以及 AI Agent 應用等方面展開了一系列動作。
4 月 18 日,字節跳動測試 Agent 產品 " 扣子空間 "。這款產品被定位為 "AI 實習生 " 和 " 領域專家 ",用戶可調用不同領域專家 Agent 協同完成任務。
扣子空間的核心功能是讓用戶可以選擇精通各項技能的通用實習生,也可以選擇行業的領域專家,通過與 AI 的互動完成工作。例如,用戶可以要求扣子規劃三天人文旅游行程并整理成文檔形式輸出,并可設置任務完成或暫停后 2 小時內的限時規則。這種 "AI 實習生 " 的定位,使得扣子空間在辦公自動化領域具有廣闊的應用前景。
4 月 17 日,字節跳動旗下的云和 AI 服務平臺「火山引擎」面向企業市場發布了更強的模型——豆包 1.5深度思考模型,這也是字節跳動旗下 AI 應用豆包 App 背后的推理模型首次亮相。一同推出的,還有豆包文生圖模型 3.0、以及升級版的視覺理解模型。
對于這次發布的模型,火山引擎總裁譚待認為," 深度思考模型是構建 Agent 的基礎,模型要有能力做好思考、規劃和反思,并且一定要支持多模態,就像人類具備視覺和聽覺一樣,Agent 才能更好地處理復雜任務。"
4 月 16 日,字節跳動宣布將 AI Lab 團隊整體并入 Seed 部門,聚焦文生圖模型(如 Seedream 3.0)和語言大模型研發。此次調整旨在優化資源分配,加速 AGI(人工通用智能)技術落地。
這一組織架構調整反映了字節跳動對 AI 業務的戰略重新定位。通過將 AI Lab 團隊并入 Seed 部門,字節跳動希望整合技術資源,形成更集中的研發力量,加速在關鍵領域的技術突破。同時,這一調整也表明字節跳動更加注重 AI 技術的商業化落地,希望通過 Seed 部門的統籌,推動 AI 技術在實際業務場景中的應用與價值實現。
4 月 12 日,The Information 援引知情人士消息報道,字節跳動正計劃推出自研的 AI 智能眼鏡,并已開始與供應鏈進行溝通,商討功能、技術方案、成本控制與上市節奏。這一消息標志著字節跳動正式進軍 AI 智能眼鏡市場,將智能眼鏡作為其 AI 生態的重要組成部分。
從 AI 智能眼鏡的研發,到大模型技術的持續迭代,再到 AI Agent 產品的推出,字節跳動正在構建一個全方位的 AI 技術與應用生態。
騰訊
騰訊 4 月份在 AI 領域的布局展現了其在算力基礎設施、模型能力提升、人才戰略和組織架構方面的全方位投入。
4 月 29 日,騰訊對其混元大模型研發體系進行了全面重構,主要是圍繞算力、算法和數據三大核心板塊展開,通過優化團隊部署和加碼研發投入,推動混元大模型的持續發展。調整后,騰訊成立了兩個新的部門:大語言模型部和多模態模型部,分別負責探索大語言模型和多模態大模型的前沿技術,持續迭代基礎模型,提升模型能力。同時,騰訊將進一步加強大模型數據能力和平臺底座建設。
4 月 23 日,騰訊宣布混元 3D 生成模型全新升級,v2.5 新版本在建模精細度上大幅提升,總參數量從 1B 提升至 10B,有效面片數增加超 10 倍,實現超高清的幾何細節建模,表面更平整、邊緣更銳利、細節更豐富,有效幾何分辨率達到 1024,就像從標清升級到了超清畫質。
混元 3D AI 創作引擎全面更新至 v2.5 模型底座,同時免費生成額度翻倍,提升至每天 20 次。混元 3D 生成 API 也已正式上線騰訊云,面向企業和開發者開放。騰訊混元積極擁抱開源生態,混元 3D 1.0、2.0 基礎模型及基于 2.0 模型的加速、多視圖和輕量級模型均已開源,Github 總 star 數超 1.2 萬。
4 月 17 日,騰訊宣布啟動史上最大就業計劃,三年內將新增 28000 個實習崗位并加大轉化錄用,2025 年將迎來 10000 名校招實習生,有六成面向技術人才開放。
騰訊透露,今年開放的校招實習崗位涵蓋技術、產品、設計、市場、職能等五大類 70 余種崗位,包括大模型、研發、算法、市場、策劃、運營、銷售、美術等多個崗位職能,同時加大對人工智能、大數據、云計算、游戲引擎、數字內容等技術類崗位的招聘力度,技術類崗位占比超 60%。
騰訊通過 " 技術架構重組 + 產品能力升級 + 人才梯隊建設 " 三維發力,持續鞏固 AI 大模型領域競爭力。
科大訊飛
4 月 20 日,科大訊飛宣布星火 X1 在數學、代碼、邏輯推理、文本生成等多項通用能力上取得顯著提升。其模型參數量比業界同類模型小一個數量級,但性能卻更加優越。
星火 X1 作為業界首個基于全國產算力訓練的深度推理大模型此次升級在數學、代碼、邏輯推理、文本生成等通用任務上效果顯著提升,特別是在模型參數比業界同類模型小一個數量級的情況下,依然保持了卓越的性能。
據悉,星火 X1 API 已同步上線訊飛開放平臺,面向廣大開發者和企業開放服務。
360
4 月 23 日,360 旗下納米 AI 正式發布 "MCP 萬能工具箱 ",萬能工具箱基于 MCP 而生,已接入超過 110 款工具,覆蓋辦公協作、學術、生活服務、搜索引擎、金融、媒體娛樂、數據抓取等多種場景,且工具免費、可一鍵安裝、安全可信。目前,用戶可在納米 AI 客戶端直接調用各類工具,還能用工具創建屬于自己的智能體,提升工作效率,方便自身生活。
據官方稱,納米 AI 這次上線的 MCP 萬能工具箱,是本著打造 "AI 應用基礎設施 " 的目標在反復打磨,面對頻頻曝出的 AI 安全問題,納米 AI 在其萬能工具箱的開發過程中專門為所有工具做了安全檢測,能夠解決行業普遍面臨的 MCP 服務安全和信任等問題,確保用戶能在安心、安全的環境下使用。
智譜
4 月 15 日,智譜正式向中國證監會北京證監局提交上市輔導備案,輔導機構為中國國際金融股份有限公司(中金公司)。這一舉動標志著智譜 AI 正式啟動 A 股 IPO 上市進程,成為 " 大模型六小虎 " 中首家沖刺上市的企業。
<>智譜上市輔導工作計劃從 2025 年 4 月到 10 月大致持續半年,分為摸底調查、集中整改、申報準備三階段。根據時間安排,智譜計劃在今年 8 月 -10 月完成 IPO 輔導。若一切順利,智譜年內有望邁出 IPO 申報的第一步。這意味著智譜 AI 有望成為 A 股 " 大模型第一股 " 。同日,智譜還發布新一代開源模型 GLM-4-32B-0414 系列,包含基座(Chat)、推理、沉思模型權重,有 9B 和 32B 兩個尺寸,并遵循寬松的 MIT License,完全開源,不限制商用,無需申請。其中,GLM-Z1-32B-0414 推理模型以 320 億個參數,在部分任務的性能表現上,可媲美參數高達 6710 億的 DeepSeek-V3/R1。
4 月 14 日,智譜宣布 AutoGLM 沉思核心鏈路的模型和技術正式開源。AutoGLM 沉思是一個能探究開放式問題,并根據結果執行操作的自主智能體(AI Agent),它于 3 月 31 日在中關村論壇上發布。
AutoGLM 沉思的技術演進路徑包括:GLM-4 基座模型→ GLM-Z1 推理模型→ GLM-Z1-Rumination 沉思模型→ AutoGLM 模型。這一模型能夠模擬人類的思維過程,完成從數據檢索、分析到生成報告,真正推動 AI Agent 進入 " 邊想邊干 " 的階段。
商湯
4 月 10 日,在 2025 商湯技術交流日活動中,商湯重磅推出全新升級的 " 日日新 SenseNova V6" 大模型體系,通過多模態長思維鏈訓練、全局記憶、強化學習的技術突破,形成領先的多模態推理能力,并突破成本邊界。
除了發布日日新 V6 大模型體系外,商湯科技還推出了商湯大裝置 SenseCore 2.0 全新升級版本。作為最懂大模型的 AI 基礎設施,SenseCore 2.0 致力于為企業提供敏捷、靈活、可靠的全棧 AI 基礎設施支持。
為促進大模型技術的落地應用,商湯科技還宣布發放 "1 億元代金券 ",旨在全棧賦能場景落地,加速 AI 技術在實際業務中的應用和推廣。這一舉措將為合作伙伴和開發者提供更實質性的支持,共同構建繁榮的 AI 生態系統。
月之暗面
4 月 16 日,月之暗面 Kimi 社區功能開始內測,預計本月底正式上線。該社區功能由 AI 抓取熱點新聞生成內容,正在邀請頻道號入駐。這一舉措旨在打造一個 AI 加持的資訊聚合體,而非僅僅模仿小紅書等現有平臺。
Kimi 社區功能的推出是月之暗面在用戶體驗上的最新嘗試,旨在提供更豐富、更互動的內容體驗。通過 AI 技術賦能內容創作和分發,月之暗面希望打造一個具有差異化競爭優勢的內容平臺。
值得注意的是,Kimi 社區功能與之前報道的內容社區產品可能存在關聯,或者是同一產品的不同階段。無論是社區功能還是內容社區產品,都反映了月之暗面在產品創新方面的積極探索,以及對用戶需求的深刻理解。
4 月 26 日,kimi 發布了新的開源項目 —— 一個全新的通用音頻基礎模型 Kimi-Audio,支持語音識別、音頻理解、音頻轉文本、語音對話等多種任務,在十多個音頻基準測試中實現了最先進的 ( SOTA ) 性能。
Kimi-Audio 模型的發布是月之暗面開源戰略的重要組成部分。此前,月之暗面已經開源了視覺語言模型 Kimi-VL 與 Kimi-VL-Thinking,這兩款模型在保持參數規模輕量的同時,展現出極強的性能。開源策略不僅提升了月之暗面的技術影響力,也為 AI 行業的發展做出了貢獻。
階躍星辰
4 月 27 日,階躍星辰正式發布并開源圖像編輯大模型 Step1X-Edit,性能達到開源 SOTA。該模型總參數量為 19B ( 7B MLLM + 12B DiT ) ,具備語義精準解析、身份一致性保持、高精度區域級控制三項關鍵能力;支持 11 類高頻圖像編輯任務類型,如文字替換、風格遷移、材質變換、人物修圖等。
一句話總結:Step1X-Edit,不只能 " 改圖 ",更能 " 聽得懂、改得準、保得住 "。
目前該功能已上線階躍 AI 官網和階躍 AI App
生數科技
4 月 22 日,生數科技最新上線的全新 Vidu Q1 視頻大模型,同時登上多個權威文生視頻、圖生視頻基準測試榜單的第一。該模型可支持生成 1080p 分辨率 5 秒視頻,生成效果清晰穩定,已在網頁端(Vidu.cn)、手機端上線。相較 2.0 版本,Vidu Q1 進一步提升了語義理解、畫質、動作、美學、逼真和絲滑程度,首尾幀銜接更加流暢,上傳兩張圖就能生成一鏡到底的自然運鏡。
4 月 27 日,清華系的智譜 AI 與生數科技宣布達成重大戰略合作,共同推進國產大模型的技術創新與產業落地。作為兩家清華系明星 AI 企業,智譜 AI 和生數科技將基于各自在大語言模型和多模態生成模型的技術積累和優勢,在聯合研發、產品聯動、解決方案整合、行業協同等多方面強強聯合。