日本一区二区三区久久-日本一区二区三区久久精品-日本一区二区三区日本免费-日本一区二区三区在线观看视频-国产不卡免费视频-国产不卡视频

關于ZAKER 合作
時代財經 昨天

00 后上場!MetaGPT 團隊親述 3 小時復刻 Manus 歷程,AI 智能體風暴加速來襲

本文來源:時代財經 作者:龐宇

圖源:視覺中國

" 開源永存。" 這是 MetaGPT 研究員、OpenManus 合作者向勁宇在面向時代財經等的分享中,留下的結束語。

近一周來,全球首款通用 AI 智能體—— Manus 爆火,成為科技圈持續熱議的話題。

與此同時,Manus 的開源替代方案如雨后春筍般冒出。國內初創公司 DeepWisdom 的 MetaGPT 團隊,僅用 3 小時便利用開源框架復刻出 OpenManus;開源社區 CAMEL-AI 團隊也 "0 天 " 復刻出 Manus 通用智能體 OWL ……持續涌現的復刻浪潮似乎也向外界傳遞了一個信息:Agent(智能體)的門檻并非高不可攀。

Manus 的 " 護城河 " 究竟有多深?Agent 賽道的終極競爭力是什么?當業內普遍認為 "2025 年有望成為 AI Agent 爆發元年 " 時,這個賽道還有哪些待解難題?

近日,OpenManus 核心作者向時代財經等分享了其中的故事,并給出了他們對于 Agent 的理解。

3 小時復刻 Manus 團隊:00 后挑大梁

Manus 發布當晚,向勁宇感受到身邊的人都很興奮," 大多數人的興奮似乎來自于 AI 能使用電腦了。"

但在他看來,這樣的功能在業內認識里并不是特別稀奇。

" 比如 Planning(規劃)的能力在我們 2024 年的開源工作 Data Interpreter(數據解釋器)工作中已經有了相關的實現;而 Computer Use 和 Browser Use 等功能也在 OpenHands(之前被稱為 OpenDevin,一個由 AI 提供支持的軟件開發代理平臺)以及智譜 AutoGLM 等各個工作中均有實現。" 向勁宇說。

他判斷,僅從一個 demo(試用版)級別的實現來說," 搓 " 一個 Manus 開源版本給大家用 " 應該不是很難 "。

MetaGPT 研究員、OpenManus 核心作者梁新兵迅速響應,并在第二天(3 月 6 日)一早根據彼時已知信息對 Manus 做了一次完整調研,包括技術細節和分析。當天晚上下班后,向勁宇召集團隊(向勁宇、梁新兵、張佳釔、于兆洋、洪思睿)討論了 Manus 的產品形態和技術路線,決定加班趕出開源版本。

僅用了 3 小時左右," 大概(晚上)11 點的時候,我們就把第一個版本合并開出去,然后掛到 GitHub 上面了。" 向勁宇回憶。

發布不到 1 天,該項目已在 GitHub 上收獲了 7000 多顆星星。" 當時沒想過 OpenManus 會爆火。" 梁新兵說。

作為 OpenManus 核心作者,梁新兵研究生畢業于華東師范大學,之前曾參與爆火的 AI Agent 數據科學家 Data Interpreter 的開發工作。而向勁宇本科就讀于西南交通大學應用物理系,去年,讀大四的他和隊友一起使用 GPT-4 與 Claude 3 組成多智能體的方案,讓 AI 分飾多個角色、相互驗證來完成答題步驟,獲得了阿里巴巴數學競賽 AI 賽道全球第二名。二人均是 00 后,同時在 2024 年 7 月加入 MetaGPT 團隊。

直到現在,MetaGPT 團隊還對 OpenManus 引發的大量討論,感到恍惚。

在 OpenManus 發酵了一天后," 早上十點半醒過來,看到微信三十多個添加好友,我就知道應該爆了,我想繼續安心地補個瞌睡,但是怎么都睡不著,拿起手機,沒想到消息已經回不過來了。" 由錦秋基金牽頭舉辦的分享會上,向勁宇向時代財經等分享道。

Manus 是一款基于 AI 核心模型所開發的 AI Agent(人工智能代理)。所謂 AI Agent,其往往需要以大語言模型作為核心,并疊加規劃(Planning)、記憶(Memory)、工具調用(Tools),從而通過解決任務邏輯連貫性的問題完成特定的跨系統任務。

據 MetaGPT 團隊解構分析 Manus 來看,Manus 是一個多智能體系統,它首先使用 Planning Tool 做規劃,形成一個包含多個任務的線性結構的計劃,然后順序執行每一個任務,并動態分配給相應的 Agent。Agent 在執行每個任務的過程中,以 ReAct(Reason+Act,推理和行動)循環的形式調用工具以完成每一個任務。

3 小時便復刻了 Manus,MetaGPT 團隊是怎么做到的?

向勁宇認為:" 一個極簡的 Agent 框架,應該是可插拔的 Tools(工具)和 Prompt(提示詞)的組合,之后我們沿著這個思路,寫了一個完整的 Agent 迷你框架。"

據他介紹,決定一個 ReAct Agent 效果的關鍵是提示詞引導和工具使用。在 OpenManus 中,Prompt 控制了 Agent 整體的行為邏輯,Tools 給定了 Agent 的行動空間,二者被定義就能完整詮釋一個 ReAct Agent。

" 可插拔的優點是可組合,我可以把幾個不同場景下的 Tools 組合到一起來創造一個新的 Agent,定義也很方便,不需要單獨寫內部邏輯,只需要修改動作空間(Tools)。" 向勁宇進一步解釋。

在他看來," 我們的工作是把抽象做得更干凈。提供豐富的工具集合,支持多種 Agent 通過裝備工具集來靈活擴展在不同場景下的能力。"

這其中,規劃能力很重要。因此,OpenManus 繼承了 Manus 的規劃優勢,通過 Planning Tool 實現任務分解,可以處理現實世界中的復雜問題。

MetaGPT 團隊分享的 OpenManus 工作流程

談及 OpenManus 后續工作,梁新兵表示,接下來將從增強 Planning 能力、引入標準化評測、拓展模型適配(從 Claude-3-5 擴展到 DeepSeek V2.5)、實現容器化部署等諸多方面來提升 OpenManus 的效果。

OpenManus 是否能超越 Manus?

"Manus 產品交互做得挺好的,有很多技術也值得學習。目前 OpenManus 效果還很有限,我們還沒有單獨調效果。OpenManus 前期目標打算達到原始 Manus 的相同效果,后續會依靠龐大的開源社區不斷優化。" 梁新兵希望,這些優化能給 OpenManus 帶來更高的智能涌現。

Manus 的 " 護城河 " 有多深?

據 Manus 官方網站介紹,Manus 能一鍵幫用戶做旅行規劃、股票分析、做 PPT、財報分析等工作,涵蓋研究、生活、數據分析、教育、生產效率等多個領域。

在官方放出來的視頻中,Manus 的表現也令人驚艷,能完全自主地完成從規劃到執行的全流程。例如,在特斯拉股票分析任務中,Manus 能在 45 秒內完成 " 數據抓取→建模→報告生成 " 的全鏈路操作。

簡單而言,用戶只需要輸入簡單的提示指令,一段時間之后,便可以得到一個完整的成品交付。

但 MetaGPT 團隊僅用 5 人 3 小時,便通過開源框架復刻出 OpenManus;開源社區 CAMEL-AI 團隊也實現 "0 天復刻 ",推出 OWL 并直接開源部分模塊。這些都讓 "Manus 缺乏技術壁壘 " 的質疑聲不斷。

據此前媒體報道,Manus 的模型能力來自 Anthropic 的 Claude。3 月 10 日,Manus 創始人季逸超在社交平臺透露,Manus 產品使用了不同的基于阿里千問大模型(Qwen)的微調模型。

有市場人士認為,隨著大模型能力的持續增強,大模型會逐步將更多工具鏈的功能內化。未來大模型便能獨立實現 Manus 期望達成的效果,而無需再繁瑣地調用外部工具鏈。因此 Manus 耗費大量精力所創造的價值,大概率會被大模型的內生能力的增長所淹沒。

一名 AI 領域的投資人士林亞秋(化名)也向時代財經表達了類似的觀點," 當大模型能力變強,未來一些高頻場景,有可能模型本身就能覆蓋,大模型公司可能也會內置這些 Agent。"

Agent 誕生的必要前提是基座模型的性能提升,這是行業內的共識,但為什么率先獲得注意力的會是 Manus?

"Manus 能最先跑出來,一方面是因為從今年春節前后開始,推理模型的技術取得了比較大的進展,這件事對 Manus 有非常大的幫助,因為只有在推理模型成熟的情況下才有機會做。" 林亞秋向時代財經表示,"Agent 有規劃、工具調用和記憶這三個特點,每一點上的成功率都會影響它最終的成功率。而推理模型變強會令第一步也是最重要的一步——規劃能力提升。"

另一方面,Manus 創作團隊本身也具備一定的實力。" 他們的產品能力非常強,非常懂用戶的需求,且在功能實現上做得很好。" 林亞秋說。據她了解,Manus 創作團隊在之前的兩年里一直在 " 產品能力 " 上表現得很好,這是他們團隊擅長的事情。

實際上,就算 3 小時實現復刻 Manus 的 MetaGPT 團隊,也是基于 MetaGPT 在 AI 場景的自動化和智能體框架上多年的技術積累。

" 從技術方案上來說,Manus 使用了大量有業內共識的核心基礎技術。但 Manus 本身是很好的作品,它在用戶示例中展示了卓越的用戶體驗,以及很不錯的整體交互效果。他們團隊實現了復雜的規劃,包括他們自己進行過 Post Train 的模型,提供了更好的效果和交互,也給我們提供了很多發展思路。"MetaGPT 團隊表示。

正如 Manus 團隊的核心理念 "Less structure, more inteligence(更少的結構,更多的智能)",強調給予 AI 更多自主權以決定如何使用工具和完成任務,這種理念也體現在 Manus 的產品特性上,讓用戶體驗更為出色。

事實上,Manus 團隊已聲明,當前的 Manus 距離正式版想交付給大家的體驗還差很遠。" 像模型幻覺、交付物友好度、運行速度等方面都還有很大的提升空間。"

Manus AI 團隊產品負責人張濤(HideCloud),同時也是 Monica.im 產品合伙人,近日在朋友圈發文表示,過去的十幾個小時對于團隊來說無異于一場充滿各種意外的冒險,團隊低估了大家的熱情。這本是一個產品探索過程中的階段性收獲分享,因此服務器資源是對標 demo 水平來準備,不曾想過會引起巨大波瀾。

Agent 元年,成本與技術難題仍待解

"2025 年有望成為 AI Agent 元年 " 似乎已經是行業內的一個共識。

開源證券指出,隨著大模型性能提升與成本的降低,以及能夠在消費級顯卡部署帶來的門檻降低,為 AI 大規模應用落地打下了堅實基礎。Manus 的發布有望加快 AI Agent 落地,重塑各行業工作流程。

華泰證券亦指出,Manus AI 底層由多模型驅動,通過高效的工程化編排,有效滿足了 Agent 交互過程中的規劃、自主、準確三大核心需求,標志著 Agent 應用實現 Action 環節的關鍵突破。Agent 應用已進入工程化落地關鍵階段,有望在 2025 年進入放量元年。

Manus 等 AI Agent 的誕生依賴于人們在基座模型上的不斷投入和不斷進化。但還有一個事實是," 隨著大模型能力的增加,許多問題的解決成功率會提高,但問題本身并不會消失。"MetaGPT 研究員、OpenManus 合作者之一的洪思睿指出。

" 人類社會有很多非常復雜和長尾的問題,包括我們正在解決的機器學習、代碼修復,以及通過搜索組合結果提供給用戶的問題。這些仍需要大量技術工作來提升大模型的效果,包括解決幻覺問題。" 洪思睿補充道。

一方面,大模型幻覺依然困擾著 AI 落地。另一方面,業內目前在規劃、記憶、工具調用上仍存在一些難點有待解決。

目前 Agent 在規劃方面的進步,主要取決于模型本身能力的提升,另外也依靠外部結構的輔助,即在 Agent 的層面上加入更加復雜的結構進行輔助規劃。

在工具上,如 OpenManus 目前主要還是使用一些現有的開源工具," 比如 Claude Computer 和 Browser 等。" 有其他團隊開展的 Browser 使用相關工作表明,僅憑這兩個工具基本上就能完成許多任務,已經初步形成了 Manus 的雛形。而據 MetaGPT 團隊設想,未來可能增加一種賦予 Agent 自己創建工具的能力。

不過,在洪思睿看來,大模型或者 Agent 使用工具本身并不新奇。" 但是隨著工具的數量逐步增加,其中的技術難點也隨之而來:如果有眾多相似工具,Agent 在解決同一任務時如何做出準確決策,選擇最合適的工具;以及工具的參數定義不合理或不夠明確時,導致大模型在生成調用工具決策出錯等等。這些都是工具使用環節中需要解決的問題。"

此外,在記憶(Memory)環節上,MetaGPT 團隊認為,目前 Agent 在處理復雜、長程任務(例如瀏覽網頁時,網頁信息可能非常長)時,如何壓縮上下文并存儲到記憶中,是一個非常具有挑戰性的問題,并且要確保壓縮后關鍵的信息不會被修改或遺漏。

Memory 和推理效率、成本直接相關。" 如果我們不考慮 Memory,不做壓縮和任何處理,目前的大模型仍然可以處理,但這樣帶來的問題并非質量下降,而是會顯著增加處理時間和成本,嚴重影響用戶體驗。" 梁新兵說。

如何降本增效,是大量的應用廠商首要考慮的問題,也是需要持續優化的方向。

據 Manus 團隊此前透露,目前 Manus 單任務成本 2 美元,已經做了大量優化,但可能對很多用戶來說還是會難接受。" 對于商用來說,(這個價格)還是挺貴的。如果沒有足夠的群眾基礎以及轉化率,可能商業化上就不一定會特別成功。" 林亞秋向時代財經表示。

當一個 Agent 產品推出后,開源社區很快涌現出功能相近的復刻項目,這引發了行業對 Agent 領域核心競爭力的深度思考:該賽道的終極競爭壁壘究竟何在?

在洪思睿看來,Agent 商業化的重要比拼在于將真實場景中的任務和效果,包括個性化的功能,做到極致。

" 目前學術界的許多工作,無論是針對 SWEBench、GAIA,還是其他的 Agent 測試,任務成功率依然有限。如果這種相對微小的任務標準對應到真實的商業場景中,不同用戶面對不同難度的問題,目前 Agent 的成功率還相當受限。"

因此,她認為," 無論是編程任務,還是數據收集和報告生成任務,如果能夠針對各種各樣的用戶問題和場景做到極致,將成功率提升到令人滿意的程度,真正實現 Agent 達到人們當前所期望的行動能力,用戶才會持續使用 Agent。"

同時,展望 Agent 的未來,洪思睿認為," 在真正有效解決用戶實際需求方面,多智能體的商業前景是明確且強烈的 ",例如從代碼生成——這個 Agent 技術目前能較好解決的場景來看," 目前用戶在這方面的付費意愿也是較高的。"

談及 Manus 的爆火對于行業帶來的信心,林亞秋說,"Manus 獲得巨大關注,很大程度上加速了對大眾的科普:AI Agent 未來可以做很多繁瑣的事務;同時吸引了很多潛在用戶群。但從投資人和創業者的角度來看,早在 2023 年左右大家就認為 Agent 一定是就大語言模型之下能產生的非常重要的應用方向。現在大家信心提升的一個重要原因在于模型進步的速度,接下來會在 Agent 技術、產品化方面做探索。"

據她了解,市場上有很多團隊在推理模型成功提升能力之后,正在快速做產品化。" 估計今年還會有更多的類似的一些產品出現。"

相關標簽

相關閱讀

最新評論

沒有更多評論了
主站蜘蛛池模板: 免费播放巨茎人妖不卡片 | 美女张开腿让男人操 | 国产三级做爰高清视频a | 亚洲综合色dddd26 | 日韩三及片 | 99香蕉网| 免费观看a视频 | 欧美午夜不卡在线观看最新 | 日本成人不卡视频 | 久久er热在这里只有精品85 | 亚洲男人在线 | 日本成aⅴ人片日本伦 | 国产精品一区二区三区久久 | 日本www免费视频网站在线观看 | 亚洲欧美影院 | 久久毛片网站 | 青青青青爽视频在线播放 | 国产精品久久久久影院 | 国产一区国产二区国产三区 | 亚洲欧美不卡中文字幕 | 精品精品国产高清a毛片 | 高清午夜看片a福利在线观看琪琪 | 亚州黄色网址 | 欧美h版成版在线观看 | 亚洲加勒比久久88色综合1 | 欧美片网站免费 | 一级成人 | 欧美特级一级毛片 | 亚洲精品成人一区二区aⅴ 亚洲精品成人一区二区www | 在线成人精品国产区免费 | 奇米888四色在线精品 | 碰碰久久 | 高清一区二区三区免费 | 亚洲精品人成在线观看 | 日本在线亚州精品视频在线 | 国产免费一区二区三区免费视频 | 黄色天堂 | 加勒比一本大道香蕉在线视频 | 亚洲国产天堂在线网址 | 国产三级日本三级在线播放 | 特级毛片www欧美 |