本期內容的作者是一位特殊的朋友。莊明浩,互聯網行業從業者,早期在經緯中國做投資,現任趣丸科技副總裁兼首席戰略官,去年他開了一檔播客欄目《屠龍之術》,產出了眾多高質量行業報告(PPT)。
本期內容就基于其對 Manus 掀起的 AI Agent 熱潮的觀察。
值得注意的是,繼國內熱議之后,本周 Manus 在海外也再次掀起討論,推特聯合創始人 Jack Dorsey 用 " 杰出(excellent)" 來評價 Manus。AI 資訊平臺 The RundownAI 的創始人 Rowan Cheung 在 X 平臺上轉發了 Manus 的介紹視頻并寫道:" 我認為中國的第二個 DeepSeek 時刻已經到來。"
以下是莊明浩的播客內容,播客首發于小宇宙 App《屠龍之術》,文章經鳳凰網科技節選編輯發布。
作者 tips:距離我上一次講述關于 DeepSeek 內容的 PPT 其實才過去半個多月,回頭看之前的內容,我自己覺得關于 AI Agent 的部分其實有些假大空。因此當我看到 Manus,并且深度體驗了之后,我知道那個之前一直飄在空中的 Agent 概念終于有了一個實打實的可以看到的東西,這或許也是 Manus 的意義所在。
接下來我們就來看看,Manus 究竟撥開了哪些迷霧。
一、OpenAI 定義的 AGI L1-L5
L1(chatbot):以 ChatGPT 為代表,核心能力是 " 對話 ",用戶感知到機器能流暢地 " 吐出文字 "。但問題顯著:依賴復雜提示詞工程,輸出結果不穩定,存在幻覺等問題。
L2(推理):OpenAI o1、DeepSeek R1 等,通過強化學習對結果激勵(而非過程干預),實現邏輯推理能力躍升。典型場景如數學解題、代碼糾錯,用戶感知到 "AI 會思考 "。
L3(Agent):暫時還處于探索期,核心特征是自主規劃、調用工具、交付成果。用戶感知到 "AI 在工作 ",例如自動分析財報、編寫程序、生成調研報告。
Perplexity 等產品的本質:高級版 " 搜索引擎 + 摘要生成器 ",依賴大模型重組信息。
垂直化悖論:醫療 / 法律等專業搜索工具面臨數據孤島問題,且無法突破 " 檢索 - 呈現 " 模式,與 Agent 的 " 執行 - 交付 " 有本質差異。
AI 編程是不是 coding Agent?
搜索與編程的啟示:當前很多 AI 應用其實都面臨套殼質疑:依賴大模型能力,難以建立垂直壁壘。但 Agent 需突破 " 工具組合 " 思維,轉向自主決策的通用性。
給 AI 一個虛擬機:為 AI 配備完整數字環境(瀏覽器、數據庫、編程接口),使其像人類員工一樣操作設備。例如 Manus 執行 " 分析 YouTube 視頻中企鵝種類 " 任務時,會暫停視頻、截圖識別、統計幀數,全程無需人類干預。
零預設工作流:與 AutoGPT 等早期 Agent 工具不同,Manus 不內置任何任務模板(如 " 寫郵件 " 流程)。其核心是通過強化學習,讓模型自主探索工具組合方式。例如在 " 小米 su7" 任務中,模型自主決定先搜索維基百科、再調用設計模板、最后生成 PDF。
成本與商業化挑戰
算力消耗暴增:單個復雜任務(如分析 100 家公司財報)成本達 2-20 美元,相較于傳統對話可能增加 100 甚至 1000 倍。若用戶日均使用 Agent 2 小時,年算力成本可能會超過當前 C 端付費意愿。
新指標 AHPU(Agentic Hours Per User):替代傳統 DAU/ 留存率,直接衡量用戶依賴度,但如何將使用時長轉化為收入(訂閱制 / 任務計費)仍是難題。
四、Manus 的具體體驗效果到底如何?
當然,也會有一些不好的地方,比如讓它做一個帶截圖的 PPT,Manus 會特別簡單粗暴地直接截一個網頁的圖,讓它做示意圖,畫了一個非常難看的簡筆畫等等,但無論如何,看上去 Manus 似乎都在很認真地干活,只是干得不好。
五、行業暴論:創新還是泡沫?
" 套殼 " 爭議的本質:首先,"Manus 只是套殼 " 的觀點是傲慢的:工程化能力(如瀏覽器控制、多任務調度)和產品設計(用戶感知工作流) 構成壁壘。類比 Perplexity 早期被質疑,最終以體驗和場景定義階段性也獲得了不錯的用戶量和收入。
大廠與創業者的博弈:頭部公司必將跟進 Agent(如最近剛剛發布新更新的阿里 - 夸克),但創業者窗口期仍在。技術 + 產品的雙敘事 是關鍵:Manus 通過 " 組合式創新 "(搜索 / 瀏覽器 / 編程經驗積累)實現爆發,驗證了黑暗森林法則——敢為者先得紅利。
給普通人的啟示:AI 時代的生存法則
用戶需要成為 " 好老板 ":普通用戶需學會精準提需求、分配任務、過程干預,與 AI 形成協作閉環。Agent 的價值不在于完美執行,而在于降低復雜任務門檻。