文 | 腦極體
月初,潞晨科技創(chuàng)始人提出 MaaS(Model as a Service,模型即服務(wù))是 " 最差的商業(yè)模式 ",滿血版 DeepSeek-R1 月虧損超過 4 億元,并宣布停止 DeepSeek API 服務(wù)。
與之形成鮮明對(duì)比的,是云巨頭仍在 MaaS 領(lǐng)域不斷加碼,扛著虧損搶占市場。
華為云上線 DeepSeek V3/R1 滿血版模型,并聯(lián)合昇騰社區(qū)適配國產(chǎn) AI 芯片,提供從芯片到 API 再到應(yīng)用開發(fā)的全棧能力;騰訊將 DeepSeek 全面接入微信等國民級(jí)產(chǎn)品,帶動(dòng)騰訊云推理算力需求增長;阿里云打出 " 前 100 萬 token 免費(fèi) " 的旗號(hào),與其他云廠商的限時(shí)免費(fèi)政策形成直接競爭,并宣布未來三年將投入超過 3800 億元用于云和 AI 基礎(chǔ)設(shè)施。
一邊是中小廠商的悄然隱退,一邊是云巨頭的大肆進(jìn)攻,2025 年云市場競爭,由 MaaS 模式的商業(yè)化分野,寫下開篇。
MaaS(模型即服務(wù))是公有云廠商的一種創(chuàng)新服務(wù)模式,不僅提供 DeepSeek API 調(diào)用,還涵蓋模型訓(xùn)練、微調(diào)、部署等全生命周期服務(wù)。用戶無需關(guān)注底層算力、框架等復(fù)雜細(xì)節(jié),通過簡單調(diào)用就能接入 DeepSeek-R1 這樣的先進(jìn)模型,根據(jù)需求靈活選擇和組合服務(wù)。
各大云廠商紛紛接入 DeepSeek API,迅速帶飛了 MaaS 服務(wù)的用戶數(shù)與使用量。
一篇 DeepSeek 發(fā)布的《V3/R1 推理系統(tǒng)概覽》技術(shù)論文,首次披露其以 H800 顯卡 2 美元 / 小時(shí)的租賃成本計(jì)算,理論日收入達(dá) 56.2 萬美元,成本利潤率高達(dá) 545%。既然如此,為什么 DeepSeek API 會(huì)讓云廠商持續(xù)虧損,也讓 MaaS 成為部分云廠商眼中 " 最差的商業(yè)模式 "?
第一,高昂的隱性成本尚未計(jì)入。以 DeepSeek-R1 為例,其滿負(fù)荷運(yùn)行時(shí),單日需處理 1000 億 token,僅 GPU 租賃成本就高達(dá)每月 4.5 億元。
除了機(jī)器成本,云廠商還需承擔(dān)存儲(chǔ)、運(yùn)維、冗余算力等附加成本。AI 模型的算力需求并非穩(wěn)定線性增長。用戶可能在白天集中調(diào)用服務(wù),深夜需求驟降,但為了應(yīng)對(duì)流量峰值,不得不預(yù)留數(shù)倍冗余算力,讓中小廠商不堪重負(fù)。以硅基流動(dòng)為例,日均調(diào)用量千億 token,遠(yuǎn)低于大廠的萬億級(jí)規(guī)模。這種 " 小水管 " 式的調(diào)用模式,導(dǎo)致算力資源無法通過 " 削峰填谷 " 實(shí)現(xiàn)高效復(fù)用,服務(wù)器在業(yè)務(wù)低峰期大量閑置,進(jìn)一步推高邊際成本。
第二,MaaS 作為企業(yè)服務(wù)高度依賴服務(wù)穩(wěn)定性與資源靈活調(diào)度能力。MaaS 服務(wù)的穩(wěn)定性要求企業(yè)能夠應(yīng)對(duì)突發(fā)的流量波動(dòng)。以電商大促場景為例,AI 推理請(qǐng)求量可能在短時(shí)間內(nèi)激增數(shù)十倍,若算力資源無法動(dòng)態(tài)擴(kuò)容,將直接導(dǎo)致服務(wù)延遲甚至崩潰。而中小廠商缺乏多云調(diào)度能力,資源利用率低下。
第三,更致命的是,云巨頭靠 " 價(jià)格戰(zhàn) " 在 MaaS 市場攻城略地,大部分中小廠商的定價(jià)空間被徹底鎖死。即便部分企業(yè)嘗試通過開源或垂直領(lǐng)域定制化服務(wù)尋求突破,但受限于生態(tài)協(xié)同能力和數(shù)據(jù)飛輪效應(yīng)薄弱,其調(diào)用量仍無法支撐算力資源的規(guī)?;瘮備N,最終陷入 " 用戶增長越慢,成本壓力越大 " 的惡性循環(huán)。
高昂的硬件投入與低價(jià) API 收費(fèi),形成剪刀差,導(dǎo)致 " 規(guī)模不經(jīng)濟(jì) " 的怪圈,進(jìn)一步加重了 AI 行業(yè)的馬太效應(yīng)。大廠加快布局時(shí),中小廠則被迫離席。
答案藏在三個(gè)關(guān)鍵詞里:算力托底、生態(tài)協(xié)同、AI 戰(zhàn)略。
算力儲(chǔ)備與彈性調(diào)度方面,云巨頭可以利用全球數(shù)據(jù)中心和自研芯片,實(shí)現(xiàn)算力資源的高效復(fù)用,保障在線推理服務(wù)穩(wěn)定運(yùn)行。華為云依托昇騰 910B 芯片和全球數(shù)據(jù)中心網(wǎng)絡(luò),能夠?qū)崿F(xiàn)高效穩(wěn)定的訓(xùn)練和推理任務(wù)。百度云則憑借昆侖芯片和錯(cuò)峰調(diào)度技術(shù),結(jié)合自研的混合精度訓(xùn)練框架,單卡吞吐量達(dá)到行業(yè)領(lǐng)先水平。
生態(tài)協(xié)同是另一大優(yōu)勢。云巨頭將大模型接入現(xiàn)有的成熟產(chǎn)品,能夠增強(qiáng)用戶粘性,為 DeepSeek API 服務(wù)提供了更多落地場景和多元變現(xiàn)方式。背靠騰訊生態(tài),騰訊云 DeepSeek API 服務(wù)可通過 C 端流量攤薄成本,同時(shí)以私有化部署和定制模型服務(wù)向企業(yè)端盈利?;鹕揭鎰t通過 " 火山方舟 " 平臺(tái)匯聚第三方大模型,吸引開發(fā)者構(gòu)建應(yīng)用生態(tài)。
MaaS 競爭中云巨頭在優(yōu)勢基礎(chǔ)上,以短期虧損換取長期規(guī)模優(yōu)勢。DeepSeek API 作為當(dāng)下最火的服務(wù),成了一場不能掉隊(duì)的戰(zhàn)役。
歷經(jīng) DeepSeek API 服務(wù)的激烈角逐,云廠商的 MaaS 商業(yè)化步伐開始出現(xiàn)分野。
對(duì)大廠而言,MaaS 是必須占領(lǐng)的技術(shù)高地,其潛在價(jià)值遠(yuǎn)超短期盈利。即便短期虧損,它們也輸?shù)闷稹⒌鹊米 ?/p>
一是通過支持國產(chǎn)開源模型,推動(dòng) AI 技術(shù)標(biāo)準(zhǔn)制定,鞏固行業(yè)地位;二是以 DeepSeek 等優(yōu)質(zhì)模型為入口,吸引開發(fā)者構(gòu)建應(yīng)用生態(tài),形成 " 模型應(yīng)用用戶 " 閉環(huán);三是通過海量 API 調(diào)用數(shù)據(jù)反哺模型迭代,形成技術(shù)數(shù)據(jù)的正向循環(huán)。
例如,優(yōu)刻得通過模型蒸餾技術(shù),將大型復(fù)雜模型的知識(shí)轉(zhuǎn)移到小型高效模型中,推出 DeepSeek 一體機(jī),實(shí)現(xiàn)低門檻模型微調(diào)和多場景適配,大幅降低了企業(yè)使用 AI 的門檻。首都在線則通過優(yōu)化并行策略和算法,顯著提升了 AI 推理服務(wù)的經(jīng)濟(jì)效益。此外,并行科技在科研云領(lǐng)域,通過提供高性能、低成本的算力租賃服務(wù),滿足了科研機(jī)構(gòu)對(duì)大規(guī)模計(jì)算資源的需求。
一言蔽之,MaaS 的本質(zhì)是場耐力賽:短期看成本,長期看生態(tài)。
這場競賽的最終贏家不僅取決于技術(shù)實(shí)力和資金儲(chǔ)備,更在于能否找到精準(zhǔn)的場景和可持續(xù)的盈利模式。
當(dāng)前,MaaS 市場格局遠(yuǎn)未穩(wěn)固,誰能率先完成 " 技術(shù)-數(shù)據(jù)-場景 " 的閉環(huán),誰就能在 AI 時(shí)代掌握話語權(quán),換取對(duì) AI 時(shí)代 " 水電煤 " 基礎(chǔ)設(shè)施的控制權(quán)。