文 | 互聯網江湖,作者 | 劉致呈
有一陣子沒聊 AI 了,趁著最有時間,有點看法想跟大家交流。
DeepSeek 誕生之后,各個行業朝氣蓬勃,百度把 DeepSeek 做進了搜索,騰訊把大模型做進了微信,各種行業,各種產品都用上了語言大模型。
一場 AI 革命,已然發生了。
前十年,移動互聯網時代掀起的流量革命,一開始是圖文,然后就是視頻。十年之后的今天,快手、抖音成了全網最大的 " 注意力黑洞 ",虹吸著流量和以流量為生的業態。
往后看十年,AI 亦如是。
DeepSeek 改變了圖文交互、語言交互,今天的 AI 正在改變視頻交互。
從 AI 生文、AI 生圖再到大模型生成視頻,這一進化符合邏輯,也順應歷史周期。問題是,新的周期之下,這場 AI 革命將由誰主導?
快手、抖音:天下英雄 " 惟使君與操耳 "。
今天的視頻大模型玩家,大概有這么幾類:
第一類是巨頭。
比如,騰訊混元視頻大模型、阿里通義萬相。
巨頭布局文生視頻,本質上是布局入口,同時為未來業務端的需求做技術儲備。
騰訊做文生視頻,可以給視頻號做能力儲備,一旦有了真正需求,現成的模型就能拿來用,阿里也是一樣,淘寶越來越內容化,文生視頻這個能力是留個后手。
符合大廠一貫的做派,我可以不用,但每個入口都要布局,每個能力都要面面俱到。如果賽道里有人跑通了,那就砸資源跟進。
語言大模型上,騰訊不也是觀望了很久,直到 DeepSeek 出世,直接整合進微信,摘了最大的果子。
第二類,是 AI 公司。
比如,商湯科技的 V-ME,科大訊飛的訊飛繪鏡。
這些 AI 公司,囿于自身的實力以及資源限制,能夠在文生視頻上投入的資源并不多,更多的精力其實還是在自身業務。做大主營業務是核心 KPI。做視頻大模型,陪跑的概率很大。
第三:短視頻平臺。
短視頻平臺核心就兩家:快手、抖音。
先來說快手。
最近,市面上有這么一則消息:快手成立了可靈 AI 事業部。快手高級副總裁蓋坤擔任可靈 AI 事業部負責人,AI 戰略在快手內部提升至最高級別。
這動作是什么意思呢?
槍擦完了子彈上膛,玩兒真的了。
快手可靈 AI 增長是很猛的。今年 2 月份可靈 AI 累計營業收入已超過 1 億元,今年前三個月,可靈 AI 營收超過了 2024 年總和。商業化這塊兒,可靈 AI 很有爆發力。
快手可靈 AI 生成的視頻質量很高,可靈 AI2.0 的產品能力已經追平甚至部分超過 Sora。目前定位于生產力工具。
生產力技術是最容易變現的。
AI 的路線上,快手走的是當年微軟走過的路子。
AI 這樣的技術,就是新時代的 office,當年微軟靠著 office 、Windows 掙得盆滿缽滿,就是因為軟件作為生產力是一種剛需。
視頻大模型,只有先把生產力變現的邏輯跑通了,才能支撐后續源源不斷迭代。所以,快手內部會上,蓋坤也提到要優先保證模型效果,聚焦 professional creators。
好產品是不缺用戶的。
可靈 AI 這一億的營收背后是 2200 萬用戶,1.5 萬開發者和企業客戶貢獻的。后續還會有多少付費用戶,且看快手后續財報。
只是,這一個億就像是一個標桿,后續視頻大模型能不能觸及商業化這個條線,一個小目標就是個重要的參考系。
與快手不同,抖音走的是另一條路。
最近,豆包大模型團隊組建了 AGI 長期研究團隊,還發布 Seaweed-7B 模型,號稱能在 25 秒內生成高質量視頻。可見在視頻大模型上,抖音還是聚焦技術。
相比快手可靈 AI,字節即夢在視頻生成效果上略顯粗糙,但體驗門檻低。這反映出團隊還在繼續打磨技術產品,并希望通過降低門檻,來把流量池做起來。
字節的優勢是用戶流量池很大,做 AI 也是復制過去成功的路徑。當年抖音做起來,也是走的這個路子。
如今 APP 工廠的優勢還在延續。
說穿了,字節做即夢,重點是鋪量,內核其實還是互聯網產品,并非 " 生產力邏輯 ",而是 " 游戲運營邏輯 "。
策略上即夢 " 先免費 ",讓 99% 的輕度用戶免費爽,然后反饋數據優化版本,用 1% 的重度用戶買單。
是不是跟某些游戲策劃的腦回路很像?
這個策略最大的一個好處是,一方面版本可以繼續升級,又有足夠的用戶交互反饋數據樣本來優化模型,另一方面也能留一點商業化的火種。
但 " 游戲運營 ",本質是個 UGC 的路子。這個策略能不能走下去,關鍵就在于用戶活躍度能不能維持下去。
維持用戶活躍度,其實還是得靠產品,產品好用自然就不缺用戶。所以怎么提升技術,產品能力,是即夢眼下最需要解決的問題。
生產力邏輯也好,游戲運營邏輯也罷,兩家路線各有優劣,就看誰先能跑出來了。
生成式 AI 對于短視頻的意義,如同自動駕駛對于網約車平臺的意義。這個業務做好了,與快手、抖音主業是有強大的協同效應的。
這種協同效應,可能會進一步改寫流量商業的底層規則。
視頻大模型,能不能革流量成本的命?
除了短視頻平臺本身,視頻大模型,還能顛覆很多。
從落地的角度來看,未來視頻大模型的確有兩個重要的方向。
一個是專業化方向。
視頻大模型,最直接的一個價值就是降低影視的生產成本。
Sora 當初之所以備受關注,是因為人們顛覆了人們對于視覺生產力的認知,覺得它能夠顛覆很多行業的生產方式。
比如,Sora 會改變整個好萊塢的成本結構。
一項新的技術、產品,先打透專業領域是一種普遍的規律。歷史上,很多偉大的互聯網產品,都是從 B 端到 C 端,比如最早的聊天軟件 MSN 就是應用在商務端,到后來的 QQ、微信普及,才擴散到 C 端。
當文生視頻大模型強到一定程度,就變成了魔法,就像魔幻小說里寫的,人人都有了 " 言出法隨 " 的能力。
一句話變成了一個鏡頭、一段視頻,這會革了攝影師的命。
比特幣有個口號:"code is law"。代碼即法律。換到視頻生成大模型上就是:"word is movie"。
所述即所見。
放在影視行業里,所述即所見是很有價值的。
愛奇藝的自制劇有聲有色,但問題就是自制劇相當耗費資源,所以成本一直是個問題。
你看愛奇藝年報,2024 年愛奇藝總成本為 219.5 億,內容成本就有 157.1 億。同年凈利潤同比暴跌 60%。天眼查 APP 融資信息顯示,愛奇藝 2018 年上市,直到 2023 年度凈利潤才轉正。
《哪吒 2》,比如《流浪地球》系列,成本都不低。原因就在于整個電影工業化成本的問題。我們的電影行業缺乏工業基礎,好內容的制作成本還是太高了。能解決這個問題的,目前看來只有 AI。
在內容行業,降本這件事兒,是能解放創造力的。
人類歷史中,鐵器的大規模使用降低了農業生產成本,人活著的成本降低了,才有了諸子百家、才會有文藝復興。
這幾年,影視行業很慘,大的影視公司都在降本,從降本來看,視頻大模型是個不錯的方案。成本降下去了,好內容多了,影視消費也才能起得來。大家周末更愿意進電影院了,也能帶動其他服務消費。
至此,服務消費的正循環就有了。
專業化方向之外,視頻大模型的另一個方向是大眾化。
百度有一個產品叫 " 秒噠 ",這個產品可以通過自然語言描述需求快速生成應用程序,門檻很低。這個產品對于編程來說是劃時代的,有了這個產品,普通也能變成了程序員。
對于今天的內容行業而言,文生視頻大模型也是劃時代的。這意味未來的內容創作者數量可能再次井噴,流量基礎設施發生改變。
做內容行業這么多年,我有這么一個感覺:內容這個東西,本質上是一種注意力貨幣,是會發生通縮的。也因此內容越繁榮,供給越多,實際的單流量成本越低。
從圖文、到視頻,各種各樣的內容暴增,單位流量成本是在一直降低的。
比如說,公眾號時代,圖文單位流量比搜索流量便宜。于是,微商崛起。短視頻時代,視頻平臺單位流量比圖文要便宜。然后直播帶貨崛起。
大模型時代,內容供給成本降低,創作數量一定會再次暴增,到那時候,生成視頻的單位流量會不會更便宜?在此基礎上會不會有新商業形態?
我認為這些都是可以期待的。
視頻大模型的價值,一方面在于改變成本,另一方面也在于改變人們創造信息世界的方式。
人們創造信息世界,主要靠三種方式:" 碼字,代碼,拍攝 "。
前兩種已經被大模型顛覆,現在正經歷的是第三種。
現在的互聯網上的大部分視覺內容,要么拍照片,要么拍視頻上傳,太沒有效率了。不符合互聯網的基本邏輯:極致的效率。
AI 天生就是效率機器。
幻方量化為什么能孵化出 DeepSeek,因為金融本身追求極致效率,這與 AI 的基因是相契合的。
不能否認,內容創作是需要創意的,創意這個東西,AI 還不能完全替代人類,但有了這個效率工具,我們一定能加速進入下一個視覺互聯網時代。
大模型生成視頻,只是推動互聯網向下個時代變革的第一步,走出了這一步,也許離真正的元宇宙互聯網就不遠了。
最后,行業格局未定,視頻大模型仍有變數。今天的可靈 AI、即夢、通義萬相,一如當年的微信、飛信、來往。
圖文 AI 領域,過去以為大家都以為最后的王者會是文心一言、會是 ChatGPT,誰承想最后跑出來了 DeepSeek。
DeepSeek 顛覆了很多人的認知,證明大模型賽道,小而精的路線跑得通。那么問題來了,未來視頻大模型,會不會出現像 DeepSeek 一樣的 Gamechanger?
最終,一切都要交給時間去驗證。