藍(lán)鯨新聞 7 月 12 日訊(記者 朱俊熹)時(shí)隔半年," 大模型六小龍 " 之一的月之暗面終于推出新一代基座模型 Kimi K2。據(jù)官方介紹,Kimi K2 是一款具備更強(qiáng)代碼能力、更擅長(zhǎng)通用 Agent 任務(wù)的 MoE 架構(gòu)基礎(chǔ)模型,總參數(shù)達(dá) 1 萬(wàn)億,激活參數(shù)為 320 億。
7 月 11 日發(fā)布并同步開(kāi)源的新模型包括兩個(gè)版本:基礎(chǔ)模型 Kimi-K2-Base、更適合通用聊天和智能體任務(wù)的后訓(xùn)練模型 Kimi-K2-Instruct。在自主編程、工具調(diào)用和數(shù)學(xué)推理相關(guān)的能力評(píng)測(cè)中,Kimi K2 均取得了較優(yōu)的表現(xiàn)。以 SWE-bench Verified、AIME 2025 等評(píng)測(cè)集為例,Kimi-K2-Instruct 的得分超過(guò)了同為開(kāi)源模型的 DeepSeek-V3、阿里 Qwen3,逼近甚至能夠反超 OpenAI GPT-4.1、Anthropic Claude 4 Opus 等領(lǐng)先閉源模型。
結(jié)合 6 月底開(kāi)啟內(nèi)測(cè)的新 Agent"Kimi-Researcher" 不難看出,月之暗面的思路正轉(zhuǎn)向 " 模型即 Agent"。模型自身就集成了自主決策和執(zhí)行任務(wù)的能力,能夠作為智能體解決復(fù)雜任務(wù)。
在官方釋出的用例中,用戶要求 Kimi K2 幫忙規(guī)劃參加 Coldplay 樂(lè)隊(duì)巡演的行程。該模型通過(guò) 17 次工具調(diào)用,涵蓋搜索、日歷、郵箱、航班、餐廳預(yù)訂等環(huán)節(jié),制定出一份完整的機(jī)酒與旅游規(guī)劃,并形成可視化報(bào)告。
智能體能力正在成為國(guó)內(nèi)外大模型廠商競(jìng)相押注的進(jìn)化方向。本周,馬斯克旗下的人工智能初創(chuàng)公司 xAI 發(fā)布新一代大模型 Grok 4,包括單智能體、多智能體兩個(gè)版本,具備工具使用、實(shí)時(shí)搜索等功能。Anthropic 在推出 Claude 4 系列模型時(shí)也強(qiáng)調(diào),在編程、推理和 Agent 方面 " 樹(shù)立了全新標(biāo)準(zhǔn) ",能夠處理復(fù)雜且長(zhǎng)時(shí)間運(yùn)行的任務(wù)。
月之暗面在 Kimi K2 的技術(shù)博客里分享了對(duì)構(gòu)建開(kāi)放智能體智能的看法。其指出,預(yù)訓(xùn)練是智能體智能的關(guān)鍵基礎(chǔ),它讓模型擁有基本的知識(shí)、理解和推理能力,從而在后續(xù)的強(qiáng)化學(xué)習(xí)中更有效地學(xué)習(xí)。但 " 人類數(shù)據(jù)就像是有限的‘化石燃料’ ",因此如何在預(yù)訓(xùn)練階段提升對(duì)有限數(shù)據(jù)的利用效率,成為當(dāng)前 AI 擴(kuò)展的關(guān)鍵挑戰(zhàn)。
而在后訓(xùn)練階段,大模型不再只依賴人類數(shù)據(jù),開(kāi)始從自己的行為和結(jié)果中獲得獎(jiǎng)勵(lì)、進(jìn)行自我優(yōu)化,以實(shí)現(xiàn)超越人類能力的可能。
"Kimi K2 正是在這些洞見(jiàn)之上鍛造而成的。" 月之暗面表示。其同時(shí)強(qiáng)調(diào),Kimi K2 是構(gòu)建通用 Agent 能力的堅(jiān)實(shí)基礎(chǔ),但通用 Agent 還需要更高級(jí)的能力,比如思考和視覺(jué)理解,計(jì)劃未來(lái)為該模型加入這些能力。此外,長(zhǎng)文本處理能力曾是 Kimi 的核心優(yōu)勢(shì),此次 Kimi K2 的上下文長(zhǎng)度為 128k,不及部分新發(fā)布的模型。
值得注意的是,Kimi K2 是國(guó)內(nèi)首個(gè)開(kāi)源的萬(wàn)億參數(shù)級(jí)別模型。此前雖有其他大模型廠商訓(xùn)練出萬(wàn)億參數(shù)模型,如騰訊混元 Turbo、MiniMax abab 6.5 等,但都采取了閉源路線。
在訓(xùn)練 Kimi K2 這樣的萬(wàn)億參數(shù)級(jí)別的大模型時(shí),月之暗面采用了自主創(chuàng)新的 Muon 優(yōu)化器。與傳統(tǒng)的 Adam 優(yōu)化器相比,Muon 在 token 利用效率上表現(xiàn)更優(yōu),能讓大模型學(xué)得更快、更有效率。同時(shí)為解決 Muon 在超大規(guī)模訓(xùn)練時(shí)遇到的不穩(wěn)定問(wèn)題,團(tuán)隊(duì)還提出了 MuonClip 這一穩(wěn)定性增強(qiáng)技術(shù),支撐 Kimi K2 順利完成 15.5 萬(wàn)億 tokens 的預(yù)訓(xùn)練,未出現(xiàn)訓(xùn)練損失值的異常峰值。
自年初 DeepSeek 橫空出世以來(lái),月之暗面雖然陸續(xù)釋出了一些技術(shù)或產(chǎn)品上的更新,但始終未能重拾外界對(duì)其的熱切期待,一度表現(xiàn)得頗為低調(diào)沉寂。而此次 Kimi K2 的發(fā)布,讓這家明星創(chuàng)企終于重回基模舞臺(tái)的聚光燈下,這場(chǎng)牌局仍未見(jiàn)定論。