日本一区二区三区久久-日本一区二区三区久久精品-日本一区二区三区日本免费-日本一区二区三区在线观看视频-国产不卡免费视频-国产不卡视频

藍(lán)鯨財(cái)經(jīng) 12小時(shí)前

月之暗面重返基模戰(zhàn)場(chǎng)：發(fā)布首個(gè)開(kāi)源萬(wàn)億模型，押注“模型即 Agent ”

圖片來(lái)源：視覺(jué)中國(guó)

藍(lán)鯨新聞 7 月 12 日訊（記者朱俊熹）時(shí)隔半年，" 大模型六小龍 " 之一的月之暗面終于推出新一代基座模型 Kimi K2。據(jù)官方介紹，Kimi K2 是一款具備更強(qiáng)代碼能力、更擅長(zhǎng)通用 Agent 任務(wù)的 MoE 架構(gòu)基礎(chǔ)模型，總參數(shù)達(dá) 1 萬(wàn)億，激活參數(shù)為 320 億。

7 月 11 日發(fā)布并同步開(kāi)源的新模型包括兩個(gè)版本：基礎(chǔ)模型 Kimi-K2-Base、更適合通用聊天和智能體任務(wù)的后訓(xùn)練模型 Kimi-K2-Instruct。在自主編程、工具調(diào)用和數(shù)學(xué)推理相關(guān)的能力評(píng)測(cè)中，Kimi K2 均取得了較優(yōu)的表現(xiàn)。以 SWE-bench Verified、AIME 2025 等評(píng)測(cè)集為例，Kimi-K2-Instruct 的得分超過(guò)了同為開(kāi)源模型的 DeepSeek-V3、阿里 Qwen3，逼近甚至能夠反超 OpenAI GPT-4.1、Anthropic Claude 4 Opus 等領(lǐng)先閉源模型。

結(jié)合 6 月底開(kāi)啟內(nèi)測(cè)的新 Agent"Kimi-Researcher" 不難看出，月之暗面的思路正轉(zhuǎn)向 " 模型即 Agent"。模型自身就集成了自主決策和執(zhí)行任務(wù)的能力，能夠作為智能體解決復(fù)雜任務(wù)。

在官方釋出的用例中，用戶要求 Kimi K2 幫忙規(guī)劃參加 Coldplay 樂(lè)隊(duì)巡演的行程。該模型通過(guò) 17 次工具調(diào)用，涵蓋搜索、日歷、郵箱、航班、餐廳預(yù)訂等環(huán)節(jié)，制定出一份完整的機(jī)酒與旅游規(guī)劃，并形成可視化報(bào)告。

智能體能力正在成為國(guó)內(nèi)外大模型廠商競(jìng)相押注的進(jìn)化方向。本周，馬斯克旗下的人工智能初創(chuàng)公司 xAI 發(fā)布新一代大模型 Grok 4，包括單智能體、多智能體兩個(gè)版本，具備工具使用、實(shí)時(shí)搜索等功能。Anthropic 在推出 Claude 4 系列模型時(shí)也強(qiáng)調(diào)，在編程、推理和 Agent 方面 " 樹(shù)立了全新標(biāo)準(zhǔn) "，能夠處理復(fù)雜且長(zhǎng)時(shí)間運(yùn)行的任務(wù)。

月之暗面在 Kimi K2 的技術(shù)博客里分享了對(duì)構(gòu)建開(kāi)放智能體智能的看法。其指出，預(yù)訓(xùn)練是智能體智能的關(guān)鍵基礎(chǔ)，它讓模型擁有基本的知識(shí)、理解和推理能力，從而在后續(xù)的強(qiáng)化學(xué)習(xí)中更有效地學(xué)習(xí)。但 " 人類數(shù)據(jù)就像是有限的‘化石燃料’ "，因此如何在預(yù)訓(xùn)練階段提升對(duì)有限數(shù)據(jù)的利用效率，成為當(dāng)前 AI 擴(kuò)展的關(guān)鍵挑戰(zhàn)。

而在后訓(xùn)練階段，大模型不再只依賴人類數(shù)據(jù)，開(kāi)始從自己的行為和結(jié)果中獲得獎(jiǎng)勵(lì)、進(jìn)行自我優(yōu)化，以實(shí)現(xiàn)超越人類能力的可能。

"Kimi K2 正是在這些洞見(jiàn)之上鍛造而成的。" 月之暗面表示。其同時(shí)強(qiáng)調(diào)，Kimi K2 是構(gòu)建通用 Agent 能力的堅(jiān)實(shí)基礎(chǔ)，但通用 Agent 還需要更高級(jí)的能力，比如思考和視覺(jué)理解，計(jì)劃未來(lái)為該模型加入這些能力。此外，長(zhǎng)文本處理能力曾是 Kimi 的核心優(yōu)勢(shì)，此次 Kimi K2 的上下文長(zhǎng)度為 128k，不及部分新發(fā)布的模型。

值得注意的是，Kimi K2 是國(guó)內(nèi)首個(gè)開(kāi)源的萬(wàn)億參數(shù)級(jí)別模型。此前雖有其他大模型廠商訓(xùn)練出萬(wàn)億參數(shù)模型，如騰訊混元 Turbo、MiniMax abab 6.5 等，但都采取了閉源路線。

在訓(xùn)練 Kimi K2 這樣的萬(wàn)億參數(shù)級(jí)別的大模型時(shí)，月之暗面采用了自主創(chuàng)新的 Muon 優(yōu)化器。與傳統(tǒng)的 Adam 優(yōu)化器相比，Muon 在 token 利用效率上表現(xiàn)更優(yōu)，能讓大模型學(xué)得更快、更有效率。同時(shí)為解決 Muon 在超大規(guī)模訓(xùn)練時(shí)遇到的不穩(wěn)定問(wèn)題，團(tuán)隊(duì)還提出了 MuonClip 這一穩(wěn)定性增強(qiáng)技術(shù)，支撐 Kimi K2 順利完成 15.5 萬(wàn)億 tokens 的預(yù)訓(xùn)練，未出現(xiàn)訓(xùn)練損失值的異常峰值。

自年初 DeepSeek 橫空出世以來(lái)，月之暗面雖然陸續(xù)釋出了一些技術(shù)或產(chǎn)品上的更新，但始終未能重拾外界對(duì)其的熱切期待，一度表現(xiàn)得頗為低調(diào)沉寂。而此次 Kimi K2 的發(fā)布，讓這家明星創(chuàng)企終于重回基模舞臺(tái)的聚光燈下，這場(chǎng)牌局仍未見(jiàn)定論。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平臺(tái)

一起剪

ZAKER旗下免費(fèi)視頻剪輯工具

相關(guān)標(biāo)簽

人工智能

日本一区二区三区久久-日本一区二区三区久久精品-日本一区二区三区日本免费-日本一区二区三区在线观看视频-国产不卡免费视频-国产不卡视频

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業(yè)峰會(huì)解決方案

元宇宙營(yíng)銷解決方案

元宇宙會(huì)展解決方案

元宇宙演藝節(jié)目解決方案

元宇宙博物館解決方案

元宇宙圖書(shū)館解決方案

元宇宙校園解決方案

元宇宙企業(yè)展廳解決方案

元宇宙藝術(shù)展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻剪輯

AI視頻剪輯

AI智能客服

AI工具箱

AI寫(xiě)稿助手

AI口語(yǔ)陪練

我的訂閱

月之暗面重返基模戰(zhàn)場(chǎng)：發(fā)布首個(gè)開(kāi)源萬(wàn)億模型，押注“模型即 Agent ”

宙世代

一起剪

相關(guān)閱讀

鐵路知識(shí)科普：車次前的字母啥意思 D不是嘚兒一下

奇瑞墨甲搶招商，智元、宇樹(shù)拿大單，人形機(jī)器人競(jìng)速跑！

對(duì)話尚海龍：10億港元“搶人”基金 不光投錢更要“造血”

具身智能賽道狂飆，突發(fā)多起大額融資事件

投顧周刊：“反內(nèi)卷”持續(xù)發(fā)力，基金看好多個(gè)行業(yè)盈利改善

賬上只剩1000萬(wàn)現(xiàn)金，買下一家掛牌公司

被“數(shù)據(jù)”驅(qū)動(dòng)的銀行一線員工

太陽(yáng)報(bào)：盧克-肖生日當(dāng)天因違停被開(kāi)罰單，需繳納60英鎊罰款

王永利：中國(guó)要借鑒穩(wěn)定幣的技術(shù)和模式，加快數(shù)字人民幣進(jìn)程

動(dòng)力電池“三國(guó)殺”：中企提前鎖定勝局，日韓廠商集體失守

國(guó)有險(xiǎn)企實(shí)施長(zhǎng)周期考核；2025年醫(yī)保目錄調(diào)整啟動(dòng)

“60天賬期”滿月 冰山下的隱形賬期何解？

海淀向北：萬(wàn)億之后，拿什么留住下一個(gè)DeepSeek？

加強(qiáng)供需兩側(cè)政策協(xié)同，促進(jìn)物價(jià)合理回升

CVC成“金手指”：中國(guó)科技投資版圖正被重寫(xiě)

最新評(píng)論

藍(lán)鯨財(cái)經(jīng)

熱門推薦

對(duì)話尚海龍：10億港元“搶人”基金不光投錢更要“造血”

“60天賬期”滿月冰山下的隱形賬期何解？