當(dāng)?shù)貢r(shí)間周二(3 月 18 日),英偉達(dá) CEO 黃仁勛在 GTC 主題演講中推出了新產(chǎn)品 "Blackwell Ultra",并預(yù)告了公司的下一代芯片 "Rubin"。
黃仁勛稱,去年幾乎全世界都參與到了建設(shè)人工智能(AI)數(shù)據(jù)中心的浪潮之中," 計(jì)算需求——即 AI 縮放定律——更具彈性,速度也正在超快地增長。"
"AI 已實(shí)現(xiàn)巨大飛躍——推理和代理式 AI 需要數(shù)量級(jí)更高的計(jì)算性能。我們?yōu)檫@一刻設(shè)計(jì)了 Blackwell Ultra,這是一個(gè)功能強(qiáng)大的單一平臺(tái),能夠輕松高效地完成 AI 的預(yù)訓(xùn)練、后訓(xùn)練和推理任務(wù)。"
據(jù)英偉達(dá)官網(wǎng)介紹,Blackwell Ultra 基于公司一年前推出的 Blackwell 架構(gòu),結(jié)合了 NVIDIA GB300 NVL72 機(jī)架級(jí)解決方案和 NVIDIA HGX B300 NVL16 系統(tǒng)。
通過 GB300 NVL72,AI 模型可以利用平臺(tái)增強(qiáng)的算力,探索不同的解決方案,并將復(fù)雜請求拆解為多個(gè)步驟,從而實(shí)現(xiàn)更高質(zhì)量的響應(yīng)。
新聞稿稱,HGX B300 NVL16 在大型語言模型(LLM)推理方面的速度比 Hopper 快 11 倍,提供 7 倍的算力和 4 倍的內(nèi)存,能夠?yàn)?AI 推理等最復(fù)雜的工作負(fù)載帶來突破性的性能提升。
英偉達(dá)表示,新機(jī)架級(jí)解決方案的性能是 NVIDIA GB200 NVL72 的1.5 倍;而與使用 NVIDIA Hopper 構(gòu)建的工廠相比,Blackwell 的 AI 工廠收入機(jī)會(huì)增加了 50 倍。
黃仁勛在演講中稱,"Blackwell 在推理模型中的表現(xiàn)是 Hopper 的 40 倍。"他還提到,公司正在全力生產(chǎn) Blackwell,下半年過渡到 Blackwell Ultra。
新聞稿提到,思科、戴爾、惠普、聯(lián)想、超微電腦等將提供基于 Blackwell Ultra 產(chǎn)品的各種服務(wù)器,亞馬遜 AWS、谷歌云、微軟 Azure 等也將提供 Blackwell Ultra 的相關(guān)云服務(wù)。
值得一提的是,Blackwell Ultra 芯片還能夠單個(gè)購買。黃仁勛在活動(dòng)中推出了一款名為 "DGX Station" 的臺(tái)式電腦,該電腦搭載單個(gè) GB300 Grace Blackwell Ultra 和 784GB 內(nèi)存,ConnectX-8 SuperNIC 支持高達(dá) 800Gb/s 的網(wǎng)絡(luò)。
Vera Rubin 是美國知名天文學(xué)家,在暗物質(zhì)研究領(lǐng)域取得了突破性進(jìn)展,其研究成果徹底改變了人類對宇宙的認(rèn)知。
Vera 集成 88 個(gè)定制 Arm 核心,176 個(gè)線程,1.8TBp/s NVLink-C2C。Rubin 中有兩個(gè) GPU,F(xiàn)P4 精度推理性能達(dá)到了 50PF,還可以支持高達(dá) 288GB 的快速內(nèi)存——是 AI 開發(fā)人員關(guān)注的核心規(guī)格。
而 2027 推出的 Rubin Ultra NVL576 系統(tǒng)能夠進(jìn)行 15EF 的 FP4 推理,5 EF 的 FP8 訓(xùn)練,性能約為 GB300 NVL72 的 14 倍。