本文來源:時代周報 作者:朱成呈
7 月 15 日,英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛在接受央視采訪時確認,美國政府已批準 H20 的出口申請,英偉達將啟動對該產(chǎn)品的對華發(fā)貨流程。" 我們可以開始發(fā)貨了,我對此感到非常高興。" 黃仁勛表示。
H20 是英偉達于 2023 年底發(fā)布的定制化產(chǎn)品,基于 Hopper 架構(gòu)設(shè)計,擁有 CoWoS 先進封裝技術(shù)。原本是在滿足監(jiān)管紅線下,為中國市場量身打造的 AI 加速卡,主要面向推理和中小規(guī)模模型訓(xùn)練場景。該產(chǎn)品是繼 A100、H100、A800 與 H800 等主力 GPU 產(chǎn)品相繼被限制出口后,英偉達試圖維持中國市場供給能力的技術(shù)調(diào)整方案。
今年 4 月,美國政府以 " 可能用于高風(fēng)險超級計算場景 " 為由,通知英偉達 H20 芯片向中國出口需許可證,隨后發(fā)貨暫停。英偉達曾在向美國證監(jiān)會(SEC)提交的文件中披露,自 4 月 9 日起,H20 等產(chǎn)品對包括中國內(nèi)地、中國香港及中國澳門在內(nèi)的 D:5 類地區(qū)出口需單獨申請許可。
除 H20 外,黃仁勛還宣布將發(fā)布一款名為 RTX Pro 的新顯卡。他表示,這款顯卡非常重要,是專為計算機圖形、數(shù)字孿生和人工智能設(shè)計。
英偉達官網(wǎng)顯示,RTX PRO 是面向?qū)I(yè)人士打造的高性能平臺,覆蓋建筑與工業(yè)設(shè)計、高級視覺特效、復(fù)雜科學(xué)可視化、大型語言模型微調(diào)和本地 AI 助手運行等多個應(yīng)用場景。
H20 回歸:性能受限但契合需求
開源證券研報指出,合規(guī)芯片 H20 恢復(fù)銷售有望緩解國內(nèi)算力 " 缺芯 " 問題,核心利好國產(chǎn) AIDC (智算中心)全產(chǎn)業(yè)鏈。
根據(jù)公開信息,H20 配備 96GB HBM3 顯存,顯存帶寬可達 4TB/s,部分升級型號還提升至 141GB 顯存、900GB/s 的卡間互聯(lián)帶寬。其 FP8 和 FP16 算力分別為 296 TFLOPS 與 148 TFLOPS,盡管其峰值算力僅為 H200 的約 15%,在 AI 推理及中小規(guī)模模型部署中仍具一定競爭力,尤其適合大模型推理階段對帶寬、內(nèi)存容量要求較高的場景。
產(chǎn)業(yè)經(jīng)濟分析師、釘科技創(chuàng)始人丁少將向時代周報記者指出,H20 主要面向中國頭部 AI 企業(yè)與云服務(wù)商,適用于推理任務(wù)與中小規(guī)模訓(xùn)練。此次解禁后,可緩解中國 AI 企業(yè)短期推理算力缺口。不過,丁少將也強調(diào),H20 因性能受限無法滿足萬億參數(shù)大模型訓(xùn)練,難以替代國產(chǎn)芯片在超算與國家級大模型項目中的角色。
"H20 在顯存容量和帶寬方面相較于 H100 有明顯提升,二級緩存更大、功耗更低,使其在當前人工智能推理應(yīng)用中具備現(xiàn)實優(yōu)勢。隨著今年 DeepSeek 的開源,大模型推理需求激增,對 H20 的需求也因此大幅增加。" 半導(dǎo)體資深專家、電子創(chuàng)新網(wǎng)創(chuàng)始人張國斌在接受時代周報記者采訪時表示。
具體到客戶結(jié)構(gòu)與應(yīng)用場景,頭豹研究院分析師曾涵宇向時代周報記者解釋稱,對于國內(nèi)那些對算力有海量需求的巨頭公司而言,H20 顯然不會是他們的首選,畢竟 H100 /H200 的性能更為強勁。而垂直行業(yè)客戶更看重在特定場景中實現(xiàn)的高精度與專業(yè)性。垂類大模型專為解決行業(yè)問題設(shè)計,能很好地適配醫(yī)療診斷、金融風(fēng)控等行業(yè)需求,因此金融、醫(yī)療、法律、教育等行業(yè)會是 H20 的主要客戶。
在價格策略方面,H20 同樣體現(xiàn)出務(wù)實取向。據(jù)張國斌介紹,該產(chǎn)品在國內(nèi)市場的報價區(qū)間大致在 8.6 萬元至 11 萬元人民幣之間,略低于國產(chǎn)昇騰 910B。對于預(yù)算有限、但仍需保持英偉達 CUDA 生態(tài)兼容性的企業(yè)而言,H20 提供了一個相對平衡的選項。
事實上,作為英偉達為規(guī)避出口限制而量身打造的芯片,H20 不僅承載著對華業(yè)務(wù)延續(xù)的技術(shù)意義,也具有重要的商業(yè)權(quán)重。廣發(fā)證券研報指出,英偉達第一季度確認 46 億美元 H20 收入(另外有 25 億美元未能交付),同時確認了 45 億美元的減值支出。此外,第二季度原本有 80 億美元 H20 訂單,預(yù)計也將產(chǎn)生損失。
在曾涵宇看來,今年發(fā)布的華為昇騰 910C 性能強且性價比高,就已成為 H20 禁售期間國內(nèi) AI 企業(yè)的另一個選項。
RTX Pro 瞄準工業(yè)數(shù)字化轉(zhuǎn)型紅利
"RTX Pro 瞄準工業(yè)數(shù)字化轉(zhuǎn)型紅利,以性價比切入邊緣計算藍海。" 丁少將表示,相比 H20,RTX Pro 更側(cè)重邊緣端低成本部署,契合中國制造業(yè)自動化升級需求,對國產(chǎn) GPU 在中小型企業(yè)市場的份額有分食作用。
據(jù)悉,英偉達 RTX 系列產(chǎn)品傳統(tǒng)上多定位于消費級市場。而英偉達官網(wǎng)顯示,RTX PRO 支持臺式機、移動工作站、數(shù)據(jù)中心、虛擬工作站以及嵌入式 GPU 方案,體現(xiàn)出更強的專業(yè)適配性,適用于多種計算環(huán)境。
其中,數(shù)字孿生被視為 RTX Pro 切入智能制造的重要落點之一。得益于其采用 GDDR7 高帶寬顯存與多單元流處理器架構(gòu),RTX Pro 能夠支撐汽車、工業(yè)制造等行業(yè)的大規(guī)模三維模型的實時交互計算。
"RTX Pro 是為智能工廠和物流領(lǐng)域的數(shù)字孿生 AI 應(yīng)用量身打造的。" 張國斌指出,隨著數(shù)字化深入千行百業(yè),大模型與各行業(yè)的深度融合對高性能 GPU 的需求日益增加。相較于 H20,RTX Pro GPU 更專注于圖形渲染,特別適用于數(shù)字孿生技術(shù)。
頭豹研究院分析師許諾進一步指出,結(jié)合國內(nèi)車企對虛擬工廠、智能座艙的數(shù)字化需求,以及工業(yè)互聯(lián)網(wǎng)平臺的普及,RTX Pro 可成為數(shù)字孿生系統(tǒng)的核心算力支撐,預(yù)計在頭部新能源車企、高端裝備制造企業(yè)中快速落地。
與此同時,RTX Pro 在 AI 融合場景中的表現(xiàn)同樣值得關(guān)注。RTX Pro 平臺內(nèi)置第五代 Tensor Core 與 DLSS 4 等新一代技術(shù),使其能兼顧圖形處理與 AI 加速。
許諾稱,中國市場對 3D 圖像處理和 AI 深度學(xué)習(xí)計算等需求不斷增加,GPU 市場廣闊。例如在智慧醫(yī)療領(lǐng)域輔助 3D 醫(yī)學(xué)影像分析,在教育科研領(lǐng)域支撐 AI 驅(qū)動的分子模擬等場景,與國內(nèi)在生物醫(yī)藥、新材料等領(lǐng)域的研發(fā)需求形成協(xié)同,進一步填補專業(yè)級 AI 算力的細分市場空白。