"2023 年大家關(guān)心價(jià)格還會(huì)跌多久,去年大家關(guān)心價(jià)格還會(huì)漲多久,我想在今天除了價(jià)格以外,大家可能會(huì)更關(guān)心存儲(chǔ)的價(jià)值還有多少。"深圳市閃存市場(chǎng)資訊有限公司總經(jīng)理邰煒在 MemoryS 2025 上表示," 而這也是今年大會(huì)的主題‘存儲(chǔ)格局,價(jià)值重塑’。"
從 ChatGPT 到 DeepSeek,多模態(tài)、大模型的發(fā)展讓 AGI 不再遙不可及,算力的爆發(fā)帶來(lái)了存力的增長(zhǎng)。高帶寬、高容量及低功耗,市場(chǎng)對(duì)存儲(chǔ)提出了更多的要求,也讓存儲(chǔ)站上了更重要的位置,邰煒說(shuō):" 我們必須承認(rèn) AI 讓存儲(chǔ)變得更加基礎(chǔ)、更加關(guān)鍵。"
先進(jìn)的存力成為 AI 發(fā)展的關(guān)鍵要素。
HBM 在全部 DRAM 產(chǎn)業(yè)中的占比已經(jīng)將近 30%,由于其用量的增加,2025 年 DRAM 市場(chǎng)將達(dá)到 2880 億 GB 的當(dāng)量。英偉達(dá) GPU 架構(gòu)的再次升級(jí)將帶動(dòng) HBM 正式進(jìn)入 HBM3e 時(shí)代,2026 年 HBM4 的出現(xiàn)也將帶來(lái)更多定制化需求。
QLC 時(shí)代也已經(jīng)提前到來(lái)。邰煒表示:" 預(yù)計(jì)今年QLC 將占接近 20% 的產(chǎn)能,32TB 的企業(yè)級(jí) SSD 將實(shí)現(xiàn)大規(guī)模量產(chǎn),QLC 在手機(jī)端的應(yīng)用也將迎來(lái)突破,這讓存儲(chǔ)市場(chǎng)規(guī)模達(dá)到 1670 億美元,并且將繼續(xù)保持增長(zhǎng)。"
當(dāng)然,PCIe5.0 也成為了存儲(chǔ)廠商繞不開(kāi)的話題,主流服務(wù)器平臺(tái)已經(jīng)全面支持 DDR5 和 PCIe5.0,其在訓(xùn)練時(shí)間上相比上一代有明顯的縮短,今年部分廠商的 PCIe5.0 搭載率將達(dá)到 30%。
AI 正在點(diǎn)燃存儲(chǔ)市場(chǎng),邰煒直言:" 對(duì)于很多企業(yè)而言,關(guān)鍵不在把控行情,緊跟需求、加大技術(shù)投入以及選擇正確的路線才是真正的難點(diǎn)。"
在技術(shù)路線上,NAND 將繼續(xù)朝更高堆疊發(fā)展,今年將步入 300 層以上的時(shí)代,同時(shí)混合鍵合技術(shù)也已成為 NAND 閃存重要的技術(shù)發(fā)展方向。在存儲(chǔ)產(chǎn)品上,DeepSeek 帶來(lái)開(kāi)源和更低成本的 AI 方案,這使得一體機(jī)熱銷。隨著行業(yè)大模型的應(yīng)用以及端側(cè)模型的加速落地,內(nèi)置 DeepSeek 的一體機(jī)已經(jīng)成為一個(gè)真正的賣(mài)點(diǎn)。
從技術(shù)、產(chǎn)品到解決方案,存儲(chǔ)行業(yè)正在適應(yīng) AI 帶來(lái)的新變化。
高帶寬、大容量、低功耗,SSD 主控芯片如何適應(yīng) AI 需求?
平頭哥產(chǎn)品總監(jiān)周冠峰在 MemoryS 上表示,團(tuán)隊(duì)梳理了 AI 數(shù)據(jù)從收集、清洗到訓(xùn)練的完整鏈條,發(fā)現(xiàn) AI 對(duì)存力的需求在每個(gè)領(lǐng)域都有所提升,存儲(chǔ)產(chǎn)品要滿足這些需求,實(shí)現(xiàn)起來(lái)頗具挑戰(zhàn) 。
芯片架構(gòu)決定任務(wù)處理分配方式,如何通過(guò)架構(gòu)創(chuàng)新實(shí)現(xiàn)時(shí)延降低?
周冠峰告訴雷峰網(wǎng):" 我們打造了‘軟硬件深度融合’架構(gòu),將適配硬件的任務(wù)用可編程硬件模塊實(shí)現(xiàn),不確定性任務(wù)由固件處理。" 在此架構(gòu)下,表項(xiàng)、隊(duì)列、Buffer 管理均通過(guò)硬件完成,錯(cuò)誤處理與地址分配則由軟件負(fù)責(zé),讓主控芯片實(shí)現(xiàn) 4 微秒的時(shí)延。
算法創(chuàng)新決定產(chǎn)品性能的上限,SSD 芯片的核心算法有兩個(gè),一是數(shù)據(jù)糾錯(cuò)算法,二是介質(zhì)應(yīng)用算法。
數(shù)據(jù)糾錯(cuò)算法要求同時(shí)具備高能效、強(qiáng)糾錯(cuò)能力以及易于硬件實(shí)現(xiàn),具有很高的技術(shù)挑戰(zhàn)。周冠峰表示:" 通過(guò)對(duì) BF+NMS 算法進(jìn)行 pipeline(流水線)整合,我們實(shí)現(xiàn)了高速率的同時(shí)保留了 NMS 的高糾錯(cuò)能力。"
而關(guān)于介質(zhì)應(yīng)用算法如何最快找到最佳電壓,使 NAND 原始誤碼率降到最低?
" 我們獨(dú)創(chuàng)了拋物線擬合算法,實(shí)現(xiàn)最多只需要四次 retry 搜索就可以找到拋物線的極小值點(diǎn),帶來(lái)的效果是更低的時(shí)延、更低的 SSD 功耗以及更好的 QOS。"周冠峰對(duì)雷峰網(wǎng)表示。
商業(yè)化是技術(shù)的目標(biāo)之一,產(chǎn)品力硬也要面臨如何落地的拷問(wèn)。對(duì)于平頭哥鎮(zhèn)岳 510 的商業(yè)化進(jìn)程,周冠峰稱:" 鎮(zhèn)岳 510 已經(jīng)在阿里云的 EBS 業(yè)務(wù)大規(guī)模上線,并且與行業(yè)內(nèi)存儲(chǔ)廠商憶恒創(chuàng)源、得瑞領(lǐng)新及佰維存儲(chǔ)開(kāi)展合作。"
端側(cè)模型加速落地,存儲(chǔ)如何適配本地化部署?
DeepSeek 的出現(xiàn)讓終端側(cè) AI 的表現(xiàn)超越了一年前僅能在云端運(yùn)行的模型,有判斷稱,AI 推理和處理正在全面向終端側(cè)轉(zhuǎn)移。
芯片工程師哲宇告訴雷峰網(wǎng):" 在資源受限的端側(cè),有了 DeepSeek 的蒸餾模型之后,原來(lái)只能部署 7B 模型的場(chǎng)景,現(xiàn)在能達(dá)到 14B 模型的效果,端側(cè) AI 的能力上了一個(gè)臺(tái)階。"
技術(shù)路徑成為現(xiàn)實(shí),實(shí)際的使用場(chǎng)景則讓需求落地。AI 軟件工程師楷杰告訴雷峰網(wǎng):" 本地化部署大模型的核心優(yōu)勢(shì)在于數(shù)據(jù)安全,很多企業(yè)的數(shù)據(jù)涉及公司機(jī)密,不適合采用云端的解決方案。"
本地化部署的需求帶火了一體機(jī),一體機(jī)將計(jì)算、存儲(chǔ)及網(wǎng)絡(luò)等多種功能集成于單一設(shè)備中,為數(shù)據(jù)安全及隱私性提供了高度適配的解決方案,但性能瓶頸、存儲(chǔ)容量以及散熱等問(wèn)題也亟待解決。
" 我們通過(guò)利用超顯存融合技術(shù)開(kāi)發(fā)添翼 AI 擴(kuò)容卡,將顯存空間擴(kuò)大了 20 倍,結(jié)合 AI Link 算法平臺(tái),銓興的訓(xùn)推一體解決方案實(shí)現(xiàn)降本 90%、推理性能提高 50% 且降低功耗。"銓興科技董事長(zhǎng)黃少娃告訴雷峰網(wǎng)。
實(shí)現(xiàn)算力、存儲(chǔ)和功耗的平衡,產(chǎn)品設(shè)計(jì)是一個(gè)有效的解決方案。" 我們把顯卡的數(shù)量從 168 張高階顯卡減少到 16 張中低階的顯卡,顯卡數(shù)量減少自然可以降低功耗,再搭載銓興添翼 AI 擴(kuò)容卡以及銓興 AI Link 算法平臺(tái),就可以實(shí)現(xiàn) DeepSeek 滿血版模型的部署。"
但省算力的方案只適合本地化小模型的部署,黃少娃稱:" 現(xiàn)在的主要客戶是政府和高校。"
面對(duì)產(chǎn)業(yè) AI 化,存儲(chǔ)廠商如何提供全套解決方案?
云端大模型和端側(cè)小模型之外,傳統(tǒng)產(chǎn)業(yè)智能化帶來(lái)的存儲(chǔ)需求被較少的關(guān)注,產(chǎn)業(yè)側(cè)要的不是單獨(dú)的技術(shù)或者產(chǎn)品,而是一個(gè)整體的解決方案。
" 面對(duì)產(chǎn)業(yè) AI 化,我們推出涵蓋傳感器、SSD、加速卡、系統(tǒng)整合軟件及 AI 管理軟件的整套解決方案。" 宜鼎國(guó)際全球嵌入式閃存事業(yè)部總經(jīng)理吳錫熙說(shuō)," 我們的邊緣側(cè) AI 布局策略是用堆積木的方式將產(chǎn)品線進(jìn)行整合,讓客戶使用一站式的端側(cè) AI 落地方案。"
" 不管有沒(méi)有 AI,擴(kuò)容都是一條沒(méi)有異議的道路。"吳錫熙告訴雷峰網(wǎng)," 現(xiàn)在市場(chǎng)都在談 QLC 就是為了突破容量極限,傳輸速度越來(lái)越快不一定意味著功耗變大,用更先進(jìn)制程去做主控芯片也可以降低功耗。"
宜鼎國(guó)際中國(guó)分公司總經(jīng)理游禮印補(bǔ)充道:" 實(shí)現(xiàn)極致的能耗比很重要,但對(duì)很多客戶而言,成本是更重要的一個(gè)考慮因素,現(xiàn)在能做的是提供給客戶一個(gè)相對(duì)兼容的解決方案,如果不計(jì)成本的話,能耗比肯定可以做得更好。"
落地產(chǎn)業(yè)的全套解決方案,意味著其專業(yè)化程度相比一體機(jī)更上一個(gè)層級(jí)。游禮印認(rèn)為,一體機(jī)偏消費(fèi)性質(zhì),真正做 B 端的產(chǎn)品要高穩(wěn)定性、高定制化,一體機(jī)通用性高,產(chǎn)品出問(wèn)題可能直接給客戶換貨即可。但 B 端客戶更關(guān)注能否切實(shí)解決其面臨的問(wèn)題,而非以舊換新。
AI 帶火的不只一體機(jī),整個(gè)存儲(chǔ)市場(chǎng)都處于上升期。
" 國(guó)內(nèi)存儲(chǔ)市場(chǎng)其實(shí)還在逐步去庫(kù)存的階段,下半年的需求會(huì)更好,宜鼎對(duì)市場(chǎng)價(jià)格的反應(yīng)采取比較符合行業(yè)的做法,不會(huì)急漲急跌,會(huì)根據(jù)客戶的需求去調(diào)整。" 游禮印告訴雷峰網(wǎng)," 各個(gè)行業(yè)對(duì)智能應(yīng)用的落地需求和探索越來(lái)越多,華南和華東這兩個(gè)市場(chǎng)的跡象尤為明顯。"