CES 2026》把「推論情境記憶」搬進機架 輝達BlueField-4「重塑AI原生儲存堆疊」

2026-01-08 12:20
NVIDIA BlueField-4 驅動新一代 AI 原生儲存基礎架構,開啟 AI 的下一個前沿。(輝達提供)

CES甫開展,輝達(NVIDIA)即宣布以BlueField-4資料處理器(DPU)為核心,推出「推論情境記憶儲存平台」(NVIDIA Inference Context Memory Storage Platform),瞄準代理型AI(agentic AI)走向長情境、多回合推理後,推論所產生的龐大「鍵值快取」(KV cache)資料,正快速成為新一代資料中心的瓶頸。

輝達點出關鍵轉折:當AI模型擴展到數兆參數、推理步驟變多,推論會產生大量以KV快取表示的情境資料,這些資料直接影響回應的「連續性」與使用體驗;但KV快取不可能長期留在GPU記憶體內,否則會讓多代理系統的即時推論被卡住,因此AI原生應用需要全新、可擴充的基礎架構去「儲存並分享」這些資料。

從「HBM 工作記憶」到「機架內情境記憶」:為什麼儲存變成AI的新戰場

黃仁勳用更直白的方式來描述KV快取的運作:每生成一個token,GPU會讀入模型與「工作記憶」(KV快取),產出新token後再寫回KV快取;對話越長、模型越大、回合越多,情境記憶就會「長到」HBM放不下。

他提到,過去一年輝達透過把Grace直接連到Hopper/Blackwell來擴充「快速情境記憶」,但「即使這樣也不夠」,若再把情境記憶丟到傳統北南向網路、回到企業既有儲存系統,多AI併發時網路終將跟不上,因此答案是「做一個不同的架構」:把高速KV快取/情境記憶直接放進機架。

2026年1月5日,輝達(Nvidia)創辦人兼執行長黃仁勳在拉斯維加斯 CES 展前記者會上發表演說。(美聯社)
輝達(Nvidia)創辦人兼執行長黃仁勳在拉斯維加斯 CES 展前記者會上發表演說。(美聯社)

BlueField-4:讓KV快取「可共享、可重用、可隔離」,把推論效率推上新曲線

依輝達說法,推論情境記憶儲存平台可擴展GPU記憶容量並在節點間高速共享,將每秒處理token的數量提升「多達5倍」,能源效率相較傳統儲存也可提升「高達5倍」。

黃仁勳更把這項變化上升到「整個運算堆疊」的層次。他表示:「AI正在徹底革新整個運算堆疊,而現在輪到儲存空間……透過BlueField-4,NVIDIA與軟硬體合作夥伴,正重新改造儲存堆疊,迎向AI的下一個前沿。」

在技術路徑上,輝達把BlueField-4放在「情境資料流」的核心:透過DOCA框架在AI節點間智慧加速KV快取共享,並與NIXL函式庫、Dynamo軟體緊密整合,用來最大化token生成量、縮短首次生成token的時間,並改善多回合回應能力;同時,BlueField-4管理的硬體加速KV快取放置,目標是消除metadata成本、減少資料移動,並確保從GPU節點的「安全隔離存取」。

在網路層,這套AI原生KV快取存取也把Spectrum-X乙太網路拉進來:輝達表示,Spectrum-X支援高效資料共享與檢索,為基於RDMA的KV快取存取提供高效能網路架構。

儲存大廠搶先卡位,2026下半年上線

值得注意的是,輝達把這波「儲存重塑」與資料中心部署型態的變化綁在一起。輝達指出,當AI工廠愈來愈採用裸機與多租戶部署,維持強大的基礎設施控制與隔離變得至關重要;BlueField-4 因此引進ASTRA(Advanced Secure Trusted Resource Architecture),作為系統級信任架構,提供「單一且受信任的控制點」,用以安全地佈建、隔離及營運大規模AI環境,且不影響效能。 (相關報導: CES 2026》宣告AI PC主流化元年!AMD推出60 TOPS處理器與「Halo」開發平台 更多文章

輝達表示,包含 AIC、Cloudian、DDN、戴爾科技集團、慧與科技、Hitachi Vantara、IBM、Nutanix、Pure Storage、Supermicro、VAST Data與WEKA等儲存業者,已率先採用BlueField-4打造新一代AI儲存平台,產品預計在2026年下半年上市。

因為你,我們得以前進,你的支持是我們的動力
今日精選
更多文章
飛官辛柏毅「倒栽蔥」彈射入海?前空軍副司令分析F-16失事原因:典型故障悲劇
CES 2026》AMD蘇姿丰:AI走入實體領域,從智慧座艙到人形機器人
CES 2026》宣告AI PC主流化元年!AMD推出60 TOPS處理器與「Halo」開發平台
CES 2026》蘇姿丰揭曉2奈米MI455X與「Helios」平台,擘劃次世代AI基建藍圖
群創(3481)被列處置仍爆量!面板股還能不能追?資金下一步全看這3點
打敗中字輩!台灣最強私立大學是它「專業實力強、業界搶著要」,畢業薪水不輸國立
Uber確定併購台灣知名車隊!全台叫車市場大洗牌,最新收購進度曝
代孕法案卡關!沈政男批民進黨自打臉「性平做半套」:至少先開放這族群
2026 CES》英特爾18A量產!Panther Lake處理器亮相 陳立武宣告奪回半導體主導權
2026 CES》內顯也能玩戰地風雲6!英特爾Panther Lake筆電高效120 FPS、27小時續航
2026 CES》不只是算力!英特爾攜手Perplexity推「混合式AI」 70B模型在PC本地運行
單邊主義時代來了!川普一口氣退出66個國際組織,聯合國官員:美國只想大家都配合他們
0050只排第6!2025 台股ETF績效 TOP 10 出爐:「這1檔」報酬率38.73%賺贏0052,驚呆一票投資人
旺宏(2337)股價衝到 61.3 元成黑馬!怎麼一個月就轉虧為盈?記憶體市場在熱什麼
不是輝達、英特爾!專家曝「這1檔」股票成2026年最大贏家,3兆美元全進它口袋
獨家》衝刺2026大選!調查局高雄處長連震宗「接辦案副局長」 綠營布局方向曝
F-16戰機失事被爆無防寒衣!顧立雄認「去年才進行採購」:預計這時全數交貨
天氣預報/寒流真的來了!「氣溫探5度以下」下波冷氣團接力時間曝,到這天才回溫
台灣1金控狂賺322億被高股息ETF瘋買!不只穩定領息、年年配,「1關鍵」讓法人搶著長抱
三仙台、鹿野輸了!台東最強景點吸205萬人,遊客讚交通方便、玩整天捨不得走
廚餘補助來了!符合資格「5000元現金入帳」,送件前沒注意這3點小心被退件
1.25兆只是小case,川普要編1.5兆美元軍費!美國2027國防預暴增50%
華爾街日報》全球首位「兆元富翁」將誕生?馬斯克身價有望飆破兆美元,2025年的經歷成關鍵
台股破新高還沒上車怎麼辦?專家指點觀察這類股票:跟AI搭上邊都要留意
盤前重點》費半回落、美股高檔震盪!台積電股利入帳能穩盤?
幕後》見習近平鄭麗文說了算?國民黨內不解她哪兒來的自信
風評:六年三修國安法─是匪諜多?還是民進黨毛病大?
王義雄觀點:貿易戰失利的川普,能從製造中美緊張扳回一局嗎?
王立本觀點:「抓馬杜洛模式」能複製嗎?台海與世界的算術
王順民觀點:當論文成犯罪報告─高雄性侵案的權控失衡與社安網崩壞
王鳳生觀點:政策錯誤比貪污更可怕—台灣是否正在錯誤政策中累積風險?
林仁斌觀點:不是核電安不安全,而是制度能不能動─EPZ下的核災撤離決策斷層
吳典蓉專欄:以國安為名的網路戒嚴又來了!
觀點投書:賴總統該怎麼團結台灣?
觀點投書:馬杜洛被抓之後,誰還能約束強權的「執法」?
黎蝸藤觀點:川普為何要生擒馬杜洛?
陳國祥觀點:民進黨在政治執念下的法律暴衝
王瀚興觀點:美軍奪帥,華人奪志?也談委內瑞拉總統馬杜拉遭活逮事件
觀點投書:美國「金融壓抑」外溢下,台灣被動承擔的代價
觀點投書:從圍台軍演看「嚇阻反轉」
觀點投書:普發1萬的財務管理課
輝達推自駕車AI模型挑戰特斯拉!專家揭「不只馬斯克緊張」:這台廠股價一度跌停
快訊! 9門AI課程讓你選,新北勞大1/8起搶先報!
第三屆「新北企業精典獎」徵件開跑go 1/16首場說明會開講 歷屆得主親授獲獎關鍵!
高雄春天藝術節票房告捷!高市國、高市交首波節目啟售 早鳥七折優惠