2026 CES(消費電子展)開展,輝達(NVIDIA)創辦人暨執行長黃仁勳在NVIDIA Live atCES演講開場直言,電腦產業「每10到15年就會重置一次」,從主機到PC、網際網路、雲端、行動裝置,每次都是應用程式改寫以追上新平台;但這一次「同時發生兩個平台轉移」,其一是「應用程式將建構在AI之上」,其二則是軟體開發與運作方式徹底翻新:「你不再是寫程式,而是訓練程式;不再跑在CPU,而是跑在GPU」。
這條「AI下一個前沿」的主線,黃仁勳在台上用一段話把邏輯說穿:當AI從一次性聊天工具,變成能「推理、使用工具、完成工作、保有短期與長期記憶」的智慧協作夥伴,整個運算堆疊就不只要算得更快,還得「記得住、傳得動、做得完」。
從「推理與代理型AI」開始:AI會在執行時思考、查資料、用工具
黃仁勳回顧近年語言模型演進,並點出2025年開始「代理型(agentic)模型」快速普及:它們具備推理能力,能查詢資訊、做研究、使用工具、規劃未來、模擬結果,開始解更重要、也更複雜的問題;他更以公司內部使用的 Cursor 為例,形容其「徹底改變」輝達的軟體開發方式。
在黃仁勳描述的框架裡,「推理」不再只是模型參數更大,而是加入「即時思考」的能力;黃仁勳在台上提到,推理模型帶出一種稱為test-time scaling的概念,本質上就是讓模型能在推論時投入更多「思考」步驟,從而把代理型系統推向實用化。
把「AI應用」講清楚:私有資料留本地、任務交給最適模型,還能連到機器人
為了讓「AI應用將建構在AI之上」不只停在口號,黃仁勳在演講中示範打造個人助理:用DGX Spark搭配Brev建立個人雲端,將需要隱私的信件工作留在本地開源模型,其餘任務再交由前沿模型(frontier model),並用「意圖式路由(router)」讓系統「用對模型做對任務」。
黃仁勳進一步把代理型系統接上Hugging Face的Reachy迷你機器人與語音API,讓助理能「看、聽、說、動」;示範結束後,黃仁勳感嘆「這一切現在已經變得非常稀鬆平常(utterly trivial now)」,但幾年前仍是「完全不可想像」。

「現在輪到儲存了」:KV快取與情境記憶,成為代理型AI的基礎建設
當模型走向數兆參數與多步驟推理,會產生大量以鍵值(KV)快取形式存在的「情境資料」。輝達指出,KV快取無法長期放在GPU上,否則會在多代理即時推論形成瓶頸,因此需要「AI原生」且可擴充的基礎架構來儲存與分享情境記憶。 (相關報導: 2026 CES》英特爾18A量產!Panther Lake處理器亮相 陳立武宣告奪回半導體主導權 | 更多文章 )
這也是輝達為何同步在CES釋出BlueField-4的用意。BlueField-4將驅動「推論情境記憶儲存平台」,官方宣稱可把每秒處理詞元(token)的數量提升「多達5倍」,並提供相較傳統儲存裝置「高達5倍」的能源效率;黃仁勳在新聞稿中直言,「AI正在徹底革新整個運算堆疊,而現在輪到儲存空間。」














































