「Nvidia正在吞食世界!」發表擁有2080億個電晶體的超級GPU,黃仁勳安慰前代H100「沒關係的」

2024-03-19 19:30

? 人氣

黃仁勳在輝達GTC的大會介紹Blackwell(左)與前代的Hopper晶片(右)。(翻攝輝達GTC大會直播影片)

黃仁勳在輝達GTC的大會介紹Blackwell(左)與前代的Hopper晶片(右)。(翻攝輝達GTC大會直播影片)

「這(左手)是改變世界的Hopper,而這(右手)是Blackwell。」

(然後黃仁勳在台上安慰明顯小了一號的前代AI晶片,說,「Hopper沒關係的」,引來哄堂大笑)

黃仁勳在輝達GTC的大會介紹Blackwell與前代的Hopper晶片。(翻攝輝達GTC大會直播影片)
黃仁勳在輝達GTC的大會介紹Blackwell與前代的Hopper晶片。(翻攝輝達GTC大會直播影片)

科技媒體《WIRED》上個月以〈輝達硬體正在吞噬世界〉(Nvidia Hardware Is Eating the World)為題,報導Nvidia如何靠當初起家的GPU(圖形處理器),從X世代遊戲顯卡的主要供應商,一躍成為人工智慧時代最重要的運算動力供應者。擁有超級算力的Nvidia GPU甚至被《WIRED》看好,未來十年將繼續在AI領域獨占鰲頭。時隔不到一個月,黃仁勳竟又拿出了Hopper GPU的下一代產品—無論算力與能耗都大有進展的Blackwell,觀看直播的外國網友再次驚嘆「Nvidia eats world」!

[啟動LINE推播] 每日重大新聞通知

穿著招牌皮衣的黃仁勳在GTC大會的主題演說中坦言,通用運算已經失去動力,但當前AI模型的參數量仍在瘋狂成長,以OpenAI的GPT-4為例,動輒處理數十億token、參數上看1.8兆。因此黃仁勳說,「我們需要更大的模型,我們需要更大的GPU」。當AI模型仍在大步邁進,輝達發表了比市場瘋搶的H100還要更火熱的Blackwell,這也把八年來的AI算力進展推上了千倍之譜。擁有2080億個電晶體的Blackwell,就是為了在數兆參數上建構和運行生成式AI而來,也難怪黃仁勳要當眾安慰無論個頭與實力都矮了Blackwell一截的Hopper。

黃仁勳介紹輝達在Blackwell世代的合作夥伴,其中有許多都是台灣廠商。(翻攝輝達GTC大會直播影片)
黃仁勳介紹輝達在Blackwell世代的合作夥伴,其中有許多都是台灣廠商。(翻攝輝達GTC大會直播影片)

黃仁勳強調Blackwell是目前最強大的晶片,也是輝達首個採用多晶片封裝設計的GPU。兩塊小晶片之間的連網速度高達10TBps,黃仁勳表示,Blackwell沒有記憶體局部性問題或快取問題,CUDA(Compute Unified Device Architecture,統一計算架構)也將其視為單一GPU。Blackwell配備192GB、速度達到8Gbps的HBM3E記憶體,AI算力達到20 petaflops ,前代H100的4 petaflops完全被拋在腦後。雖然黃仁勳自己也將Blackwell稱為晶片,但他也說Blackwell不是晶片名、而是平台的名字。採用Blackwell架構的GPU除了B200,還有整合了Grace CPU與兩個B200 GPU的GB200。高效整合的多die晶片,讓輝達在製程升級速度減慢的狀況下,仍有辦法大幅推升算力。

黃仁勳表示,B200 GPU透過2080億個電晶體提供高達20 petaflops的FP4吞吐量,GB200 GPU則透過每秒900GB超低功耗晶片連接,將兩個B200 GPU與一個Grace CPU進行整合。如果是GB200這塊超級晶片,比起H100 GPU提供了30倍的推理效能改善,能耗也降低了25倍之多。黃仁勳並未在演說中透露Blackwell的價格,不過他在台上打趣「(Blackwell的)原型主板價值100億美元,第二塊是50億美元,不過之後就會變得更便宜」要現場的潛在客戶不要擔心價錢。

黃仁勳在輝達GTC的大會介紹Blackwell與前代的Hopper晶片。(翻攝輝達GTC大會直播影片)
黃仁勳在輝達GTC的大會介紹Blackwell與前代的Hopper晶片。(翻攝輝達GTC大會直播影片)

基於Blackwell架構的AI運算能力,輝達將以DGX GB200的伺服器形態提供給用戶,這台伺服器共有36顆NVIDIA Grace CPU 和72塊Blackwell GPU,透過第五代NVLink連接成超級電腦。Grace Blackwell架構的DGX SuperPOD由8個或更多DGX GB200建構而成,這些伺服器還可以再透過NVIDIA Quantum InfiniBand網路連接,擴展成為串連數萬個GB200的超級算力怪獸,加快新一代AI模型的訓練腳步。具體來說,使用使用Hopper訓練GPT需要用上8000張GPU、耗時90天,但GB200只要2000張,能耗大幅下降為四分之一。

恐怖的是,黃仁勳拿出手的還遠遠不止「能幫助每個公司、產業和國家,完善並生成自己AI」的B200、GB200和超級電腦DGX。輝達還利用生成式AI 建構了一系列元宇宙、工業數位孿生、機器人訓練軟體。尤其在主題演講的最後,黃仁勳還展示了由GR00T驅動的人形機器人,輝達還開發了專供機器人使用的運算晶片Jetson Thor,輝達的人形機器人能夠理解自然語言,甚至觀察與模仿人類動作、強化自身能力。

2024年3月18日,Nvidia執行長黃仁勳在加州聖荷西的輝達GTC大會發表主題演說。(美聯社)
2024年3月18日,Nvidia執行長黃仁勳在加州聖荷西的輝達GTC大會發表主題演說。(美聯社)

黃仁勳將目前的AI發展視為「新的工業革命」,除了更強的算力將讓生成式AI進展得更快、催生新的電腦軟體與應用程式,未來的資料中心則像個AI工廠,其目標就是「生成智慧」。輝達也宣布將推出6G研究平台,推進無線存取網路(RAN)的人工智慧發展,連接無數設備與雲端設施。黃仁勳與輝達高層更預言「未來所有會動的東西都將是機器人」,無論是人形機器人、自駕車、堆高機、機械手臂,這些體積更小、動作更快的機器人也會進駐各種工業產線,輝達也正與同業合作、希望加速研發進展。

喜歡這篇文章嗎?

國際中心喝杯咖啡,

告訴我這篇文章寫得真棒!

來自贊助者的話
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章