輝達(NVIDIA)創辦人暨執行長黃仁勳今(1)日在GTC Taiwan主題演講中,把AI下一個戰場從螢幕推向真實世界。他指出,代理式AI本質上就是一種數位機器人,能理解、推理、規劃、使用工具並採取行動;而當同樣的能力進入汽車、工廠、機器人、基地台與各式設備,AI將真正走出螢幕,進入物理世界。
黃仁勳表示,未來不只雲端、企業與PC會運行AI代理,機器人、自駕車、衛星、基地台、農業設備、製造設備與重工業機具,也都會成為代理式AI系統的一部分。
物理AI最大挑戰是資料
黃仁勳指出,語言模型能快速發展,是因為網路上存在大量由人類撰寫、也供人類閱讀的文字資料;但機器人與物理AI需要的是來自機器人視角的資料,也就是能理解真實世界、第一人稱視角與行動結果的資料。
他表示,全球多數影像資料是第三人稱視角,並非機器人真正執行任務時所看到的第一人稱視角。因此,物理AI最大的瓶頸不是模型本身,而是資料。
為了解決這個問題,NVIDIA持續推進Omniverse模擬、遙操作、人類示範、合成資料生成與世界模型,讓機器人可以在虛擬世界中學習,再把能力帶到真實世界。
Cosmos 3登場,成為物理AI基礎模型
NVIDIA本次發表Cosmos 3,定位為物理AI基礎模型。黃仁勳指出,Cosmos 3可理解真實世界場景、生成物理準確的合成影片,也可作為模擬器,協助機器人政策訓練與評估。
他表示,Cosmos 3不只是模型,也是一套開放模型系統。NVIDIA將開放模型、資料與訓練方法,讓開發者可依照自身機器人、工廠設備或自駕車應用進行後訓練,打造專屬物理AI模型。
黃仁勳強調,在語言模型領域,全球已有許多團隊投入競爭;但在物理AI領域,NVIDIA處於最前線,Cosmos 3將成為開發各式機器人的重要基礎。
自駕車進入推理時代
除了Cosmos 3,NVIDIA也發表Alpamayo 2,作為自駕車開放模型。黃仁勳指出,自駕車不只是感測與辨識,而是需要具備推理能力,能理解路況、判斷行人與車輛動態,並在複雜道路環境中做出決策。
NVIDIA展示的自駕系統可在行駛過程中解釋自身決策,例如何時禮讓行人、何時閃避前方障礙、何時與其他車輛保持距離。黃仁勳笑稱,若讓車子一直把思考過程講出來,可能會讓乘客受不了,但車子持續「自我思考」正是推理型自駕的關鍵。
Isaac Groot推動人形機器人研發
在人形機器人方面,NVIDIA發表Isaac Groot參考平台。黃仁勳表示,打造人形機器人非常困難,因為研究團隊必須整合感測器、馬達、模擬器、資料管線、訓練系統與運算平台,往往還沒真正開始研究,就已經耗費數月建置基礎架構。
Isaac Groot整合開放模型、模擬與訓練函式庫、資料生成器、Isaac Lab、Omniverse、Cosmos與Jetson Thor,並提供人形機器人參考設計,讓大學、研究機構與企業能更快投入前沿機器人研究。
黃仁勳表示,未來將有數十億、甚至更多代理式系統在全球運行,從雲端到PC,從工廠到機器人,這種運算模式將被不斷複製。AI不再只是螢幕裡的聊天工具,而會成為看得見、摸得到、能行動的新一代機器人與智慧設備。 (相關報導: 黃仁勳「兆元宴」又來了!台灣AI巨頭全到齊 「C位」名單包括這6人 | 更多文章 )
而在今日演講的最後,黃仁勳更爲現場觀眾帶來驚喜彩蛋——一部全由AI製作的音樂電影,由熟悉的台灣夜市街景開始,搭配旋律動感輕快的饒舌音樂,歌詞內更是滿滿輝達對於AI技術的發展與期許,現場氣氛來到最高點,也讓人對今年的GTC Taipei以及Computex有著濃濃的期待。












































