DeepSeek改寫AI版圖!低成本模型引爆「AI珍珠港事件」 華爾街質疑「這件事」?

2025-02-07 15:49

? 人氣

DeepSeek用極少的資源訓練出與西方科技巨頭並駕齊驅的AI模型,引發矽谷震撼。(美聯社)

DeepSeek用極少的資源訓練出與西方科技巨頭並駕齊驅的AI模型,引發矽谷震撼。(美聯社)

美國總統川普剛就任的隔天,馬上召集軟銀、甲骨文和OpenAI高層,將耗資5千萬美元在美國成立類似主權AI的相關投資計畫。不料,隔天原本沒有名氣的中國深度求索(DeepSeek)發表一款AI模型R1,之後引發華爾街市場大震撼,且被市場稱為「AI珍珠港事件」,襲擊美國AI相關股,並讓美股在一月二十七日當天市值蒸發掉一兆美元,與AI關聯度最高的費城半導體指數當天重挫後,因Nvidia表現不佳至今走勢相對弱勢,等於是給川普洗臉。

透過<Google新聞> 追蹤風傳媒

中美科技戰下的突圍

美國與中國關係惡化,從八年前川普在第一任總統期間宣布向中國發動貿易戰。拜登繼任總統後,除貿易戰外還擴大封鎖中國科技。對中國的科技封鎖不限美國企業,還把美國所有的盟友拉進來,持續要求外資企業撤離中國並選邊站。在這樣敵我界線分明下,中國透過各種管道還是有能力拿到Nvidia的高階AI晶片。深度求索承認使用約兩千多片的H200晶片,且整個開發成本僅約560萬美元就打造出能與OpenAI、谷歌同等級的AI模型DeepSeek-R1。

中國AI新星僅花「這個價格」 華爾街質疑

這樣的AI模型成本結構與美國大型CSP業者至少要使用1.6萬片的H200和H100晶片相比,其開發成本僅是OpenAI成本的2%。在DeepSeek-R1大出鋒頭後,引發全球用戶大量下載,不到一個星期,累積的下載次數超過1600萬次,尤其以印度用戶的下載數量最高。

衝擊過後,華爾街引述數名半導體分析師對深度求索能以如此低成本,打造出能與美國先進AI模型相匹敵產品提出質疑,大部分分析師普遍認為深度求索不太可能以這麼低的成本打造出具突破性的AI模型,要不然那些美國大型CSP業者過去不就白花錢。OpenAI創辦人阿特曼(Sam Altman)也跳出來質疑,深度求索有不合法使用OpenAI模型的技術,而他們也掌握相關的證據。部分晶片分析師認為,深度求索應該用到5萬片的AI晶片才做得出來,而560萬的開發成本也僅能算是應用上的使用成本。因為5萬片AI晶片的成本就不只這些金額,也有分析師質疑應該有中國政府介入,才有辦法做得出來。

產業反思:AI泡沫化疑慮

Meta目前正在研發的Research SuperCluster(RSC)至少就使用超過1.6萬片的A100晶片,該公司目前的Llama大型語言模型、谷歌Gemini和OpenAI的AI模型也都耗掉上萬片的AI晶片才做得出來。特斯拉創辦人馬斯克的xAI早已購入超過十萬片的H200和H100晶片,只要Nvidia的GB200晶片出得了貨,也都會被特斯拉、甲骨文和大型CSP業者掃貨。市場擔心如果深度求索能以極低的成本打造出AI模型,就會引來AI產業反思是否真的有必要砸大錢打造AI模型,甚至引發AI產業是否將泡沫化的問題。

遭美國封鎖下生出的產品

以時間推論,不論是深度求索在去年十二月下旬推出的DeepSeek-V3還是這次令市場震撼的DeepSeek-R1 AI模型,在開發期間都處於被美國政府科技封鎖期間。雖然Nvidia推出閹割版的H20晶片,只有H200本尊效能的十分之一,他們還是能開發出頂尖的AI模型出來。先進的AI系統需歸納文字、圖片、影音等大數據的深度學習技能,深度求索大概是把這些數據分析工作分配給多個不同模型,每個模型負責特定領域,力求讓高效數據處理的時間縮短。這種方式在美國和其他發展AI模型的國家並非沒做過,只不過是沒辦法像深度求索那樣僅用到更少的運算能力就做到這樣的地步。

【文/魏聖峰】
本文經《先探投資週刊2338期》授權

喜歡這篇文章嗎?

下班經濟學喝杯咖啡,

告訴我這篇文章寫得真棒!

來自贊助者的話
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章