美國封鎖也不怕,中國AI產業要怎麼「戴著鐐銬起舞」?

2025-01-09 12:00
2023年7月5日,在上海舉行的世界AI大會期間,一名工人正在檢查顯示電腦晶片與中文「自主」字樣的螢幕。(美聯社)
2023年7月5日,在上海舉行的世界AI大會期間,一名工人正在檢查顯示電腦晶片與中文「自主」字樣的螢幕。(美聯社)

最近,OpenAI的新推理模型o1可說是遇上了不少勁敵。中國AI公司DeepSeek和Moonshot AI(月之暗面),都各自推出「可以媲美o1」的新模型,表示效能和o1不相上下;阿里巴巴則宣稱,自家的研究模型在數學方面比美國更強。

雖然這幾間公司還未發表相關論文,卻已經在美國造成不小的討論。「中國正在用更快的速度迎頭追趕。」曾任OpenAI研究員、現為人工智慧企業家的安德魯·卡爾(Andrew Carr)指出,DeepSeek的研究人員只花了幾個月就成功複製OpenAI的推理模型,讓他許多同事詫異不已。

更不用說,近兩年來美國幾次限制企業向中國出售晶片,日前又迎來第三波出口禁令,點名140家企業、擴大出口管制範圍至台灣、南韓、馬來西亞等地,為的就是要防堵中國在半導體產業的發展。在這樣不利的環境下,中國新創公司卻能以驚人的速度,推出一款款性能毫不遜色的AI模型,為業界帶來不小的震撼。

免費訂閱電子報連結圖

推理模型成新發展焦點

長期以來,業界一直以「擴展法則」(Scaling Laws)為發展主流,透過不斷擴大數據量和計算能力來擴展現有模型。但最近,許多大公司如OpenAI、Google都在這裡碰上了瓶頸,不少人紛紛對擴展法則提出質疑。

既然碰壁了,那就換一條路吧!於是有些公司轉而研究推理模型(Reasoning model),這是一種能自我進行事實查核的模型,得比傳統的模型花更多時間思考、查詢資料,但也能有效避免許多讓模型出錯的陷阱。以DeepSeek新推出的「R1」為例,它平均需要花費數十秒思考後才能作答。

DeepSeek表示,在AIME(美國數學邀請賽,美國數學奧林匹克的預選賽之一)測試中,他們的表現勝過OpenAI。根據《華爾街日報》實驗結果顯示,OpenAI的o1預覽版在解題速度上仍較DeepSeek、月之暗面和阿里巴巴的實驗模型還要快,例如在一個和雙人遊戲策略有關的文字謎題中,OpenAI程式在10秒內給出答案,DeepSeek則花了超過2分鐘。

不過,文字題對AI來說難度相當高,第一次就能正確解答,已經是個很不錯的開始。

被美國「排擠」 中國會就此敗下陣來嗎?

中國公司的研發成果不禁讓人好奇,面對拜登幾次收緊出口管制、拿不到高品質晶片的情況下,究竟是怎麼辦到的?

背後金主包括阿里巴巴和騰訊的月之暗面的創辦人楊植麟表示,他們把主力放在「強化學習」(Reinforcement learning),一種模仿人類試錯過程的技術,在提升性能時對運算能力的需求通常較低。

再來,從2023年底以來,愈來愈多開發者使用「專家混合模型」(Mixture of Experts,簡稱MoE)的技術。這種方法利用初始路由機制,將問題分派給各個專門模型。舉個例子來說,就類似餐廳主廚將義大利麵訂單交給義大利廚師處理,這種方式也進一步減輕了晶片的負擔。 (相關報導: 輝達台灣總部落腳何處?郭智輝:黃仁勳6月會在COMPUTEX公布好消息 更多文章

騰訊表示,他們去年11月發布的MoE模型性能,可以媲美Meta旗下Facebook在去年7月推出的Llama 3.1模型。根據審閱過兩家公司論文的研究人員說法,騰訊的模型大約只用了Meta模型訓練所需運算能力的十分之一。

喜歡這篇文章嗎?請作者喝杯咖啡支持他

請他喝杯咖啡
更多文章
籲朝野立委支持憲訴法覆議 卓榮泰:堅持「惡法」就是造成錯誤歷史的一方
2025準備發財了!4生肖「財運飆升、事業運突破」,屬蛇者偏財運旺、有機會中大獎
網紅爆參加「7男3女性愛趴」!遭起底「曾拍台南反詐影片」警急下架切割 本尊回應了
哪一牌汽車導航最好用?內行大推1神款「路線圖示清楚、指引準確不亂繞」:真的無敵
台灣3間知名飯店接力熄燈!業者撐不住了「經營28年無奈關門」,最後營業時間曝光
台糖案》吳乃仁賤賣土地欠1.7億未還 郭智輝承諾:將依法追討
越南峴港必去景點推薦》世界最美沙灘、紅酒小法國村!8個錯過後悔一生的美景
兒子摔斷手醫藥費僅6700元…前消防夫妻竟「勒索麥當勞7060萬」!判決定讞「確定坐牢」
貨輪損毀海底電纜事件成兩岸官方罵戰 國台辦批我政府炒作「反中抗中」、陸委會嚴詞回應了
變胖變重的新世代BMW M5 馬力優勢壓制Audi RS6 Performance與Mercedes-AMG GT 63 S
「法務部長也怕得罪吳乃仁?」黃國昌轟鄭銘謙軟趴趴:特定檢察官很會「經營」
她中年轉職,怎麼帶好台灣團隊?Google手機技術總監:跟主管建立互信,你才會工作生活平衡
保時捷發表 911 Carrera S Coupé 車型,起售價 845 萬起!
不是竹科、中科!輝達第2座算力中心瘋傳落腳「這1城市」 經濟部長認:機率比較高
刮刮樂號碼都沒中「獎金15000」?隱藏規則曝光,一定要看清楚!
[CES 2025] 英特爾推出整車解決方案、次世代獨立顯示卡和AWS虛擬設計環境
民進黨2026台中不是蔡其昌?黃暐瀚曝另有黑馬:她受到今上眷顧
黃國昌爆吳乃仁與檢察官餐敘 吳思瑤籲勿看圖說故事:沒不法怎麼辦?
醫師律師沒擠進榜!2025年最有前景10大行業出爐,1職業「不看學經歷年薪破百萬」
台灣大哥大、AppWorks、USPACE戰略投資印尼智慧停車科技公司Soul Parking 推動印尼智慧城市發展
Honda CES 2025展出全球首發0 Saloon和0 SUV原型車,同時推出原創車載OS(ASIMO OS)!
一文看懂》為何說中歐正在「普京化」?奧地利極右派崛起,是否為俄羅斯入侵歐洲打開大門
受Luxgen n⁷人氣旺、格上電動車業績翻3倍,與中古車試駕一季、安心就買總訂單成長80%!
輝達第2座算力中心落腳高雄?郭智輝回應了
台灣福斯商旅2024年成長超過20%,榮登進口商旅車級距銷售冠軍!全新Amarok展間試乘啟動!
陳玉珍真有中國身分證?驗證網站跳出「恭喜」 查核中心實測結果曝光
蔡英文差點因年改「被政變」?退將揭祕辛:AIT曾緊急打過一通電話給她
以AI智慧座艙及其他創新AI驅動服務實現主動汽車網路防禦,VicOne與恩智浦半導體擴大合作!
比亞迪仰望U9真的飛起來 跳躍模式展現極致科技實力
蒸蛋怎麼蒸才不會有坑洞?用1招保證光滑又鮮嫩,完美還原壽司郎口感
麻疹患者全台跑!跨年、吃尾牙、聽演唱會 醫曝可能症狀:沒有特效藥
現代Ioniq 5 N DK版!韓國飄移王降臨東京改裝車展
政府農曆年前發紅包!長輩符合資格6000元「免申請直接入帳」,發放對象一次看
庇護島頻繁遭「騎上」,交通部呼籲勿「切西瓜」 !
全新面貌、續航力升級,全新改款 Škoda Enyaq 正式登場
「想到我是女性,反而會卡住自己」Google手機技術總監25年職場經驗:做好工作和性別無關
柴油性能大升級 ! 2025 Ram 2500 和 3500 重型皮卡全新登場
諾貝爾經濟學獎得主斯賓賽:以「國安」之名全面抵制中國,將使綠色轉型陷入全球困境
中國貨輪拖斷台灣海底電纜?國台辦稱渲染炒作,陸委會反指劣跡斑斑
大罷免煞車踩不住?前立委揭一地方觀察指標:戰鬥藍、綠「我鬥故我在」
饗饗爆食物中毒「遭重罰300萬元」!雙月社長「1原因」抱不平:以後台灣沒有人做晚餐了
氣象預報》氣溫暴跌探5度!越晚越濕冷「全台連凍5日」,一周天氣一次看
高雄春節慰問金來了!符合條件「免申請直接入帳2300元」,發放對象、時間曝光
在韓國不太能用Google Maps!5大韓國自助行必下載APP,找路/翻譯/換匯暢通無阻
事實查核「退流行」了?祖克柏為何喊停,對臉書又有什麼影響
關稅政策恐大幅影響通膨?陳鳳馨大膽判斷「川普2.0」貿易衝擊:2018年有先例
發熱衣不要直接丟洗衣機!專家曝6大清洗禁忌,小心越穿越冷「保暖效果打對折」
蘋果端出10億美元投資仍被打槍!印尼堅持本土製造標準,iPhone 16禁售令再延長