「AI蒸餾」是什麼?DeepSeek、月之暗面遭點名,中美「模型能力之爭」懶人包

2026-05-05 15:55
(Nano Banana Pro繪製)
(Nano Banana Pro繪製)

人工智慧(AI)競賽持續升溫,一項原本屬於工程優化的技術——AI蒸餾(AI distillation,又稱知識蒸餾)——正迅速走向地緣政治前線,成為美中科技競爭中的新焦點。

過去幾週,圍繞這項技術的爭議明顯升溫。美國政府和部分大型科技公司指控,一些中國企業透過蒸餾技術「複製」美國的先進AI模型能力;中國則反駁相關說法,強調技術進步來自自主研發,並質疑指控帶有政治動機。原本偏向工程與研究的技術問題,正逐步升級為涉及知識產權、競爭公平與國家安全的議題。

美國總統川普週一(5月4日)表示,預計將於本月稍後與中國國家主席習近平會面,並稱會提醒對方美國在AI領域保持領先地位。在白宮舉行的小型企業峰會上發表演說時,川普將雙方科技競爭形容為既具競爭但仍保持友好的關係,顯示AI已成為雙邊關係中的核心議題之一。

川普說:「我們已在人工智慧領域領先中國。兩週後我將與習近平主席會晤。我很期待……我們之間存在著非常友好的競爭,但這實際上是一次非常重要的訪問。」

美國布魯金斯學會中國中心研究員陳凱欣(Kyle Chan)博士對BBC中文表示,美國的政策思路正在發生轉變,「美國認為,只限制晶片與設備出口已經不夠,相關行動已擴展到演算法與數據。」

什麼是「AI蒸餾」?

要理解這場爭議,首先需要回到蒸餾技術本身。

AI蒸餾建立在當前人工智慧的基本現實之上:性能最強的AI模型,往往也是最昂貴、最難部署的。

當前主流的大型語言模型系統,通常擁有數十億甚至數千億個參數,比如OpenAI與Anthropic開發的模型,之所以能夠處理複雜語言任務,很大程度依賴於龐大算力與高端晶片支撐,其訓練與運行成本極高。

在這樣的條件下,AI蒸餾提供了一條不同的技術路徑。

它的核心原理,是用一個性能強大的「教師模型」,對大量任務生成結果,再用輸出的結果來訓練一個教小的「學生模型」。與傳統大語言模型訓練方式不同,「學生模型」不僅學習正確答案,還會學習「教師模型」對不同答案的判斷方式。

舉例來說,在傳統訓練中,AI模型只需判斷一張圖片是貓還是狗。但在蒸餾過程中,模型會學習各更細緻的概率分布,比如「80%是貓、15%是狗、5%是其他動物」。這種資訊能幫助「學生模型」掌握更完整的決策邏輯。

因此,一個較小的模型,往往能在成本更低的情況下,達到接近大型模型的效果。它並不是從零開始學習,而是建立在既有模型能力之上的「二次學習」。

這種技術正在加速AI技術的傳播。一旦強大模型被開發出來,它的能力可以透過蒸餾技術,被轉移到多個較小的模型中,加速商業化和跨場景應用。這使得AI能力不再局限於少數科技巨頭,可能更快進入市場,甚至跨越國界。

AI業界的質疑

近日,馬斯克(Elon Musk)在一場涉及OpenAI的訴訟案庭審中承認,其旗下人工智慧公司xAI在訓練模型時「部分」使用了OpenAI模型的輸出進行蒸餾。他直言:「一般來說,所有AI公司都這麼做」。

這一表態顯示,利用其他模型進行蒸餾並非個別現象,而是在業界某種程度上存在的做法。支持者認為,這有助於降低AI開發成本,加速技術普及;批評者說,這種做法可能模糊創新與「搭便車」之間的界線,並對知識產權構成挑戰。

當前,這項技術本身仍處於法律與倫理的灰色地帶。陳凱欣博士對BBC中文說,蒸餾難以被簡單歸類為「技術竊取」,「因為它不涉及直接取得底層源碼或模型參數,而且在AI公司和研究領域中,這本來就是常見做法」。

但他也説,在商業競爭中,情況相對複雜,「如果利用競爭對手投入大量資源訓練的模型來改進自身產品,確實會引發公平性的質疑。」

從晶片封鎖到模型能力之爭

「AI蒸餾」之所以受到高度關注,與當前美中科技競爭的結構性變化密切相關。

近年來,美國與中國在科技領域的競爭持續升溫,AI被普遍視為關鍵戰略技術之一。從半導體、算力,到數據與算法,再到應用落地,競爭已經從單一環節擴展至整個技術體系。

其中,高端晶片一直是關鍵瓶頸。美國近年對中國實施了一系列出口管制,限制半導體與高端晶片流通,試圖削弱中國在高性能計算與前沿AI模型方面的能力。由於大型AI模型高度依賴這類硬體,這些措施確實對產業帶來影響。

但蒸餾技術的興起,似乎正在改變這種競爭邏輯。

在算力受限的情況下,中國企業開始尋找替代路徑,包括提升算法效率、優化模型架構,嘗試降低對高端硬體的依賴。「AI蒸餾」正好符合這一需求。透過這項技術,即使算力有限,也能在一定程度上實現接近大型模型的效果。

換言之,競爭的焦點正在從誰擁有最強晶片,轉向誰能更有效利用已有資源。

對中國而言,這提供了一條在限制條件下持續推進AI發展的路徑。對美國而言,則帶來新的挑戰:即使限制硬體出口,也未必能完全阻止技術能力的擴散。

這種壓力也反映在華盛頓近期的政策與立法動向中。美國兩黨參議員週一(5月4日)推出《人工智慧監管法案》(AI Overwatch Act),試圖將先進AI晶片的出口限制上升至法律層面。發起人將當前局勢形容為一場「AI軍備競賽」,明確指出要讓美國「永久性地保留這些關鍵技術的所有權、監督權和戰略利用權」。

在此背景下,蒸餾等技術的敏感性也隨之上升。陳博士表示,美國的政策思路正在發生轉變,其行動已從硬體擴展至演算法與數據領域,不再認為僅僅限制中國取得半導體晶片與設備就足夠。

他表示,這反映出兩國不同的發展策略。「美國傾向於投入資源打造更大、更強的模型,並視其為通往通用人工智慧的重要路徑;中國則更重視效率和普及,透過分享、在彼此成果上持續建構的開源模式佔據絕對主導地位。」

「AI蒸餾」影響究竟有多大?

在政策和企業層面,緊張關係也日益升高。OpenAI、Anthropic、谷歌等美國頂尖科技公司,表示觀察到異常的「大規模模型調用行為,可能與蒸餾訓練有關。中國人工智慧公司「深度探索」(DeepSeek)和「月之暗面」(Moonshot AI)等公司被指責透過自動化腳本,對美國模型進行了數百萬次對話查詢。

在此之前,DeepSeek等中國企業因推出成本較低、但性能接近高端模型的產品而受到關注。北京強調,技術進步來自持續投入和工程創新。支持者認為,這體現了效率和優化能力提升;批評者則質疑,這種低成本優勢是否部分依賴於蒸餾等方法。

諮詢公司DGA Group合夥人、中美科技政策專家保羅·特里奧洛(Paul Triolo)對BBC中文說,美國的關注已從硬體延伸至模型、數據與算法本身,特別是在涉及潛在安全風險的能力時,監管態度更趨審慎。

他指出,目前的核心問題在於,缺乏明確的方法來評估蒸餾的影響。「外界很難量化,在中國開源模型的基準測試表現中,究竟有多少是來自於對Claude/GPT的蒸餾,又有多少來自強化學習、架構設計、算力與數據品質等。」

他說,要對此問題給出可靠的答案,必須依賴資訊披露、審計或平台內部測試數據,而這些資訊目前多數並不公開。

這也引出一個潛在問題:當AI能力可以被快速複製與轉移,既有的技術領先優勢能維持多久?而現有的監管與知識產權框架,是否能跟上這種技術擴散的速度? (相關報導: 川習會前夕再施壓!美國要求北京加速接收「遣返非法移民」,否則將實行簽證制裁 更多文章

    今日精選
    更多文章
    流行性腦脊髓膜炎增2例!1個月男嬰重症進ICU 今年已增7例創10年新高
    藍白封殺徐錫祥檢察總長人事案!王鴻薇投出「唯一廢票」 背後原因曝光
    羽田、香港都輸了!全球最佳機場排行冠軍「很好逛美食多、景色絕美」:交通轉機都方便
    存了一輩子錢卻不敢花?專家曝退休族2大理財錯誤,小心晚年過得超辛苦
    同時買3張電影票 「被收3次手續費」!內行教1招省錢小撇步:線上預訂免多繳一毛錢
    台股衝破4萬點該獲利了結嗎?法人勸別急著下車,今年可望擺脫「五窮六絕」魔咒
    左媒紐約時報竟被指控「歧視」 美聯邦政府機構擬提起民權訴訟
    震傳媒民調》持續緊咬!李四川小贏蘇巧慧4.8個百分點 新北人認「2大主因」害他被拉近
    賴清德提名檢察總長「滑鐵盧」!徐錫祥61票不同意未通過 民眾黨團揭關鍵原因
    五月天台北大巨蛋演唱會連唱7天,拓元搶票時間曝!購票平台/座位圖/嘉賓歌單/交通方式一次看|持續更新
    台灣大根與阿波羅聯手 年供千萬度綠電引爆半導體低碳革命
    彰化青平盟全球大進擊!熱血菁英集結 打造最強「媒體X農業」跨界國家隊
    為什麼年輕人動不動就離職?不全是因為薪水,專家曝5原因,難怪公司留不住人
    為何低價旅行團團費這麼便宜? 他揭露「7大內幕」,旅行社不會告訴你的價格秘密
    逸硯空間從裝潢到上市 定義信任新標準
    15.6萬獎勵金入袋!勞動部這計畫補足新鮮人薪資缺口,缺工獎勵與尋職津貼翻轉求職路
    漢堡王優惠懶人包2026》雞塊薯條買一送一、89元爽吃小華堡套餐!24組代碼一次看
    新北青年局推動文創出海 於「吉隆坡插畫展」 展現新北文創國際競爭力
    中高齡可以做什麼工作?50歲靠1副業「一年多賺1300萬元」,收入比企業主管更高
    不能只靠台積電!庫克密會英特爾、考察三星德州廠,要替晶片代工尋找「第二可靠選項」
    點數當現金用!國泰世華攜手全支付、全家擴大支付版圖
    核三廠加速購買燃料棒準備重啟?台電董座曾文生曝時程:不是想買就買
    冷氣1常用功能千萬別開!他一按「電費暴增3萬」,能源署證實耗電2倍狂燒錢
    存股族看傻眼!0050成分股大洗牌 網驚:怎麼一堆雜魚
    解密賴清德回台「極限航程」全細節 學者揭台灣戰略運用:元首外交新利器
    別只看光陽、山葉!2026最強機車是它「賣爆1.3萬台」,車主讚:省油妥善率高、採買通勤神車
    柯志恩民調大敗16%?藍小將曝賴瑞隆「最弱母雞」撕不掉:民進黨基本盤都拿不滿
    從老古董A-10在荷莫茲海峽「慢」破伊朗快艇蜂群戰術 看台軍如何應付解放軍「漁船群」侵犯
    貨輪在波斯灣爆炸,韓國這下慘了!川普斷言「就是伊朗幹的」,趁機逼迫青瓦台出兵護航
    知名醫美集團多家診所疑偷拍?煙霧偵測器內竟是針孔 愛爾麗急發聲明回應了
    6000元直接沒了!1縣市嚴抓「亂丟便當盒、家庭垃圾」,科技執法拍到照樣開罰
    保溫瓶千萬不要只用清水沖!專家教2招正確清潔方法,黴菌髒污異味徹底消失
    台股奔向主動投資時代!ETF新兵00405A即將上陣,三大選股邏輯一次看懂
    盤後快訊》台股穩守4萬點但暗藏變盤?聯發科亮燈漲停、鴻海239元強攻,「這類股」慘跌逾9%
    LINE宣布「1常用優惠」沒了!5/13起全面取消,3實用功能也縮水,官方調整一次看
    川習會「3大議題」浮現,交易台灣換取中美合作?戰略學者黃介正:台灣是跑不掉的
    別只看東吳輔大!台灣最強私立大學是它,世界排名超越國立頂大、競爭力強好就業
    肯德基優惠代碼2026》比買一送一還划算!蛋撻1元多一件、爽嗑6塊雞不到400元
    政府發1000元物資券!符合資格1縣市「免申請直接領取」,發放時間方式一次看
    【新新聞】美日韓「螞蟻雄兵」大軍壓境!散戶槓桿狂飆推升股市 巴菲特卻喊:這根本是賭場!
    剛從史瓦帝尼回台灣!賴清德將接待「這南美洲友邦」總統 當地產業團先行訪台
    陸客不去日本改去哪?五一長假「144萬中國人塞爆1國家」,遊客讚:好買好玩,吸引力超高
    上千護理師包圍衛福部!三班護病比入法卡關2年 護理界怒吼:究竟在等什麼?
    士檢偵辦麥當勞性侵案「二度不起訴前主管」 高檢署再打回票:發回續查
    JR東日本聯手伊藤忠!新不動產巨頭將鐵路變身「地方創生」推手,目標5年營收衝上2500億日圓
    川普推「自由計畫」要荷莫茲海峽能自由航行 航運業為何痛批計畫缺乏實務細節
    淨零排放國家隊再擴大!USGBC與台糖簽署 MOU 引進技術加速低碳運輸
    台積電和你想得有差?她從公務員年薪看「台灣2大困境」:全民都在股市賭
    星巴克、麥當勞能撐住嗎?油價衝擊消費習慣 餐飲巨頭掀起「促銷救命戰」
    不是日韓!這1地超愛到台灣旅遊「今年已27萬人朝聖」,搶著移民工作、黏著度大增