「AI蒸餾」是什麼？DeepSeek、月之暗面遭點名，中美「模型能力之爭」懶人包 | BBC News 中文

人工智慧（AI）競賽持續升溫，一項原本屬於工程優化的技術——AI蒸餾（AI distillation，又稱知識蒸餾）——正迅速走向地緣政治前線，成為美中科技競爭中的新焦點。

過去幾週，圍繞這項技術的爭議明顯升溫。美國政府和部分大型科技公司指控，一些中國企業透過蒸餾技術「複製」美國的先進AI模型能力；中國則反駁相關說法，強調技術進步來自自主研發，並質疑指控帶有政治動機。原本偏向工程與研究的技術問題，正逐步升級為涉及知識產權、競爭公平與國家安全的議題。

美國總統川普週一（5月4日）表示，預計將於本月稍後與中國國家主席習近平會面，並稱會提醒對方美國在AI領域保持領先地位。在白宮舉行的小型企業峰會上發表演說時，川普將雙方科技競爭形容為既具競爭但仍保持友好的關係，顯示AI已成為雙邊關係中的核心議題之一。

川普說：「我們已在人工智慧領域領先中國。兩週後我將與習近平主席會晤。我很期待……我們之間存在著非常友好的競爭，但這實際上是一次非常重要的訪問。」

美國布魯金斯學會中國中心研究員陳凱欣（Kyle Chan）博士對BBC中文表示，美國的政策思路正在發生轉變，「美國認為，只限制晶片與設備出口已經不夠，相關行動已擴展到演算法與數據。」

什麼是「AI蒸餾」？

要理解這場爭議，首先需要回到蒸餾技術本身。

AI蒸餾建立在當前人工智慧的基本現實之上：性能最強的AI模型，往往也是最昂貴、最難部署的。

當前主流的大型語言模型系統，通常擁有數十億甚至數千億個參數，比如OpenAI與Anthropic開發的模型，之所以能夠處理複雜語言任務，很大程度依賴於龐大算力與高端晶片支撐，其訓練與運行成本極高。

在這樣的條件下，AI蒸餾提供了一條不同的技術路徑。

它的核心原理，是用一個性能強大的「教師模型」，對大量任務生成結果，再用輸出的結果來訓練一個教小的「學生模型」。與傳統大語言模型訓練方式不同，「學生模型」不僅學習正確答案，還會學習「教師模型」對不同答案的判斷方式。

舉例來說，在傳統訓練中，AI模型只需判斷一張圖片是貓還是狗。但在蒸餾過程中，模型會學習各更細緻的概率分布，比如「80%是貓、15%是狗、5%是其他動物」。這種資訊能幫助「學生模型」掌握更完整的決策邏輯。

因此，一個較小的模型，往往能在成本更低的情況下，達到接近大型模型的效果。它並不是從零開始學習，而是建立在既有模型能力之上的「二次學習」。

這種技術正在加速AI技術的傳播。一旦強大模型被開發出來，它的能力可以透過蒸餾技術，被轉移到多個較小的模型中，加速商業化和跨場景應用。這使得AI能力不再局限於少數科技巨頭，可能更快進入市場，甚至跨越國界。

AI業界的質疑

近日，馬斯克（Elon Musk）在一場涉及OpenAI的訴訟案庭審中承認，其旗下人工智慧公司xAI在訓練模型時「部分」使用了OpenAI模型的輸出進行蒸餾。他直言：「一般來說，所有AI公司都這麼做」。

這一表態顯示，利用其他模型進行蒸餾並非個別現象，而是在業界某種程度上存在的做法。支持者認為，這有助於降低AI開發成本，加速技術普及；批評者說，這種做法可能模糊創新與「搭便車」之間的界線，並對知識產權構成挑戰。

當前，這項技術本身仍處於法律與倫理的灰色地帶。陳凱欣博士對BBC中文說，蒸餾難以被簡單歸類為「技術竊取」，「因為它不涉及直接取得底層源碼或模型參數，而且在AI公司和研究領域中，這本來就是常見做法」。

但他也説，在商業競爭中，情況相對複雜，「如果利用競爭對手投入大量資源訓練的模型來改進自身產品，確實會引發公平性的質疑。」

從晶片封鎖到模型能力之爭

「AI蒸餾」之所以受到高度關注，與當前美中科技競爭的結構性變化密切相關。

近年來，美國與中國在科技領域的競爭持續升溫，AI被普遍視為關鍵戰略技術之一。從半導體、算力，到數據與算法，再到應用落地，競爭已經從單一環節擴展至整個技術體系。

其中，高端晶片一直是關鍵瓶頸。美國近年對中國實施了一系列出口管制，限制半導體與高端晶片流通，試圖削弱中國在高性能計算與前沿AI模型方面的能力。由於大型AI模型高度依賴這類硬體，這些措施確實對產業帶來影響。

但蒸餾技術的興起，似乎正在改變這種競爭邏輯。

在算力受限的情況下，中國企業開始尋找替代路徑，包括提升算法效率、優化模型架構，嘗試降低對高端硬體的依賴。「AI蒸餾」正好符合這一需求。透過這項技術，即使算力有限，也能在一定程度上實現接近大型模型的效果。

換言之，競爭的焦點正在從誰擁有最強晶片，轉向誰能更有效利用已有資源。

對中國而言，這提供了一條在限制條件下持續推進AI發展的路徑。對美國而言，則帶來新的挑戰：即使限制硬體出口，也未必能完全阻止技術能力的擴散。

這種壓力也反映在華盛頓近期的政策與立法動向中。美國兩黨參議員週一（5月4日）推出《人工智慧監管法案》（AI Overwatch Act），試圖將先進AI晶片的出口限制上升至法律層面。發起人將當前局勢形容為一場「AI軍備競賽」，明確指出要讓美國「永久性地保留這些關鍵技術的所有權、監督權和戰略利用權」。

在此背景下，蒸餾等技術的敏感性也隨之上升。陳博士表示，美國的政策思路正在發生轉變，其行動已從硬體擴展至演算法與數據領域，不再認為僅僅限制中國取得半導體晶片與設備就足夠。

他表示，這反映出兩國不同的發展策略。「美國傾向於投入資源打造更大、更強的模型，並視其為通往通用人工智慧的重要路徑；中國則更重視效率和普及，透過分享、在彼此成果上持續建構的開源模式佔據絕對主導地位。」

「AI蒸餾」影響究竟有多大？

在政策和企業層面，緊張關係也日益升高。OpenAI、Anthropic、谷歌等美國頂尖科技公司，表示觀察到異常的「大規模」模型調用行為，可能與蒸餾訓練有關。中國人工智慧公司「深度探索」（DeepSeek）和「月之暗面」（Moonshot AI）等公司被指責透過自動化腳本，對美國模型進行了數百萬次對話查詢。

在此之前，DeepSeek等中國企業因推出成本較低、但性能接近高端模型的產品而受到關注。北京強調，技術進步來自持續投入和工程創新。支持者認為，這體現了效率和優化能力提升；批評者則質疑，這種低成本優勢是否部分依賴於蒸餾等方法。

諮詢公司DGA Group合夥人、中美科技政策專家保羅·特里奧洛（Paul Triolo）對BBC中文說，美國的關注已從硬體延伸至模型、數據與算法本身，特別是在涉及潛在安全風險的能力時，監管態度更趨審慎。

他指出，目前的核心問題在於，缺乏明確的方法來評估蒸餾的影響。「外界很難量化，在中國開源模型的基準測試表現中，究竟有多少是來自於對Claude/GPT的蒸餾，又有多少來自強化學習、架構設計、算力與數據品質等。」

他說，要對此問題給出可靠的答案，必須依賴資訊披露、審計或平台內部測試數據，而這些資訊目前多數並不公開。

這也引出一個潛在問題：當AI能力可以被快速複製與轉移，既有的技術領先優勢能維持多久？而現有的監管與知識產權框架，是否能跟上這種技術擴散的速度？（相關報導：川習會前夕再施壓！美國要求北京加速接收「遣返非法移民」，否則將實行簽證制裁｜更多文章）