人工智慧(AI)競賽持續升溫,一項原本屬於工程優化的技術——AI蒸餾(AI distillation,又稱知識蒸餾)——正迅速走向地緣政治前線,成為美中科技競爭中的新焦點。
過去幾週,圍繞這項技術的爭議明顯升溫。美國政府和部分大型科技公司指控,一些中國企業透過蒸餾技術「複製」美國的先進AI模型能力;中國則反駁相關說法,強調技術進步來自自主研發,並質疑指控帶有政治動機。原本偏向工程與研究的技術問題,正逐步升級為涉及知識產權、競爭公平與國家安全的議題。
美國總統川普週一(5月4日)表示,預計將於本月稍後與中國國家主席習近平會面,並稱會提醒對方美國在AI領域保持領先地位。在白宮舉行的小型企業峰會上發表演說時,川普將雙方科技競爭形容為既具競爭但仍保持友好的關係,顯示AI已成為雙邊關係中的核心議題之一。
川普說:「我們已在人工智慧領域領先中國。兩週後我將與習近平主席會晤。我很期待……我們之間存在著非常友好的競爭,但這實際上是一次非常重要的訪問。」
美國布魯金斯學會中國中心研究員陳凱欣(Kyle Chan)博士對BBC中文表示,美國的政策思路正在發生轉變,「美國認為,只限制晶片與設備出口已經不夠,相關行動已擴展到演算法與數據。」
什麼是「AI蒸餾」?
要理解這場爭議,首先需要回到蒸餾技術本身。
AI蒸餾建立在當前人工智慧的基本現實之上:性能最強的AI模型,往往也是最昂貴、最難部署的。
當前主流的大型語言模型系統,通常擁有數十億甚至數千億個參數,比如OpenAI與Anthropic開發的模型,之所以能夠處理複雜語言任務,很大程度依賴於龐大算力與高端晶片支撐,其訓練與運行成本極高。
在這樣的條件下,AI蒸餾提供了一條不同的技術路徑。
它的核心原理,是用一個性能強大的「教師模型」,對大量任務生成結果,再用輸出的結果來訓練一個教小的「學生模型」。與傳統大語言模型訓練方式不同,「學生模型」不僅學習正確答案,還會學習「教師模型」對不同答案的判斷方式。
舉例來說,在傳統訓練中,AI模型只需判斷一張圖片是貓還是狗。但在蒸餾過程中,模型會學習各更細緻的概率分布,比如「80%是貓、15%是狗、5%是其他動物」。這種資訊能幫助「學生模型」掌握更完整的決策邏輯。
因此,一個較小的模型,往往能在成本更低的情況下,達到接近大型模型的效果。它並不是從零開始學習,而是建立在既有模型能力之上的「二次學習」。
這種技術正在加速AI技術的傳播。一旦強大模型被開發出來,它的能力可以透過蒸餾技術,被轉移到多個較小的模型中,加速商業化和跨場景應用。這使得AI能力不再局限於少數科技巨頭,可能更快進入市場,甚至跨越國界。
AI業界的質疑
近日,馬斯克(Elon Musk)在一場涉及OpenAI的訴訟案庭審中承認,其旗下人工智慧公司xAI在訓練模型時「部分」使用了OpenAI模型的輸出進行蒸餾。他直言:「一般來說,所有AI公司都這麼做」。
這一表態顯示,利用其他模型進行蒸餾並非個別現象,而是在業界某種程度上存在的做法。支持者認為,這有助於降低AI開發成本,加速技術普及;批評者說,這種做法可能模糊創新與「搭便車」之間的界線,並對知識產權構成挑戰。
當前,這項技術本身仍處於法律與倫理的灰色地帶。陳凱欣博士對BBC中文說,蒸餾難以被簡單歸類為「技術竊取」,「因為它不涉及直接取得底層源碼或模型參數,而且在AI公司和研究領域中,這本來就是常見做法」。
但他也説,在商業競爭中,情況相對複雜,「如果利用競爭對手投入大量資源訓練的模型來改進自身產品,確實會引發公平性的質疑。」
從晶片封鎖到模型能力之爭
「AI蒸餾」之所以受到高度關注,與當前美中科技競爭的結構性變化密切相關。
近年來,美國與中國在科技領域的競爭持續升溫,AI被普遍視為關鍵戰略技術之一。從半導體、算力,到數據與算法,再到應用落地,競爭已經從單一環節擴展至整個技術體系。
其中,高端晶片一直是關鍵瓶頸。美國近年對中國實施了一系列出口管制,限制半導體與高端晶片流通,試圖削弱中國在高性能計算與前沿AI模型方面的能力。由於大型AI模型高度依賴這類硬體,這些措施確實對產業帶來影響。
但蒸餾技術的興起,似乎正在改變這種競爭邏輯。
在算力受限的情況下,中國企業開始尋找替代路徑,包括提升算法效率、優化模型架構,嘗試降低對高端硬體的依賴。「AI蒸餾」正好符合這一需求。透過這項技術,即使算力有限,也能在一定程度上實現接近大型模型的效果。
換言之,競爭的焦點正在從誰擁有最強晶片,轉向誰能更有效利用已有資源。
對中國而言,這提供了一條在限制條件下持續推進AI發展的路徑。對美國而言,則帶來新的挑戰:即使限制硬體出口,也未必能完全阻止技術能力的擴散。
這種壓力也反映在華盛頓近期的政策與立法動向中。美國兩黨參議員週一(5月4日)推出《人工智慧監管法案》(AI Overwatch Act),試圖將先進AI晶片的出口限制上升至法律層面。發起人將當前局勢形容為一場「AI軍備競賽」,明確指出要讓美國「永久性地保留這些關鍵技術的所有權、監督權和戰略利用權」。
在此背景下,蒸餾等技術的敏感性也隨之上升。陳博士表示,美國的政策思路正在發生轉變,其行動已從硬體擴展至演算法與數據領域,不再認為僅僅限制中國取得半導體晶片與設備就足夠。
他表示,這反映出兩國不同的發展策略。「美國傾向於投入資源打造更大、更強的模型,並視其為通往通用人工智慧的重要路徑;中國則更重視效率和普及,透過分享、在彼此成果上持續建構的開源模式佔據絕對主導地位。」
「AI蒸餾」影響究竟有多大?
在政策和企業層面,緊張關係也日益升高。OpenAI、Anthropic、谷歌等美國頂尖科技公司,表示觀察到異常的「大規模」模型調用行為,可能與蒸餾訓練有關。中國人工智慧公司「深度探索」(DeepSeek)和「月之暗面」(Moonshot AI)等公司被指責透過自動化腳本,對美國模型進行了數百萬次對話查詢。
在此之前,DeepSeek等中國企業因推出成本較低、但性能接近高端模型的產品而受到關注。北京強調,技術進步來自持續投入和工程創新。支持者認為,這體現了效率和優化能力提升;批評者則質疑,這種低成本優勢是否部分依賴於蒸餾等方法。
諮詢公司DGA Group合夥人、中美科技政策專家保羅·特里奧洛(Paul Triolo)對BBC中文說,美國的關注已從硬體延伸至模型、數據與算法本身,特別是在涉及潛在安全風險的能力時,監管態度更趨審慎。
他指出,目前的核心問題在於,缺乏明確的方法來評估蒸餾的影響。「外界很難量化,在中國開源模型的基準測試表現中,究竟有多少是來自於對Claude/GPT的蒸餾,又有多少來自強化學習、架構設計、算力與數據品質等。」
他說,要對此問題給出可靠的答案,必須依賴資訊披露、審計或平台內部測試數據,而這些資訊目前多數並不公開。
這也引出一個潛在問題:當AI能力可以被快速複製與轉移,既有的技術領先優勢能維持多久?而現有的監管與知識產權框架,是否能跟上這種技術擴散的速度? (相關報導: 川習會前夕再施壓!美國要求北京加速接收「遣返非法移民」,否則將實行簽證制裁 | 更多文章 )



















































