華爾街日報》中國的DeepSeek如何在AI賽道追趕美國 | 華爾街日報

把一群年輕的中國工程師組成團隊，由一位不看重經驗的老闆來領導。再加上一些聰明的編程捷徑，以及美國規定中的一個使他們能夠獲得先進製程晶片的缺陷。

這就是中國DeepSeek的人工智能（AI）程式得以震驚世界的秘訣。

訂閱風傳媒VIP會員，享有零廣告閱讀介面

透過<Google新聞>追蹤風傳媒

本文為風傳媒與華爾街日報正式合作授權轉載。加入VVIP會員請點此訂閱：風傳媒・華爾街日報VVIP，獨享全球最低優惠價，暢讀中英日文全版本之華爾街日報，洞悉國際政經最前沿。

傳統觀念認為，開發領先的AI需要使用大量昂貴的尖端電腦晶片，而中國企業將難以參與這場競爭，因為它們無法獲得這些尖端晶片。DeepSeek以其足智多謀顛覆了這種預期，導致華爾街損失1兆美元，並促使矽谷重新審視研發方式。

美國總統唐納德·川普（Donald Trump）表示，這家中國公司也給華盛頓敲響了警鐘。在未來幾個月，川普政府將就如何處置喬·拜登（Joe Biden）執政時期限制中國獲得最好AI晶片的政策做出決定。

DeepSeek的老闆梁文鋒把公司設在科技中心城市杭州，科技巨頭阿里巴巴（Alibaba）總部也在杭州。DeepSeek是從梁文鋒聯合創立的一家對沖基金發展起來的，該基金利用AI在金融市場裡尋找有利可圖的交易。

梁文鋒在2023年接受一家中國媒體採訪時曾表示，公司的大多數技術崗位都是由應屆畢業生或只有一兩年工作經驗的人來擔任。

他說，經驗可能是一種障礙。梁文鋒表示，「做一件事，有經驗的人會不假思索告訴你，應該這樣做，但沒有經驗的人，會反覆摸索、很認真去想應該怎麼做，然後找到一個符合當前實際情況的解決辦法。」

他們的成果現在正被矽谷最優秀、最聰明的一群人研究著。

直到最近，OpenAI的ChatGPT等開創性AI程式的底層大模型還是通過大量文本、圖像和其他數據訓練出來的。他們採用專門的演算法來尋找聊天機器人可以用來進行對話的模式。

DeepSeek的策略則是利用自己的一些創新以及同樣受到限制的中國AI公司常用的技術，來減少訓練模型所需的數據處理。

智庫蘭德公司（Rand）的AI研究員萊納特·海姆（Lennart Heim）表示，想像一下早期版本的ChatGPT就像一個讀過圖書館裡所有書籍的圖書管理員。當被問到一個問題時，ChatGPT會根據讀過的許多書給出答案。

這個過程既耗時又昂貴。閱讀這些書籍需要很多晶片，會耗費大量電力。

DeepSeek採取了另一種方法。它的圖書管理員並沒有讀過所有的書，而是在被問到一個問題後，被訓練成能夠找到合適的書來回答問題。

這涉及另一種技術，稱為「混合專家」。DeepSeek和其他一些AI開發者並沒有試圖找到一個能夠準確回答任何主題方面問題的圖書管理員，他們所做的類似於將問題委託給特定領域（如小說、期刊和烹飪）的一系列專家。每位專家需要的培訓更少，從而減輕了對晶片一次性完成所有任務的需求。（相關報導：華爾街日報》長假適合做這件一年中最有成效的事｜更多文章）

DeepSeek的方法在提出問題之前需要較少的時間和算力，但在回答時需要較多的時間和算力。海姆說，綜合考慮所有因素，DeepSeek的捷徑可以幫助它以大大低於競爭模型的成本訓練AI。

「通過工程應對限制，」英特爾（Intel）前首席執行官帕特·基辛格（Pat Gelsinger）在X上寫道。「中國工程師的資源有限，他們必須找到創造性的解決方案。」

獨創性只是DeepSeek成功的一部分。

另一部分是美國出口管制的出台過程經歷起伏，給了DeepSeek購買強大美國晶片的窗口期。

拜登政府在2022年對出口到中國的晶片實施了管制。想要向中國銷售的美國公司首先需要限制一種被稱為互連頻寬的晶片性能，這指的是數據傳輸的速度。

為應對這一政策，全球領先的AI晶片設計公司輝達（Nvidia）為中國設計了一款符合這一參數的新產品，但通過在其他方面保持高性能來彌補這一缺陷。一些分析師表示，這款晶片的性能幾乎與輝達當時最好的晶片一樣強大。

美國官員公開和私下錶達了不滿，認為雖然輝達沒有違反上述法規，但違背了這一法規的精神。拜登政府的一位前高級官員表示，政府曾希望行業領袖能夠合作，為快速變化的技術設計有效的出口管制。

輝達一位發言人周一表示，「DeepSeek是一項出色的AI進步」，它展示了一種創新的AI技術，同時使用了「完全符合出口管制」的算力。

在最初的管制實施一年後，美國政府收緊了規定。儘管如此，這已為DeepSeek購買輝達強大的中國市場晶片H800留下了大約一年的窗口期。DeepSeek在去年12月發表的一篇研究論文中表示，該公司使用了2,048塊此類晶片來訓練其一個AI模型。

自2023年相關規定修訂以來，輝達為中國設計了一款符合出口管制的新晶片，其性能遠不如H800。

一些美國AI行業領袖懷疑DeepSeek並未透露其所有的秘密。他們表示，中國研究人員可能在美國實施限制之前就囤積了尖端的輝達晶片，或者使用了變通方法，例如從美國和中國以外的國家和地區獲得由輝達高端晶片提供支持的算力。拜登政府在任內最後幾天實施了新規來解決這些漏洞。（相關報導：華爾街日報》長假適合做這件一年中最有成效的事｜更多文章）

DeepSeek沒有回應置評請求。