華爾街日報》中國的DeepSeek如何在AI賽道追趕美國

2025-01-30 09:06

? 人氣

DeepSeek。(取自X社群)

DeepSeek。(取自X社群)

把一群年輕的中國工程師組成團隊,由一位不看重經驗的老闆來領導。再加上一些聰明的編程捷徑,以及美國規定中的一個使他們能夠獲得先進製程晶片的缺陷。

透過<Google新聞> 追蹤風傳媒

這就是中國DeepSeek的人工智能(AI)程式得以震驚世界的秘訣。

本文為風傳媒與華爾街日報正式合作授權轉載。加入VVIP會員請點此訂閱:風傳媒・華爾街日報VVIP,獨享全球最低優惠價,暢讀中英日文全版本之華爾街日報,洞悉國際政經最前沿。

傳統觀念認為,開發領先的AI需要使用大量昂貴的尖端電腦晶片,而中國企業將難以參與這場競爭,因為它們無法獲得這些尖端晶片。DeepSeek以其足智多謀顛覆了這種預期,導致華爾街損失1兆美元,並促使矽谷重新審視研發方式。

美國總統唐納德·川普(Donald Trump)表示,這家中國公司也給華盛頓敲響了警鐘。在未來幾個月,川普政府將就如何處置喬·拜登(Joe Biden)執政時期限制中國獲得最好AI晶片的政策做出決定。

DeepSeek的老闆梁文鋒把公司設在科技中心城市杭州,科技巨頭阿里巴巴(Alibaba)總部也在杭州。DeepSeek是從梁文鋒聯合創立的一家對沖基金發展起來的,該基金利用AI在金融市場裡尋找有利可圖的交易。

梁文鋒在2023年接受一家中國媒體採訪時曾表示,公司的大多數技術崗位都是由應屆畢業生或只有一兩年工作經驗的人來擔任。

他說,經驗可能是一種障礙。梁文鋒表示,「做一件事,有經驗的人會不假思索告訴你,應該這樣做,但沒有經驗的人,會反覆摸索、很認真去想應該怎麼做,然後找到一個符合當前實際情況的解決辦法。」

他們的成果現在正被矽谷最優秀、最聰明的一群人研究著。

直到最近,OpenAI的ChatGPT等開創性AI程式的底層大模型還是通過大量文本、圖像和其他數據訓練出來的。他們採用專門的演算法來尋找聊天機器人可以用來進行對話的模式。

DeepSeek的策略則是利用自己的一些創新以及同樣受到限制的中國AI公司常用的技術,來減少訓練模型所需的數據處理。

智庫蘭德公司(Rand)的AI研究員萊納特·海姆(Lennart Heim)表示,想像一下早期版本的ChatGPT就像一個讀過圖書館裡所有書籍的圖書管理員。當被問到一個問題時,ChatGPT會根據讀過的許多書給出答案。

這個過程既耗時又昂貴。閱讀這些書籍需要很多晶片,會耗費大量電力。

DeepSeek採取了另一種方法。它的圖書管理員並沒有讀過所有的書,而是在被問到一個問題後,被訓練成能夠找到合適的書來回答問題。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章