中國人工智慧(AI)公司DeepSeek發布的「R1」模型震驚了世界,該模型的性能似乎與美國領先模型不相上下,而訓練成本卻低得多。
這給現有的科技巨頭帶來不確定性,並引發人們對美國競爭力的質疑,但過去兩年一直對AI高昂成本感到沮喪的企業卻對這一進展相當樂觀。
本文為風傳媒與華爾街日報正式合作授權轉載。加入VVIP會員請點此訂閱:風傳媒・華爾街日報VVIP,獨享全球最低優惠價,暢讀中英日文全版本之華爾街日報,洞悉國際政經最前沿。
一些資訊長已在測試R1模型在商業案例中的有效性。另一些人則對數據安全問題和該模型的中國所有權保持警惕,但他們仍對該模型可能降低美國AI成本的前景感到興奮。
Reynolds American資訊長艾倫・格溫納(Aaron Gwinner)表示:「我認為這對企業來說是件好事,也許對OpenAI或一些科技巨頭來說不是,但對普通的企業資訊長來說是好事。」
格溫納表示,出於對數據安全的考慮,他不打算直接測試DeepSeek,但他希望這家中國公司用來構建該模型的技術能夠被微軟(Microsoft)等美國供應商複製,最終降低企業技術領導者的成本。
由於訓練模型所需的算力成本高昂,使用AI的成本一直居高不下。格溫納說,對Reynolds而言,這甚至阻礙了AI在公司內部的推廣。
由於美國政府實施出口限制,DeepSeek在獲取輝達(Nvidia)最高端AI晶片方面受限,因此該公司採取了不同於美國競爭對手的做法。DeepSeek表示,其最新模型之一的訓練成本為560萬美元。相比之下,AI公司Anthropic執行長達里奧・阿莫戴(Dario Amodei)去年給出的模型訓練成本數字是1億至10億美元。
格溫納說:「即使他們的成本是我們的十分之一,如果我們在美國也能想辦法做到,那真的是顛覆性的改變。」
一些企業領導者正在積極推進使用DeepSeek的技術。
紐約人壽保險公司(New York Life) 數據和分析長Don Vu表示,該公司正探索使用DeepSeek的AI模型。Vu說,紐約人壽有一個框架來評估不同模型在不同案例中的有效性,包括OpenAI的GPT、Anthropic的Claude和Meta Platforms的Llama模型。該公司現在將測試DeepSeek的新模型在服務和理賠等領域的使用效果。
Vu表示,紐約人壽不會使用現有的DeepSeek應用程式,因為這會引發數據安全問題。該公司將下載開源版本並開始進行試驗。