一上架就在蘋果商店超越ChatGPT下載量,來自中國的DeepSeek究竟是何方神聖?

2025-01-28 14:00
中國新型生成式AI系統「DeepSeek」橫空出世,讓美股相關產業暴跌。(美聯社)
中國新型生成式AI系統「DeepSeek」橫空出世,讓美股相關產業暴跌。(美聯社)

就在川普宣布5000億美元投資人工智慧領域之際,中國AI初創公司深度求索(DeepSeek)於本周一(1月27日)推出了兩個新的AI語言模型:DeepSeek-R1-Zero和DeepSeek-R1。據公司透露,這些模型在某些基準測試中的表現卓越,性能直接對標OpenAI的o1正式版。而其價格僅為o1的幾十分之一,且以開源形式向全球開發者開放。

與大多數傳統大型語言模型(LLM)不同,DeepSeek-R1采用了一種被稱為「模擬推理」(simulated reasoning)的方法。模擬了類似人類的思維鏈,采用長鏈推理(Chain-of-Thought, CoT)技術,能夠逐步分解複雜問題,並通過多步驟邏輯推理解決問題。這一過程比典型的語言模型耗時更多,但在處理數學、物理和自然科學領域的任務時,能顯著提高結果的準確性。

OpenAI的o1模型是2024年9月推出,是首個采用此種方法的OpenAI模型。

 

令人矚目的測試成績

 

DeepSeek通過多種基準測試評估了其模型性能。

在數學測試Aime 2024中,DeepSeek-R1取得了79.8%的成績,略高於OpenAI的79.2%。在Math-500基準測試中,該模型的準確率達到97.3%,超越了所有其他測試系統。在編程能力測試SWE-bench Verified中,DeepSeek-R1的得分為49.2%,展現了專家級的編程能力。

在常識測試MMLU和GPQA Diamond中,該模型的準確率分別為90.8%和71.5%。在寫作和問答基準測試AlpacaEval 2.0中,該模型的勝率達到87.6%。不過,上述測試結果尚未得到獨立驗證,因此必須謹慎解讀。

該模型數據庫使用截至2024年7月的資訊進行訓練。與OpenAI當前的模型類似,DeepSeek 還可以根據需要整合來自網路的更新資訊。但其並不具備生成圖像的功能。

 

中國新型生成式AI系統「DeepSeek」橫空出世,讓美股相關產業暴跌。(美聯社)
中國新型生成式AI系統「DeepSeek」橫空出世,讓美股相關產業暴跌。(美聯社)

 

開放許可

 

與矽谷競爭對手開發的專有大語言模型(LLM)不同,DeepSeek是開源的,這意味著任何人都可以訪問其應用程序代碼,了解其工作原理,並自行進行修改。

其推理模型DeepSeek-R1遵循MIT License開源協議,允許用戶自由使用、修改,包括用於商業目的。

「我們正處於一個由非美國公司保持OpenAI最初使命的時代——真正開放的、前沿的研究,賦與所有人權力。」輝達(Nvidia)高級研究經理Jim Fan在社交平台X上寫道。DeepSeek表示,它「在開源模型中名列前茅」,並且可與全球最先進的閉源模型相媲美。

Scale AI創始人Alexandr Wang在X上寫道,「DeepSeek給美國敲響了警鐘。」

 

性價比高

 

DeepSeek-R1的最大版本包含6710億個參數。公司還提供了多個簡化版本,參數範圍從15億到700億不等,其中最小的版本甚至可以在筆記本電腦上運行。 (相關報導: 華爾街日報》這兩個加大伯克利分校博士生寫的AI排名網站,為何成為全球矚目的焦點? 更多文章

在商業領域,DeepSeek以極具競爭力的價格進入市場。相比OpenAI的o1版本每生成100萬詞元(token)需支付60美元,DeepSeek僅需2.19美元,價格僅為前者的5%。

更多文章
懶人包》DeepSeek是什麼公司,為何震撼美股?技術能媲美OpenAI?
創辦人梁文鋒才剛見過李強!DeepSeek震撼市場 幻方疫情時曾捐數億元
DeepSeek橫空出世,震撼矽谷科技巨頭:創辦人梁文鋒是誰
柯建銘一句話駁主導大罷免!PTT怒問「當民眾白癡嗎」:都甲動立委代收了欸
歷史新新聞》毛澤東誇口超過8億人收看 央視春晚是怎麼開始的
2024年春節刮刮樂逾百萬元大獎!這縣市全台手氣最旺
DeepSeek殺戮台積電短期如何?陸行之曝早說別跟輝達綁死:不再「一家吃肉」了
看到「新春優惠」別急著下單!內政部揭過年最常見2詐騙手法 5招守住紅包錢
比爾蓋茲公開砲轟馬斯克:質疑他不該支持極右、干涉他國內政,大讚川普「做事有效率」
叫柯建銘請長假!林濁水不解「修憲罷免犯中共大忌」:賴清德就必須膽小如鼠?
評審是汪星人!賴清德親下廚做「寵物年菜」 大談家中毛小孩照顧經
疑似添加過量「煙火氧化劑」,可口可樂在歐洲召回大批健怡、雪碧碳酸飲料
過年用火、用電要小心!不只遵循「人離火熄」原則,還要謹記「5不1沒有」
DeepSeek讓台股崩跌1500點?謝金河提黃仁勳迴避川普就職:有點端倪了
大破冰!賈永婕在王偉忠女兒婚宴「有個意外」:100個周玉蔻罵我都無所謂
天氣預報》入冬首波寒流發威,最冷只剩6度!「這天」開始水氣增、有機會下雨
川普再提台灣!不滿98%晶片生產額度「被外國端走」,揚言將對半導體、鋼鐵銅加徵關稅
柯文哲年夜飯吃什麼?看守所除夕加菜「極品佛跳牆」 春節完整菜單曝光
DeepSeek成AI競賽最大變數?上兆美元企業血流成河 分析師對一件事有疑問
日本人不再政治冷感?年輕人公民意識正悄悄抬頭
輝達市值蒸發近6000億美元!慘遭DeepSeek血洗後緊急聲明曝光 川普都喊「不妙」
DeepSeek兩大優勢恐將ChapGPT擠到老二 蔡正元:輝達無法唯我獨尊
1% 推薦週報》三千年前「這國」就有導演椅了!中古世紀「放血治療」是治病,還謀殺?及其他風格觀點
香港大律變台灣大廚!陳淑莊的紅棉私廚火紅,連邱垂正也愛光顧
華爾街日報》矽谷現在需要什麼:利潤微薄的普通行業
最容易中的刮刮樂是哪張?蛇年32款刮刮樂中獎率曝光,快選這1張保證一定中
高麗菜別只知道加蒜頭炒!內行主婦放2食材「層次秒升級」,鮮甜爽脆比餐聽美味
春節出遠門、祭祀 注意這些「水、火」降低風險過好年
別只知道日韓泰!2025年8個必訪亞洲景點「高CP值平價好玩」,風景絕美百去不膩
威士忌入門新手推薦!這款Whisky「層次豐富、順口不刺激」,搭配台菜熱炒都適合
過年哪裡可以看醫生?2招秒知道附近診所醫院有沒有開!春節期間天天有的看
春聯要什麼時候貼?忘記貼春聯怎麼辦?完整貼法/最佳時間/禁忌一次看
華爾街日報》這兩個加大伯克利分校博士生寫的AI排名網站,為何成為全球矚目的焦點?
中國DeepSeek衝擊美股多收跌 輝達重挫逾16%市值蒸發近6000億美元
不是核桃腰果!營養師推1種優質堅果「富含維生素E、礦物質」,降膽固醇預防癌症
小耳朵》黃國昌也有怕的東西!戰神正和一件事大作戰
PChome靠創新稱霸十年!為何被蝦皮、momo雙面包抄?統一20億入股能否重返榮耀
麻婆豆腐怎麼煮才好吃?達人教3秘訣「鹹香麻入味、口感更滑嫩」,超下飯媲美熱炒店
斷捨離不是把雜物仍掉而已!比整理更重要的5件事:不要為了丟而丟
2025過年有垃圾車嗎?全台「春節垃圾清運時間」一鍵查!除夕到初五哪天有秒知
別再叫他們工作狂!疫後日本人休閒習慣大調查:重視休閒時間比例創歷史新高
60歲退休只靠勞保根本不夠用!達人教3招放大退休金,老年沒工作也不愁吃穿
豬腳、佛跳牆不是第一!營養師公布15種常見年菜熱量排行榜,冠軍根本熱量炸彈
從俄羅斯到北韓,藥物如何在戰爭和暗殺中扮演關鍵角色?
崔男觀點:川普主義暴衝,猛推百年大變局!
孔令信觀點:強勢反移民與基督精神對撞,川普帶領美國走進死胡同
呂政璋觀點:如何用「好自為之」在美中博弈中釋放弦外之音?
黃丙喜觀點:政論名嘴出任務!
張讚國觀點:春城無處不寄生,「壯世代」成怪獸
鄧鴻源觀點:與其點光明燈,不如反求諸己