「做量化交易的公司,做起AI更加腳踏實地」中國AI專家看DeepSeek

2025-02-02 09:42
(Powered by SD3.5 Large)
(Powered by SD3.5 Large)

德國之聲:DeepSeek被不少人稱為「神秘的東方力量」。其原因之一在於性能比肩GPT-4o的DeepSeek-V3,據其自稱訓練成本不到GPT-4o的1/20。也有人質疑其真實成本是否更多?您認為用如此低的成本訓練出頂級的模型有可能嗎?

肖涵博士:我認為完全有可能。首先這並不包含試錯成本的,也就是「炮灰成本」。只計算這一次成功花了五百多萬。其次大模型本身的訓練技巧,隨著時間變化,發生了很多演進和升級。像OpenAI這種頂尖公司,發布一項產品需要打磨很久,成品出來可以從發布日期向前倒退3、4個月,而DeepSeek本身不需要做太多PR相關的宣傳,準備大概一個月左右,所以這兩個模型之間差了有小半年,在這個時間差裡,模型的發展是非常迅速的。不管從數學上還是深度學習上會出現很多新知識使得模型訓練更有效。而且就我所知,DeepSeek在2023年就開始做一些非常底層的技術優化,再加上整個開源社區,在過去兩三年之內,會有很多新的一些技巧,使得成本會降得非常低。

德國之聲:您剛才提到開源社區, DeepSeek便宜又好用,有人認為它的成功不僅是技術層面,更是對開源精神的徹底踐行,您認為就開源與閉源而言,開源會是未來趨勢所在嗎?

我覺得就AI模型而言,未來價格肯定是越來越便宜,這在未來會象是水電煤氣一樣,成為通用的基礎設施。好比我們現在不會在每個月為上網花多少錢糾結一樣。但便宜是有代價的。因為就很多新創公司而言,它無法支付這麼高的運營成本。DeepSee之前積攢了非常多的GPU,它現在把這部分算力一下釋放出來,肯定會對市場造成衝擊。而開源本身,和價格以及商業化之間是一個非常復雜的關係。有人非常討厭開源——比如早期的比爾蓋茲。他曾經非常討厭Linux,因為他覺得Linux開源免費,沒有人願意用Windows了。所以這兩天我們看到Altman(OpenAI CEO)和Amodei(Anthropic CEO)反應非常激烈,因為覺得DeepSeek這種低價策略加上開源,導致他們的客戶流失非常嚴重。 (相關報導: 「川普2.0」全球貿易戰揭開序幕!美國正式對中國、加拿大、墨西哥開徵關稅,歐盟剉咧等 更多文章

德國之聲:所以主要還是商業利益上的衝突,從DeepSeek來說,這可能是個很好的戰略?

從DeepSeek角度來說,把模型開源確實是一個非常好的戰略,但得看它之後是不是堅持開源,如果堅持開源就是戰略,假如只開源這一次,就是一個戰術。為什麼說是很好的戰略呢?因為西方對中國模型本身並不放心,他覺得模型內部訓練時就有了價值觀偏見。因為生成類AI的輸出風格和他的訓練樣本非常相關。大家都知道中國互聯網基本處於一個封閉狀態,西方人會對「模型自帶的意識形態」產生害怕心理。而選擇開源的話,就相當你把我模型的數據(不是訓練模型的數據)下載下來放到自己的GPU上去跑,包括我們今天看到Amazon和輝達的雲伺服器都支持了DeepSeek模型,就是因為它選擇開源模式。部署到本機內部,西方也無所謂什麼顧慮,不管什麼價值觀輸出,至少不存在信息傳回中國政府這種。

更多文章
光陽、山葉全輸了!2024全台機車銷量冠軍是它,車主讚省油之王、便宜耐操空間大
2025年最新信用卡推薦》10張神卡最高現金回饋10%!國外刷哪張最好用?可綁行動支付、日韓旅遊必備
歐洲廁所裡為何有兩個馬桶?其中一個不是用來上的!Bidet用法與歷史大揭密
鉛筆原子筆該丟一般垃圾還是回收?環保局教正確做法!丟錯1200元直接沒了
唸到大學畢業,賺多少才算多?主計處公布中位數,一鍵查詢你贏過多少人
鏡頭下的北京》經濟成長趨緩下,不一樣的蛇年春節
台北萬華必吃美食推薦》必比登密集度最高!Q彈甜不辣、鮮甜魷魚羹...11間銅板小吃一次看
馬桶陳年尿垢刷不掉怎麼辦?專家用1便宜好物「免狂刷恢復亮白」,浴室瞬間乾淨如新
科學家警告:「足球場大小」的小行星2032年可能撞地球,威力足以摧毀大城市
小耳朵》柯文哲案嚇到李四川?民進黨研究川伯為何民調高竟摸到意外情報
納智捷、BMW輸了!2024電動車銷量冠軍是它,車主讚:空間大馬力強、高CP唯一選擇
小耳朵》大將軍講的是真的!潛艦上廁所要訓練 史上真有「被馬桶擊沉的潛艦」  
為何老一輩常說「冬天打雷是不祥之兆」?氣象專家解答背後原因:氣候改變了歷史!
有錢人為何可以越來越有錢?他們用1招合法避稅,贈與稅、遺產稅通通不用繳
「川普2.0」全球貿易戰揭開序幕!美國正式對中國、加拿大、墨西哥開徵關稅,歐盟剉咧等
地球到底可以容納多少人口?石油開採到何時會完全枯竭?科學家分析人類成長的極限
許劍虹專欄:大陸重提南京大屠殺目的─緩和對美關係的另外一步棋
韋安觀點:從「茶葉、絲綢、瓷器」到中國製造「新三樣」—川習「二度交手」的結局
劉依俐觀點:川普的反擊─「見不得光」的光明會與「深層政府」即將邁入歷史?
張瑞雄觀點:DeepSeek改變AI競爭
區桂芝專文:實踐自我覺醒的追尋─光明坦蕩的君子路
張凱鈞觀點:臺南孔廟公然違法─無障礙通道竟淪為營利空間
康正果專文:勇猛精進結善緣─走出白色恐怖的孫康宜
觀點投書:科技封鎖下的鯰魚效應─鹿死誰手仍未知!
觀點投書:刪減預算節省百元擦手紙,卻斥資2000萬元打造豪華公廁!?
黃于洋專文:加勒比海,瑪琳,和她的貓
觀點投書:餘震或大地震前兆?
觀點投書: 形式化問候與政治宣傳─國台辦對台溝通的鴻溝
今天是大年初五要拜財神!拜拜供品時間、習俗禁忌一次看,拜6種食物事業恐不順
川普擬對台半導體加徵關稅 吳嘉隆:美國根本沒有替代選項
曾預言盧秀燕一定選上台中市長!蔡正元曝2028優勢:特質容易號召選民
川普2.0關稅戰比預期還糟 中經院長:加拿大都被課,台灣不要想會被排除
已收到7萬份罷免鄭正鈐、高虹安連署書?民進黨新竹市黨部宣布3日遞交中選會
加州大火燒了快一個月!燒毀1.5萬公頃土地,消防當局終於「完全控制火勢」
2025花蓮太平洋燈會吸客35萬人 東大門買氣旺 加碼「星空煙火秀」增添璀璨色彩
春節垃圾別煩惱!桃園清潔隊初四開工 張善政親自慰勞
路邊尋車更便利!高雄建置5,095格智慧停車格
華府空難悲劇》美禁直升機靠近雷根機場,目前已打撈到41具遺體
初四迎財神、財源「蛇」進來!陳其邁參香走春發紅包 民眾熱烈回應加油鼓勵
2025 屏東燈節人氣爆棚!春節連假狂吸百萬人潮 四大燈區「光」彩奪目
2025冬日遊樂園寫生暨著色比賽熱鬧登場!吸引上萬人次親子共創藝術饗宴
重現鹽埕再造風華!林岱樺提「新樂新商圈」發展三策
川普硬要巴拿馬運河,專家擔憂引發拉美反彈:中國可能獲得新契機
美國又掉飛機!救傷專機墜毀費城,6名墨西哥人罹難
2025台灣燈會在桃園點燈倒數!「遊桃園APP」帶你玩轉燈會 暢遊桃園
「忽然就大哭了起來,想自己為什麼這樣淒涼」香港移民潮下的留港長者
日本扭蛋正夯!創造上千億日圓商機,去年更在美國德州設點
傳奇超跑大廠「主力銷不出去」每天得賠5800萬!欠債暴增至數百億…
周春米「長高了」? 鵝鑾鼻燈塔前俏皮合影 公開恆春半島春節遊玩攻略
DeepSeek是真的震撼AI業界,或者只是一場笑話?美股崩潰五天後,《華爾街日報》這麼說