AI界風向變了?《經濟學人》:別再迷信ChatGPT,小型模型才是「隱藏王牌」

2025-09-12 11:19
人們普遍認為,大型語言模型--即為ChatGPT提供動力並在海量數據基礎上進行訓練的算法--並不是一項完全成熟的技術。(AP)
人們普遍認為,大型語言模型--即為ChatGPT提供動力並在海量數據基礎上進行訓練的算法--並不是一項完全成熟的技術。(AP)

OpenAI的ChatGPT於2022年問世,掀起人工智慧浪潮,迅速改變許多產業的樣貌以及人們的日常生活:比起自己上網篩檢資料,詢問AI總是更便捷快速。近來科技圈經常將ChatGPT等大型語言模型類比智慧型手機,指出AI發展漸趨平淡,就像新一代智慧型手機上市,雖然性能升級,但缺乏真正的創新與突破。2007年蘋果革命性的iPhone引發轟動,而8月27日OpenAI推出最新AI模型「GPT-5」話題性卻低於預期,熱度甚至不如蘋果9月9日的iPhone 17發表會。

《經濟學人》(The Economist)分析,生成式人工智慧發展放緩的趨勢,也顯示大型語言模型(LLM)未能符合人們的期待,而另一方面,較小、較靈活的AI模型逐漸崛起,同時備受企業界青睞,許多公司偏好客製化的小型語言模型(SLM),以達到特定需求。無論是透過公司內部系統或雲端服務,小型語言模型都可以順暢運行,而且因為尺寸較小,格外適合高度要求電源效率和速度的裝置,例如智慧型手機、自動駕駛系統和機器人等。相較於SLM,開發、訓練全方位、多功能的LLM需要花費更多資金,而且後者無所不知的神通可能無用武之地。IBM人工智慧研究部副總裁的考克斯(David Cox)就說:「你的人資聊天機器人不需要懂進階物理。」

大型語言模型和小型語言模型目前尚無精確定義,兩者之間的主要差異在於模型訓練時的參數(協助模型理解資訊的設定)數量多寡,LLM的參數量高達數千億,SLM的訓練參數則可能為400億或更少,最「迷你」的SLM參數量甚至不到10億。不過模型訓練的方式改進,小型模型可以部不必上網爬蟲學習,可以交由大型模型「教導」,而SLM的性能也慢慢趕上LLM。AI模型評測機構「Artificial Analysis」表示,輝達(NVIDIA)近期推出的AI模型「Nvidia Nemotron Nano」具有90億參數,在各項測試中,表現比Meta四月推出的「Llama-4」模型還要好,後者的參數是前者的40倍。市場研究公司Counterpoint研究總監阿瓜拉瓦(Mohit Agrawal)指出:「現在的小型模型,性能比去年的大型模型還要強。」

SLM的卓越性能吸引了企業客戶,科技研究及顧問機構Gartner表示,LLM會自信滿滿地生成看似合理但錯誤的陳述,也就是「AI幻覺」(hallucination),這些LLM的缺陷眾所皆知,也已經減損用戶的興趣。企業需要更專業的AI模型,最好可以針對產業內的數據進行微調,雖然專業化的小型模型需求基數遠比LLM低,但Gartner預測2025年市場對這類AI模型的需求成長速度,會是LLM需求成長速度的兩倍,而且隨著時間推移,小型模型將會轉由企業內部開發。

OpenAI與其生成式大語言模型ChatGPT生成之圖片。(美聯社)
OpenAI與其生成式大語言模型ChatGPT生成之圖片。(美聯社)

另一項SLM的魅力所在則是經濟效益。企業從早期不顧一切投入生成式AI的模式,轉而更加重視投資回報,儘管企業仍然能夠利用性能全面的LLM執行多項任務,但如果使用多個SLM分別處理重複性的任務,將可節省成本。考克斯舉例,IBM開發的工具「Docling」能夠解析PDF等常見文件格式,並匯出為結構化數據方便儲存。Docling僅有2.5億參數,若是在具有數十倍參數的LLM運行,效益反而不高。最小的AI模型可以直接使用CPU運行,不必仰賴高算力的圖形處理器(GPU),這是小型AI模型的一大賣點,考克斯表示,GPU就像「總是停在展間的法拉利。」

喜歡這篇文章嗎?請作者喝杯咖啡支持他

請他喝杯咖啡
更多文章
火燙出爐》最新iPhone Air現場評測:為纖薄機身做的犧牲值得嗎?
台灣學歷不吃香了?「1國家」來台留學生連七年衰退:鄰國祭高額獎學金,人才都被搶走了
汽車買哪個顏色最好?過來人一面倒大推它「保值耐看不吸熱」:賣中古也超搶手
雀巢永續行動奪兩大獎!「雀巢1000天營養計畫」深耕在地十年 獲亞太及台灣永續行動獎雙重肯定
亞尼克YTM有大事!重磅聯名貓界天王高雄捷運「蜜柑」站長 元氣蜜柑生乳捲限量超療癒開賣
聯合利華二度進駐國內最大永續盛事「亞太永續博覽會」!【曙光計劃】集結七大光之使者 呼籲行動、改變未來
年薪高達393萬!美研究曝「5大熱門高薪工作」最不會被AI取代,超缺人不怕失業
柯文哲如何牽動藍綠白?呂秀蓮全說了 憶去年「總統大選1現象」洩端倪
「載貨物 更載對地球的承諾」長榮海運參展2025亞太永續博覽會
墨西哥對中國汽車祭出50%重稅!背後竟是為討好美國,下一步衝擊會是誰?
夏天吹冷氣疏忽1件事慘了!能源署曝電費多2000元,秒成吃電怪獸一開機荷包狂噴
金融熱議》輝達光環正在消失!華爾街日報點出結構性問題,拖累公司成長腳步
月薪破10萬!大學生打工最想做「1工作」,時間彈性又高薪,比上班族賺更多,全台都有職缺
台灣水泥業第一家!台泥取得ISO 20400永續採購認證,打造低碳韌性供應鏈
普發1萬元詐騙3大手法曝光!刑事局超前部署組專案小組:牢記防詐4不口訣
赴三軍士官學校開學典禮!賴清德一度搞混軍風 鬆口1情況「願跟中國交流」
搶搭降息行情!富邦投信一口氣推出3檔ETF,主動、被動「雙刀流」因應市場波動
「綠營高雄市長選舉盤破裂!」郭正亮喊柯志恩運來了:最強綠委正被打壓
人類最接近外星生命的一刻!NASA公布火星「豹紋岩石」驚現生物跡象,樣本如何送回地球成最大難題
師大夜市沒人逛了!在地人曝2大原因超冷清「很多攤販都關門」,盛況回不去了
6000元進國庫!開國道未注意1交通規定「警方立馬開單」,很多駕駛都忽略
四叉貓業配被砍有少賺嗎?抖內金「1天進帳11萬」一文看懂政治網紅的道德邊界
嘆柯克之死加劇政治對立!外媒揭2危機 血紅濾鏡「示警最大隱憂」
收到2類帳單千萬不要繳!最新詐騙手法恐讓「銀行存款一夕蒸發」,很多人都被騙了
績效打敗0050!「1類ETF」連有錢人都在搶,專家曝進場時機:這樣布局才能穩穩賺
傅崐萁參選黨魁資格爭議?黨內人士:趙少康、郝龍斌也不能選
關稅談判最新!盧特尼克證實「將與台灣達成重大協議」 台股漲不停能衝多高?
在日本千萬別買1類電器!到機場才驚覺上不了飛機,無論托運隨身都會被丟掉
台灣民意基金會民調》柯文哲嘆冤獄「41.6%認同」!54%不滿北檢 游盈隆:嚴重警訊
LINE是日本還韓國的?謝金河曝發明源於311大海嘯:Google在這完全吃不開
台泥股價跌,抄底機會來了?專家警告:「這個數字」沒回來,千萬不要進場!
天氣預報》入秋第一波東北季風要報到!專家曝「降溫時間點」,周末天氣曝光
2025雙城論壇拍板!蔣萬安赴滬3天見誰?談什麼?核心主題、MOU一次看
不是中信、國泰!台灣最賺錢金控是「它」:3金雞發威,穩坐獲利王寶座,單月大賺百億
年薪超過300萬元!美研究公布10大高薪職業「免看學歷、無經驗可」,薪水完勝上班族
3歲病童為何遺憾離世?骨髓移植病床布建南北失衡 小兒血液科醫師出現斷層
本周最強內幕》柯文哲交保啃冰棒,落魄獅王懂了狗的悲哀!北韓欠台灣1.8億爛帳,金正恩爸有個要求
專訪》飛彈襲擊下的急救藍圖,以色列MDA災害管理專家揭如何「化亂為序、守護生命」
調查》大人吵什麼?盧秀燕率15縣市長槓中央 總預算藏賴清德政府五鬼搬運法
「美國優先」下台灣自求多福?郭正亮分析川普國防戰略:賴清德根本束手無策
說出你身邊的故事 台北市公用頻道用影像打造社區新媒體
風評:美國好朋友得到的「大禮包」
王智明專文:走出神話迷霧,重新探問「美國是什麼?」
游瑪雅觀點:白天扮作記者,夜晚從事恐怖行動—揭露哈瑪斯濫用新聞證件的真相
揭仲專欄:從115年國防預算窺探台美軍事交流
許文忠觀點:國民黨主席選舉─不能只是權貴傳承,更要回應全民困境
劉東皋觀點:從卓伯源宣布參選,看國民黨需要怎樣的黨主席
夏珍專欄:戰犯找賴清德─不冤!
觀點投書:藍綠不承認自己是中國人,又何須在意大陸紀念抗戰勝利?
觀點投書:政府還能給中小企業多少信心?