華爾街日報》AI大模型為何不「香」了?考量成本與實際需求,企業現在更青睞這類模型

2024世界人工智慧大會7月4至6日在中國上海登場。(AP)
2024世界人工智慧大會7月4至6日在中國上海登場。(AP)

越來越多的公司正部署較小型及中型生成式AI模型,更青睞這種規模縮小、成本效益高的技術,而不是在AI熱潮早期掀起波瀾的那種熱炒的大型模型。

OpenAI的GPT-4等基礎模型開發成本超過1億美元,使用超過一兆個參數(這是其規模的一個衡量標準),較小型模型與之不同,使用較少的數據進行訓練,通常是為特定任務而設計的。

本文為風傳媒與華爾街日報正式合作授權轉載。加入VVIP會員請點此訂閱:風傳媒・華爾街日報VVIP,獨享全球最低優惠價,暢讀中英日文全版本之華爾街日報,洞悉國際政經最前沿。

幾乎所有的模型提供商都在轉向提供更多此類模型,包括微軟(Microsoft)、Google以及Mistral、Anthropic和Cohere等新創公司。

資訊長們表示,對於一些最常見的AI用例(通常涉及文件分類等小範圍的重複性任務)來說,較小型及中型模型更有意義。而且由於較小型模型使用的算力較少,運行成本也更低。

企業在慢慢轉向部署更多AI用例的同時,也面臨著對這種昂貴技術控製成本和回報的壓力,上述轉變正是發生在這種背景之下。

網路安全、內容分發和雲計算公司Akamai技術長Robert Blumofe說:「在整個網際網路上訓練出來的巨型大語言模型可能會嚴重大材小用。」他說,對於企業用例來說,「你並不需要一個知道《教父》(The Godfather)所有演員、知道所有電影、知道所有電視節目的AI模型。」

Google Cloud全球生成式AI產品上市策略副總裁Oliver Parker表示,在過去三個月裡,他已經看到企業轉向中型模型,部分原因是這些模型符合捕捉更多企業用例的標準。

非銀行抵押貸款服務商和發起人Mr. Cooper資訊長Sridhar Sharma說,Mr. Cooper正在其呼叫中心測試中型模型的功能,以分析語音數據,幫助座席人員了解對話的可能走向,以及客戶可能會問的問題。

Sharma說:「我們不需要僅僅因為某個東西更大就對其進行過度設計,」並稱Mr. Cooper也在使用大型基礎模型來處理更複雜的用例。

到目前為止,道明銀行(TD Bank)一直在使用GPT-4等OpenAI的GPT系列模型和其他模型來幫助呼叫中心工作人員更快地回答客戶諮詢。道明銀行首席AI科學家Maksims Volkovs稱,該行最近還與AI模型提供商Cohere簽訂了合作協議,將研究是Cohere的小型模型還是中型模型在該用例和其他用例中更有效、更具成本效益。

Volkovs說,他將從成本、準確性和延遲方面對Cohere的模型和OpenAI的產品進行評估。Volkovs說,他預計中型模型將在某些情景下勝出。

他說,在準確性和成本之間進行權衡應該更有利。

營銷服務公司WPP的首席技術官Stephan Pretorius說,一些企業一年前還傾向於使用少數大模型。他說,當企業在有限的試點範圍內使用大模型時,這種做法還算不錯,但現在隨著範圍的擴大,大模型的成本很快就會失控。WPP正在使用GoogleGemini系列中的幾個模型,包括中型模型Flash。

Flash適合用於分析不同國家的購物習慣,並利用分析結果為給定產品撰寫合適的網路文案。例如,在英國銷售的睫毛膏的文案最好能突出防水功能。撰寫這樣的文案正是中型模型大顯身手之處,Pretorius說。 (相關報導: 華爾街日報》職場上的科技戰:數位監控技術大升級,遠距辦公也別想摸魚 更多文章

Pretorius說,對於需要海量數據、創造力和進行解釋的複雜用例,大模型仍然具有實用價值。他舉例稱,大模型適用於讀取莎士比亞(Shakespeare)的所有作品,並分析女性角色與男性角色在不同時期的對比情況。但這並不在WPP的任務清單上。

因為你,我們得以前進,你的支持是我們的動力
更多文章
手搖飲成本低但超競爭,創業如何存活?專家:注意商圈發展,才能長久經營
最強鐵板燒不是夏慕尼、明水然!內行全推它「高CP值絕對再訪」:每道菜都很驚豔
CP最高的變頻冷氣不是日立、國際牌!內行推1款「省電耐用又靜音」:吹20年都沒壞過
颱風假停班停課標準為何?8大QA一次看!一鍵查全台停班停課地區
行動電源起火事件頻傳!台電警告「充電3禁忌別犯」大部分人都做錯
全球大當機災情 微軟:影響850萬台設備占比不到1%
行政院拍板軍公教加薪 卓榮泰:明年調升3%
金管會彭金隆:會對川普當選變數會預演模擬
台新銀搶攻暑假刷卡熱潮 遊日本信用卡最高回饋24.8%
不是所有ETF都能存!存這兩種可能會大賠,最好做短期波段交易
保時捷Panamera最強車型揭露 破紐北紀錄的就是Turbo S E-Hybrid
台股一周跌千點,該停損或加碼?專家用一招進場「抓買點」撿便宜!
Cybertruck變身8人座車型 特斯拉新增超貴配備
好市多1人氣白酒降價400元!內行讚便宜好喝、微甜順口,她一次搬30箱
65歲以上長輩領錢了!符合條件「最多可領2萬元」,忘記申請就沒了
凱米颱風將增強為中颱 專家曝這2天挾強風豪雨襲台:不可小覷
冷氣才裝3年,吹23度還是不涼!達人曝元凶「一開電費就翻倍」,帳單不知不覺暴增
又是飲料店食安出事!迷客夏「喝到尖銳碎片」竟遭店員駁:沒有這種東西 業者急道歉滅火
集雅社30生日慶 買家電抽電視 一起打造夢想·家
路透:拜登突然改變心意退選,白宮幕僚也是「最後一刻才知道」
銘傳大學課程導入AI輔助 大為提高創意啟發、設計構想
台灣最強吃到飽是哪一間?內行大推4.9顆星老饕神店,400多元還有哈根達斯:已經吃過3次
請成為彼此的英雄!臺北台新戰神黃萬隆攜手許皓程打造「真正的團隊」
講話明確、堅定的人,未必是專家!有「主動開放」心態的人,能做出更好的決策
「凱米」最快明天發海警!暴風圈擴大「10縣市侵襲率超過8成」,放颱風假機率曝光
期交所微型臺指期貨將於7/29上路
台灣有事,美國盟友幫不幫?智庫報告揭秘:日本、澳洲、英國、加拿大,可能都不會出兵
想在股市賺錢,該等崩盤或高點順勢進場?專家分析台積電漲跌「曝最佳買股時機」
想買房給單親媽住,卻葬送人生…揭台灣「坑殺窮人」現代奴隸悲歌:一輩子還不起
阿里山小火車福森號車票怎麼訂?車票價格、行車路線、時刻表一次看
幕後》鄭文燦系統幹掉賴清德愛將!民進黨一個神秘手印 派系內鬥「欲蓋彌彰」
為何美國鐵鏽區挺川普?陳文茜曝「重回白宮」2意義:他們是被拋棄的一群人
新青安淪投資客炒作?學者曝2政策漏洞:都在玩假的
六都平均最富里是「它」!不在台北、新北,所得稅中位數達166.5萬
「政府應展現打房決心」!直指升息無助打擊投資客 張金鶚提更有效解方
拜登退選》賀錦麗表態爭取黨內提名,呼籲「團結美國擊敗川普」
民主黨內戰再起?拜登宣布退選後,誰將成為民主黨總統候選人?
拜登難堪退場:美國政壇奮戰半世紀,最後還是敗給了年紀
風評:蔡英文成了民進黨的鍾無艷
川普談拜登退選:他根本沒能力當總統,賀錦麗是「更容易擊敗的對手」
陳偉華觀點:再次東進─印度以國際法實現南海戰略
李鎨澂觀點:馬克宏人馬贏得國民議會議長,但組閣僵局仍難解
劉性仁觀點:安全與發展,中國深化改革的挑戰─中共二十屆三中解析
孔令信觀點:憲政危機到底是誰搞來的?
拜登丟出退選震撼彈,一次看懂美國大選將如何發展
張鈞凱專欄:台灣有事,日本搞事?
楊治宜專文:死且不懼,何畏乎駡─國不能戰,汪精衛轉向綏靖
觀點投書:實現「土地正義」不應犧牲公共利益為前提—以高雄「空中鳳城」為例