SLM是什麼?微軟Phi-3小模型靈感來自「女兒的睡前故事」!比LLM更快更平價

2024-04-25 13:51
微軟Phi-3系列為SLM模型,成本、尺寸更低,於特定專業領域應用表現良好。(圖/翻攝自X/微軟)
微軟Phi-3系列為SLM模型,成本、尺寸更低,於特定專業領域應用表現良好。(圖/翻攝自X/微軟)

微軟(Microsoft)近期發表SLM(小型語言模型)「Phi-3」系列,引起熱烈討論!微軟指出,對比其他模型,他們相信Phi-3是效能最好但成本最划算的模型,特別的是,微軟官方也曝光研究員順利研發出Phi-3的靈感來源和「女兒的睡前故事」有關!究竟SLM和LLM有何差異?本文帶您深入了解!

Phi-3系列共有哪些模型?

微軟內部AI首席產品經理Sonali Yadav指出,Phi-3系列並非單純將LLM進行規模轉化、變成SLM,而應該定義為從「單一類」模型轉為「系列化」模型,如此客戶可以在整個小模型系列組合中找出最符合需求用途的其中一個。

Phi-3系列率先推出的模型是「Phi-3-mini」,其中包含38億個參數,現在已列入Azure AI 模型目錄、Hugging Face、Ollama,也在輝達「NVIDIA NIM微服務」的提供項目中。

該系列中,還包含其他模型「Phi-3-small」和「 Phi-3-medium」,前者包含70億個參數,後者包含140億個參數,將陸續推出。

(圖/微軟官網)
微軟AI首席產品經理Sonali Yadav。(圖/微軟官網)

Phi-3系列的靈感來源是什麼?

該系列模型的靈感來源要從研發團隊研究員Ronen Eldan和女兒的溫馨互動說起。微軟公開透露,Ronen Eldan有天對女兒朗讀睡前故事時,突然萌生了「生成許多小故事(TinyStories)」數據集的想法,而這個數據集包含了數百萬個經由大型語言模型生成的簡單短篇故事,其中包含的詞彙也是4歲左右的孩童能理解的。

特別的是,對比其他「億」級參數規模的模型來說,這樣的小故事數據集僅有約1000萬個參數,卻還是能生成讀來流暢且語意良好的好故事。

因此Ronen Eldan後來便和團隊成員先取得大量精準的數據,經過一系列提示、人工與LLM嚴密審查後,再創建出「CodeTextbook」數據集,以作為Phi-3系列的基礎。

(圖/微軟官網)
Phi-3系列模型與其他相似規模的基準測試成效表。(圖/微軟官網)

話說回來,SLM到底是什麼?相較LLM,具有什麼特點?

SLMs是建立於更為簡單的神經網路架構之上,再基於較短序列的數據集進行推理或預測生成,非常適合用來進行文本生成、分類分析和翻譯等項目,相較LLM,訓練成本消耗更低,也更容易部署和維護。

儘管「知識廣度」和數據規模不如LLM,但是在特定專業領域中,其表現成效和能力極為優異。 (相關報導: 「日版台積電」進駐矽谷了!日本IC產業銷售總額破3千億 奪下全球第二、只輸美國 更多文章

以下為SLM的6大優點。

1. 尺寸較小:SLM的參數數量較少,因此在設備部署層面更容易,不需要大量的計算推理資源。

2. 速度更快:SLM可以提供「延遲率低」的良好AI使用體驗,對於有時需要「即時做出反應」的迫切情況下,會比LLM表現地更為優秀。

3. 沒網絡也可以:SLM能夠在離線狀態繼續運行,這對於沒連接網絡或網絡連接不穩定的場合非常重要。

4. 有利隱私保護:SLM的數據不需傳送到雲端,這有助於保護用戶的隱私。

5. 成本效益佳:SLM的維運與訓練成本通常偏低,不需要大規模的成本,這對於想在有限預算使用AI的企業或客戶來說非常方便。

6. 多樣性:SLM可適用於不同應用場景、各類產業,並協助進行簡單的問題回答、摘要和內容生成。

喜歡這篇文章嗎?請作者喝杯咖啡支持他

請他喝杯咖啡
更多文章
臺灣國樂團《愛無限 樂無界》音樂會 打造百人舞台
屏東西市場攤(鋪)位4/29公開抽籤 申請人注意時間準時出席
名列全國三大!製造商巨頭「欠債4.2億」破產了 相關行業連帶一起倒…暴增至2142公司倒閉
徐榛蔚視察壽豐災損狀況 全力協助鄉親度過難關
科技業寒冬又擴大!「知名電信龍頭」大砍1500人,預告短期又有一波大裁員
第9屆原住民族語言單詞競賽登場 饒慶鈴盼多使用族語傳承原民文化
臺東國小首次全面推動智慧適性閱讀 精選選書讓閱讀越幸福
桃園工程進度超前 張善政要讓建設如期如質上路
2024台北好時尚 發掘臺北獨家記憶 徵件活動開跑
AI EXPO Taiwan 2024 盛大開幕 推動北市AI智慧城市建設
投資房地產真的能賺錢?教你如何計算報酬率,當房東沒有想像中簡單
快訊》分局內「舉槍自戕」傳巨大槍響!中正第一分局37歲男警「頭部中彈」送醫搶救中
國會改革》曝民進黨版本2問題 黃國昌直呼瞠目結舌:內容竟有「自宮」條款
長榮海運疑內線交易? 財經名嘴有話說 呼籲金管會不能置身事外
北分署籲支持多元商品 挺民間團體自立重建
變頻冷氣買哪牌最推薦?家電老闆讚2品牌零負評「安靜耐用又省電」,空調師傅都認證
出演舞台劇模仿黃國昌咆哮 柯文哲笑喊訓練太痛苦:回去會把許甫宰了
共和黨最大金主的數百億資產,為何慘遭美中關係綁架?《金融時報》:他擁有TikTok母公司15%股份
立院「內鬼」暗助洗錢集團案 黃國昌籲徹查:因是民進黨大樁腳被上屆國會輕輕放下
花蓮餘震不斷傅崐萁仍堅持訪中 綠委痛批:國民黨心裡只有中國?
美股快走出下跌陰霾?費雪:4月重挫未破壞多頭
文人領軍!顧立雄喊話加入區域協同嚇阻 曝首要目標:讓中國冒進時間表遞延
記得申請!勞保局這筆給付「沒上班照樣有錢拿」,每月直接入帳、最長領1年
藥單打「媽媽是婊子!」兇手找到了!藥劑師「工作不順」崩潰發洩 基隆醫院記2大過:已主動辭職
癌症前兆有哪些?7大警訊大家最容易忽略,常常覺得累、咳嗽都中
麥當勞捲捲薯條來了!超佛加16元就能爽吃
華爾街的電腦,還在用60年前的程式碼!懂它的工程師逐漸退休,AI成為金融業救星
Netflix《淚之女王》72秒大結局曝光!金智媛「被洗腦」探監金秀賢,劇迷看傻:無法理解
台灣人誰最常用AI?MixerBox內部數據大公開!年收入超過這金額的最愛用
華爾街日報》中國房地產泡沫早有警示信號,為何無人懸崖勒馬?
「日版台積電」進駐矽谷了!日本IC產業銷售總額破3千億 奪下全球第二、只輸美國
地震後不敢去花蓮!內行改衝1景點「美食美景多、玩百次不膩」,假日訂房滿到8月
普通上班族退休竟能月領4.8萬元!專家教1招放大資產,老後不能工作「每月多領1萬元」
只靠勞保、勞退,竟能月月領8萬現金!專家曝2招放大退休金,每月多領8000元
事實查核》立法院表決軍公教18%回歸?事實查核中心揪2疑點:錯誤訊息
「10%折扣」與「10%點數回饋」何者較划算?金融專家揭真相:兩者獲利是不同的
不用大學畢業「年薪可破200萬」!3職業門檻低、保障高 職缺只會越來越多「已成搶手貨」
日圓重摔30年新低!投資人該如何把握這波操作機會?
新政府國安團隊亮相 賴清德提3大特色:專業經驗兼具、有默契能合作
7-11、全家60元便當不用搶了!1神招輕鬆買到,一鍵查詢最近販售門市、剩餘數量
為何有些人特別會交朋友?不必花言巧語,一招就能建立輕鬆自在的人際關係
不只特斯拉!「知名汽車品牌」大規模裁員,淨利少383億,2000人慘失業
「國際特赦組織」指責歐洲國家:對於人權問題根本就是雙標!
子孫多人共同繼承房地產,小心淪為廢紙一張!專家教一招解決,拿回應得的財產
國會改革》喊話民進黨增開公聽會再排審 羅智強預告將提案增訂「神遁局條款」
新竹就業中心運用「青年職得好評」 提升面試就業力獲取高薪
富比庫啟動世代傳承計畫 點亮弱勢兒童希望之炬
貓咪晚上不睡覺一直叫怎麼辦?動物專家教你1方法,讓愛貓一覺到天亮
台灣要沒有4G、5G吃到飽了?內行人曝網路費恐變貴!以後只能人人連WiFi