生成式AI的產業結構長怎樣?想追AI熱潮,中游最關鍵:是建立模型的核心

2024-03-10 09:10

? 人氣

生成式AI的產業結構長怎樣?(示意圖,取自pexels)

生成式AI的產業結構長怎樣?(示意圖,取自pexels)

總體來看,整個生成式AI的產業地圖可以分為三類:上游資料服務產業、中游演算法模型產業、下游應用拓展產業(圖5-1)。

[啟動LINE推播] 每日重大新聞通知

圖5-1:生成式AI產業地圖(圖/高寶書版)
圖5-1:生成式AI產業地圖(圖/高寶書版)

1. 資料服務

作為智慧型機器的「食物」和數位經濟世界的生產要素,資料在被「餵」給機器之前,常常會涉及查詢與處理、轉換與編排、標註與管理等前置步驟,而在整個資料的使用過程中也離不開治理與規範方面的管理工作。作為生成式AI的源頭,相關資料服務產業孕育了很大的商業機會。

2. 演算法模型

人工智慧之所以能判斷、分析、創作,主要是因為有支撐這些功能的演算法模型。因此,訓練演算法模型就成為整個產業鏈中最「燒腦」、最具技術含量和最具商業潛力的環節。在數位世界,圍繞著如何讓演算法模型更聰明的命題,誕生了包括人工智慧實驗室、集團科技研究院、開源社區等主要玩家,構成了整個產業鏈的中游環節。

3. 應用拓展

經過資料訓練後的演算法模型最終會在下游應用拓展層完成「學以致用」的使命,根據應用場景的模態和功能差異誕生出文本處理、音訊處理、影像處理、影片處理的各個細分賽道。每個細分賽道裡都有許多創新企業在相互較量,這也是當前風險投資機構最熱衷投資的環節。

產業中游的演算法模型是生成式AI最核心的環節,是機器完成教育訓練過程的關鍵環節。中游演算法模型包括三類重要的參與者:人工智慧實驗室、集團科技研究院和開源社區。

延伸閱讀:當ChatGPT「一本正經胡說八道」,如何破除「AI幻覺」?《經濟學人》的四種可能解方

開源社區

開源社區對生成式AI的發展十分重要,因為它提供了一個平臺,讓開發人員能夠共用他們的程式碼,分享他們最新的研究成果,並與其他人一起協作,共同推動生成式AI相關技術的發展進步。除了可以讓研究人員彼此充分學習交流外,開源社區還可以幫助開發者更快地開發出人工智慧相關應用。建造各個場景下的人工智慧應用系統就像建造一棟棟大樓,往往需要很多人的共同努力。而開源社區就像是工地上的交流中心,讓所有參與建造的人都能夠找到合適的工具和材料,並與其他人交流想法,共同完成建造工作。如果沒有交流中心,大樓的建造將會變得困難重重,甚至無法完成。同樣,如果沒有開源社區,人工智慧的發展也會面臨諸多困難。因此,開源社區對於人工智慧的重要性不言而喻。

根據開源社區所覆蓋領域的寬度和深度,可以將開源社區分為兩類:綜合型開源社區和垂直型開源社區。

1. 綜合型開源社區

GitHub是世界上最大的開源程式碼託管平臺,目前已有超過9,000萬的活躍帳戶和1.9億資料庫。作為開源玩家界的Facebook,GitHub是開發者與朋友、同事、同學及陌生人共用原始程式碼的完美場所,無論是人工智慧領域相關的程式碼,還是其他領域的程式碼都可以在這裡上傳共用。

程式碼開源不僅可以減少重複性工作,還可以推動技術研究的快速突破,降低應用門檻,加速技術產業化推廣使用,以及有效促進學界與產業界的有效交流,促進產學研融合。

2018年,Github被微軟收購,但其社區與業務依然獨立運營,保留了它傳承已久的開源精神。無論是生成式AI領域的論文還是項目,如果要選擇上傳開源程式碼的地方,Github絕對是首選。

2. 垂直型開源社區

除了像Github這樣大而全的開源社區外,還有一些針對垂直領域的小而精的網站和社區在開源領域發光發熱,比如Papers with Code和Hugging Face。

Papers with Code是一個總結了機器學習論文及其執行程式碼的網站。使用者可以輕鬆地在網站上檢索到所需要的機器學習論文及儲存在Github上的開源程式碼。使用者可以按照標題關鍵字或者研究領域關鍵字進行查詢,也可以按照流行程度、論文發表時間以及Github上收藏(Star)數量最多來對論文及論文代碼進行排序。

Papers with Code網站最初是由Reddit的使用者rstoj開發,讓人們可以從中發現一些以前不知道的研究精華。作為機器學習界的內容社區,Papers with Code大大促進了人工智慧領域的研究。

Hugging Face是專注於機器學習領域的垂直版GitHub。它想要把主打年輕使用者的聊天機器人作為主營業務,因此在GitHub上開源了一個Transformer的資料庫,不過沒想到聊天機器人業務沒做起來,Transformer庫卻在機器學習社區爆紅。很多人認為Hugging Face的成功是因為團隊開放的文化和態度,以及利他利己的精神很具有吸引力。

目前,仍然有很多業界專家都在使用Hugging Face和提交新模型,甚至有些NLP工程師招聘中明確要求面試者熟練使用Hugging Face Transformer庫。如果說人工智慧是一場淘金運動,那麼Hugging Face則是典型的「賣水人」。(19世紀加州盛行淘金,山谷裡水源極缺,淘金者苦於無水可喝,於是小農夫亞默爾放棄淘金,改為掘水賣水,因此賺進大筆錢財。)

作者介紹

杜雨:中國社會科學院大學技術經濟學博士研究生,北京大學金融學碩士,香港中文大學理學碩士,武漢大學經濟學學士。胡潤U30中國創業先鋒,G20青年企業家聯盟中國理事會青年委員。先後工作於騰訊、紅杉資本,關注數字經濟與科技創新,曾參與騰訊音樂娛樂集團合併上市,並參與投資管理得物、超級猩猩、文和友等創新型企業。北京大學未名創投協會和科技創業加速器QAQ(Quadratic Acceleration Quantum)創始人。著有《WEB3.0:賦能數字經濟新時代》。

張孜銘:北京大學管理學碩士,新加坡國立大學金融工程碩士,華中師範大學信息管理與信息系統、華中科技大學計算機科學與技術雙學士。元宇宙教育實驗室智庫專家,未可知文化科技與科技創業加速器QAQ聯合創始人。著有《WEB3.0:賦能數字經濟新時代》。


本文經授權轉載自高寶書版《AI生成時代:從ChatGPT到繪圖、音樂、影片,利用智能創作自我加值、簡化工作,成為未來關鍵人才》

責任編輯/郭家宏

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章