楊建銘專欄:人工智慧新創可別成為無米之巧婦

2017-03-31 06:40

? 人氣

人工智慧正夯。圖為2016世界機器人大會。(新華社)

人工智慧正夯。圖為2016世界機器人大會。(新華社)

人工智慧正在加速進化,這是無庸置疑的。

[啟動LINE推播] 每日重大新聞通知

科技巨人如谷歌、臉書、百度、亞馬遜和蘋果搶著在定義這個正在快速崛起的產業的結構,也是眾所皆知的。

螞蟻雄兵般的各種人工智慧新創,從矽谷和中國增生氾濫到世界各地,也已經成為讓人目不暇給的一個事實。

但是看過諸多人工智慧新創的提案和相關新聞後,我隱隱覺得許多創業家們又重複犯下了曾經在無人機以及VR浪潮中所犯下的錯誤。

關鍵字:載體(carrier)。

任何科技都有最終的實體載體,不管是醫療、運輸、能源或通訊。在我們人類進化(?)到【攻殼機動隊】那樣上傳大腦到網路上去、完全虛擬存在的時代以前,任何科技都需要透過實體載體和人類以及自然環境互動。

從2004年以來的新創大浪潮,主要是奠基在兩大載體的普及:手提式電腦以及智慧手機。臉書和Youtube在電腦瀏覽器上建立起帝國,Whatsapp和Snap等原生的移動新創則在APP的生態圈裡快速地攻城掠地。

這兩大載體的普及是無數新創得以誕生的原因:有專門的大公司和大品牌大量製造和販售硬體和作業系統,新創開發出的應用程式所能夠觸及到的終端裝置數以億計,挑戰只在於如何贏得使用者或者企業用戶的心。

這個背景下所產生的是各種「非垂直整合」的精實新創,有新創專注在做網路廣告的流量導向價值鏈中的一環,有新創開發某種產業應用的共通API,有的開發BOT去谷歌上「收割」特定資料再包裝成現代使用者需要的格式,甚至有單純把各大新聞網站的內容按照關鍵字客製化、再以美麗的樣貌呈現給使用者的

這些精實新創的特色都在於他們只需專注在一條完整價值鏈中的一環,除了架在臉書或者微信平台上的應用類別會有平台風險以外,大多數精實新創和他們的潛在使用者之間都沒有任何中介者,因此可以挑軟柿子吃。換句話說,新創可以只專注在他們覺得最有利可圖的那一塊,通常是純軟體,實體載體的部分反正會有傻子——別名電子代工廠(誤)——去搞定,自己不用弄髒雙手。

這種違反自由市場直覺的「眾人皆醉我獨醒」心理謬誤,讓各式各樣的精實新創在無人機和VR這兩個也是由新創掀起的浪潮中狠狠栽了個跟頭。

中國人工智慧大會在北京開幕,一名參展工作人員介紹「小優機器人」,它可以識別語音,主要應用於陪伴兒童。 (新華社)
中國人工智慧大會在北京開幕,一名參展工作人員介紹「小優機器人」,它可以識別語音,主要應用於陪伴兒童。 (新華社)

以無人機來說,起頭的是現在無人不知的大疆DJI,但真正引爆無人機創業熱潮的是由Wired雜誌主編克里斯・安德森所創辦的3D Robotics。又稱為3DR的這間美國新創選擇開源(open-source)它的無人機架構,吸引了不少的開發者來設計基於3DR的客製化無人機,以及更多的精實新創開發作業系統和應用軟體,後者把自己關在舊金山的辦公室裡,一步不出地寫著程式碼,等著下載安裝到總有一天會爆大量的開源無人機中。

問題是無人機不同於智慧手機,外面並不已經存在幾億台裝置在等著這些軟體公司推銷自家產品——他們覺得無人機硬體無利可圖,若是事實,那麼硬體開發商和代工廠一定比他們更清楚,也不會傻傻地搶入這樣一個非剛需的高價硬體市場。

一年過去,兩年過去,純粹做軟體(甚至包含引爆開源無人機熱潮的3DR本身)開始慌了,因為日復一日的養著軟體開發團隊,卻遲遲沒有其他傻子願意賠錢出貨一億台無人機到全世界的消費者手上去,好輪到他們賺快錢。於是從去年上半開始它們不約而同來到亞洲跟電子代工廠敲門,希望由電子代工廠直接為他們製造硬體,好讓他們可以一邊賣硬體一邊佈局軟體。

供應鏈算盤打得比誰都精的代工廠們當然不是白痴,因此這樣的對話要不就不了了之,要不就新創被迫付出大筆NRE費用和量產頭期款,要不就傻傻地簽下並無法真正大量出貨無人機的中國廠,曠日廢時到最後還是狠狠地砸了自己的腳

到頭來唯一一家大賺其錢的,是從硬體到作業系統到應用程式全面垂直整合大疆DJI,獨霸肥到出油的商業無人機市場,去年營業額已經堂堂突破十六億美元。許多美國純軟體無人機新創現在剩下的唯一期待,是DJI來高價收購自己——但這種夢如Cruise Automation這樣的自駕車軟體新創做做可以,因為大車廠有很多家,搶親的機率很高,反觀無人機裡只有一家DJI獨霸,這家將來上市市值肯定破百億美元的中國獨角獸,只要靜靜地等待這些純軟體新創燒完現金,再去挑三揀四地購買自己要的IP就好,吃完連骨頭都不吐一根。

亞馬遜(Amazon)的送貨無人機(AP)
亞馬遜(Amazon)的送貨無人機(AP)

VR的世界我們也看到類似的問題,只是結構不同。

Oculus VR高價賣給臉書、引爆虛擬實境熱潮後,果不出其然大量的軟體新創出現了,有的專注在開發內容,有的開發各種API,每個人都認為頭戴式VR裝置成本很高,苦工給別人去做就好。

然後一年過去,兩年過去,市場上出現了成千上百家的純軟體VR新創,但已經開始大量出貨載體(頭戴式裝置)的卻只有新力、三星Oculus

其中三星和Oculus都是PC平台,理論上各種純軟體新創都有機會取得應用市場,但這兩家的頭戴型裝置都需要高階PC,短期來說只有超級電腦遊戲玩家們是可觸及的市場。對於手頭上已經有了筆電、智慧手機和平板電腦三種移動裝置的一般消費者來說,為了VR得專門買一台高階PC,別說預算是個問題,光是那一大台主機放在家裡看了都煩!

唯一本來就有主機的新力則同時擁有平台,因此精實新創並沒辦法像在智慧手機上那樣,無視於平台地直接進攻消費者,還是得乖乖遵循古老的新力遊戲開發商模式,沒有太多彈性策略可以採用。

了解到無人機和VR軟體新創現在不勝唏噓的現實後,我們如果來檢視人工智慧新創,也不難發現他們有許多都犯下了同樣的錯誤。

蘋果執行長庫克(Tim Cook)認為,AR比VR更有吸引力。(美聯社)
蘋果執行長庫克(Tim Cook)認為,AR比VR更有吸引力。(美聯社)

首先要瞭解到的是,雖說是人工智慧,現在蓬勃發展的其實是很狹義的「深度學習」(Deep Learning)。在這個領域裡,有明確的「輸入」和可定義的「輸出」,開發者建立複雜的數學模型,使用足夠資料量的「訓練集」(training set),反覆餵入多層的非線性演算單元,從而提煉出一個人工神經網路(neural network),今後再有新的輸入資料時,就可以直接匯入這個人工神經網路,來得到輸出。

舉例來說,如果我們想要的人工智慧應用是自動駕駛,我們可以先分析人類開車的方法:用眼睛接受路況(輸入),用大腦和經驗法則進行判斷(人工神經網路),然後用手腳去控制方向盤、油門、煞車和排檔(輸出)。因此直覺來說,要開發自動駕駛的深度學習系統,就得把大量的路況資料——包含高速行駛中看到的行道樹、突然從人行道衝出來的小狗、沒打方向燈就換車道的白痴車主⋯⋯等——餵入深度學習演算法中,進而提煉出一組可以代替人類駕車的人工神經網路,將這個網路植入到自動駕駛車中,讓它可以針對未來新的輸入資料(路況),去自動控制方向盤、油門、煞車和排檔等。

看起來非常合乎邏輯,所有數學很好的人工智慧專家都躍躍欲試,但這裡面有一個天大的問題:沒有任何一間新創在成立之初,就有龐大的路況資料庫可以用來訓練自己的機器——你可以擁有高達240的智商,也熟稔所有深度學習的理論和編程,甚至可能你的論文指導教授就是Yann LeCun大神本人,但只要手頭上沒有谷歌累積了十幾年的路況資料,都是巧婦難為無米之炊

這樣一來大家應該可以理解為什麼明明是軟體巨頭,亞馬遜卻要自行開發並販售Echo,明明市面上已經有滿坑滿谷的安卓手機,谷歌卻仍持續開發自家產品,另外還收購智慧家庭裝置新創Nest,並推出Google Home和亞馬遜競爭。原因在於他們理解持續累積的龐大資料庫才是人工智慧的決勝戰場,他們除了自己已經有的、由他們的使用者自願提供的純網路資料(使用者的消費習慣和搜尋歷史),連實體環境中的資料他們都想要!

換句話說,當一個美國家庭的小孩在吵雜的廚房中開口:「Alexa,世界最長的河流是哪一條?」時,亞馬遜得到的並不只是可以銷售亞馬遜河相關旅遊書籍給這個家庭的資料,而是立刻多了一組自然環境中的人聲資料,可以餵入其深度學習系統,協助Alexa進一步提升語音辨識和回答能力,以期有一天可以達到語音辨識的聖杯:雞尾酒派對對話

如果理解到這一點,想搞純軟體新創的人工智慧創業家就應該仔細檢視自己的應用情境:可以輕鬆入手的輸入資料庫是否存在?

在某些領域,這樣的資料庫的確是存在。

以谷歌收購的Deep Mind所開發的Alpha Go來說,輸入資料庫是固定的圍棋規則以及幾千年來人類歷史累積的棋譜,這是最單純的應用情境,決勝完全在於團隊的智商(和谷歌的資金)。

日前,人工智慧與人類的圍棋賽引發全球關注,會不會有一天,這些科技有了自我意識?(美聯社)
人工智慧與人類的圍棋賽引發全球關注,會不會有一天,這些科技有了自我意識?(美聯社)

文字介面的智慧型新創,某種程度也是由(語言)規則和容易取得的文字資料庫所構成,但即便如此我們仍然看到簡單如「安排行事曆行程」這樣的應用,在新創燒掉大筆資金後所產生的產品都仍然遠遠不如我們預期。

另外一個公開資料很豐富的是上市股票交易,不過這部分的市場早就在避險基金的競爭下千錘百鍊,戰場已經轉移到關於上市公司的非公開資訊,這部分在我之前的專欄【避險基金管理人的末日與冷酷異境】有解釋過,非金融背景的新創不見得有優勢。

此外最眾所皆知的人工智慧相關資料庫是史丹佛大學的ImageNet,這也是許多深度學習研究者「出國比賽」的戰場。但大家都有的,就等於沒有,隨著深度學習的普及化,同樣使用ImageNet開發深度學習的新創彼此間的效能差異(準確度和速度)會越拉越近,而靜態影像辨識到底有多少可以應用在其他領域,那又是另一個問題。

扣除這幾個「輸入」相對容易取得的領域後,新創能夠入手的有用的資料真的寥寥無幾。

想用人工智慧管理商業大樓?感測器開發商不會笨到拱手把辛苦搜集來的用電、用水、濕度、溫度⋯⋯等資料讓給你。

想用人工智慧進行社區安全管理?谷歌Nest旗下的雲端監視器龍頭Dropcam肯定已經自己在開發相關應用。

想用人工智慧管理全加州的農場?開著車南北跑、說服農夫把IoT感測器安裝到幾百公頃的範圍的科技公司或者新創,豈會把一身臭汗和痠痛肌肉所換來的寶貴資料轉手交給你?

換句話說,要抵達我們期待的人工智慧優化世界,有大量的資料是需要新的實體載體去搜集的,這些實體載體目前不見得存在,存在的話也不見得像電腦或者手機那樣是任何軟體新創都可以直接使用和佈局的。

如果不把自己的手弄髒,人工智慧新創永遠不會有任何有意義的產出!親愛的人工智慧創業家,如果你想通這些,並因此決定跨入包含硬體的垂直整合創業,我們Hardware Club隨時等著你!

*作者為台灣大學電機畢業,在台灣、矽谷和巴黎從事IC設計超過十年,包含創業四年。在巴黎工作期間於HEC Paris取得MBA 學位,轉進風險投資領域,現為Hardware Club合夥人

喜歡這篇文章嗎?

楊建銘喝杯咖啡,

告訴我這篇文章寫得真棒!

來自贊助者的話
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章