如果理解到這一點,想搞純軟體新創的人工智慧創業家就應該仔細檢視自己的應用情境:可以輕鬆入手的輸入資料庫是否存在?
在某些領域,這樣的資料庫的確是存在。
以谷歌收購的Deep Mind所開發的Alpha Go來說,輸入資料庫是固定的圍棋規則以及幾千年來人類歷史累積的棋譜,這是最單純的應用情境,決勝完全在於團隊的智商(和谷歌的資金)。
文字介面的智慧型新創,某種程度也是由(語言)規則和容易取得的文字資料庫所構成,但即便如此我們仍然看到簡單如「安排行事曆行程」這樣的應用,在新創燒掉大筆資金後所產生的產品都仍然遠遠不如我們預期。
另外一個公開資料很豐富的是上市股票交易,不過這部分的市場早就在避險基金的競爭下千錘百鍊,戰場已經轉移到關於上市公司的非公開資訊,這部分在我之前的專欄【避險基金管理人的末日與冷酷異境】有解釋過,非金融背景的新創不見得有優勢。
此外最眾所皆知的人工智慧相關資料庫是史丹佛大學的ImageNet,這也是許多深度學習研究者「出國比賽」的戰場。但大家都有的,就等於沒有,隨著深度學習的普及化,同樣使用ImageNet開發深度學習的新創彼此間的效能差異(準確度和速度)會越拉越近,而靜態影像辨識到底有多少可以應用在其他領域,那又是另一個問題。
扣除這幾個「輸入」相對容易取得的領域後,新創能夠入手的有用的資料真的寥寥無幾。
想用人工智慧管理商業大樓?感測器開發商不會笨到拱手把辛苦搜集來的用電、用水、濕度、溫度⋯⋯等資料讓給你。
想用人工智慧進行社區安全管理?谷歌Nest旗下的雲端監視器龍頭Dropcam肯定已經自己在開發相關應用。
想用人工智慧管理全加州的農場?開著車南北跑、說服農夫把IoT感測器安裝到幾百公頃的範圍的科技公司或者新創,豈會把一身臭汗和痠痛肌肉所換來的寶貴資料轉手交給你?
換句話說,要抵達我們期待的人工智慧優化世界,有大量的資料是需要新的實體載體去搜集的,這些實體載體目前不見得存在,存在的話也不見得像電腦或者手機那樣是任何軟體新創都可以直接使用和佈局的。
如果不把自己的手弄髒,人工智慧新創永遠不會有任何有意義的產出!親愛的人工智慧創業家,如果你想通這些,並因此決定跨入包含硬體的垂直整合創業,我們Hardware Club隨時等著你!
*作者為台灣大學電機畢業,在台灣、矽谷和巴黎從事IC設計超過十年,包含創業四年。在巴黎工作期間於HEC Paris取得MBA 學位,轉進風險投資領域,現為Hardware Club合夥人