楊建銘專欄:人工智慧新創可別成為無米之巧婦

2017-03-31 06:40

? 人氣

了解到無人機和VR軟體新創現在不勝唏噓的現實後,我們如果來檢視人工智慧新創,也不難發現他們有許多都犯下了同樣的錯誤。

[啟動LINE推播] 每日重大新聞通知

蘋果執行長庫克(Tim Cook)認為,AR比VR更有吸引力。(美聯社)
蘋果執行長庫克(Tim Cook)認為,AR比VR更有吸引力。(美聯社)

首先要瞭解到的是,雖說是人工智慧,現在蓬勃發展的其實是很狹義的「深度學習」(Deep Learning)。在這個領域裡,有明確的「輸入」和可定義的「輸出」,開發者建立複雜的數學模型,使用足夠資料量的「訓練集」(training set),反覆餵入多層的非線性演算單元,從而提煉出一個人工神經網路(neural network),今後再有新的輸入資料時,就可以直接匯入這個人工神經網路,來得到輸出。

舉例來說,如果我們想要的人工智慧應用是自動駕駛,我們可以先分析人類開車的方法:用眼睛接受路況(輸入),用大腦和經驗法則進行判斷(人工神經網路),然後用手腳去控制方向盤、油門、煞車和排檔(輸出)。因此直覺來說,要開發自動駕駛的深度學習系統,就得把大量的路況資料——包含高速行駛中看到的行道樹、突然從人行道衝出來的小狗、沒打方向燈就換車道的白痴車主⋯⋯等——餵入深度學習演算法中,進而提煉出一組可以代替人類駕車的人工神經網路,將這個網路植入到自動駕駛車中,讓它可以針對未來新的輸入資料(路況),去自動控制方向盤、油門、煞車和排檔等。

看起來非常合乎邏輯,所有數學很好的人工智慧專家都躍躍欲試,但這裡面有一個天大的問題:沒有任何一間新創在成立之初,就有龐大的路況資料庫可以用來訓練自己的機器——你可以擁有高達240的智商,也熟稔所有深度學習的理論和編程,甚至可能你的論文指導教授就是Yann LeCun大神本人,但只要手頭上沒有谷歌累積了十幾年的路況資料,都是巧婦難為無米之炊

這樣一來大家應該可以理解為什麼明明是軟體巨頭,亞馬遜卻要自行開發並販售Echo,明明市面上已經有滿坑滿谷的安卓手機,谷歌卻仍持續開發自家產品,另外還收購智慧家庭裝置新創Nest,並推出Google Home和亞馬遜競爭。原因在於他們理解持續累積的龐大資料庫才是人工智慧的決勝戰場,他們除了自己已經有的、由他們的使用者自願提供的純網路資料(使用者的消費習慣和搜尋歷史),連實體環境中的資料他們都想要!

換句話說,當一個美國家庭的小孩在吵雜的廚房中開口:「Alexa,世界最長的河流是哪一條?」時,亞馬遜得到的並不只是可以銷售亞馬遜河相關旅遊書籍給這個家庭的資料,而是立刻多了一組自然環境中的人聲資料,可以餵入其深度學習系統,協助Alexa進一步提升語音辨識和回答能力,以期有一天可以達到語音辨識的聖杯:雞尾酒派對對話

喜歡這篇文章嗎?

楊建銘喝杯咖啡,

告訴我這篇文章寫得真棒!

來自贊助者的話
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章