華爾街日報》微波麥片的合適溫度是幾度?那些AI語音助理還做不到的事

2019-12-26 11:23

? 人氣

你家的AI助理能夠滿足多數指令和需求嗎?(Alex Knight@Unsplash)

你家的AI助理能夠滿足多數指令和需求嗎?(Alex Knight@Unsplash)

語音優先技術過去幾年進展顯著,但大多數人卻還停留在透過語音設置鬧鐘、播放音樂的階段。

我:「 Alexa,微波燕麥片。」

Alexa :「好的,溫度多少?」

我:「我不知道。」

Alexa :「呃,我不確定。」

我正在試用亞馬遜品牌一款新的烤箱,設計理念是用戶可以向 Alexa發出語音指令,讓烤箱的操作更為便捷。

雖然在許多層面上,這款烤箱的確操作簡單,而且有的功能相當驚艷,但當我們不斷嘗試以語音操控它時,它的問題就被放大了。有人知道微波燕麥片的恰當溫度嗎?或者說,微波爐竟然有溫度設置?

這款烤箱的功能很豐富——它同時也是一款對流式烤箱和氣炸鍋——但是, 當我說「做鮭魚」時,Alexa 問我要做多少。 我回答1磅(約0.45公斤),卻被告知只能 做「0.063 到 0.37 磅的鮭魚」 。雖然我可以透過聲音輕鬆啓動對流烤箱,卻不能用聲音關閉它。(烤箱本身不具備對話功能,你可以使用附近的Alexa智慧喇叭來操控它。)

亞馬遜(Amazon)的具「亞馬遜回音」(Amazon Echo)智慧型揚聲器和「Alexa」語音助理功能(AP)
亞馬遜(Amazon)的具「亞馬遜回音」(Amazon Echo)智慧型揚聲器和「Alexa」語音助理功能(AP)

亞馬遜表示,我遇到的諸多問題都正在透過後台更新修復,但要讓語音助手與使用者流暢對話,恐怕還有很長一段路要走。這就像在旅行前臨陣磨槍學外語:你能記住某些短語,但是在用完「儲備」詞語後,你就會提高嗓門,開始一個勁地比手畫腳。

我已經把好幾個燈的開關換成了Wifi智慧開關,其他燈也裝上了聯網燈泡。 我還在好幾個房間放置了智慧喇叭,包括浴室,聖誕樹的燈也連接到一個智慧插座上。我的家人都向Alexa發出命令,大部分時候她都照辦無誤。不過我們的命令都簡單直接:播放這首歌、關掉這些燈、設置計時器或鬧鐘。我們在蘋果設備上與Siri的互動,或者在廚房的Nest Hub Max上與Google助理的互動也是如此。                    

「不論什麼事,只要這件事能快速完成,透過語音來實現是最佳的,」語音優先軟體開發商Witlingo首席執行長、前亞馬遜 Alexa 產品負責人布茲德(Ahmed Bouzid)在一封電子郵件中說。最佳用戶界面的所需工作量,應該比它所代替的命令更少。與被替換掉的指令相比,最佳界面應該讓用戶更省力才對。

以亞馬遜智慧烤箱為例,布茲德質疑這套設計:做飯的時候你就在烤箱附近,通常也不會嘗試做其他事情,所以還不如直接按下按鈕。 亞馬遜智慧家居業務副總裁勞棄(Daniel Rausch)則提出相反的觀點。他認為這款烤箱功能繁多,沒有其他界面可以容納這麼多指令: 「如果你試圖畫一張囊括該設備所有功能的圖表,並把每個功能都設一個按鈕,你恐怕需要一個路邊廣告牌大小的操控面板,」他說。

那麼,語音助手的作用就是替換開關和搜尋框嗎? 製作這些界面的公司不斷為語音助手增添功能,有些功能具有驚人的顛覆性。如果仔細研究,可以發揮的空間其實很大。但是受到一系列因素,包括隱私方面的考慮影響,我們似乎仍然停滯不前。

本文為風傳媒與華爾街日報正式合作授權轉載。欲看更多華爾街日報全文報導,請訂閱特別版華爾街日報VVIP方案,本方案僅風傳媒讀者專屬,以低於原價3折以下之全球最優惠價,即可無限暢讀中英日文全版本之華爾街日報全部內容。

回話功能

例行程式是一種將幾個動作組合在一起的方法。這樣一來,只需一個簡單的語音命令,例如「我到家了」,就可以關閉警報器、打開燈、調節恆溫器,也許還能奏響輕快的爵士樂。

理論上,這種感覺很酷;但真正設定起來卻很煩人——因為設定例行程式時 你必須坐在那裡,設想自己想透過一個指令做到的所有事情,以及如何確保它們依照設定準確無誤地執行。

現在,操控這些界面的程式會提供建議——通常是基於你自己的行為。

如果你下載一個叫「捷徑」(Shortcuts)的應用,蘋果版本的例行程式就會出現。雖然這並非最好用的例行程式工具,但如果你打開它,點擊「捷徑資料 庫」(Gallery),然後在「來自您App的捷徑」(Shortcuts from Your Apps)中查看,可能會發現有用的指令。晚上我通常會設置三個鬧鐘—— 「醒來」、「校車抵達」和「搭車」。現在,我只需說一聲「早間鬧鐘」 ,一切就搞定了。

但是例行程式只能解決按鍵次數太多的問題。開發人員正努力讓這些界面變得更「健談」,讓後續提問成為可能。你可能會說,「打開門廊的燈,」這項任務完成了,然後你的助手可能會建議,「你也想打開陽台的燈嗎?」因為這樣比較合邏輯。

雖然亞馬遜和 Google 的產品都會提出建議,但亞馬遜的「預測」功能更進 一步:當你要求打開門廊燈時,它可能會說,「你是不是也想讓我演奏舒緩的爵士樂? 」這個問題是基於你的(可能是下意識的)行為而問的:通常,打開門廊燈的時候,你也會播放輕柔爵士樂。

此外,亞馬遜和Google都允許你無需喚醒詞即可啓用語音助手。 透過啓用 Alexa 程式中的「跟進」(Follow-Up)和Google Home程式中的「連續對話」(Continued Conversation),你可以喚醒助手,然後在不重複喚醒詞的情況下繼續提問。它還能記住部分語境:「Alexa,耶誕節是哪一天? 」在它回答之後,你可以簡略地問:「那復活節呢? 」

蘋果的 Siri 可以在不同情境下做到這一點。蘋果的藍牙耳機Airpods Pro現在有一個「播報訊息」(Announce Message)功能,可以把收到的消息讀給你聽,然後讓你用語音方式回覆。沃爾瑪基於iOS的日用品配送App將Siri和你的購物紀錄結合,所以你只要透過語音就可以更方便地挑選商品,而無需記住關鍵詞。

個人化和隱私

好幾位與我有過交流的分析師認為,真正需要做的是加強人類和機器語音之間的聯繫。個人化代表能辨識誰在說話、並記住對方的偏好。但這需要收集數據,而近來人們在這方面的自我保護意識越來越強。

「隱私是消費者最關心的問題。蘋果等公司已經做了大量工作,加以改善這點,」Futuresource Consulting的首席分析師福里斯特(Simon Forrest)說。例如,現在的智慧裝置能將更多資訊儲存在本機,並且在某個聲音要求播放某部特定的電影時辨識出來。

Alexa程式提供一個單獨的智慧家居設備歷史記錄選項,用戶可清除已存儲的數據。Google稱,該公司的產品能讓你查看和刪除自己的歷史記錄。

「我們正想方設法,儘可能獲取更少的數據,同時又能為用戶改進產品,」 Google 助理高級產品總監琳肯(Lilian Rincon)表示。目前,出於品質考量,Google助理的大部分工作都需要使用雲端,她說。不過,「我們希望把更多資料儲存在設備上。」

正如我的同事斯特恩(Joanna Stern)今年稍早指出的那樣,GooglePixel 4手機就是個很好的典範。這款手機只需基於自身硬體就可以即時將語音轉換成文本。iPhone 11也更不依賴雲端就能達成功能,如呈現Siri的新聲音,即便是舊款的iPhone也可以透過自身硬體來學習你的行為,並據此提出行動建議。

發現新功能

那麼,為什麼語音技術有了如此顯著的進步,大多數時候我們的使用仍然停留在設置計時器和播放音樂的層面?與你最喜歡的程式更換新Logo不同,你無法實實在在看到語音助手的新功能。Alexa、Google Home和Siri快捷指令可提供大量建議,亞馬遜和 Google 販售的附螢幕智慧喇叭也是如此。但這些還不足以推動人們養成使用習慣。

「一直以來我們面臨的一大問題就是『發現』問題,尤其是對揚聲器而言——讓 你知道你能(透過產品)做些什麼,」 里肯說。

來自亞馬遜的勞契也承認存在可發現性問題,他套用了亞馬遜創始人貝佐斯(Jeff Bezos)的名言: 「這是亞馬遜的第一天,對Alexa和AI來說絕對是如此。」

那麼,第二天或者第12天是什麼樣子的呢?Futuresource 公司的福里斯特說,即使是語音優先的界面,也可以結合手勢控制和觸覺反饋等技術,就像在手腕上輕輕點擊Apple Watch一樣。 他認為「智慧耳戴式設備」 (hearables),如超級智慧的AirPods,很可能成為聲音優先的成功案例。

同時,我也會試著「說服」這款智慧烤箱製作超過 0.37 磅的烤鮭魚。 

文/Wilson Rothman

決策者的最佳夥伴

立即訂閱,即刻暢讀華爾街日報全文內容

並享有更佳的閱讀體驗

訂閱 每天只要10.9元 查看訂閱方案
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章

你可能也想看