明智地讓人類智慧參與其中:《機器、平台、群眾》選摘(3)

2018-01-16 05:10

? 人氣

作者認為,人類固然有電腦沒有的偏誤,但也有電腦欠缺的長處(圖/pinterest.com)

作者認為,人類固然有電腦沒有的偏誤,但也有電腦欠缺的長處(圖/pinterest.com)

有一則老笑話是,在未來的工廠裡,將有兩名員工:一個人和一條狗,人的職務是餵狗,狗的職務是看人,不讓人碰觸任何機器。未來的公司,真的會變成這種面貌嗎?

[啟動LINE推播] 每日重大新聞通知

我們可不這麼認為。人類固然有電腦沒有的偏誤,但也有電腦欠缺的長處。就拿其中一項來說吧!我們隨時從感官接收大量資訊,而且不會事先篩選資訊,來什麼就接收什麼,哪怕只是很短的時間,我們也難以只聽特定聲音、只看特定事物。電腦則是剛好相反,下指令的人要它們蒐集什麼資料,它們就蒐集那些資料,很難蒐集更多或其他資料。……因此,在多數的情況下,由人類檢查電腦的決策,確保那些決策合情合理,會是比較好的做法。長期研究分析與科技領域的學者湯瑪斯•戴文波特(Thomas Davenport),將這種做法稱為「望向窗外」(look out of the window)。這個名詞並非全然是聯想式的隱喻,是一個飛機駕駛給戴文波特的靈感。他告訴戴文波特,在開飛機時,他高度仰賴飛機的機械操作,但也必須時而望向窗外,掃視天際線。這種方法非常有益,不只是為了防止錯誤,也有助於維護一家公司的聲譽。

叫車平台Uber,在2014 年末就學到了慘痛教訓。當時,Uber 的加成計費(surge pricing,在尖峰時段暫時調高費率),令許多用戶十分不爽。Uber 的辯護理由是(我們也同意),加成計費有助於平衡尖峰時段的供需,當實際或預期的Uber 車輛供給不敷需求時,該公司的演算法將會調升費率,鼓勵更多駕駛加入提供服務。

這項實務在2014 年12 月,招來了大量的負面輿論,起因是一名伊朗教士在澳洲雪梨一間咖啡館挾持了十八名人質,許多人慌忙逃離事件的發生地區,其中一些利用Uber叫車,Uber 的電腦系統便對這股激增的需求做出反應,啟動加成計費。許多人看來,在危機爆發時,這是非常不當的反應,所以該公司遭到強烈抨擊。

Uber 發出了下列聲明:「在事件發生時,我們沒有立刻關閉加成計費,這是錯誤決策。」 顯然,該公司也內建在一些情況下取消加成計費的設定。比方說,後來在2015 年11 月13 日的晚上,伊斯蘭恐怖分子在巴黎發動了一連串的攻擊,在第一起攻擊行動發生的三十分鐘內,Uber就取消該市的加成計費,並提醒所有用戶這個緊急事件。

像這樣的例子,足以顯示將人類判斷與演算法結合的好處。不過,公司在採用這種方法時,也必須小心,因為我們實在太鍾情於自己的判斷力,往往過度自信,許多人(如果不是絕大多數的話)經常太快凌駕於電腦之上,縱使是在電腦的答案較佳時。前文提過社會學家克里斯•史奈德斯,他對荷蘭採購經理人的預測能力進行研究,他發現「有演算模型輔助的專家,預測準確度通常介於純模型和無模型輔助的專家之間。所以,提供演算模型給專家,他們的預測準確度將會提高,但純模型預測的能力仍然較佳。」

倒置夥伴關係,畫出清楚界線

最後一個有助益的做法,一些公司已經開始採行,就是把人機的標準夥伴關係倒置,不再由機器提供資料給人類當作判斷參考,而是把人類的判斷當成一個資料點,輸入演算法。谷歌首創將這個方法用於人才招募上,人才招募對該公司非常重要,但分析顯示,人機標準夥伴關係的成效很差。

拉茲洛•博克(Laszlo Bock)在擔任谷歌資深人資長時發現,當時所採用的大多數新員工遴選方法近乎無效。他的團隊檢視究竟是什麼因素,造成公司員工工作表現的差異;他們發現,錄用前的徵信調查(reference check)只能解釋7%的差異性,先前工作經驗的年資只能解釋3%,無條理結構的面試只能解釋14%(就是那種最常見的面試,在開頭時詢問:「你最大的長處是什麼?」,或「請逐項談談你的履歷表。」)博克說,這類面試的問題在於:它們形成了一種情況,其實是試圖在確認我們對此人的想法,不是真的在評估對方。

心理學家把這稱為「確認偏誤」(confirmation bias),我們只根據最少的互動,得出了一張快照,在無意間做出判斷,卻深受既有偏見和想法的左右。不知不覺中,我們從原本是在評估一位應徵者,變成了在尋求證據,確認自己的初步印象。

這又是把偏誤和毛病帶入一項重要決策裡。那麼,有什麼更好的人才招募方法?谷歌改為高度倚賴有條理結構的面試,這項因素對員工錄用之後實際工作表現的解釋度超過25%。所謂的有條理結構面試,包含一套用以評估應徵者的預先設定問題,例如評估應徵者的一般認知能力。谷歌採用了一種人才招募流程,所有面試官使用結構性面試,詢問應徵者大致相同的問題,博克解釋:「我們使用一致的面試評分表格⋯⋯,面試官必須評估應徵者表現如何,表格上清楚定義了每一項表現的等級⋯⋯。一份簡明的人員招募評分表格⋯⋯,把混亂、模糊且複雜的工作情況簡化,得出可評量、可比較的結果。」

在此方法中,個別面試官的判斷仍然受到重視,但這些判斷被量化,用以對應徵者打分數。博克認為,這個方法並未貶低面試流程或去人性化;相反地,應徵者也感謝自己受到客觀、公平的對待(透過新流程應徵但未獲錄用者,有80%表示會推薦朋友應徵谷歌),雇用決策變得更容易,因為「可以看出優秀者和普通者之間的清楚界線」,博克如此說道。

《機器、平台、群眾》立體書封。(天下文化提供)
《機器、平台、群眾》立體書封。(天下文化提供)

*安德魯‧麥克費為麻省理工學院數位經濟研究中心共同主任,麻省理工學院史隆管理學院首席研究科學家,專長於研究資訊科技對經濟、商界及企業的影響,以及電腦化如何影響競爭、社會、經濟及勞動市場。

 艾瑞克‧布林優夫森為麻省理工學院數位經濟研究中心共同主任,麻省理工學院史隆管理學院教授,專長於資訊科技生產力研究及資訊經濟學。

本文選自《機器、平台、群眾》(天下文化)。本系列結束。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章