好文嚴選：大數據不能做什麼？ —— 互聯網雙週評-風傳媒

好文嚴選：大數據不能做什麼？ —— 互聯網雙週評

人們對大數據寄予了許多的希望：賣出更多的貨物，做出更好的產品，找到更酷的朋友，甚至幫我們決定明天早上是否睡個懶覺。現在，凡是有信息流通的地方，都有人們對大數據的期望。

大數據果真如此神通嗎？大數據不能做什麼？下面從幾個方面來談談大數據的反面。

一、大數據不能對具體行為作出精確預測

事實上，人們的社會行為具有不可預測性。甚至我們不妨可以定性地歸成一個大數據測不准原理：人和事件，如果放到越大的空間和時間範圍，則是越可以精確預測的；如果放到越小的空間和時間範圍，則是越不可以精確預測的。

舉個例子說：我們幾乎可以在100%的程度上預測一個人24小時的範圍內會吃飯，但若精確到某一分鐘，則幾乎不可能預測準確。進一步我們會發現，利用更多過去一段時間的數據，能夠幫助我們提高預測某半個小時內是否吃飯的機率，但如果把時間精確到某一分鐘，則更多的數據幾乎提高不了預測的準確性。

其實，行為的不可預測性早已植根於人類的潛意識中。

比如，我國前一陣子發射了嫦娥三號探月飛船，在嫦娥三號發射前，科學家們已經計算出了在未來的一個月之後的某個小時、分、秒，嫦娥三號在月球上空高度和經緯度，如果這個計算結果偏離預計幾十米，則可能推遲發射，重新計算校準。這是科學對未來的精確預測。

相對的情形是，在晚上10點以後，當我們準備睡覺的時候，能預測明天早餐後下樓碰到的第一個人是誰嗎？幾乎沒有人能知道，但這個巨大的不可預測卻沒有引起人的關注，幾乎沒有人會因為不知道下樓碰到的第一個人是誰而影響睡覺。人們對不可預測性熟視無睹。

大數據的有效範圍討論，需要引進一個假設：人們可以自由決定自己的行為（常常稱為「自由意志」）。一個人自由決定自己行為，在別人看來，就是他的行為無法預測，如果能夠精確預測未來的一舉一動，就不具備任何的自我決定的自由。

因此，大數據不能對具體行為作出精確預測，即大數據測不准原理。

大數據的不可預測性說明，企圖利用大數據預測用戶具體行為的努力或許是徒勞的，我們哪怕掌握一個人從出生開始就有的全部行為信息，也無法預測明天早餐他會吃什麼。這也意味著，許多基於用戶歷史數據進行行為分析的努力會遇到瓶頸，預測縮小到一定範圍之後，無法再精確下去。

二、大數據不能用來消除不確定性

大數據不能對具體行為進行預測，還表現大型社區的行為預測上。

最近，很多城市的商業中心開始引入了大數據技術，希望對用戶行為作出精確的預測來提高商業中心的有效使用。從單個商家的角度出發，知道進店顧客的精確行為，能提供更針對性的服務，但是，從整個商區的角度來做預測會出現悖論。

1 2 全文閱讀