只有「大」還不夠!政府玩大數據 做錯了什麼?

2015-07-03 11:40

? 人氣

大數據熱潮方興未艾,政府也積極推動大數據調查,但受到不少質疑。(影像合成:風傳媒)

大數據熱潮方興未艾,政府也積極推動大數據調查,但受到不少質疑。(影像合成:風傳媒)

「大數據」大概是近兩年來最火紅的字眼,不僅商業行銷大幅應用,就連打選戰、政治圈都想來參一腳,近來行政院積極推動大數據應用,好比近來財政部即以484萬筆賦稅資料所做的「民間薪資大數據調查」打頭陣,響應政策方針;雖然名稱「大數據調查」聽來Fancy,但網路上仍出現不少聲浪質疑「這就叫大數據(Big Data)?」或者「政府真的懂什麼叫大數據嗎?」

[啟動LINE推播] 每日重大新聞通知

柯文哲掀起「婉君」熱 大數據治國時代來臨

去年11月29日,政治素人柯文哲瘋狂席捲85萬票,「白色力量」不容小覷,雖然大部分的人將柯文哲的人氣歸功於他的「真」,但除了敢言果斷的個性深受選民喜愛以外,用以分析網路輿情的「大數據」也是不容忽視的幕後功臣,媒體報導柯P的網路軍師團是一支5人的年輕團隊,其中年紀最小的甚至只有24歲。

相較於深受年輕人喜愛的柯P,年紀較輕的連勝文卻遭受網友連番的嘲諷砲轟。那一次的選戰讓執政的國民黨看見「婉君」的力量,不僅國民黨團積極成立粉絲頁,要求不擅使用網路的老立委經營臉書,政府部門更是全體總動員,行政院一聲令下,從財政部、國發會到交通部紛紛推出新的統計系統或平台,強調運用「大數據」資料分析作為政策參考,幾乎可說是「大數據治國」。

到底政府將大數據應用在哪些地方呢?國發會推動整合財政部、行政院消保處及主計處等單位資訊成立「政府物價資訊看板平台」,利用財政部電子發表即時取得資訊,讓物價資訊透明化;財政部則使用大數據技術分析484萬筆賦稅資料後做出全國薪資統計;央行總裁彭淮南也宣告,未來將透過大數據分析外資進出動態、股市買賣超情況及其他匯市資訊,以降低熱錢來襲的風險。

雖然行政院長毛治國喊出「開放資料」、「大數據」與「群眾外包」科技三箭,讓科技背景的行政院副院長張善政規劃執行,但以日前財政部所做的薪資大數據分析報告來看,雖然資料豐富、分析精準,但網路上「政府真的什麼叫大數據嗎?」的質疑聲浪仍然不斷,到底什麼是大數據呢?

大數據特性:量大、多樣、快速、價值密度低

21世紀宛如是大數據的世紀,《哈佛商業評論》便曾說,「數據科學家」是21世紀最性感的職業,而根據MBA智庫百科的定義,大數據技術指的是「從各種各樣類型的數據中,快速獲得有價值信息的能力。」所謂大數據,包括數據量巨大、數據類型多樣、處理速度快及價值密度低等特性。

從這個定義來看,企圖搭上大數據順風車的政府做錯了什麼?484萬筆賦稅資料難道還不夠「大」嗎?

對此,世新大學資管系副教授葉炳倉表示,學界所說的海量資料庫除了具備夠大的取樣外,還包括資料是否具備多樣性,財政部賦稅資料由於需要透過人工輸入蒐集,不至於過度龐大,若是像街上每秒擷取一次資料的監控攝影機,就可能在短時間內累積超過幾十GB的資料,較符合大數據的定義。

葉炳倉也強調,大數據並非透過共有幾筆或所占容量的大小來界定,重點還包括資料的多樣性及是否具備結構性。他說,一般大眾用資料庫方式來存資料,存下來的資料因已設好變項而具有結構性,但自從網路盛行後,網路上出現非常多不具結構性的使用者行為,這才是大數據技術主要處理的範圍。

學者:政府的調查較類似開放資料

基於此兩點,他認為目前政府積極推動的大數據調查「不太像大數據」,政府推廣的應該較類似開放資料(Open data)的概念,讓社會大眾也能自由使用政府資料。

雖然政府使用的資料來源可能因結構性太整齊而非專家眼中「正統的大數據」,但與民間相比,政府的確握有民間學界都難以取得的完善資料,若能用以分析作為政策參考,或者開放給大眾,都對社會非常有貢獻,只是須永遠記得《小王子》的那句箴言:「大人總愛數字;告訴他數字以外的事情,他們不了解,也並不在乎。」在只看重數字的同時,一定也有些東西失去了。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章