丘昌泰觀點:搬開巨量資料新絲路的路障

2016-01-28 06:40

? 人氣

大數據分析,重點在資料庫。

大數據分析,重點在資料庫。

政府巨量資料的應用,在前後任科技部長張善政與徐爵民熱心推動下,克服無人、無錢、無題目的「三無」困境,打造大數據分析的「新絲路」。新絲路的開拓是透過學者的自由發想,構思出巨量資料在政府施政上可能適合的應用情境,挖掘出政府制訂公共政策的資訊。張善政院長領導的科技團隊在短暫時間內,讓這些躺在政府內部、從未被開發利用的「資料金礦」,展現初步的研發成果,值得我們肯定,但在實際運作過程中,也發現不少路障必須搬開。

[啟動LINE推播] 每日重大新聞通知

路障一:政府自己為什麼不做?

政府推動任何施政,最重要產物之一就是累積龐大的資料庫,有誰比政府更瞭解資料庫的用途與限制?政府不當成是自己主辦的業務自行分析與應用,卻倚賴科技部編列經費,以研究計畫方式委託學者挖掘礦脈,這就值得檢討了。老實說,政府官員高學歷者比比皆是,應非官員本身的能力不足,而是官員忙於送往迎來的政治公關、等因奉此的官樣文章或消磨志氣的繁雜瑣事,壓縮了政府官員分析大數據以提升決策品質之精力與時間。

從事「數據導向的政策分析」是歐美先進國家政府官員的責任,但我國政府少有這種嚴肅態度。試以當前大學數目過於浮濫的夢魘來說,主其事者只要運用簡單的大專生就學率與出生率等數據,就可以訂定大學數目的「總量」管制標準,何至於出現如今的大學倒閉潮?基此,政府巨量資料的分析應是政府業務的一部份,必須自己去分析,學者只能接受更高層次的大數據分析技術。

路障二:走出科技部以外,能自由發想?

科技部是非常尊重學者專家的部門,故賦予學者自由發想的學術空間,而這種尊重學術研究的態度正是大數據分析的要件之一,蓋大數據分析往往無法預期其研究成果,學者絞盡腦汁挖掘出來的資訊固然可能是有價值的,但也可能產生平淡無奇、毫無價值的垃圾資訊,甚至可能出現誤導性的資訊。

上述幾種政府巨量資料應用可能產生的「風險」,科技部可以接受,但科技部以外的中央或地方政府機關能夠接受嗎?須知政府委託研究計畫,悉依《政府採購法》規定辦理,公開招標文件必須載明確定的委託研究項目與預期研究成果,大數據分析若未產生預期的研究成果,抱著法規辦事的公務員膽敢驗收這樣的研發成果嗎?這是一個嚴肅的問題,據本人所知,不少中央各部會官員或地方政府首長都蠢蠢欲動,希望能趕上大數據分析的時髦,但多數官員並不瞭解大數據並非是萬靈丹,政府可能得到一大堆毫無用處的資訊。

路障三:政府能提供「奈米級」的高品質資料嗎?

大數據分析的價值取決於資料品質,而所謂資料品質是指政府提供的資料單元不能太粗,例如,致癌率、出生率等以「縣市」或「年度」為分析單元的「結果資料」,分析價值有限。相反地,必須提供出細緻到「奈米級」程度的「過程資料」,例如,以鄉鎮市區、每日或小時為分析單元的政策執行過程資料;一般而言,資料顆粒愈細,愈可能得到有價值的資訊。

大數據分析是行動通訊時代才出現的新興產業,故最能反映巨量資料者莫過於網民留下的「網路足跡」,如網民瀏覽網頁歷程、社群媒體點擊率或發言等,其累積資料速度之快、數量之龐大,故堪稱為「大」數據。然政府目前提供給外界使用的資料型態,很多是根本無法或僅能作初步分析的「統計資訊」,如機構名單、設施地點、某某標準、某年報等,這些資料怎麼作分析?中央或地方主計機關早在多年前就已建置網路版的「統計資訊網」,有了這個資訊網,還需要大數據分析嗎?

路障四:沒有資料的對象怎麼分析?

無可否認地,大數據分析的前提是政府對每位國民都擁有鉅細靡遺的完整資料庫,但這是天方夜譚。從公共政策原理而言,政府資料庫中無法找到任何資料的對象往往是政策制定的重點所在。如食品安全、環境污染的關鍵在於未列冊的地下工廠;校園毒品的來源很多是警方無法掌握資料的毒頭。由此可知,政府建置完整有用的資料庫遠比資料庫的分析應用更為重要。

大數據分析要發揮效益,需要腦袋革命,今後政府官員推動任何業務都必須重視資料庫系統的建置,然後設計出便利快速的資料運算系統,最後才能得到有價值的分析應用成果。如今我們竟將焦點放在最後的分析與應用上,乃是本末倒置作法,最終還是要政府自己來做,學者僅能提供政策諮詢協助而已。

*作者為元智大學社會暨政策科學系、大數據與數位匯流創新中心教授

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章