讀者投書:台灣人關心社會議題,真的一窩蜂嗎?分析網路熱搜關鍵字,數據看真相

2016-08-30 12:28

? 人氣

咦?網路輿論可以量化!現代的世界瞬息萬變,誰能窺見輿論的變動,誰就能掌握事件的先機!但定量虛無縹緲的的輿論談何容易?應該要怎麼做呢?

[啟動LINE推播] 每日重大新聞通知

調查輿論的傳統工具,不外乎是問卷或電話訪查,但它們都無法脫離這些缺點:

1. 無即時性
2. 受訪者可能會隱瞞事實
3. 調查的成本極高。

而現代網路滲透進每個人的生活裡,於是網路活動成了窺見「民意」的最好途徑 [1]!在台灣,每個人都離不開Google和PTT等平台,換句話說,重大平台上關鍵字的熱度變化,能真實地反映出民眾想知道什麼?關心什麼?和接收到什麼? [2]

媒體正在關注……?

還記得「流感」在何時被吵得最熱嗎?答案就是3月的第二週!從Google的數據來看,台灣人搜尋「流感」的熱潮在該週衝上最高峰(圖1)。原來3月7日那天,就是立法委員們就流感疫情質詢的日子 [3]!而同時間裡,查詢「克流感(藥物)」和「葉克膜(儀器)」的人也衝上高峰。因此分析網路活動,不僅可以推測台灣媒體們正在關注什麼議題,更有機會藉此推出相關的新聞,趁勢搭起網路熱議的浪潮!

1(圖/作者提供)
2016年1~4月,台灣社會的「流感」、「葉克膜」和「克流感」在Google搜尋強度和流感相關大事。(圖/作者提供)

那些事件引發熱議? 

今年5月起,華航空服員開始向資方挑戰。是什麼關鍵事件引發網路輿論呢?從圖2的Google數據和圖3的PTT論壇討論量中可以看到,6/21的投票讓輿論小幅上升,但資方在6/22召開的記者會,非但沒有澆熄網路熱度,反而更讓民眾關注罷工議題!隨後的罷工開始更引發了華航一連串的公關危機。

網路輿論的轉折點在6/24,勞資雙方達成共識後急轉直下,即使是日後另一個工會揚言再罷工,網路輿論也沒有重新被點燃 [註2]。從這些數據可以發現,資方召開記者會並沒有澆熄網路輿論,反而火上加油!以及另一個工會試圖再點燃罷工議題的操作,同樣也沒有達到引起網民關注的目的。

2(圖/作者提供)
圖2:華航罷工大事記和在Google上的「華航」和「華航罷工」搜尋強度變化(圖/作者提供)
3(圖/作者提供)
圖3:「華航罷工」在PTT八卦板上的活動強度變化(圖/作者提供)

好處一:成本低、速度快!

相較於實體調查,成本低、速度快是分析網路活動最明顯的優點[4] [註3]!以台灣每年夏天的腸病毒疫情來說明,疫情的評估是件耗時傷財的工作,技術上的限制讓疫情的通報有3-14天的延遲,這對傳染病的掌握是無法避免的致命傷。但網路活動的分析就可以得到當天的數據!那麼分析特定關鍵字真的能預測疫情嗎?讓我們用台灣2013年的腸病毒疫情來說明!

如圖5a所示,關鍵字「腸病毒」的Google搜尋強度和全台急診的腸病毒患者比例之間,似乎有著對等的變化關係。而圖5b統計了兩者的線性關係,R2線性值達到0.8633,Pearson 相關係數也達到0.92916,顯示了觀察網路特定字的搜索強度,就能反映出腸病毒疫情的嚴重程度!更重要的是,分析網路活動無需費時耗日,當下可以獲得數據!把握住疫情控制的先機 [註4、5]!

4(圖/作者提供)
分析網路活動量和傳統疾病檢測互相搭配,可彌補檢測等待期。From張昱維、蔣維倫(圖/作者提供)
5(圖/作者提供)
腸病毒的送檢與檢測時間。From:中華民國疾病管制署署長信箱回應(圖/作者提供)
6(圖/作者提供)
圖5a:2015年各週因腸病毒而前往急診求醫的比例(‰),同時關鍵字的Google搜尋強度。圖5b:關鍵字 「腸病毒」搜索強度和因腸病毒而前往急診求醫的比例(‰)的線性關係。(作者提供)

好處二:不同議題的量化

對不同議題的量化是分析網路活動另一個優點!圖6a-e是「華航罷工」、「南海」、「寶可夢」和「奧運」在Google和PTT八卦板上的強度變化。

從圖6a中可以發現,在Google上的熱議程度,Pokémon Go來台和奧運遠勝華航罷工和南海仲裁 [註6]。但在PTT八卦板上卻呈現完全相反的排名!在PTT八卦板上熱議度最高的是華航罷工(44610@06/24)其次是南海議題(20019@07/13),寶可夢和奧運議題則較不受青睞(圖6e)。而出現這些差異的原因,可能是兩個平台的使用者年齡、族群或平台使用習慣有所不同(如:使用PTT論壇的族群年齡層和空服員接近,容易產生同理心),也有可能是因為在PTT板上出現了讓鄉民瘋狂討論的熱門文章所致!

7(圖/作者提供)
圖6a:自6月15日至8月11日,在台灣Google搜尋上述四種關鍵字的網路強度。(作者提供)
8(圖/作者提供)
圖6b(作者提供)
9(圖/作者提供)
圖6c(作者提供)
10(圖/作者提供)
圖6d(作者提供)
11(圖/作者提供)
圖6-e:四個關鍵字在PTT的八卦板上的活動強度變化。From: OmnInsight公司(作者提供)

未來

本文僅觀察了部份網路的活動,因此難免會有疏失之處。在未來,應該結合PTT看板、Yahoo搜尋和Facebook的統計數據,才能夠更全面地了解民眾在網路上的活動與變化,以獲得更精密的資訊!

本文感謝UDN 聯合報系媒體創新研發中心研究員和OmnInsight公司的CEO陸子鈞、鍾采芳、衛生福利部台東醫院檢驗科張昱維(Yu-Wei Chang)協助

註1:網路熱度起伏的原因,可能是很複雜的,不一定是因為單一的記者會所引起,所以要推論背後的原因,還需要更多的資訊和討論。

註2:我曾用同一時間區段搜尋「最美麗」、「最美」和「顏值」等關鍵字的搜尋強度,但搜尋強度都幾乎為零,顯示使用Google查詢相關議題的人,較少使用(或關注)外貌取向的罷工新聞。

註3:此處的成本是指硬體,人才的培育和軟體的成本尚未評估於內。

註4:針對台灣的腸病毒,我評估了2012-2016年的情況;而台灣的登革熱疫情,我評估了2012-2015年,未來將有另文進行描敘。

註5:用Google評估疫情會受到許多因素影響,如媒體大量報導時,因個人興趣而查詢特定關鍵字的民眾會變多,導致搜尋熱門度趨勢受到影響。因此群眾行為模式並不能完全取代現行的機制。所以本文著重於提供「不同面向的參考」。

註6:此處僅針對「最高強度」的數值。事件熱議的程度仍必須依照業主的需求,觀察議題延續的時間、強度、分眾等面向。

參考文獻

[1] Fung IC, Fu KW, Ying Y, Schaible B, Hao Y, Chan CH, Tse ZT. Chinese social media reaction to the MERS-CoV and avian influenza A(H7N9) outbreaks. Infectious Diseases of Poverty 2, 31 (2013). DOI: 10.1186/2049-9957-2-31

[2] Odlum M, Yoon S. What Can We Learn about the Ebola Outbreak from Tweets? American Journal of Infection Control 43, 563–571 (2015). DOI:  10.1016/j.ajic.2015.02.023

[3] 中華民國立法院社會福利及衛生環境委員會,議案整合既綜合查詢系統 http://misq.ly.gov.tw/MISQ/IQuery/misq5200QueryMeetingDetail.action?MeetingNo=2016030410&MeetingTime=105/03/07&DepartmentCode=4500

[4] Chiang Wei-Lun. (2016, April 20). 台灣流感疫情也可以問問Google大神!. PanSci 泛科學. Retrieved August 14, 2016 from pansci.asia/archives/96812

*作者為《泛科學》科普新聞網專欄作家、《故事》歷史人文網專欄作家兼網路數據觀察愛好者

(原文標題:台灣人比較關心寶可夢還是華航罷工?從Google和PTT八卦板看輿論的量化)

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章