得民調者得天下?學者「3關鍵」揭每個選民必須知道的事,不是只看數字高低而已

2023-11-26 11:00

? 人氣

我們對於許多人事物的看法都仰賴民調的結果,不論是在設計、回應或評估等面向,都應該用更審慎的態度來面對。(資料照/陳品佑攝)

我們對於許多人事物的看法都仰賴民調的結果,不論是在設計、回應或評估等面向,都應該用更審慎的態度來面對。(資料照/陳品佑攝)

歸納推理與我們的生活息息相關,例如民調(opinion poll)。每次選舉結束後都是幾家歡樂幾家愁,也會常有媒體指出該次選舉的結果反映出大選前封關的民調大致上準確,而在選舉前各家媒體所做出的民調也成為選民關心的焦點,幾乎每隔一段時間網友就為了民調吵翻天。其實民調的基礎就是歸納推理,本章將介紹民調背後的邏輯結構,也要告訴讀者如何真正讀懂民調。

[啟動LINE推播] 每日重大新聞通知

上一章我們介紹過歸納推理中的枚舉歸納法。所謂的枚舉歸納,指的是推論者從一個群體的部分成員觀察到某個特質,進而推論出該群體可能也有同樣比率的成員具備那個特質。例如,假設我遇過的基督徒有九成都是心地善良的人,我可以據此歸納出,在所有的基督徒中可能有九成的人都是善良的人。所有的基督徒稱為目標群體,我所遇過的基督徒則稱為樣本。所謂的民調便是一種枚舉歸納,從樣本推論到目標群體。例如,若有臺灣的民調從1000人的訪問結果統計出有六成的人支持候選人Y,我們便可以推出全臺灣的選民應該有六成的人支持Y。

歸納論證的條件

歸納論證要成為可信論證需要滿足兩個條件:是強歸納並且有真前提。這兩個條件反映在民調上,便是以下兩點:從樣本得出的結果必須要能恰當支持結論,並且樣本反映出來的狀況要能呈現真實的狀況。底下一一說明。

首先,樣本要夠大,如果不夠大的話,前提便無法恰當地支持結論。如果臺灣總統大選的民調樣本只有十人,而這十人中有六人說他支持候選人Y,那麼我們能說臺灣的選民有六成的人支持Y嗎?這樣的民調只會是笑話。不過,像總統大選這樣的民調,樣本不需要到非常巨大就能有一定的準確度,事實上,即使是在美國的民調,就算目標群體為全體美國成年人,樣本也只需要1000到1500人就能推出大致準確的結果。在臺灣也一樣。例如,2019年自由時報在12月9號做的總統大選民調,樣本只有1078人,結果顯示有53.12%的人支持蔡英文,而最後蔡英文勝選的得票率是57.1%,相差不算太大。當然,當時的民調受到另一候選人韓國瑜的蓋牌效應影響,韓要他的支持者在接到民調電話時喊出「民調唯一支持蔡英文」,因此民調未必能如實地反映出真實狀況,雖然《自由時報》的民調也有提到,回答「唯一支持蔡」僅佔1.12%。這就可以連結到民調要滿足的第二個條件,就是必須要得出準確的資料。

產生誤導的民調

有時候,民調的問法會產生誤導,因而無法反映出真實。例如,在關於墮胎的問卷,如果問題這樣問:「你認為女性應該擁有殺害未出生的小孩的權利嗎?」大概不會有太多人的回覆是正面的,因為「殺害小孩」這樣的措辭已經帶有強烈的負面意味。這樣的問法可能是無意的,但有時候可能是有意的,反映出做民調者意圖將受訪者的看法導向特定結果。這樣的民調當然不會有太高的可信度。

另外一個很重要的影響因素是問題的順序。假設有一份民調問卷在調查市長施政滿意度,第一個問題先是問了高雄的愛河有沒有蓋摩天輪,第二個問題才問對於(當時的)韓國瑜市長的施政滿不滿意,這樣的問題安排順序其實頗有陷阱。第一個問題拋出帶來負面觀感的事實,受訪者很容易在第二個問題回答不滿意。姑且不論韓市長有無實際的施政成績,這種左右受訪者意見的問卷無法如實反映民意。這就好像先問你知不知道臺灣最近發生什麼重大犯罪事件,然後才問你覺得臺灣治安好不好。這樣的民調只會成為媒體帶風向的工具。

最後,問卷可能會有簡化選項的風險,因而無法反映出真實的民意。如果詢問韓國瑜市長施政滿意度的調查只有「好」與「不好」的選項,會忽略了一些市民可能會抱有的其他態度,例如覺得施政普通、沒感覺或是不太清楚。在只有兩個選項的狀況下,這些人可能會勉強選擇其中一個,這與提供兩個以上的選項所調查出來的結果,恐怕就會有顯著的差異。

設計民調的問題時要盡量避免上述三種陷阱,而我們在回答問題時也應該要認知到這樣的陷阱,進而對民調的結果抱持保留態度。

早先有提到,即使民調的目標群體數量龐大,樣本卻可以相對地小,為什麼能夠如此呢?主要歸因於「隨機抽樣」(random sampling)的方式。我們已經知道,枚舉歸納成為弱論證的兩個原因,一個是樣本太小,一個是樣本沒有代表性,隨機抽樣就是要避免後者發生。使用隨機抽樣才能確保目標群體中的每一個成員都有可能被選為樣本,才不會造成偏差樣本(biased sample)的狀況。不過,要進行完全的隨機抽樣也不是那麼容易,當我們要從一長串的名單或號碼中隨機挑選時,往往還是會被一些主觀因素影響。例如,我們可能潛意識偏好某些名字或數字。要避免這種情況,一種做法是把目標群體的成員做編號,再用隨機的號碼生產程式來決定。

民調不一定準確

要注意的是,有一種很常見的民調方式其實無法真正確保隨機抽樣。例如,雜誌上可能會有讀者回函,請讀者回信來讓讀者投票;或是網站上會有問卷,請網友填寫來讓網友投票;或是廣播節目要聽眾call in來投票。不論是哪一種,都是屬於所謂的「自我選樣」(self­selecting sample)。在這些情況中,這些回應投票的人可能剛好只是那些比較勇於表達自己意見的人,或是特別喜歡填寫問卷或回答問題的人。也就是說,在這種狀況中,要不要成為樣本是他們自己決定的,因此才稱為自我選樣。既然自我選樣不是隨機抽樣,所得出來的結果自然不會準確。

抽樣(sampling)畢竟不是普查(census),針對同一個目標群體所做的隨機抽樣不會每一次都得到一樣的結果,這種差異性構成了所謂的誤差範圍(margin of error)。再舉剛剛《自由時報》的民調為例,蔡英文的支持率是53.12%,報導裡面有提到抽樣誤差在2.98個百分點以內,這代表蔡英文的支持率落在53.12%加減2.98%的範圍內。以總統大選來說,誤差範圍通常都在3個百分點以內。

在民調中,除了誤差範圍,還有一個很重要的概念叫做「信心水準」(confidence level)。在剛剛提到的總統民調的報導中,有註明信心水準是95%。這意思是說,有95%的機率,包含誤差範圍在內的民調結果會反映真實的情況。以蔡英文的民調結果來說,誤差在53.12%加減2.98%的範圍內,那麼有九成五的機會結果會是如此。

樣本、誤差與信心水準

底下順帶介紹三個有趣的事實,主要都是關於樣本、誤差以及信心水準三者之間的關係。

首先,樣本愈大,誤差範圍會愈小,這是因為隨機抽樣的樣本若愈大,當然就會愈有代表性。然而,在樣本數超過1000之後,大幅提高樣本數並不會大幅縮減誤差範圍。例如,把樣本數從1500提高到10000只會降低1個百分點的誤差範圍。

第二,信心水準愈低,樣本數就可以愈小。例如,90%的信心水準意味著,有10%的機率民調結果會不準確。如果可以接受這麼低的信心水準,當然可以不用有太大的樣本。

最後,誤差範圍愈大,信心水準就愈高。這是因為範圍愈大,我們當然更有信心最後民調的結果會落在這麼大的範圍內。當我們把結論的準確度降低了,就更有信心預測不會出錯。

很多人接受民調時即使沒有特定的想法也會硬擠出想法,原因之一是人們有一種傾向,認為提供假的意見比起承認自己沒有意見要好。在這樣的狀況之中,民調並沒有收集到人民真正的想法。想想我們自己在回答民調的時候,可能不一定有真正的想法,或者對問題根本不了解。英國的一間數據分析公司曾做過一個民調,調查英國人對1975年的公共事務法案的看法。有18%的受訪者針對這份民調給了意見。問題是,這個法案是虛構的,根本不存在,人們卻仍然願意提供看法。該民調其實是重現了辛辛那提大學曾經做過的實驗,用來說明有很大一部分的人對於自己不熟悉的議題仍會做出回應。

在這個資訊發達的時代,做民調是一件很方便的事情,我們對於許多人事物的看法也都仰賴民調的結果。也就因為這樣,我們對於民調必須更加小心,不論是在設計、回應或評估等面向,都應該用更審慎的態度來面對。

作者介紹|林斯諺

現任東吳大學哲學系專任副教授,紐西蘭奧克蘭大學哲學博士,同時也是台灣推理作家協會成員,迄今出版推理小說十二本。目前的生活目標是兼顧學術研究與推理創作,常自嘲是不要命的斜槓族。

本文經授權轉載自晴好出版《一魚三吃!哲學、美學與批判思考》(原標題:得民調者得天下?「民調」背後的邏輯問題)

責任編輯/蔡惠芯

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章