吳鐵肩觀點:曲解「統計誤差範圍」─柯文哲是無知?還是故意?

2023-11-22 06:40

? 人氣

作者質疑,柯文哲及柯陣營都對「在統計誤差範圍內」的真正意義無知。(資料照,蔡親傑攝)

作者質疑,柯文哲及柯陣營都對「在統計誤差範圍內」的真正意義無知。(資料照,蔡親傑攝)

藍白合又卡關了,盼望政黨輪替的廣大人民再度陷入憂心焦慮中。卡關的原因是藍營與白營在民調誤差範圍認知上的差異。

[啟動LINE推播] 每日重大新聞通知

11月15日馬英九、朱立倫、侯友宜、柯文哲四人親自簽名的藍白合協議第三條是: 「雙方同意,若(民調支持率的差異)超過統計誤差,由勝者得一點;若在統計誤差範圍內,由侯柯配得一點」。藍營與白營卡關的原因是對於這一句「在統計誤差範圍內」解釋或理解上的差異。

事實上,「在統計誤差範圍內」並沒有主觀的詮釋問題,而是一個客觀的數學陳述。它的意義只有一種。運用數理統計的計算,若民調的信心水準是95%,則近似的抽樣誤差 = 0.98除以「樣本數的平方根」;所以當樣本數 = 1068時,抽樣誤差約等於3%;當樣本數 = 4269時,抽樣誤差約等於1.5%。這裡的重點是統計抽樣誤差並非固定不變,而是隨著樣本數變動。

承接上述,它的意義可以用下例說明。在信心水準 = 95%及樣本數 = 1068(一般民調常採用)時,若候選人A和B的支持率分別為43%和48%,則支持率的雙邊信賴區間(two-sided confidence interval,約等於 [支持率-3%, 支持率+3%])分別為 [40%, 46%] 及 [45%, 51%]。雖然A比B的支持率低5%, 但因為抽樣誤差的緣故, 導致兩個信賴區間有重疊,A有可能高到近46%, 而B有可能低到近45%, 亦即; A仍有可能比B的支持率高; 遂說A和B的民調支持率的差異在統計誤差範圍內-即A和B支持率没有統計上的顯著差異。但是,若B的支持率高達49% 以上,則B領先A超過抽樣誤差的兩倍(即 3% x 2 = 6%)以上,A和B的信賴區間不再重疊,遂說A和B的民調支持率的差異在統計誤差範圍外-即B支持率領先於A具有統計顯著性(此例參見美國權威的民調機構皮尤研究中心的論文“5 key things to know about the margin of error in election polls”)。

綜上所述, 柯文哲一旦簽字同意了藍白合協議第三條,他就只能以上述的客觀意義來理解,不能有任何模糊性或曲解。因此, 藍營與白營推薦的三位專家所檢視的最後六份民調, 其結果必定是五比一,侯友宜勝出。

柯陣營用激烈的政治語言否定前述結果, 例如, 柯文哲親上火線喊話「民調讓3%還可以,國民黨要求讓6%超過一般人民常識,太強人所難,等於叫我們自己棄械投降…朱立倫要不要出來明白告訴台灣人民,希望民眾黨讓6%,他敢嗎?」遇到疑難,他沒有向統計專家學者們討教,以求正確地理解「在統計誤差範圍內」的意義,卻用反智的言語來鼓動群眾反對五比一侯勝柯敗的民調結果。

有兩種可能:其一是柯文哲及柯陣營都對「在統計誤差範圍內」的真正意義無知,其二是柯陣營明知其真正意義卻胡攪蠻纏不認輸,他們企圖用否定性言語扭曲真理、煽動群眾,是對科普教育的反動,更是對學術尊嚴的蔑視。

*作者為國立成功大學統計系退休教授

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章