吳統雄觀點:藍白合─抽樣誤差的統合校正

2023-11-20 06:50

? 人氣

民眾黨主席柯文哲簽下藍白合協議,却為民調統計誤差到底該讓幾%而翻臉。(柯承惠攝)

民眾黨主席柯文哲簽下藍白合協議,却為民調統計誤差到底該讓幾%而翻臉。(柯承惠攝)

藍白合因雙方對民調評估、抽樣誤差未達共識而卡關,預定11/22為定讞日,如何終極審判?

[啟動LINE推播] 每日重大新聞通知

本文作者在本刊的《藍白協商之民調評估 「統合分析」可獲得較佳結果》一文中已指出:

民調評估就是2大方向:「願賭服輸」模式、即一切按照慣例,採用近似數據、眾人相信的方法。今日至少有5家民調,都宣稱「誤差在± 3% 以內」,卻沒有任何2家各項目都在彼此的± 3% 以內,這個天天上演的事實,客觀證明依靠坊間民調,就是以「希巴啦」(擲骰子)決定,只是大家習而不察與願賭服輸。

其次就是「統合分析」模式,即以科學程序降低坊間民調的人爲誤差,將骰子中加入的鉛塊盡量剔除。

日前3方實施的方向就是進行「願賭服輸」模式,這是各政黨行之有年的慣例,應該最沒問題。

問題出在3方共識文中「統計誤差」一詞的意義,又與「勝者得一點」連結,創造史無前例「讓分」的約定。不過,幸而也有一句「由民調統計專家檢視評估」,提供若有疏漏可以補救的機會。

沒有約定者依慣例,沒有慣例者依法理,還是可以解決問題。

過去的慣例就是將各將民調直接總加比較,與「統計誤差」的真相並沒有關係,這次卻變成關鍵。

坊間民調的誤差─必須來自於二項分配

坊間民調的「誤差」,是限制在以下「二項分配」條件才能夠計算得知的:

P + q = 100% =1

亦即只有在兩人/組競選,且兩人/組獲票之和必須為 100%。如果原始數據不是100%,必須先將其標準化為 100%。

所有坊間民調沒有任何一家只有2個選項,因為至少還有1個「未決定」選項,也沒有任何對比組之和為100%,所以其所列的「誤差」全部是不準確的。

慣例的比較方式用不到「誤差」,所以無所謂。這次變成「讓分」依據,影響深遠。

在以上條件下,「誤差」的計算是:

圖示
圖示

E 就是誤差;Z 是統計判斷點,常用值為2,結果就是坊間民調常見的「信賴水準95%」;pq 就是兩人/組的各百分比乘積,與誤差成正比;n 是樣本數,與誤差成反比。

pq 乘積是個變數,但幾乎所有民意調查公司都是使用玉瑪系統,將其固定設為 .25,且無法調整,再證所有坊間「誤差」一定是錯的。

柯文哲以為誤差是個固定數3。誤解應來自「民調套餐」均以1067份樣本為準,pq 固定設為 .25,若抽樣方法是在科學條件下,則以上公式所得的誤差為± 3%。

「誤差」是個變數,不應作為讓分的依據。如果樣本數偏少,柯文哲變成全讓全輸;如果樣本數增加,柯文哲變成全部不必讓。

柯文哲可能依據社會相信,認為是讓固定 3%;但文字寫成讓「統計誤差」,除非雙方差距很大,對被讓分者相當有利,而讓分者則相當艱鉅。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章