吳統雄觀點：藍白合─抽樣誤差的統合校正-風傳媒

吳統雄觀點：藍白合─抽樣誤差的統合校正

藍白合因雙方對民調評估、抽樣誤差未達共識而卡關，預定11/22為定讞日，如何終極審判？

民調評估就是2大方向：「願賭服輸」模式、即一切按照慣例，採用近似數據、眾人相信的方法。今日至少有5家民調，都宣稱「誤差在± 3% 以內」，卻沒有任何2家各項目都在彼此的± 3% 以內，這個天天上演的事實，客觀證明依靠坊間民調，就是以「希巴啦」（擲骰子）決定，只是大家習而不察與願賭服輸。

其次就是「統合分析」模式，即以科學程序降低坊間民調的人爲誤差，將骰子中加入的鉛塊盡量剔除。

日前3方實施的方向就是進行「願賭服輸」模式，這是各政黨行之有年的慣例，應該最沒問題。

問題出在3方共識文中「統計誤差」一詞的意義，又與「勝者得一點」連結，創造史無前例「讓分」的約定。不過，幸而也有一句「由民調統計專家檢視評估」，提供若有疏漏可以補救的機會。

沒有約定者依慣例，沒有慣例者依法理，還是可以解決問題。

過去的慣例就是將各將民調直接總加比較，與「統計誤差」的真相並沒有關係，這次卻變成關鍵。

坊間民調的誤差─必須來自於二項分配

坊間民調的「誤差」，是限制在以下「二項分配」條件才能夠計算得知的：

P + q = 100% =1

亦即只有在兩人/組競選，且兩人/組獲票之和必須為 100%。如果原始數據不是100%，必須先將其標準化為 100%。

所有坊間民調沒有任何一家只有2個選項，因為至少還有1個「未決定」選項，也沒有任何對比組之和為100%，所以其所列的「誤差」全部是不準確的。

慣例的比較方式用不到「誤差」，所以無所謂。這次變成「讓分」依據，影響深遠。

在以上條件下，「誤差」的計算是：

圖示

E 就是誤差；Z 是統計判斷點，常用值為2，結果就是坊間民調常見的「信賴水準95%」；pq 就是兩人/組的各百分比乘積，與誤差成正比；n 是樣本數，與誤差成反比。

pq 乘積是個變數，但幾乎所有民意調查公司都是使用玉瑪系統，將其固定設為 .25，且無法調整，再證所有坊間「誤差」一定是錯的。

柯文哲以為誤差是個固定數3。誤解應來自「民調套餐」均以1067份樣本為準，pq 固定設為 .25，若抽樣方法是在科學條件下，則以上公式所得的誤差為± 3%。

「誤差」是個變數，不應作為讓分的依據。如果樣本數偏少，柯文哲變成全讓全輸；如果樣本數增加，柯文哲變成全部不必讓。

柯文哲可能依據社會相信，認為是讓固定 3%；但文字寫成讓「統計誤差」，除非雙方差距很大，對被讓分者相當有利，而讓分者則相當艱鉅。

1 2 全文閱讀