「民調0正確」一文已經證明,一般的坊間民調平均誤差其實在正負10%以上,加入手機,直覺上是想接觸手機使用者,但事實上是降低「隨機性/等機率性」,一定會更擴大誤差。
筆者團隊的手機民調作法是:找到指定受訪者,如果受訪者不在家,請家屬告知受訪者的手機號碼。
對年輕受訪者加權:顛倒結果
對年輕受訪者加權的直覺原因是,中外民調都有「在家男性偏少、年輕人偏少」的現象。所以就將樣本的性別、年齡,依據普查資料加權。
但長期研究顯示,年輕人投票的比例本來就比較低,而去投票的通常意識型態比較鮮明、政治態度積極度超過同儕。
即願意回答選舉民調的是年輕人的少數,但經過加權後,他們變成假的多數,更提高了年齡層的影響力,造成巨大的扭曲。
舉一個假設的簡化例子如下:
若總選舉人為100人,投票率為69%(前3次選舉投票率均約66%,總統選舉會提高),按人口普查資料平均分為:高、中、低3層,則下表中的數字正好等於百分比。
若母群、即真實結果如左欄,甲候選人實以36:33,勝乙候選人。
坊間民調由於視覺上,發現低齡層受訪者偏少,於是主觀認為要把年輕人加權如右欄,變成甲候選人反以31.17:37.83,落後乙候選人。
以上是以全體選舉人為分母的標準化百分比。
一般民調與新聞是以投票人為分母,則:
甲候選人事實勝選3%以上,但坊間民調反以45.17:54.83,大幅落後乙候選人近10%。
未達科學標準的坊間民調誤差 + 手機民調誤差 + 加權誤差,其互動誤差有可能超過10%、甚至20%。
科學民調耗時不易
科學民調就是要達成最低隨機性/等機率性的樣本,實務上就不能換樣本,調查一輪最少要4周以上。
美國有一本著名統計書上,第一句話就是:統計是天書。一般人、甚至不少教統計的人也不了解其所以然,又與當前1到3天就要結果的習慣不合,不容易推動。
53237選民結構:解釋歷年選舉
「53237選民結構」是臺灣近40年來的穩定投票結構,發現選民分作「主動」和「被動」投票 2類,
假設總共 20人,每類10人,則:
一、主動投票類10人分作:
5(25%)維持現勢群:意識型態+現勢利益。
3(15%)反現勢群:意識型態+反現勢利益。
2(10%)可變群:根據自己感受的候選人形象。
二、被動投票類10人分作:
3(15%)搖擺群:投社會形象人多的一邊。
7(35%)疏離群:不投票。但其中有最多15%的輕疏離群,如果發生危己/危機事件,有可能去投票。
以上充分解釋過去連3屆選舉,投票率均約66%,而史上僅有2次投票到達80的原因。