吳統雄觀點:藍白協商之民調評估 「統合分析」可獲得較佳結果

2023-11-17 06:50

? 人氣

樣本分散性其實有測試機制,但現在要到各民調公司做現場測試,根本來不及。所以本項必須採用「較佳決策」,即知道有此議題,但略過不論。

[啟動LINE推播] 每日重大新聞通知

故「納入哪些民調公司」應是藍白雙方必須優先合議、是唯一宜以政治解決的問題,也是民調專家不必介入的問題。

「3腳督」「4腳督」都應納入

納入民調公司哪些報告?

少數樣本可以推論全體的第二大前提是:達到最適樣本數。

如果是隨機/等機率樣本,200個以上,開始產生推論意義;1500個以上,推論開始穩定;3000個以上,推論效益開始降低。

如果是不隨機/等機率樣本,則除了嚴重偏差樣本外,可盡量大。

所以,各民調公司的「3腳督」「4腳督」都應納入分析。

而各民調公司的網路調查,與純手機調查,均不應納入分析。

網路調查就是傳統函件調查的虛擬化,國內外均有大量研究文獻,證明這種調查嚴重缺乏隨機/等機率性,具備主動偏頗性,適合市場行銷,不宜作為推論與決策性使用。

「手機調查」當前有個迷思,因為NCC 的年度報告,指出手機使用率已超越市話。這個現象可支持要重視運用手機,但不可誤解為要使用純手機調查。

因為決定抽樣正確性的是「母群清冊完整性」,與「使用率」並無關係。前者可大略理解為「可接觸率」,市話仍優於手機,在這情況下如何相輔相成,需要另文解說。

幸而,當前網路上廣為流傳一份數據,即2022 選舉,以混合清冊、或純市話的調查,其報告數字或超過宣稱誤差,但當選人不變;而相同的調查公司,若採用純手機調查,連當選人都弄錯相反了!這是個不需要詳細解說的實務例證。

「統合分析」之資料標準化

如何標準化資料?哪些資料必須標準化?實務上可標準化?

●取得各民調公司的真實資料,而非加權後資料。

●標準化為二項分配形式

●比較標準化百分比

●「誤差」分析的素質改善

當前坊間民調幾乎全部是加權後數字,而非調查真實數字。

因為採用類RDD 的隨機尾數、又不斷更換樣本,會造成樣本的人口資料,和母群產生很大差距。

所以,這些民調公司再用《性別、戶籍、年齡》加權,只有美化數字效果,不能增加推論性,反而有擴大誤差之虞。

加權法美化數字 擴大誤差

「加權法」必須是加權項目,為應變項的因果/關聯自變項。譬如,要預測燒開水所需時間,若我們各式水壺與瓦斯桶樣本不足,但根據已有樣本的「水壺容量」、「耗瓦斯量」加權,則可經加權,正確預測各種燒開水時間。

但如果我們以「水壺廠牌」、「瓦斯桶顏色」加權,則毫無作用,可能反而擴大誤差。

國內外大量選舉研究均指出《性別、戶籍、年齡》和選民的投票傾向並無因果關係,或許特定候選人和某人口變項會有個案的關聯性,但人口變項不是對選舉有預測力的變項。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章