樣本分散性其實有測試機制,但現在要到各民調公司做現場測試,根本來不及。所以本項必須採用「較佳決策」,即知道有此議題,但略過不論。
故「納入哪些民調公司」應是藍白雙方必須優先合議、是唯一宜以政治解決的問題,也是民調專家不必介入的問題。
「3腳督」「4腳督」都應納入
納入民調公司哪些報告?
少數樣本可以推論全體的第二大前提是:達到最適樣本數。
如果是隨機/等機率樣本,200個以上,開始產生推論意義;1500個以上,推論開始穩定;3000個以上,推論效益開始降低。
如果是不隨機/等機率樣本,則除了嚴重偏差樣本外,可盡量大。
所以,各民調公司的「3腳督」「4腳督」都應納入分析。
而各民調公司的網路調查,與純手機調查,均不應納入分析。
網路調查就是傳統函件調查的虛擬化,國內外均有大量研究文獻,證明這種調查嚴重缺乏隨機/等機率性,具備主動偏頗性,適合市場行銷,不宜作為推論與決策性使用。
「手機調查」當前有個迷思,因為NCC 的年度報告,指出手機使用率已超越市話。這個現象可支持要重視運用手機,但不可誤解為要使用純手機調查。
因為決定抽樣正確性的是「母群清冊完整性」,與「使用率」並無關係。前者可大略理解為「可接觸率」,市話仍優於手機,在這情況下如何相輔相成,需要另文解說。
幸而,當前網路上廣為流傳一份數據,即2022 選舉,以混合清冊、或純市話的調查,其報告數字或超過宣稱誤差,但當選人不變;而相同的調查公司,若採用純手機調查,連當選人都弄錯相反了!這是個不需要詳細解說的實務例證。
「統合分析」之資料標準化
如何標準化資料?哪些資料必須標準化?實務上可標準化?
●取得各民調公司的真實資料,而非加權後資料。
●標準化為二項分配形式
●比較標準化百分比
●「誤差」分析的素質改善
當前坊間民調幾乎全部是加權後數字,而非調查真實數字。
因為採用類RDD 的隨機尾數、又不斷更換樣本,會造成樣本的人口資料,和母群產生很大差距。
所以,這些民調公司再用《性別、戶籍、年齡》加權,只有美化數字效果,不能增加推論性,反而有擴大誤差之虞。
加權法美化數字 擴大誤差
「加權法」必須是加權項目,為應變項的因果/關聯自變項。譬如,要預測燒開水所需時間,若我們各式水壺與瓦斯桶樣本不足,但根據已有樣本的「水壺容量」、「耗瓦斯量」加權,則可經加權,正確預測各種燒開水時間。
但如果我們以「水壺廠牌」、「瓦斯桶顏色」加權,則毫無作用,可能反而擴大誤差。
國內外大量選舉研究均指出《性別、戶籍、年齡》和選民的投票傾向並無因果關係,或許特定候選人和某人口變項會有個案的關聯性,但人口變項不是對選舉有預測力的變項。