吳統雄觀點:藍白協商之民調評估 「統合分析」可獲得較佳結果

2023-11-17 06:50

? 人氣

「隨機」不是「隨便」而是「不能隨便」

以上「完訪人數、信賴水準、抽樣誤差」之間的關係,必須在符合「隨機樣本」的前提下才能實現。

[啟動LINE推播] 每日重大新聞通知

「隨機性」一詞常被誤為「隨便」,其實為「等機率性」,有極嚴謹的條件,完全「不能隨便」!

若要符合「隨機性/等機率性」,則被抽出之樣本後,不可改變其機率,亦即抽出樣本後,必須「若且唯若」訪問到全部樣本、沒有更換,相關推論才能成立。

如何獲得「隨機/等機率性」樣本?就是必須要有「完整母群(或稱母體)清冊」,即所有受訪者都在同一個清冊上出現1次,這樣抽出的每個樣本的才有「等機率性」。

各民調所稱「以年滿20歲設籍在台北市的民眾為母體」,而這種母體的實體清冊根本不存在。許多坊間民調公司,以電話簿充當母群清冊,但大家都知道,當前電話簿不登記率太高,並不具隨機性/等機率性。

在符合科學條件的調查可以RDD (Random Digit. Dialing)等方法,實現虛擬母群清冊,以追求解決沒有實體母群清冊的問題。

我所知道的坊間民調公司,沒人真正做RDD,而是將收集到的「市話」和「手機」號碼資料庫中抽出號碼,再做隨機尾數,通常是改變最後2碼為隨機號。

完整的RDD 必須要做「群碼分析」即市話前6碼、手機前8碼與公告釋出的號碼是否配當?配當的程度為何?同時,必須做定時號碼資料庫更新。

不得改變樣本被抽中機率

採用類RDD 的隨機尾數,更不容易找到受訪者,當前實務上2~3天絕對訪問不到抽出的樣本,所以坊間各民調公司在開始時,就抽出11~20倍的樣本予以更換,實際隨機樣本只有5%~9%,故以上推算數字一定不正確。

如果有人被更換,被換者等於出現2次、其被抽中機率變成「原定等機率」的2倍;如果是第20次才更換到,其被抽出機率變成20倍。

所有採用玉瑪系統者,其報告之「抽樣誤差」不僅是錯的,對採用替代樣本,而形成的非隨機/非等機率樣本而言,根本是無意義的。

「統合分析」之選擇納入的資料

採用「統合分析」的首要程序,為選擇納入「統合分析」的資料。再分為:納入哪些民調公司、納入民調公司哪些報告。

納入哪些民調公司的原則有二:沒有故意做假、樣本具備分散性。

坊間無法到達樣本具備隨機/等機率性,但要至少具備分散性,亦即不得發生「整群」號碼都不在資料庫中的情形。

如果民調公司沒有持續增加新樣本、與定時檢查過濾既有樣本,甚或開始建立的來源樣本就有系統性偏差,如來自某個團體的會員樣本,則此資料庫就存在「樣本分散性」低的事實,即使不作假,也會自然產生偏差。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章