民調專家開講/民調結果到選舉預測的距離?

聯合新聞網 文/中正大學政治系教授莊文忠
民進黨總統候選人賴清德(左起)、國民黨總統候選人侯友宜、民眾黨總統候選人柯文哲2...

每逢競爭激烈的選舉,民眾除了茶餘飯後聊聊選戰花絮外,「這次選舉,誰會當選?」應該是所有關心選舉的人最想知道的,且越到選戰後期,媒體不管有意或無意,在報導民調結果時可能會暗示:以當前的民調數據來看,某候選人的當選機會最大,宛如在對選舉結果進行預測。至於社會大眾又是如何預測選舉結果呢?有人憑個人的主觀臆測、有人從候選人或政黨的造勢活動來推測,當然,也有不少人會參考媒體公布的民調數據來推估。由於前二者並無客觀的判準,他們是如何判斷和預測選舉的結果,不在本文的討論範圍之內。

本文想提出的一個基本問題是:媒體報導候選人的民調支持度是否就等於選舉預測嗎?如果是,那為何選舉前總是有些民調的候選人支持度和最後實際得票率之間差距很大?甚至出現民調中的領先者並不是最後的當選者?如果不是,那民調結果離選舉預測究竟還有多遠的距離?和民調有關的選舉預測數據究竟是怎麼來的?

坊間有些民調機構會利用最簡單的方法做選舉預測,即根據民調中詢問「候選人支持度」的題目,在扣除未表態(如拒答、未決定、都支持等)的受訪者後,重新計算各個候選人的支持度,以此一數據當作選舉預測的結果。這種方法用來判斷誰會當選,或許有參考性,但若要預測各候選人的得票率,可能就過於粗糙了。因為除了已表態的受訪者可能因各種原因沒去投票外,未表態的受訪者也有可能會去投票,而他們實際上會投給誰,就有可能影響候選人的得票率。

事實上,選舉預測的方法非常多元,在問卷設計上除了候選人支持度外,要納入更多相關的題目輔助判斷,例如政黨認同、施政滿意度、統獨立場、族群或省籍背景、候選人評價等等。在完成民調後,有些專家是直接利用民調資料進行分析,有些專家會使用過去的投票資料進行研判,也有些專家是同時結合民調資料和投票資料進行分析,至於預測的方法與技術則是屬於個人的獨門秘技,從簡單的百分比分配到複雜的統計預測模型都有,這已超出本文的討論範圍,有興趣的讀者可以閱讀洪永泰教授在2014年所撰寫的《誰會勝選?誰能凍蒜?》一書,對此一主題會有更深入的瞭解。本文主要介紹幾種利用選舉民調中常見的選舉預測方法,讓讀者一窺民調結果和選舉預測的差異在哪裡?距離有多遠?

選舉預測有兩個層次,一個是預測誰當選?這是相對較為容易的事情,只要候選人的民調支持度差異大,要判斷誰會當選相對較為簡單;另一個是預測候選人的得票率,這是真功夫的展現,尤其是當候選人的支持度很接近時,得票率的預估就會變得很困難。在後文介紹選舉預測方法前先說一個小故事,國內某大學政治系曾在2014年臺北市選舉時辦理一項選舉預測活動,邀請國內三位知名的民調專家,在投票日前十天,各自利用獨門絕技預測各個市長候選人的得票率,並將預測結果密封後交給主辦方保管,在選後公開拆封預測結果,讀者猜猜看誰的最準?透露一個小線索,薑是老的辣,這位民調祖師爺等級的專家,預測誤差非常小,與實際得票率的差距只有1%左右,有興趣的讀者可以自行在網路上搜尋相關資訊。

討論選舉預測的一個基本觀念是,分析者除了判斷選民會不會去投票外,最關鍵的是,未表態的選民最有可能支持哪一個候選人,唯有精準判斷才能正確推估候選人的得票率。因此,在不考慮民調抽樣的母體涵蓋率前提下,若民調中未表態的受訪者比例不會太高,或是候選人的支持度差距大,無論有沒有做選舉預測,或是用什麼預測方法,對選舉結果的判斷應該不會有太大落差,因為未表態的受訪者中可能各候選人的支持者都有,研判各個候選人可以分到的選票比例差異不大,除非某一候選人的支持者都隱藏在未表態的受訪者中。

另外,選戰中可能會出現一些影響選舉民調預測結果的變數,其中之一是最後有沒有發生棄保效應,因為有些選民可能為了防止不喜歡的候選人當選,集中選票支持民調中排名第二的候選人,在投票時改變支持對象,這是在民調執行時所難以掌握的;另一個民調執行時另一個無法掌握的因素就是選戰最後時刻發生重大事件,例如兩顆子彈槍擊事件、周子瑜拿國旗事件等,這一些都會影響選舉預測的準確度。

利用選舉民調進行選舉預測,從簡單的人工計算到複雜的統計模型都有,但主要的做法是以民調中已表態之受訪者的候選人支持度為基本盤或參考值,再進一步針對民調中尚未表態支持對象的受訪者,利用相關資訊進行研判和推估,據以預測候選人的得票率。由於民調中表示會投票的比例可能高達八至九成,而實際的投票率可能在七成上下,預測時要不要先排除民調中表示不會投票的受訪者,就看每個人的做法而定,至於民調中關於未表態者的研判與推估方法,主要可分為三大類型,簡要介紹如下。

第一種方法是相對簡單的做法,分析者篩選出民調中所有未表態支持特定候選人的受訪者,然後根據他們在民調中其他問題的看法,來判斷他們最有可能的支持對象,例如先根據最直接相關的政黨認同題目,若有未表態者在這個題目上回答支持民進黨,那他便是最有可能支持賴蕭配,這些受訪者就判給賴蕭配;依此原則,回答支持國民黨者分給侯趙配、回答支持民眾黨者分給柯吳配;剩下仍未明確支持特定政黨的受訪者,再依他們在另一題目的立場,例如對候選人的評價,依前述邏輯分給不同的候選人;若還剩下不少對各個候選人的評價不相上下或沒有明確偏好的受訪者,再依他們在第三、第四、……等相關題目的答案判給不同的候選人,最後將各候選人的支持人數加總除總數,即是預測結果。

第二種方法同樣是利用民調中的資訊,根據已表態支持特定候選人之受訪者的主要特徵,例如政黨認同、候選人評價、統獨立場、性別、年齡、地區等,來研判未表態的受訪者中,具相同特徵的人投給某一候選人的機率,因要同時考慮很多變數,所以必須使用統計軟體來建立預測模型,再根據未表態者投給某一候選人的機率高低分別判給不同的候選人,最後將各候選人的支持人數加總除總數,即是預測結果。這個方法是綜合各個相關且重要的變數,比第一種方法逐一處理各個變數,在做法上較為嚴謹一些。

第三種方法除了使用民調的資訊外,同時還加入由中選會所公布的各個縣市或鄉鎮市區的投票資料輔助判斷。換句話說,選舉民調中通常會詢問受訪者的戶籍地,例如鄉鎮市區或村里,分析者可以整理民調中未表態支持候選人的受訪者,根據其所回答的戶籍地,查找該地區過去各政黨的得票率,再依比例判給各個候選人,最後將各候選人的支持人數加總除總數,即是預測結果。但因民調的樣本數通常只有1,068個左右,每一個地區未表態的人數可能很少,細膩一點的做法是,先將鄉鎮市區或村里劃分為反映不同政黨實力的政治版圖(筆者將另外撰文介紹政治版圖的概念),再依各個版圖內的政黨實力比例分配未表態的受訪者比例給受訪者。

不過,這個做法只是估計未表態的受訪者中,大約有多少比例會支持某一候選人,而不是判斷每一個受訪者最有可能的支持對象;此外,讀者可能也注意到了,此一方法的另一個缺點是,新興政黨因沒有過去的得票紀錄,例如這次總統大選中的民眾黨,故只能依據分析者的實務經驗或候選人的政黨屬性,分配各個政治版圖內未表態者的比例。

順帶一提的是,除了利用電話民調的資料進行選舉預測外,前此文章提及的出口調查(exit poll)也是選舉預測的途徑之一,臺灣的選舉中也有執行此種調查的經驗。這個方法好處是,調查對象都是真正有參與投票的人,理論上就是投票母體,所以,如果抽樣設計得好且受訪者真實填答的比例高,那麼,調查結果應該會是最接近最後的投票結果,國外的眾多調查案例也顯示,其準確性非常高。不過,因為這種調查的成本非常高,且在我國修改《公職人員選舉罷免法》後,執行出口民調的困難度也提高不少,甚至不被政治人物所接受,再加上民眾因個人隱私意識提高,接受訪問和表態的意願也下降,其準確性會受到影響,所以,這些年的選舉幾乎看不到出口民調了。

在介紹完民調中三種常見的選舉預測方法後,其實不管是用何種方法,哪一個預測較為準確,都是要到選後才能見真章。不過,相信讀者日後在看到媒體報導的候選人民調支持度時,應該就不會直接將它等同於選舉預測結果了,因為兩者之間還是有一段距離,而這個距離的遠近,除了取決於民調機構的調查設計與執行的品質、民調中已表態者的候選人支持度差距外,也取決未表態支持對象的受訪者比例,若未表態者的比例越高,選舉預測就越是關鍵,而預測之巧妙,就看各個民調專家的經驗和功力了。最後,也藉此拜託媒體記者日後在報導民調結果時,不要再刻意將候選人的民調支持度直接當成選舉預測,或許有機會也可以邀請各家民調機構,在投票日前來一場選舉預測武林大會,讓眾多好手各顯神通。

中正大學政治系教授莊文忠。聯合報資料照片

作者簡介

中正大學政治系教授

學歷:政治大學公共行政學博士

研究專長:公共政策分析、研究方法、政府績效管理、民意調查、非營利組織研究



2024選舉 2024總統選舉 民調

延伸閱讀

留言