陳方隅/民調到底準不準? 科學歸科學 政治歸政治

我們想讓你知道…民調只要依照科學方法來做一定都是準的,問題是我們不一定知道每一個民調的背後是怎麼抽樣、怎麼加權。

▲ 民意調查的關鍵在於「抽樣」,就是從我們要推估的研究對象當中「抽」出一些人來詢問他們的態度,用這一群「樣本」來推估全部的人。(圖/ETtoday資料照)

● 陳方隅/菜市場政治學共同編輯、東吳大學政治系助理教授

民意調查是用科學的工具來評估真實的民意分布狀況。由於我們不可能每個人發給一組互動按鈕,然後問每個人的某個政治態度、請每一個人都按鈕表態,因此民意調查的關鍵在於「抽樣」,就是從我們要推估的母體(研究對象)當中「抽」出一些人來詢問他們的態度,用這一群「樣本」來推估全部的人。那麼,到底有關選舉的民調準不準?我們可以從事後的選舉結果來做推估,然後再回去修正抽樣的方法、執行的方法。然而這次大選最有趣的現象是,所有政治學者、民調專家都是拿著人民投票結果檢討自己的民調,就只有一個陣營是拿著自己民調檢討人民的投票結果。

發布錯誤民調又信以為真

選舉過後,柯文哲陣營開始質疑票數不對,有人說明明「內參民調」都已經追上侯友宜,甚至直逼賴清德,怎麼可能最後投出來還輸兩百萬票,因此有人質疑選舉作票(註:內參民調是指政黨自己做的民調,通常沒有公布出來,但只有柯文哲黨不斷在公布自己的內參民調)。這個套路跟世界上許多「輸不起」的候選人很像,選前就在講說民調結果顯示一定贏,如果輸了就說別人作弊。例如四年前美國總統大選的時候,川普甚至還鼓動支持者衝進國會阻止「選舉人」投票,最後釀成死傷悲劇。台灣在威權時期的中國國民黨統治底下,確實曾經出現很多的作票事件,然而現在我們的選舉制度已經被全世界認可為最公平公正的國家之一,外媒每次都會大幅報導我們的開票過程有多麼公正透明。而柯文哲這樣子攻擊投票程序就是對整個民主制度正當性的攻擊,這不只是非常糟糕的「輸不起」態度,更可能會動搖人們對民主的信心。

▲ 2021年1月6日,川普支持者質疑選舉不公,聚集國會大廈,引發暴動。(圖/路透社)

事實上,民調是科學的調查工具,只要按照一定的程序來做,它就會有很高的準確度。然而的確需要注意的是,市面上的民調,很多時候會變成民調(ㄊㄧㄠˊ),因為發布民調數字很可能會影響人們的投票意願(各方陣營都需要說服支持者說自己有可能會贏),因此有一些政客或者是媒體都會選擇講一些對自己有利的來發布,甚至不惜以誤導的方式來講一些數字。我們之所以有「選舉十天前不能發布民調」的規定,就是為了避免有人亂用民調來影響大家的投票意願,因為我們無法確認每一個民調數字的真實性、科學性。

而這次柯文哲陣營的狀況比以往還要更特別,他們在選前不斷發布對自己有利的民調數字,還聲稱市面上的民調都不準、媒體都是被操控,只有自己黨內做的內參民調最準,而這些柯文哲黨拿出來的數字都與實際狀況差很多的狀況下,全黨似乎都還信以為真,這就會出現不小的問題。

大部份的民調都可稱得上「準」

事實上,這次的大選當中,大多數民調數據都還算是滿一致的,尤其是在三組候選人的排序方面,大致上都是很穩定的賴、侯、柯排列,而且在賴清德方面的數字算是很穩定維持平盤,柯文哲支持度的起伏比較大一些。因此我們可以說,大部份的民調都有反映出這樣的趨勢。不過,在我們評價民調「到底準不準」的時候,還需要注意幾件事情。

▲ 選前多數民調數據都還算是滿一致的,尤其是在三組候選人的排序方面,大致上都是很穩定的賴、侯、柯排列。(圖/翻攝自《美麗島電子報》)

►►►思想可以無限大--喜歡這篇文章? 歡迎加入「雲論粉絲團」看更多!

首先,與其說要檢驗最後的數字到底準不準,不如說是在考驗抽樣和推估的程序到底哪樣比較可以貼近真實。畢竟,我們有十天的時間是不能發布民調的,拿著最後封關的民調數字來對比結果可能也不盡正確,中間會有十天的間隔,數字可能會有改變。

而在這個過程當中,影響最大的莫過於「抽樣」和「加權」。每家民調的抽樣方法和加權方法都不一樣,而這些都會影響到最後的結果。例如以市話為主的民調,或者市話併手機的民調,又或者是在加入網路調查資料庫抽樣下的民調,數據都會有所不同,因為調查可以觸及的群體並不完全一樣。而在加權方式方面更是各家的「獨門祕方」,特別是,每次抽樣都會有些群體的樣本數抽不夠(尤其年輕樣本數會偏少),因此要透過特定的公式來調整各群體的比例。

這些不同的抽樣或加權方式沒有絕對的好或壞,端看研究者怎麼設定,以及如何依照過往經驗來做調整。我們現在大致知道的是,「市話民調」在選舉預測方面還是相對較準確的,從洪永泰老師的研究論文,以及「美麗島民調」的結果來看大致上可以得到這樣的結論。

▲ 「市話民調」在選舉預測方面還是相對較準確的。(圖/周刊王)

新興的研究方法

不過,除了市話民調之外,還有很多其他的綜合評估方式,去補足市話民調無法觸及到的部份群眾不足。例如現在有不少媒體使用「自建資料庫」或者「網路資料庫」的方式來做調查,像是ETtoday民調雲的自建會員資料庫,做調查時從裡面做分層比例抽樣(戶籍地、性別、年齡)。只要這個資料庫的會員分布足夠多元、會員數目足夠多、然後抽樣的方式確實是有分層,就可以有機會抽出「貼近於母體分布」的樣本出來做估計。ETtoday是以簡訊通知資料庫中被抽中的民眾填寫問卷,而一些網路調查則是以email的方式來通知資料庫當中被抽中的受訪者,這樣的方式原理是一樣的。網路民調方面應用最多的是張佑宗老師的民調,那就是以建立資料庫然後抽樣的方式來做處理;學術型的網路調查資料庫最有名的是政大選研中心的PollcracyLab,不過他們並沒有做選舉民調的業務。

從結果來看,ETtoday封關民調賴蕭38.9%、侯康35.8%、柯盈22.4%,與大方向是相符的。我們可以預期,建立資料庫並從中抽樣的方式可能更加流行,因為一旦資料庫建立之後,之後要再抽樣的成本將會下降許多。不過再次強調,這類民調的準確性是來自於資料庫本身必須要具備足夠多元的受試者,再從中進行抽樣。

 

▲ ETtoday封關民調顯示總統候選人支持度分別為賴蕭38.9%、侯康35.8%、柯盈22.4%,與最終選舉結果相近。(圖/ETtoday民調雲)

至於在手機民調方面,現在有很多民調都會以市話併手機的方式來做處理,不過問題可能是在於,手機民調比較難掌握到每一個門號到底是在哪個位置、代表的是哪個群體,這也是為什麼美麗島的「全市話」民調整體來看仍然是比加入手機樣本之後還要準。從非常初步的觀察看起來,這次大選當中,手機民調似乎會低估賴清德的得票率,但若以最後結果來看,好像也沒有高估柯文哲。到底市話與手機的比例該怎麼設定,這應該還有待民調專家的討論;每次有政黨要用全民調初選的時候,這個比例總是會被拿出來討論很久,但其實不過就是政治上的喊價而已,大家都想要採用對自己比較用利的結果,不見得是要追求民調的真實性。不過,像柯文哲出來喊說「手機民調都是我贏,我們應該要推行手機投票」,這就是完全令人無法理解的神奇邏輯了。

別拿民調數字來當投票「主要」參考依據

這次台灣的大選有個非常有趣的現象,就是過程中人們不斷地討論民調,主因是有人一直不斷「發明」新的民調觀念,那個人就是柯文哲。從藍白合期間在討論的抽樣誤差(請參考菜市場政治學文章),柯文哲就發明了讓6%還是3%才算贏的信賴區間新解,而在選後柯文哲更是開始講說自己陣營做的民調最準,投票出來結果自己輸了兩百萬票,肯定有問題,要不是民進黨作票、要不就是因為太少年輕人出來投票才會輸。這些說法都毫無根據且邏輯不通。

▲ 柯文哲在本次選戰中,不斷「發明」新的民調觀念。(圖/記者林敬旻攝)

這邊要提醒政治人物們,科學的精神很重要,尊重專業也很重要。在選舉當中,民調可以幫助一般民眾知道大致的民意分布,也可以讓選舉操盤的幕僚知道該怎麼樣去調整策略。正如同我們在制定政策的時候需要用科學的方法來評估,在打選戰的時候,若要知道當下的支持度高低以及選民的看法,也同樣是用科學的方法來做調查(包括質化與量化的部份)。如果依照「常識」來做決策那會是很危險的。

而對一般大眾來說我們最需要知道的是,民調只要依照科學方法來做一定都是準的,問題是我們不一定知道每一個民調的背後是怎麼抽樣、怎麼加權(這邊我們甚至還沒有討論到「機構效應」或者是問卷題目措詞等問題)。影響民調數字高低的因素有不少,除了候選人本人真實的支持度之外,還有很多技術因素需要考慮,所以看到任何民調數字只需要參考就好,最好不要拿來當成投票的「主要」參考依據。

● 本文獲授權,轉載自陳方隅臉書。以上言論不代表本網立場。歡迎投書《雲論》讓優質好文被更多人看見,請寄editor88@ettoday.net或點此投稿,本網保有文字刪修權。

 
陳方隅專欄

陳方隅專欄 陳方隅

密西根州大政治學博士。目前擔任「菜市場政治學」以及「美國台灣觀測站」的共同編輯。

分享給朋友:

讀者迴響

關注我們

回到最上面