陳方隅/民意調查和統計學都是科學 不是政客操弄工具

我們想讓你知道…根據公布的資料,一共九份民調,侯柯至少是8:1或6:3。而柯文哲這邊則是堅持要把抽樣誤差縮減到1.5%(這樣結果會變成3:3?到底怎麼算的,實在很神奇)。當科學碰上政治的時候,可能政治考量才是首要。

▲▼馬英九基金會執行長蕭旭岑手持民調專家會議署名文件。(圖/台北市攝影記者聯誼會提供)

▲馬英九基金會執行長蕭旭岑手持民調專家會議署名文件。(圖/台北市攝影記者聯誼會提供)

● 陳方隅/東吳大學政治系助理教授

身為一位政治學的老師,而且是同時在教研究方法以及民意調查、也教過應用統計的老師,看著藍白爛戲真的是覺得又好氣又好笑。我希望我的學生們都可以在政治人物胡說八道的時候,至少分辨出來什麼事情是錯誤的。

以下提供一些很簡單的科普思考

1、全民調是一個好的初選方式嗎?

答:不是,台灣用全民調進行初選,是一個獨步全球的設計,應該是沒有任何一個國家有類似的制度。其實全民調比的是動員能力,要動員支持者顧電話,並不是比全民的支持度。

不過,因為民調有其限制,每一個環節都有調整與影響的空間,例如:樣本要多少,抽樣的時間,要不要戶中抽樣,市話和手機的比例,還有影響最大的:要怎麼加權,每一個設定都會影響到最後的結果,所以民調的結果本來就是僅供參考就好。

這是自然的結果,因為民調本來就是一個預估值,真正的值,只有上帝知道,我們只能用盡量最科學的方法去預估。不過,必須要強調一下,不管是抽樣誤差或者是估計的區間,都有一定的公式(隨信心水準的設定和樣本數而有所變動),並不是像自詡理性科學的政客一樣出來喊價的。沒有什麼昨天喊3%、今天又出來喊1.5%這種道理。

2、如果全民調不是好的初選方式,為什麼藍綠都很愛用?

答:事實上,初選方式的規則設定,本來就一向都是政治的決定。制度決定行為,規則決定結果,這是必然的。每一個比賽、協商,最重要的第一件事情永遠都是進行的規則。

所以,當一個黨內的大家都決定了用某一種方式來比賽,那麼,這種方式就會是最好的方式。只要能讓大家同意的方式就是最好。(這次藍白合的問題是,有人簽了約之後再反悔。這本身就是很有問題

►►►思想可以無限大--喜歡這篇文章? 歡迎加入「雲論粉絲團」看更多!

3、藍白合的民調問題出在哪裡?

答:承上題,其實從來就不是民調內容的問題,而是規則設定的問題。

前幾天馬英九、柯文哲、朱立倫、侯友宜四個人的密室會談,會後簽了一個協議。其實就註定了今天的結果
因為內容根本沒有設定好規則,雙方只有同意說要採計民調,並由民調專家來判斷輸贏。

但是,雙方並沒有講說要採計「幾份」民調,甚至沒有講說輸贏「多少」算是贏,只有講說在如果雙方在「誤差範圍」內則算侯友宜贏。現在重點來了,什麼叫做誤差範圍?

▲民眾黨總統參選人柯文哲出席藍白合民調說明會。(圖/記者林敬旻攝)

▲「藍白合」原定18日公布最後搭配結果,卻因民眾黨對民調認知的差異出現變化。民眾黨總統參選人柯文哲出席藍白合民調說明會。(圖/記者林敬旻攝)

4、關於誤差範圍,到底怎麼計算?

答:柯文哲先前自己拋出來講說要用民調決勝,誤差範圍3%以內都算侯贏,18日又出來喊說是不可能讓6%,要1.5%以上才算。問題是,誤差範圍從來不可能是3%,更不可能是1.5%

要先知道的是,只要有抽樣都會有誤差,但這個誤差(error)其實並不是不好的,而只是一個區間估計值。

統計的計算(中央極限定理)讓我們得知,當我們抽1068個樣本的時候,抽樣誤差大約是正負3%。也就是說,如果我們抽出發現柯的支持率是20%,意思是可能落在17%到23%之間,如果侯友宜是17%,那可能落在14%~20%之間。

有些人說,如果我們用最簡單的方式來想這個區間。柯至少要贏6%才能算是超過抽樣誤差,今天他們就是在吵這點,柯認為6%不合理,應該是3%,甚至,應該是1.5%。

不過,實際上的計算更複雜一點,並不是6%(當然更不是3%)。因為每一個候選人本身的支持度都是單一樣本,抽樣誤差是算自己的估計值。正負3%只適用在估計自己一個人的值。

那如果兩個人都在同一份民調上的話呢?那是要算「兩個估計值之間」有沒有顯著差異。

這邊要用的是無母數分析中的麥內瑪檢定(McNemar's test),麥內瑪檢定是採取「卡方檢定」(Chi-square test)來判別兩組測驗是否有顯著差異。我們要去計算 p_hat{柯侯配}=p_hat{侯柯配} 這樣的虛無假設有沒有辦法被拒絕。

再解釋一下,統計檢定要做的事情是,去檢驗我們抽出來的樣本分布,有沒有辦法「拒絕虛無假設」(即兩個樣本之間的值有沒有顯著差異),而並不是說誰一定贏過誰。

葉教授算好了給大家:用麥內瑪檢定模型在一個1068樣本數的民調中,要創造「p_hat{柯侯配} =/= p_hat{侯柯配}」(95%信心水準)的狀況,柯侯配至少要贏侯柯配5%,例如37%柯侯配支持率對比32%侯柯配支持率,這樣就會統計顯著。

再強調一次,不管是抽樣誤差或者是估計的區間,都有一定的公式(隨信心水準的設定和樣本數而有所變動),並不是像自詡理性科學的政客一樣出來喊價。

5、民調專家的評斷有沒有問題?

答:他們簽的協議內容是馬英九、國民黨、柯文哲各找一位民調專家來判讀。從新聞內容來看,不管是馬英九推薦的陳陸輝老師、國民黨推薦的莊伯仲老師,兩位專家的解讀都是根據科學的解讀。侯柯和柯侯兩組民調數字,用公式去算一下有沒有顯著差異,這是一翻兩瞪眼的事情

根據他們前幾天簽的協議,超過誤差範圍誰贏就算誰的,在誤差範圍內都算侯柯得分。

目前看起來根據他們公布的資料,一共九份民調,侯柯至少是8:1或6:3。而柯文哲這邊則是堅持要把抽樣誤差縮減到1.5%(這樣結果會變成3:3?到底怎麼算的,其實我也覺得很神奇)

反倒是柯文哲找的這位民調公司專家,講出一些讓人覺得問號的話。他講:「一個調查它是不是能夠涵蓋最多數的民眾,這是他們在做選舉研究或者是各式各樣調查的時候都會最優先想到」。

樣本數的多寡其實跟母體數的大小無關耶....並不是多抽樣就多正確。我只能善意解讀說,這位專家說的是「樣本清冊」有沒有涵蓋足夠多的人。但問題在於,現在市面上的民調公司或學術單位,應該是沒有哪一家的電話樣本清冊是不夠大的,我不知道他是要質疑什麼。

至於現在跑出來說抽樣誤差範圍是1.5%的,這種只能說就是純粹來鬧。

6、民調看起來不管柯侯或侯柯,都一定會贏民進黨嗎?

答:回到民調本身,現在民調拿了9份出來都是柯侯或侯柯贏,難道說只要藍白合就一定會贏嗎?當然不是的,因為到現在都還不確定候選人,我們無法確定民眾心裡的想法是什麼,只能用假設的。

再說,1+1也未必等於2,因為彼此的支持者都不一定會支持另一黨的人。這應該是很簡單的道理
對我來說,我只希望候選人趕快確定,所有正經事都沒有媒體版面,實在很煩。

7、讓我來quote一下好朋友王宏恩老師說的:「各位政治學的學弟學妹們,現在你們知道為何政治系方法論的課必修統計、抽樣、跟假設檢定了吧?你當年放棄的那幾頁,可能幾年後就決定了國運……」

統計其實不是數學,很多時候是在學習處理資料和處理數字的方式,這比較關乎邏輯。不過,當科學碰上政治的時候,可能政治考量才是首要。比較麻煩的是有些不讀書的政客整天發明新的科學觀念誤導大眾,這就會有點麻煩了。

至於統計與民調之外的事情,關於憲政體制的那些胡說八道,又或是各種關於聯合政府的奇怪想像(或者副總統「監督」總統這種說法),那更是需要好好地來討論以及導正現在的各種莫名其妙說法。

● 本文獲授權,轉載自「陳方隅」臉書。以上言論不代表本網立場。歡迎投書《雲論》讓優質好文被更多人看見,請寄editor88@ettoday.net或點此投稿,本網保有文字刪修權。

陳方隅專欄

陳方隅專欄 陳方隅

密西根州大政治學博士。目前擔任「菜市場政治學」以及「美國台灣觀測站」的共同編輯。

分享給朋友:

讀者迴響

關注我們

回到最上面