▲ 藍白合不合的爭議,讓3%或6%引發雙方口水戰。(圖/記者許靖騏攝)
● 蘇建州/世新大學傳播管理系特聘教授
藍白合? 或不合?這是「統計學」x「政治學」問題!只是「三腳督」選戰已鳴槍,「政治學」部分就翻頁,對比民調(兩題目)的「統計學」難題也跳過,選擇討論在選舉棄保戰場關心的「統計學」:「三腳督(單一題目)民調中兩候選人支持度差距的抽樣誤差」怎麼算才合「統計學」的理?當初藍白合破局元凶就是卡在雙方民調統計專家對「抽樣誤差」的計算與判讀沒共識,未來藍白支持者棄保判斷「侯康配」和「柯盈配」民調差距是否在統計「抽樣誤差」範圍內的標準可以有共識嗎?3趴?6趴?還是另有其趴?
筆者是「統計學」的粉絲,也曾經著迷於「民調」。曾經積極地參與和關注調查程序穩健性、非抽樣誤差(或稱系統偏誤)相關研究,雖然脫離「調查方法論(survey methodology)」學術圈甚久,但仍蹭此「全民瘋狂補修統計學」風潮,透過惱人的統計學公式和符號在熱鬧之餘,介紹一些基礎統計學的門道。
隨2024年總統大選日益接近,面對滿天飛舞的各家民調,大家除關心三組候選人個別民調支持度變化外,候選人支持度差距的「抽樣誤差(Margin of Error, MOE)」也會是民調的觀盤、解盤重點。為何MOE如此關鍵? 以統計學術語來說,MOE是最終用來判斷檢定假設(testing hypothesis,這裡的命題是「兩候選組合支持度有差距」)是否成立的門檻值(critical value)。
首先,可能是大家最為熟悉、也是最常在統計學教科書上看到的「抽樣誤差」公式:
這是針對特定候選組合支持度的抽樣誤差,即指在95%信心水準下支持度的信賴區間估計。當樣本數n= 1068、支持度p=0.5時,可計算出「抽樣誤差」確實是大家所熟悉的3%,其中p=0.5是依據最保守的MOE推估,亦即實際的MOE可能會再更小一些。
如果是「兩組候選人支持度差距」的抽樣誤差? 筆者認為以多項分佈(multinomial distribution)和抽樣分配來定義此問題更為適當,其中「抽樣誤差」公式為:
如果是兩組候選人選戰,而且民調未表態比例甚低,在樣本數n= 1068、兩組支持度相同p1=p2=0.5時,可計算出「抽樣誤差」確實是大家熟悉的6%,其中p1=p2=0.5是依據最保守的MOE推估。
回到2024年總統大選有三組候選人的案例,綜觀近日媒體發布的民調都不是選舉預測,其中未表態約約1~3成,另「賴蕭配」約3~4成。因此,藍+白的民調支持度約佔5-6成(p1+p2≠1),「兩組候選人支持度差距」的抽樣誤差需再精算。依據是藍白兩組候選人平均支持度為0.3(p1=p2=0.3,是最保守的MOE推估),帶入公式後可計算出「抽樣誤差」為4.6%。亦即只要侯康配和柯盈配雙方支持度差距大於4.6%,即可聲稱雙方的差距已達統計顯著性。話雖如此,除了錙銖計較幾趴的抽樣誤差計算外,民調程序中潛藏太多嚴重、難控的系統性「非抽樣誤差」是動輒十幾趴,也因此仍建議在解讀這些民調數字時還是應附加警語提醒:保守為宜、審慎為上!
►►►思想可以無限大--喜歡這篇文章? 歡迎加入「雲論粉絲團」看更多!
● 以上言論不代表本網立場,歡迎投書《雲論》讓優質好文被更多人看見,請寄editor88@ettoday.net,本網保有文字刪修權。
我們想讓你知道…藍白合? 或不合?這是「統計學」x「政治學」問題!只是「三腳督」選戰已鳴槍,「政治學」部分就翻頁,對比民調(兩題目)的「統計學」難題也跳過,選擇討論在選舉棄保戰場關心的「統計學」:「三腳督(單一題目)民調中兩候選人支持度差距的抽樣誤差」怎麼算才合「統計學」的理?