美国大选民调还有多少可信度?
2020-11-12蔡婷贻
蔡婷贻
2020年9月29日,美国总统特朗普(右)与美国民主党总统候选人拜登展开了2020年美国总统候选人首场电视辩论。图/法新
9月18日,标志性男女平权捍卫者,美国最高法院大法官金斯伯格因癌症过世。由于大法官席次由总统提名,她留下的大法官席位随即变成牵动总统大选的新变数。
9月26日,总统特朗普在争议中提名受保守派青睐的艾米·科尼·巴雷特出任美国最高法院大法官。出于对美国最高法院被保守派控制的担忧,民主党支持者可能会更踊跃参与此次总统大选投票,这正是民主党希望看到的一幕。
美国总统大选进入最后40天的短兵相接,部分州已经开始允许选民提前投票,同时新冠肺炎疫情对美国各州的选情影响程度不同,加上不断出现的新变因,所有参与和观察选举的专家提早达成的结论不是谁可能赢得选举,而是这次选举将打破1948年以来所有的常规选举,原本的民调预测模型最后都可能出现严重偏差。
自8月底至今,20多个全国性民调陆续出炉,一路落后的特朗普在部分民调出现追赶上对手拜登的趋势。选举网站“真正清晰政治”(realclearpolitics.com)将主要民调机构的数据进行了平均,结果显示拜登至8月22日为止在全国领先特朗普7.6个百分点,之前两位数的领先幅度已经被拉近;另一个组由CBS和YouGov在8月20日-22日期间所做的民调显示拜登领先幅度达10个百分点,9月2日-4日的民调也维持相同幅度,但是埃默森学院在8月底的民调则显示拜登的领先幅度仅有2个百分点。
由于2016年民调和选举结果相差甚远,自2020年选战开打以来,民调在多大程度上值得相信或参考一直备受争议。尽管民调专家试图找出并纠正上次选举民调出现的误差,但是密歇根大学定量方法专家特劳戈特(Michael Traugott)对《财经》记者指出,这些纠错是否有效只有等到选举结果揭晓才能得到印证。
民调专家普遍认为,2020年总统大选投票结果、候选人民调支持度和当选几率三者之间的关系堪称美国选举史上最为复杂的一次。从不同族群的投票率、年纪、宗教信仰、收入水平、关注的议题到就业情况、股市和国内经济等可能影响投票的因素,再到各州自行安排的邮寄投票、新冠肺炎疫情不断变化、各州对“黑人的命也是命”运动的反应不一等,试图建立一个能够直接透视到选举结果的民调模型可谓难上加难。
曾预测希拉里当选几率为98%的知名专家纳塔莉(Natalie Jackson)自2016年的大选后不断反思自己的错误。她指出,不确定性是影响民调和几率计算的最大变因。
提前预测出的结果也在很大程度上影响选民投票行为,例如2016年部分希拉里的支持者因为她选前的高当选几率而未投票可能促使她最终败选。根据选举专家的交叉比对,2012年支持奥巴马的选民中7%并未参与2016年的投票,这意味着400多万希拉里的潜在支持者在选举中缺席。
检讨各种原因,纳塔莉认为社会大众和选民接受各种不确定性是看待选举民調的重要态度,“以民调为基础的选举预测永远需要与不确定性做斗争”。
2016年的失误
2016年11月8日堪称美国选举史上少数出乎选民预期的一天。预测显示希拉里能以比特朗普多出3%的总选票获胜(最终结果多出了2%),但是随着主要摇摆州开出一张张支持共和党的选票,特朗普在一路当选几率严重落后的劣势下逆转取胜。自此,美国社会对总统大选民调和预测出现前所未有的质疑。
选举预测方法分成民调和数据分析。专家主要通过量化的民调数字加入经济和历史因素写成模型,进而计算出候选人的胜选几率。这意味着负责第一层工作的民调人员需要先推估可能投票的选民族群和他们的投票倾向,参考上一次选举参与投票的选民的各种特质,然后搭建出这次选举的可能选民模型。
进行取样调查之后,民调机构再结合不同因素推算可能结果。选前受到大量关注的预测网站“538”(fivethirtyeight.com)负责人纳特·席尔瓦(Nate Silver)指出,在美国,民调机构如果随机打电话并不会得到真正的随机结果,因为回答电话的女性会多于男性、年纪大的会多于年纪轻的、白人会多于非洲裔和拉丁裔。为了得到更真实的结果,调查机构会根据实际年龄、族群比例将调查结果倍数化。例如,如果非洲裔在调查样本中只有5%,但选区里的非洲选民实际为12%时,这些机构就会将非洲裔的调查结果乘以2.5倍。
另外,民众的教育程度越高,其愿意接受调查的比例就越高,但在当今美国,高教育程度的民众支持民主党的倾向已十分明显,因此民调机构通常也需要针对教育情况调整比例。“如果不从教育程度调整比例,整个结果最后会有太多民主党支持者的风险。”席尔瓦指出。这也是导致2016年过于放大希拉里胜选机会的部分原因。
在实际操作中,拨打电话的调查对象在党代会前后其实也有所区别。两党党代会之前的民调通常是针对已登记的选民,党代会后调查的对象通常会转为可能投票的选民,因此民调支持率会因为对象不同而出现明显改变,这也是为什么选前夏天的民调与选举结果经常大相径庭。
“候选人具体的支持度需要等到两党党代会结束后才会真的明朗……特朗普的选举人票(分布)也是如此。”特劳戈特告诉《财经》记者,“美国总体是民主党支持者较多,但是登记的支持共和党的选民数较多,可能参与投票的选民比例,共和党又更多。”
2016年2.5亿符合投票资格的选民中将近70%的选民登记参与投票,其中87%登记的选民最后实际投了票,最终投票率为63%。以种族区分,白人选民占1.77亿,登记投票率达70%,58%投给特朗普,37%支持希拉里;非洲裔选民仅有2800万,投票率59.6%,占总投票人数的12%,但支持希拉里的达88%,支持特朗普的只有8%。西班牙裔投票率更低,仅占总投票人数的11%,其中65%投给希拉里,29%支持特朗普。亚洲裔占投票人数仅4%,支持希拉里的仍占多数,达65%,支持特朗普的则为29%。其他少数族群的投票人数加起来只有3%,支持希拉里的比例也较高,达56%,相较之下特朗普只有37%。
考虑到白人选民参与投票的高比例,特朗普在“黑人的命也是命”运动中明显倾向于保守的白人至上主义。为了争取权利,非洲裔社区近来发动非洲裔选民确实参与投票,支持拜登。
以区域划分,特朗普在农村的支持度达62%,相较之下希拉里只有34%。主要城市郊区选民也倾向于支持特朗普,50%选民投给了他,45%投给希拉里;城市选民偏好希拉里,59%的选民将选票投给她,相较之下特朗普只拿到35%的选票。
以年纪区分,特朗普较受45岁以上选民欢迎,53%的中高年龄层选民投给他,而希拉里比较受年轻人欢迎,30岁-44岁选民当中的50%以及18岁-29岁选民当中的55%将票投给希拉里。
比对2016年的选举结果和选前民调,专家发现采样和假设出现些许误差,以至于接下来的推估出现失误。《纽约时报》民调专家指出,2016年的误差来自两大原因:一是最后一刻才做出决定的选民大量投给了特朗普,二是特朗普调动了不少民调专家原本认定不会出来投票的郊区选民,尤其是未取得大学学位的选民。从调查样本角度看,部分调查样本中教育程度较低的白人选民太少,加上一部分特朗普支持者不愿承认自己的投票倾向,导致调查结果出现失真。
在民调出现误差的情况下,以民调数据为基础的计算模型计算出的胜选几率也因此出现误差。
“538”是预测特朗普胜选几率最高的网站,达29%,但是该预测意味着希拉里胜选的几率仍然高达71%,选举结果无可避免地引起希拉里支持者对“538”网站的愤怒。不过,席尔瓦坚持该网站模型非常准确,2020年也几乎沿用上次的模型,只是加入新冠肺炎疫情可能带来的不确定性、邮寄投票和投票率等变量。
弗吉尼亚大学政治研究中心“萨巴托的水晶球”(Sabatos Crystal Ball)网站总编辑康迪克(Kyle Kondik)对《财经》记者指出,2016年的民调数字显示出白人选民投票倾向的改变。他解释称,受过大学教育的白人选民在过去偏向支持共和党,但这个群体已变得更支持民主党,而未接受大学教育的白人选民变得更加支持共和党。未能及时发现这一变化导致各家民调在2016年高估了受过大学教育的白人选民的比重,进而导致高估了民主党在主要摇摆州的表现。
“这些改变在特朗普之前就开始发生了,但是特朗普加速了这个趋势。”康迪克说。
主战场在摇摆州
让缺乏大学文凭的白人选民在选举中起到关键作用的另一个原因,是这些选民身处所谓的摇摆州,这些州的选民族群比例和投票倾向不如其他州稳定,如纽约州和加利福尼亚州是彻头彻尾的民主党州,犹他州和亚拉巴马州是彻底的共和党州,每次大选的变数就在于摇摆州。
2016年时,特朗普拿下以中西部为主的六个摇摆州——密歇根州、佛罗里达州、威斯康星州、俄亥俄州、艾奥瓦州和宾夕法尼亚州,尤其是代表了46张选举人票的密歇根州、威斯康星州和宾夕法尼亚州,他在这三个州多拿的普通选票分别只有0.2%、0.8%和0.7%,这些总数加起来约8万的选民最终决定了谁是美国总统。
特劳戈特对《财经》记者指出,2016年大选时,民调系统性的偏见导致高估了对希拉里的支持,低估了特朗普。当时预测网站和民调都预估希拉里能拿下这些州。
仔细分析特朗普的得票,在密歇根州他赢不到1万票,其中主要原因是该州总投票率下降,主要未投票的选民是非洲裔选民,但反过来原本投票率较低的郊区白人选民却踊跃投票,类似情形也出现在威斯康星州。
基于上次教训,两党阵营在2020年的选举中更专注于这几个摇摆州。根据“538”网站的分析,拜登目前在全国和主要的摇摆州,包括佛罗里达州、威斯康星州、密歇根州、宾夕法尼亚州、亚利桑那州和俄亥俄州的民调都处于领先,如果拜登能拿下这些区域且同时能拿下之前希拉里拿下的州,那他就能打败特朗普。另外,拜登在得克萨斯州、佐治亚州、艾奥瓦州和缅因州的第二区也只是稍微落后,如果他也能拿下这些地区,就能拿下412张选举人票。
不过,拜登的胜算在于这次民调数字能正确反映选举结果和明天马上投票,但是距离11月3日的投票日还有40多天,选战瞬息万变,特朗普更是不会放弃任何可能连任的机会。
特朗普的机会
尽管特朗普执政四年来争议不断,对新冠肺炎疫情的处理也让不少原本的支持者不满,但是对他的满意度几乎一直维持在40%上下。其中一大原因是他的支持者对他铁杆忠诚。
CBS电视台8月19日-21日的调查显示,75%的共和党支持者觉得美国比四年前更好,只有25%对此持否定态度;但是在全国范围内,只有35%的美国国民认为当下美国比四年前好,65%不认为如此。另外,82%的共和党支持者表示,特朗普的领导是他们觉得目前美国比2016年更好的原因;70%表示是美国国内经济;64%表示是家庭的经济情况。70%觉得现在更好的选民还表示,民主党在野是美国成功的主要原因。
尽管拜登一路领先,但在选举日之前,任何新闻事件和可能发生作用的选战策略都会左右选情,因此选民对候选人的忠诚度、独立选民的投票倾向和最后的投票率都是决定选举结果的关键。
由于这次选举受到疫情影响,选民考虑感染因素,最后会选择邮寄投票或不投票成为关键因素。选战专家普遍认为,投票率非常难预测,选民结构也难预测。目前为止的数据显示,低投票率有助于特朗普的当选机会,在高、低和平均投票率三种假设下,拜登在低投票率時领先幅度最小。
特朗普和共和党因此被认为有意压低投票率,其中主要做法就是阻止邮寄投票。特朗普自选战以来数度表示邮寄投票不可信,即使在疫情威胁下,他也未从抗疫的角度考虑推动邮寄投票,他接着在8月宣布将不会对美国邮政署下拨250亿美元的纾困预算。
2016年,41%申请提前投票的选民中,24%采取邮寄投票,17%提前投票的选民选择本人送达。今年因为新冠疫情,部分预测显示邮寄投票的比例可能高达60%。埃默森学院9月初的民调显示,特朗普的支持者偏好亲自投票,拜登的支持者偏好邮寄投票。但是由于邮局缺乏预算,各州政府因为应对疫情也面临选举经费短缺的问题,邮局最后如果不能处理今年大增的选票将可能形成出现严重争议的局面。
俄亥俄州立大学选举法专家修夫纳(Steven Huefner)对《财经》记者强调,总统完全没有权力左右各州如何举办选举,唯一可能影响的是邮寄投票的做法,毕竟邮局是联邦政府的一部分。但是联邦政府照道理应该在这种紧急情况对各州拨款,因为联邦政府具备州政府没有的举债弹性。
通过压低投票率,特朗普也寄希望于2016年帮他拿下总统宝座的摇摆州。“真正清晰政治”网站的数据分析,目前最关键的六州是佛罗里达州、宾夕法尼亚州、密歇根州、威斯康星州、北卡罗来纳州和原本支持共和党的亚利桑那州,拜登在这些州平均领先幅度为3.7个百分点,其中威斯康星的领先幅度最大,达到6.4个百分点,但他在佛罗里达领先幅度只有1.2个百分点,北卡罗来纳州也仅为1.5个百分点。
威斯康星州被认定是决胜州之一,该州自2000年以来都是竞争最激烈的摇摆州之一,2000年戈尔拿下47.8%对小布什的47.6%;2004年克里49.7%对小布什的49.3%。希拉里在2016年并未到该州举行任何竞选活动,而特朗普本人则多次造访,结果希拉里在威斯康星州比奥巴马少拿了23.9万张票,其中黑人选票就少了20%。
为了拿下威斯康星州,民主党特别把今年党代会选在该州的密尔沃基召开,但是碍于疫情,会议以视频形式进行,拜登本人并未到访。最近考虑选情的需要,拜登还是在9月第一周拜访了密尔沃基。
相较于拜登考虑疫情和社交距离,主要通过网络或电视广告刺激选情,特朗普阵营在摇摆州动用大量志愿者挨家挨户敲门拜票,究竟效果如何将待选举结果才能验证。另外,11月3日之前,特朗普和拜登的电视辩论也将可能对选情带来关键影响。
“特朗普至今仍有30%的机会,而不是15%的机会,是因为选举人制度。”席尔瓦称。拜登在决战州维持4个-6个百分点的领先,在全国性民调则领先7.5个百分点。在目前的推演下,拜登完全可能在全国拿下比特朗普多4.5个百分点的普通选票,但因为选举人票制而落选。
无论谁最终当选,几乎可以确定的是投票当晚无法知道当选人是谁,考虑到选战的激烈程度,双方都会派出律师,在每一州关注选票计算,确保投给自己的选票被计算在內。
修夫纳担忧地指出,鉴于目前邮寄投票缺乏资金和人力,计票过程可能发生各种争议,“如果他(特朗普)落选了,他会发动他的阵营和律师挑战选举结果。”届时不只可能重复2000年戈尔和小布什在佛罗里达州的计票纠纷,类似情形还可能在多个决战州发生。