美国总统大选中的“预测帝”们
2017-02-24王菱红
王菱红
国总统大选,全美大部刮起一阵农村包围城市的强劲旋风,将此前不被看好的特朗普送进白宫。这个结局出乎之前大多数人的预料。对大选结果,人们给出各式各样的解读。每个人的解读,都带着自己的认知模式,好比透过一个独特的棱镜看世界。
众说纷纭中,有一种说法各方似乎都同意,即民调预测大失准星,没能准确反映选情民意。更有人指责主流媒体偏袒希拉里一方,操纵民调数据,故意误导民意。一时间,民调机构和预测专家们灰头土脸,前几天他们好像还捧着能看透未来的水晶球,现在却仿佛变成了一群数据傻瓜,蹲在角落里反省。普林斯顿大学的华裔学者Sam Wang,选前通过数学模型,预计希拉里获胜几率高达99%,因为把话说得太满,不得不兑现诺言,在CNN当众吃了“虫子”——虽然是富于营养的罐头蟋蟀,但是那镜头,还是令吾心生戚戚。
评论看得多了,发现很多人似懂非懂,其实并不真正明白民调到底是怎么一回事,也没有搞清楚民调机构(pollsters)、预测模型(forecasters)、媒体(media)与政治评论家(pundits)的角色与概念。
打个比方说吧,民调机构好比是采矿的,对民意采样收集并做必要的数据处理;模型预测机构好比是做深加工的,把民调数据放入统计模型中进行分析,推算出让人一目了然的大选获胜几率;媒体和政治观察家们则好比包装与分销商,把民调支持率和获胜几率预测等拿去报道评论,为自己的判断提供佐证;媒体受众则是这些信息的消费者。在这次美国大选中,主流媒体确实表现出一边倒的倾向性,民众凭直觉就可以感受到偏颇,我觉得问题主要出在大众传播层面,并不意味着民调被有意操纵,预测是故意误导。
美国有数百个大大小小的民调机构参与了从个别州到全国的民意调查,这些机构有些隶属于各大媒体,有些由两党资助,也有很多是独立研究机构,比如隶属于大学的,或者从事市场调研的专业公司。做统计预测模型的机构专业性更强,数量也要少很多,有跟媒体挂钩的,如《纽约时报》的UPSHOT、《赫廷顿邮报》的模型,也有独立机构,如著名的538和前面提到的普林斯顿模型。认为他们都背弃了专业精神,故意误导民众,于情理于逻辑都难以说通。
在许许多多的反思中,我最关注的是538网站(http://fivethirtyeight.com/)的解释,因为在这次美国总统大选期间,我一直跟踪538的数据分析,对他们的预测模型更加熟悉一些。
538的创始人兼总编Nate Silver运用概率学中的贝叶斯决策理论(Bayesian Theorem),用数学方法对未知事件进行概率分析。和绝大部分政治、新闻专业出身的预测者不同,Silver预测选举结果的基础并不是传统意义上的经验与直觉,而是通过搜集整理大范围的数据和各种层面的民意调查,通过数学算法得出直观的大选胜率。在2008年美国总统大选中,Silver正确预测了49个州的结果;在2012年,他对美国50个州的预测又全部正确,因此声誉鹊起,成为预测模型界首屈一指的“大咖”兼“网红”。
这次美国总统大选,538在选举日早晨给出的最后胜率预测是希拉里71.4%(vs.特朗普28.6%)。这个预测远低于普林斯顿的99%,《赫廷顿邮报》的98%,罗斯柴尔德的89%,《纽约时报》的85%,或可稍微为538和Nate Silver挽回一点颜面,但他们毕竟还是站在了错误的一边,只能算一份不及格的答卷。
坦率地说,我对Silver迄今为止给出的分析并不十分滿意。他提出了很多精当的见解,但更多的是在强调民调的问题和客观不确定性,尚没有深入反思自己的预测模型有什么大的漏洞,似乎还在努力维护自己的面子。
我认为至少有一点是值得挖掘的,即传统的随机抽样民意调查方式在今天已经越来越困难(回答率低,随机性差,代表性存疑),难以反映出人们未定的/变化的/隐藏的想法,建立在民调数据基础上的预测模型也难免无用输入无用输出(garbage in, garbage out,计算机用语)。相反,很多真实的情绪想法却弥漫在Twitter、Facebook、微信这样的社交媒体中,那是真正的数据金矿,实在不能视而不见。对纷杂的社交媒体数据进行分析,如何识别信号与噪声是更大的挑战,还期待Silver和Sam Wang这样的数据科学家能在这方面更有作为。
人们把民调数据或预测模型当成窥探未来的水晶球,实在是个不小的误会。可有什么办法呢?人们总希望能提前预知未来,消除身在未知中的迷茫和困顿。
要真说起来呢,“预测帝”也不是没有。先说远的——早在1987年,普利策奖得主Garry Trudeau就在他的漫画系列《Doonesbury》中,描绘特朗普要竞选总统,可能那时候连特朗普本人都还没生出过这个念头吧。
再说近的——美国总统大选前的2016年11月3日,中国湖南长沙石燕湖,红布铺起一个总统预测台,特朗普和希拉里的硬纸板画像分列左右,两人画像前面都放着香蕉。一只名叫“哥大”的5岁猴子身穿印有“预测帝”字样的黄马褂,走上前去,经过深思熟虑,不但吃掉了特朗普身边的香蕉,而且给了他一个热烈的吻。
哈哈,玩笑归玩笑,我给大家介绍一位真正的预测帝吧——Scott Adams,著名漫画系列《Dilbert》的作者(奇怪,怎么又是个漫画家)。我跟踪Adams关于美国总统大选的博客近一年,他从2015年8月起,就预言特朗普将拿下共和党内提名,并将一路赢得最后总统大选,而那时候刚刚宣布参选的特朗普还是很多人眼中的笑料。2016年3月,Adams又预言特朗普将会在总统选举中大胜,而那时候特朗普还没有拿到共和党候选人提名。怎么样,够厉害吧!
更有意思的是,Adams声称自己对政治、经济、移民等方针政策与影响之类的东西并不在行。
Adams对特朗普的预测乃是基于一条非常独特的判断,即特朗普是一个天才的说服大师,其异常出众的说服力对其目标听众具有催眠般的控制和影响力。
Adams的说服力预测模型,好比他看待事物的独特棱镜。对这个棱镜,我一直将信将疑,但他有几个重要观点还是令我印象深刻:
——聪明而充分了解各种信息的人们,几乎在所有重大问题上都意见相左。可见,你再聪明,拥有的信息再多,都不能让你如希望的那样准确把握现实。
——在真实的世界中,唯有情感才是重要的,因为情感驱动人们的行为。
——事实如何,并不影响人们的决策。人们首先形成决定,然后再挑选数据,为他们的非理性选择寻找理由。如果你发现人们总是对你睿智的观点不以为然,记住,那是因为他们也在你身上看到了同样的非理性。
这些观点,也许值得Nate Silver和Sam Wang等数据英雄们体会、借鉴。