民调、谎言和人工智能
2016-12-12毛旭新
毛旭新
2016年美国大选,是一场牵动全世界亿万人神经、影响深远的大事件。截止到12月1日,美国选票清点仍在进行中,希拉里的选票已超过特朗普250万张。如果按照全国得票率来决定美国总统人选的话,希拉里将以超过特朗普2%的支持度赢得大选。但是特朗普赢得了更多的选举人票数,成功当选总统。
结果已出,尘埃未定。
美国大选结束后,很多人开始质疑民调的准确性。大部分机构和预测师,包括曾经成功预测2012年大选结果的内特.希尔沃(Nate Silver),都在这次预测大战中折戟。
2016年美国大选中充斥着各种谎言。特别指出的是,大选期间特朗普发表的言论中有超过一半被认为是完全错误和谎言,只有不到4%完全符合事实。我们不禁要问,为什么美国选民最后选择了一位谎话连篇的候选人?
今年美国大选的一个重要的特殊现象是,社交媒体上存在大量支持特朗普的政治机器人。在社交媒体的语境下,机器人(Bot) 是指基于人工智能技术,自动模拟人类行为,特别能自动模拟发布信息的程序。在这次美国大选期间,双方,特别是特朗普阵营,在社交媒体(Twitter,Facebook)平台利用大量政治机器人,模拟人类用户与真实选民交流,并试图影响选民投票意向。
根据政治僵尸账户研究网Politicalbots.org、美国南加州大学Emilio Ferrara博士以及本人的研究,在美国大选期间,2016年9月中旬到10月中旬,20%以上的与美国大选相关推特信息都是由机器人发出,其中3/4以上都支持特朗普,不到1/4支持希拉里。
随着选举日的临近,越来越多的机器人自动信息支持特朗普,到选举日支持特朗普和希拉里的信息比达到惊人的5:1。同时,支持特朗普的机器人会模仿人类作息规律,推文行文更加符合人类语言表达,选举结束后,数十万计支持特朗普的政治机器人很快停止了自动程序。
我们不排除这种可能,人工智能技术开发的在社交媒体上大量撒播支持特朗普,抹黑希拉里的政治机器人,成功扭转了大家对于特朗普连篇谎话的关注,转向克林顿阵营方面的丑闻。
面对着汹涌而来的社交媒体中的智能机器人,传统媒体的对于深层次议题的引导力明显下降。主流媒体对于参选人错误事实的纠正很快就淹没在机器假信息的海洋里。本人在投票日前的大数据检索显示,2016年美国大选掺杂了过多的人身攻击,极少涉及深层次议题。选民除了工作就业问题以外,对于其它重要的经济和传统政治议题(堕胎,禁枪等)均没有关注。
双方阵营的选民都高度关注两位候选人本人和其选举期间的各种争议事件,包括了民主党阵营方面的电邮门、克林顿基金会,共和党方面特朗普关于女性、移民等议题的争议言论和可能的逃税行为。按照预测,这样的混沌战争使得特朗普阵营将差距缩小到2%,但是,在正常的选战中,这种差距仍然不会赢得大选。
美国是一个多种族的国家。政治正确与否,任何州选战都要考虑该州的人口组成。奥巴马成功当选并连任总统,使得很多评论家认为美国选民投票种族考量比重下降。但是,奥巴马当政8年,种族问题越来越多,这次选战中,种族问题重新浮现。
在所有的民调中,55%-60%的白人选民都选择特朗普。美国的人口种族分布不均。非西语裔的白人在美国人口比重为63%,在“锈带”摇摆州中,情况则大不相同,白人比重都超过76%。
按照美国的选举人团制度,这些白人的票比其他族裔的票有更高的决定率。据本人估算,在整个总统选战里,一张白人票在全国范围内大概具有1.05-1.1张选票的决定力,而在摇摆州这一决定力相当于1.07-1.12张选票。2016年美国选战中,谁获得这几个摇摆州,谁将获得美国300张以上的选举人票,超过当选所需270张。
如果采用这种加权处理的民调,俄亥俄和爱荷华从10月中下旬以来就倒向特朗普阵营,宾夕法尼亚、密歇根、威斯康辛处于双方阵营都可以争取的范围。
此前,本人创建的TRUST(Topic Retrieved、Uncovered and Structurally Tested,即主题检索、揭视及结构式测试)大数据模型判定,这次选战中大家对于参选人信息的关注有助于其支持度的提高,而对于其对手则有反作用。
我们发现,在10月底FBI重启调查后,特朗普阵营在摇摆州大数据关注度方面开始甩开希拉里阵营。在这一期间,在摇摆州里特朗普比希拉里多进行了2倍以上的公众集会 public rally,政治机器人的信息比希拉里更加密集,有效吸引选民关注的同时成功淹没了主流媒体对于其谎言的检视信息。据TRUST模型的估计,在最后10天,三个摇摆州中,特朗普比希拉里多争取了30-50万摇摆选民,虽然在全国选民中比重可以忽略不计,但足以改变选举方向。
面对口无遮拦的候选人,这本来是一场希拉里可以稳赢的选战,完全不用争取重新计票。不管重新计票结果如何,除了本人11月7日报告中提到的希拉里本身的丑闻之外,特朗普阵营同时着力于白人选民和摇摆州,利用社交平台,采用大量人工智能化的政治机器人散播信息,降低了主流媒体影响,清洗自身丑闻影响,并打击希拉里阵营,一石三鸟,打了一场成功的大数据选战。
未来,我们也许将在更多的公共事件中,看到更多的僵尸粉、更多的机器人,提供错误的信息,误导我们作出错误的决定。(本文作者系英国伦敦大学学院博士生导师、讲师)