算法瞄准与智能选举:算法如何重塑西方选举
2021-11-15王中原
文/王中原
西方正在进入智能选举的新时代,数据资源和算法技术开始重新定义西方的选举政治,选举不仅是政党政策主张之间的比拼和选民自由意志的选择,而且越来越成为不同政党和选举人在数据和算法领域的较量。最大限度地搜集和挖掘选民数据,运用智能算法对选民展开精准动员,引导选民行为以收割选票,成为算法时代新的选举方程式。基于海量选民个体数据的算法瞄准,一方面拓展了竞选活动的形式,更加有效地传递选举资讯和智能化地动员投票,有助于提升选举民主的活力;另一方面加大了对选民心理和行为的操控,引导候选人分割和选择动员对象、掌控选民情绪、精准投放信息,以及“围猎”潜在支持者,这些都将危及民主的核心价值。算法时代的西方选举正在走向某种形式的异化,为我们观察和思考选举民主的危机及其治理提供了契机。
智能选举中的算法瞄准
锁定目标选民(voter targeting)是选举动员的核心策略,其目标是在竞选经费有限的条件下有效地动员尽可能多的选民参与选举活动(包括投票、捐款、集会、担任志愿者等)。随着算法时代的到来,数据资源的积累和算法科技的精进为选民动员提供了新的手段,聚焦选民个体的精准动员成为可能,基于算法的政治瞄准(political micro‑targeting)应运而生。
算法瞄准(algorithmic micro‑targeting)是指“运用数据分析识别个体的具体兴趣,然后创制个性化的资讯内容,预测这些资讯的影响,然后将这些资讯精准投放给相关个体”。算法瞄准起初为商业营销手段,即根据个体特征、消费记录、日常喜好和社交网络等数据对客户进行画像,进而投其所好地为客户推荐广告和产品。近年来,算法瞄准越来越多地被运用于政治领域,用以建立选民关系和动员选举投票,并在选举实战中取得突飞猛进的发展。算法瞄准的核心是数据而非选民,其基本假设是单个或几个数据点(data point)无法准确反映选民的偏好,需要收集海量的、多维的、各领域的选民数据才能构建完整的选民画像。区别于传统的选举方式,算法瞄准依靠大规模的选民个体特征数据和行为数据来对选民进行精准划分和归类,然后依托算法识别选民的人格特性和偏好立场,基于此向其推介个性化定制的选举资讯和动员活动,并通过预测、试验、反馈、迭代等过程不断优化,从而达到最大化影响选民投票意愿和投票行为的目的。整个竞选过程由数据驱动,通常被瞄准的选民并不知道其个体数据是如何被收集、分析和使用的。
算法瞄准是大数据时代智能选举的核心技术,近年来在西方各国选举中得到不断发展,由于各国制度环境和法律体系的差异,呈现出不同的发展态势。但无论是在多数决制的国家(例如美国和英国),还是在比例代表制的国家(例如荷兰和瑞典),算法瞄准技术都在重塑选举政治生态。
算法瞄准的基本原理和技术过程
算法瞄准涉及不同的参与主体,使用不同的数据资源,运用不同的工具,瞄准不同的对象。然而,算法瞄准的基本原理是一致的,其核心技术过程可划分为以下三个步骤:
(一)选民数据采集和预处理
算法瞄准首先需要采集海量的选民个体层面数据,数据资源通常来自“公共数据”和“私人数据”。公共数据包括人口普查数据、地理信息数据、选民注册数据、历史投票数据、选举捐款数据等。私人数据包括选民个人的网络行为数据、消费数据、生活方式数据、财务数据、联系方式和社会交往数据等。政党或竞选团队既可以自己采集上述数据(特别是公共数据),也可以通过数据掮客购买。数据丰富度和数据质量是决定算法瞄准成效的关键要素。竞选团队在采集和购买数据后,通常会对来自不同渠道的数据进行清洗、匹配、合并和插补等预处理,构建数据库以备后续环节使用。通过历届积累,政党通常能掌握大规模的选民数据,形成丰富的选举数据资产。
(二)选民分类、模式识别和算法预测
算法瞄准的第二个关键环节是运用分类建模对选民进行精准画像,识别选民特征与其投票行为的隐性关联模式(hidden patterns),并进行算法测试。首先,竞选团队会对所掌握的海量选民数据进行深度挖掘,借助统计模型和机器学习算法分析选民的人格特征、情感偏好、心理结构、政策倾向和政治态度等,完成对选民的政治画像和精准分类。其次,还需借助预测算法分析选民特征与投票决策之间的隐性关联模式。诚然,这些关联模式只是特征变量之间的某种相关性,缺少因果解释,但是在指导竞选活动时,相关性就已经足够,候选人只求按照该关联模式可以实现精准动员,无需深究其间的因果机制。预测算法除了挖掘可观测对象的投票行为模式外,还可以预测类似不可观测对象(lookalike audiences)的活动,这意味着即便数据库中没有某个选民的数据记录或者数据记录极不完整,算法同样可以根据对现有数据中相似选民的分析预测该选民的投票倾向。
(三)选民瞄准和个性化动员
算法瞄准的最终落脚点是对选民个体施加政治影响。竞选团队根据所识别的选民类型和特征关联模式,运用机器学习算法定制个性化的动员策略,并不断优化瞄准精度,实现对支持者的精准动员和对竞争者的精准打击。不同于传统大水漫灌式的电视广告轰炸,算法瞄准精准对人,一人一策,根据选民画像进行定制化的信息推送和个性化的游说动员,既可以提升动员效率又可以节约竞选成本。政党/候选人通常会启动全媒体的选民触达策略,根据选民使用习惯,采用社交媒体、在线订阅、电子邮件、搜索引擎、手机短信、邮寄、电话、电视、广播、播客等形式向选民传递竞选资讯,并根据对象调整不同的话语策略和投放时间,以最大限度地提升动员效率。个性化动员有两个核心目标:一个是督促支持者采取某种行动,例如投票、捐款或志愿服务;另一个是改变选民的支持态度和投票行为。虽然选举实践证明后者难度较大,但是随着算法技术的精进,算法瞄准将在选举中发挥更大的影响力。
算法瞄准的政治后果:选举民主的异化
随着算法科技的无限制使用,算法瞄准渐渐走向民主政治的对立面。
(一)信息操弄和选民操控
民主选举得以有效运转的前提是选民能够在开放的信息环境和政策市场里自主地作出投票决策,免于外在力量的干预和操弄。算法瞄准打破了这一前提,让政党/候选人有机会控制选民的信息获取和投票行为,选民被异化为一组数据构成的投票工具。
首先,算法瞄准导致信息操弄。一方面,政党/候选人在选民不知情的情况下采集了海量的选民个体信息,这些数据能够覆盖几乎全体选民并涵括成百上千个特征维度,从而对选民实现超级精准画像(super profiling)。选民成为数据组成的“透明人”,选民的任何活动都可能被追踪和记录,被用于算法瞄准,而选民通常并不知道自己的哪些数据、正通过什么方式被政党/候选人所掌握和利用,导致“监控式资本主义”(surveillance capitalism)。更严重的是,竞选活动面对的不再是一个个活生生的选民,而是一个个冷冰冰的数据点,选民被物化为某种“特征集合”。另一方面,政党/候选人可以运用算法对选民进行“分而治之”,针对不同类型的选民“投喂”不同信息,选民所接受的选举资讯是根据其喜好、特征、阅读习惯和政治立场所精心编制的。民主需要“明智的选民”(informed electorate),但算法瞄准导致信息自由流通受阻,信息市场被高度扭曲,每个选民都生活在算法编织的信息“滤泡”(filter bubbles)当中。此外,选民对这些个性化信息的回应(点击、转发、回复等)再次变成新的数据,帮助算法瞄准不断优化,形成互动式的算法升级螺旋,进一步固化信息茧房。算法瞄准赋予政党/候选人和第三方算法公司超出常规的权力来影响选民的态度和行为,并且其运行极其不透明,形成难以监督的“算法利维坦”。
其次,算法瞄准导致选民操控。民主选举必须基于选民的自主决策,然而在扭曲的信息环境下,选民偏好不是自主的,而是被建构的。民主选举的过程不再是选民根据自己的利益和偏好来选择政党/候选人,而是政党/候选人选择和驯化支持者,并通过控制信息流通和塑造非理性的政治偏见来“围猎选民”(hunt for voters)。类似于选区操控(gerrymandering)通过将选民“分解”和“打包”在不同的地理选区内来制造竞争优势,算法瞄准通过将选民“分解”和“打包”在不同的信息茧房中来操控投票行为。认知心理学认为任何人都存在“决策脆弱性”,算法瞄准正是利用了选民的认知局限来影响其投票行为。无论选民同意与否、有意识或是无意识,算法都可以通过操弄选民的希冀和恐惧、喜好和厌恶、欢欣和愤怒来进行瞄准式动员,不断激活选民的某种心理范式和神经反应,形成结构性刺激以左右其决策。智能选举构建了一个越来越庞大的复杂信息系统,选民的认知、心理、情绪和判断能力被算法所影响,无法作出自主、独立和理性的决策,甚至没有能力察觉和反思自己的决策。结果是,选民决定投票或不投票以及投给谁看似是选民自己的选择,其实该选择早就被算法瞄准所操控,并且这种操控是隐匿的和持续的。选举政治的制度逻辑是选民可以通过选票控制政党/候选人,但算法瞄准却将选民异化成被控制的对象。
(二)消极竞选和政治极化
民主选举要求政党/候选人通过良性竞争赢得选民支持,竞选的过程也是开展全国性公共对话的过程,通过议题论辩和理性沟通促进交叉认同。算法瞄准打破了这一过程,数据和算法被“武器化”(weaponize),导致政治对抗升级,加剧消极竞选和政治极化。
首先,算法瞄准导致消极竞选。智能选举时代算法科技成为决定胜负的关键,将算法运用到极致是所有政党/候选人的策略,这就使得算法的各种极端运用手段开始流行,包括推送虚假信息、传播阴谋论、污名化宣传、制造仇恨、歪曲事实等消极竞选方式。为了追求选举利益最大化,政党/候选人会通过同质信息巩固支持阵营,运用虚假信息分化敌对阵营,算法帮助实现精准动员和精准打击,针对选民的不同特质进行高度个性化的洗脑和游说,并且毫不顾忌信息真实性。此外,暗黑手段大行其道,社交机器人可以根据算法指示精准高效地向选民分发假新闻链接和污名化短信,并根据反馈调整推送策略。由于算法瞄准是一个过程黑箱,外部并不知晓政党/候选人对哪些人传播了哪些虚假信息,无法进行事实核查和信息纠偏。加之虚假信息的传播速度、深度和广度惊人,消极竞选的影响被不断累积和放大,从而误导选民。消极竞选导致选举生态恶化,首先采取这些消极手段的党政/候选人会获得高额的“算法红利”,并带动其他政党/候选人跟进,形成“算法军备竞赛”。此外,第三方算法公司出于盈利考量,也会不断升级智能算法,激化恶性竞争。
其次,算法瞄准加剧政治极化。第一,算法瞄准按照特定的党派意识形态展开动员,党派割裂线在信息操弄下被不断触发和强化,超过其他任何社会认同,或者将其他认同吸附到党派认同当中,造成党派极化。第二,算法将选民切割为不同类型的子群体,对每个群体构造不同的信息环境,从而形成高度“部落化”的认同结构。算法瞄准通过虚假信息、政治攻击、选择性动员等不断激活党派认同边界,强化认同群体的组内抱团和组间排斥,不同“部落”之间缺少开放理性的对话,加剧了社会撕裂和认同对抗,造成群体极化。第三,算法瞄准拆解了信息多元性,强化了选民个体的单维特性(one‑dimensionality),其人格、情感、心理和情绪被算法捕捉并放大,选民越发缺少反思和沟通能力,只能接受契合自己立场的观点和信息,而罔顾事实和真相,造成个体极化。上述党派极化、群体极化和个体极化相互作用、彼此强化,不断消解交叉认同,催生整体政治极化。更为严峻的是,算法瞄准并非一次性行动,而是贯穿选前、选中和选后的整个过程。算法使得西方选举成为“全周期竞选”(permanent campaigns),数据收集、选民追踪、算法监控和瞄准式动员无时无刻不在发生,这将加剧政治极化的强度和烈度。
(三)政治代表性偏差和“回应—问责”失灵
民主选举的目标是实现政治代表性和有效的回应与问责,让不同的利益和声音得到平等对待,运用选票压力督促政府回应民众诉求,并惩罚不守承诺的执政者。算法瞄准模糊了这些目标,筛选或压制选民导致政治代表性偏差,碎片化承诺引发政府回应和选民问责的困难。
首先,算法瞄准导致政治代表性偏差。政党/候选人借助算法将选民分割成不同特征组合,根据选民画像和心理测绘来判断选民的投票意愿和偏好,但并不是所有的群体都会被“瞄准”,政党/候选人会选择性地精准动员一部分人而有意忽略另一部分人。如果算法预测表明某些民众无论如何都不会参与选举或者不可能改变投票倾向,那么这部分选民将被排除在算法瞄准的序列之外。同时,政党/候选人也会运用算法来压制选民(voter repression),特别是消解对方选民的投票几率和意愿。此外,数据和算法是昂贵的政治资产,政党/候选人必须投入大量的资金、组织专门的团队、经过常年的积累才能把握先机,这有利于强大的主流政党,代表少数群体利益的弱小政党将被挤出竞争舞台。同时,掌握数据资源和算法科技的第三方平台、数据掮客和政治咨询公司在选举中越来越有影响,其商业利益和话语权力在当选政府中拥有举足轻重的地位。一方面是部分选民群体和弱小政党代表性的丧失,另一方面是科技公司影响力的扩张,两者都将导致政治代表性偏差。
其次,算法瞄准引发回应与问责失灵。竞选和执政是一个承诺和守诺的过程,然而在瞄准式动员当中,政党传递给选民的信息是高度个性化和碎片化的,面对不同的选民,强调不同的议题和承诺不同的方案,缺乏始终如一的政策叙事。每个选民所看到的是不同版本的政党形象,选民并不知道其关心的事项在整个政党议程中的优先级,也不知道围绕该议题有哪些不同的政策立场和解决方案,最终很可能出现当选政府无法满足其期许的局面,选民也很难就其个体诉求向政府问责。一方面,当点对点动员更加有效时,政党将致力于讨好选民的个性化诉求,而忽略宏观和长远的政治规划,竞选被微观算法所绑架,缺乏统一的政治纲领和政策排序,这便导致承诺和责任的模糊化,增加了回应和问责的难度。另一方面,算法瞄准将引导选民关注个殊化需求,而对关系国计民生的重大议题失去兴趣,长久将形成选民与政党/候选人之间的私人庇护关系(patron‑clientelism),损害回应和问责的公共性。此外,算法瞄准通常是在隐秘环境下进行的,通过非公开渠道传递的选举承诺,其透明性和可追踪性较差,很难实现有效的回应和问责。
算法瞄准的多圈层治理
算法瞄准将产生一系列负面的政治后果,导致选举民主的异化。如何治理智能选举中的算法失范,是摆在西方各国面前的紧迫议题。算法瞄准涉及不同的利益主体,其治理过程也需要多方参与和相互制约,从而构建多圈层的复合治理结构:在制度圈层需要国家法律规制;在舆论圈层需要社会主体监督;在竞选圈层需要平台治理和政党协作;在投票圈层需要公民教育。
首先,在制度圈层,算法瞄准的诸多政治风险无法在传统的法律框架内得到有效治理,需要新的法律规制。近年来,特别是“剑桥分析”丑闻爆发以来,欧洲和北美各国纷纷推动相关立法。总体来说,欧洲走在算法治理的前列,采取了更加干预主义的治理策略;美国的算法瞄准政策较为宽松,目前尚未颁布类似严格的个人数据保护法规,总体来说,法律规制相对于算法瞄准的迅猛发展明显滞后,同时容易陷入多方博弈的僵局。此外,算法治理不能依赖总体性的数据保护条例,还需对具体的选举法、政治广告法、选举资金法等进行配套修改,形成法律治理系统并确保其执行,这对很多国家来说是不小的挑战。
其次,在竞选圈层,平台治理和政党协作在算法治理中尤为重要。(1)平台治理。平台公司不仅是海量用户数据生成和存储的主体,并且是算法服务和政治广告业务的供应商。脸书、谷歌、推特等平台公司掌握强大的数据权力,其自我治理是优化选举数字生态的重要手段。当前平台治理还面临诸多困境,虽然社会舆论、国会听证和相关法规给平台公司施压,但是它们的商业利益和政策立场使得真正的平台治理步履维艰。此外,科技公司过度干预内容生产也招致诸多违宪质疑。(2)政党协作。作为竞选主体的政党和候选人也需参与到算法治理当中,例如不同政党可以就竞选伦理达成共识,出台最佳操作指南;约束提名人的算法行为,规范选举资金使用和政治广告投放,避免陷入“算法军备竞赛”;推动跨党派的立法协作,通过法治手段管理平台公司和竞选行为。政党/候选人也应该管理好竞选团队,在选民数据采集、虚假信息传播、瞄准式动员等方面做好自我约束,维护良性的选举文化。诚然,在政治极化和民粹主义日趋严重的今天,依靠政党和候选人的自律进行算法治理显得尤为困难。
再次,在舆论圈层和投票圈层,社会监督和公民教育在算法治理中发挥着重要作用。(1)社会监督。算法瞄准呼唤媒体记者、非政府组织、学术界等社会力量的外部监督。从事选举报道的调查记者可以揭示算法瞄准乱用的丑闻,通过媒体曝光警示和教育公众;从事事实核查的非政府组织(fact‑checkers)可以核验算法推送的资讯是否存在事实错误和信息误导,及时澄清误解,引导民众对所接收的资讯作出理性判断;学术研究可以从政治学、法学、伦理学、传播学、心理学和计算机科学等跨学科的视角研讨和反思算法瞄准的应用和局限,对其发展趋势作出研判,从专业角度提出治理方案。(2)公民教育。公民个人作为选举决策的主体和算法瞄准的对象,也须承担相应责任。一方面选民需要意识到自己是被“瞄准”的对象,接收的信息是算法过滤的,并提升甄别和反思能力,拒绝参与虚假信息的“共同生产”;另一方面积极参与公共空间的协商对话,除了关注同温层的观点,还要认识到其政策主张将如何影响其他人。此外,公民要提升个人数据保护意识,警惕个人信息的授权和分享。对此,国家提供相应的数字素养教育显得尤为重要。
最后,算法瞄准的多圈层治理需要不同圈层和各个主体之间的有机协作和相互制约,外部的法律规制和舆论监督、内部的平台治理和政党共识,以及个体数字素养培育对于算法治理都至关重要。然而,多圈层复合治理是理想型的算法治理模式,现实中由于制度环境差异、利益考量不同,各方很难达成共识和一致行动。更严峻的是,政治极化与算法瞄准彼此强化,裹挟着政党/候选人、算法第三方、媒体和选民走向更加极化的境地,导致算法治理和选举改革陷入僵局。
结论
算法瞄准正在重塑西方的选举政治生态,影响了西式民主的程序正义和结果正义。算法瞄准本身只是选举工具,虽然算法瞄准可能尚未达到媒体所渲染的危机局面,但随着政党/候选人在选举利益最大化的驱使下无所不用其极地运用算法瞄准来操控选民,西方选举的游戏规则和竞争格局将彻底改变:选举的中心不再是选民而是数据,竞争的核心不再是政策而是算法。选举民主的前提、过程和目标都将出现异化,最终随着算法瞄准的不断升级和无限制使用,通过投票聚合选民偏好从而选出政府回应选民需求并接受选民问责的民主链条将出现更多裂痕,甚至危及民主政治的健康运转。
西方各国已经意识到算法治理的重要性,致力于构建多圈层的复合治理结构。然而,就如何把握言论自由与个人隐私之间的边界、算法经济与权利保护之间的张力、竞选效率与政治伦理之间的平衡等问题,各方分歧严重。算法治理的过程也是不同政治力量博弈的过程,未来如何发展,值得跟踪观察。就学术研究而言,算法瞄准的兴起为我们提出了一系列崭新的跨学科研究议题。加强相关研究,不仅可以帮助我们把握西方政治发展的最新动态,研判西方政治制度的发展趋势,同时能够提升我们对新技术环境下人类政治行为的一般性认识。