计算政治学的形成与发展
2023-02-21李锋王浦劬
李锋 王浦劬
摘要:在新技术时代,随着政治学研究对象和政治环境的变化,政治学研究的方法和范式持续更新,形成了计算政治学的新范式。随着计算机获取数据能力的提升、算法的逐步优化、算力的日益增强和用户界面的友好化,计算政治学的研究范式也不断发展,形成了大数据政治学、智能体仿真模拟和计算实验等研究方法。大数据政治学可以运用自动文本分析、机器学习等方法分析海量的、类型多元的、实时互动的政治数据。智能体仿真模拟的仿真能力不断提升,能够更好地设定与调整参数、分析智能体与复杂环境系统的互动。计算实验依托互联网政治实践,能够较好解决传统实验研究中干预困难和外在效度不足的问题,更好地探索互联网政治行为和规律。
关键词:计算政治学;大数据政治学;智能体仿真模拟;计算实验;机器学习
DOI: 10.20066/j.cnki.37-1535/G4.2023.02.06
基金项目:本文系国家社会科学基金重大研究专项项目“新时代中国特色政治学基本理论问题研究”(18VXK003)、国家社科基金青年项目“大数据背景下地方政府回应性实证研究”(20CZZ017)的阶段性成果。
一、引言:新技术时代下的计算政治学
习近平总书记指出,“与以往历次工业革命相比,第四次工业革命是以指数级而非线性速度展开”①。第四次工业革命本质上是信息革命,核心特征是计算机技术、互联网技术科学的深入发展和持续升級。随着第四次工业革命的发展,人类生产生活方式和组织方式、运行价值发生深刻变化,引发了社会科学研究范式、研究工具的重大变革②。
一般来说,研究范式是通过学术研究方法、研究问题的学术评价标准等要素表现出来的,它体现着学科内容和方法的统一,常常被认为是新学科形成的标识。政治学以政治现象及其发展规律为研究对象,在不同的技术时代,政治现象形态及其环境等具有很大差异性。关注的问题不同,相应研究也显示出不同的特征。在第四次工业革命过程中,计算机的运力不断提升,计算机应用软件界面愈益简单,研究方法和工具不断更新,大量研究者有意识地应用新的计算方法来分析政治现象和议题,形成了计算政治学的研究方法和范式,标志着计算政治学的问世。
计算政治学(Computational Politics)是计算社会科学(Computational Social Sciences)的一个分支,属于计算科学与政治学的交叉学科。它基于计算社会科学的方法论,利用不断扩展的多源异构的海量大数据、日益增强的算力和逐步优化的算法,来研究政治行为与话语实践,形成了大数据政治学、智能体仿真模拟和计算实验等多种计算政治学的研究形态。大数据政治学的出现,使得许多政治学研究者可以直接分析海量的文本信息、图像、视频和社会网络信息等非结构化数据,探索分析新的研究议题,并为传统议题研究提供新方法。智能体仿真模拟也成为计算政治学的重要分析方法,在当前能够更简单地设定参数、调整参数,更好地分析主体与环境的互动关系。此外,更多的政治现象在计算机和网络平台出现,也为研究政治行为提供了更多创新性场域。例如,人工智能实验室OpenAI在2022年11月发布了ChatGPT,可在提示词(prompt)的引导下生成文本,也可以用来生成大量政治话语,这为研究新技术条件下的政民互动形态提供了新的机制性可能,而元宇宙等新兴技术也为计算政治学提供了新的研究议题。
二、从政治算数到计算政治学
从计算的角度研究政治学并不是21世纪的新发明。随着现代自然科学的发展,人们一直希望能够运用像数学、物理那样的自然科学的范式来研究社会问题。格劳秀斯就试图以模仿数学的方式来建构新的社会科学。配第在《政治算数》(Political Arithmetick)中希望通过数学算式规则来更好地实现人的幸福,强调在政治学中引入数学计算,创建以“数学”为基础的国家科学,用数学工具来揭示治国方略的规律①。配第使用大量统计资料,研究工业革命后资本主义生产的内在流通和生产过程。马克思认为,配第所创立的“政治算术”是“政治经济学作为一门独立科学分离出来的最初形式”②。
19世纪末20世纪初,实证主义、科学主义思潮极大地影响了政治学的发展。人们认为,政治学应与自然科学一样,采用归纳和实证方法来研究。20世纪20年代,美国兴起以“科学主义”为指导的“新政治学运动”,到“二战”后形成行为主义政治学的研究范式。学者们认为,应该通过可观察的政治行为构建政治理论、进行政治分析。但即便在定量研究盛行的美国,因当时的统计硬件和软件滞后于统计理论,政治学者无法直接基于统计理论进行“计算”,大部分实证研究主要是定性分析,以统计为主的定量研究停留在基础方法层面③。此后,在大规模数据采集技术形成、计算机分析软件逐步成熟后,政治学定量方法才逐步成为美国政治学统计分析的主流。
1975年,Alker 提出 Polimetrics 概念,意指通过数学形式、统计技术对观察到的政治现象进行的编码、度量和对政治理论的形式模型(formal model)。但是,这个概念内涵过于丰富,许多非计算的描述(逻辑、集合论、博弈论等)也都归属于此概念④,使此概念的使用受到限制。随着人工智能理论的发展,越来越多的学者注意到人工智能对社会的影响,开始强调计算科学对研究政治现象的作用。1987年,Richard Ennals提出“计算政治”的概念,主张采用并行计算、并行逻辑程序设计语言等方式来解决长期存在并在人工智能时代不断发展的并行与复杂协同问题①。麻省理工学院人工智能实验室的John C. Mallery指出,应该开辟“计算政治学”的学术领域,开发更好的政治认知理论和计算模型,科学设计评估这些理论和模型的标准,推动国际社会中人工智能系统的作用。罗切斯特大学的Edith Hemaspaandra 等分析了1876年刘易斯·卡罗尔(Lewis Carroll)提出的一种选举制度。该选举制度是为了解决18世纪法国思想家提出的“孔多塞悖论”,即认为在选民投票偏好中变动最少的人应该当选。计算科学教授利用计算科学中的算法,确认这种方式虽然在运行中更为复杂,但确实是更好的选举方式②。此外,他们还系统分析了选举投票相关的计算和可处理性问题,通过对算法的比较,指出模拟退火算法(Simulated Annealing Algorithm)比美国正在使用的选举计算方式更为科学③。
新世纪以来,更多学者提出,应该利用计算科学的方式来研究政治和社会现象。许多计算机学者开始分析公共管理与政策过程中的信息处理过程。例如,麻省理工学院计算机科学与人工智能实验室的Patrick H. Winston和 Mark A. Finlayson提出“计算政治学”,一方面帮助政治学学者和政府工作人员找到合适的分析工具来分析日益增多的信息流,以作出更加可靠的决策;另一方面,越来越多的学者指出,在理性行为之上还有很多“非理性”机制影响认知决策,希望能有更好的工具来理解社会环境④。但在大数据分析技术出现之前,这些计算学者开发的工具分析能力有限,无法理解复杂的句子。总之,在这个时期,关于计算政治的研究,大多由计算机专业教授发起,他们试图用计算方法分析政治现象。但是他们实际上并未认真分析政治运行过程和机制,而是简单将政治学视为计算科学的应用场景。随着高性能计算显卡出现,算力得到提升,数据采集技术得到新的发展,海量的大数据更容易被政治学者使用和分析,包括Python等分析软件的出现,进一步促进了计算政治学的发展,计算政治学的重点才由此逐步从“计算”转向“政治”。
三、大数据政治学:计算政治学的大数据研究
2009年,大卫·拉泽尔等十余位来自哈佛大学、麻省理工学院等多所世界知名高校和研究机构的学者在《科学》杂志发表了题为《计算社会科学》(Computational Social Science)的文章。文章提出,在新的技术时代,人们的日常生活和经济、政治行为都留下了数字痕迹,而计算机收集和分析大规模数据能力的提升,使得数据驱动的新研究领域即计算社会科学出现⑤。大卫·拉泽尔提出并重塑“计算社会科学”的概念,把用大数据研究社会科学的方法定义为计算社会科学。在政治学领域,利用大数据技术分析采集海量多元数据,就成为大数据政治学。从大数据政治学来说,政治行为的大数据具有5V特征,即数据体量(volume)大、数据类型(variety)多、数据收集快(velocity)、数据密度(value)低、数据真实性(veracity)高,这些特征实质性地影响了政治学的研究方法和研究范式。
从数据体量来看,大数据政治学的研究样本不再局限于抽样的“小”数据,而是能够研究不需要抽样的大数据、全数据,数据总规模从TB(240)级别发展到EB(260)级别,甚至ZB(270)级别。在传统的问卷调查阶段,学者基于理论假设,通过结构化问卷对复杂的政治学概念进行操作化处理,利用多种科学抽样方法最大限度地“代表”总体,由此识别政治心理、政治行为等复杂性关联。随着社会发展,依赖面访和概率抽样的实证研究抽样调查成本持续高企,城市小区进入难度提高,无应答率不断提升①。计算政治学希望依托大数据直接从“总体”出发,而不需要进行传统的抽样;同时,希望通过大数据分析方法,以强大的算力,对全样本数据进行采集和分析,由此全面地分析公民的政治痕迹数据,减少在抽样环节带来的误差。比如,学者通过对全国性网络问政平台全样本的分析,利用大数据分析技术可以整体把握分时段、分地区面向不同层级政府的诉求特征②,而不需要研究者自己按照系统抽样选取部分帖子来进行人工阅读和分析③,可以减少主观选择带来的误差。当然,大数据可以不需抽样,并不代表大数据和抽样方法本身互相排斥,在一定程度上,人们可以结合大数据与抽样方法,在全面性和效率之间寻求平衡。
从数据类型来看,大数据政治学的数据具有类型多样、多源异构的特征。传统政治学在定量研究中高度依赖结构化問卷,而政治学的概念,如权利、权力、利益等都具有高度复杂性,将这些概念操作化为可定量测量的问卷难度极大,而且不同受访者面对同样的测量问卷会形成参照系偏差,由此产生测量误差。针对这种情况,有学者采取了虚拟情境测量等多种方法,设定多个虚拟情境来体现政治效能感的高低,并让受访者比较自身和虚拟情境中的人物的“效能感”,从而更好地理解“政治效能感”的复杂概念④。然而受访者针对概念的理解仍然高度受限于问卷设计。不论问卷调查设计如何复杂,最终调查对象的调查数据都会形成一个结构完全一致的矩阵,调查者更加丰富的信息和内容遭到裁减,信息化约严重,信息失真较多。大数据政治学则可以直接分析类型多元的图像、视频和结构差异大的文本信息,并且综合多源异构的多种数据。例如,利用自动文本分析研究大规模的司法裁判文书,给政治学者观察司法过程提供了良好的契机⑤。通过采集和文本分析获得的司法裁判文书数据,政治学者可以更好地分析司法改革的政治效应,理解行政诉讼在规范公权力、调整政商关系等方面的运行机制⑥。此外,为了更好地感知城市居民对城市规划的主观态度,更好地建设人民满意的城市,城市规划者可以采集多源数据,如利用新浪微博 API采集带有位置信息的微博数据,根据微博上的人脉关系利用聚类规则抓取16000名微博上的规划圈成员的ID信息及社交关系①,利用OPEN STREET MAP和兴趣点数据获取用地现状,结合公交一卡通刷卡数据和开放的地理信息资源数据,进行城市研究和规划评估工作②。斯坦福大学李飞飞教授利用谷歌街景车收集的5000万张街景,使用深度学习的视觉技术,估计美国200个城市地区的社会经济特征,结果显示,根据街区中皮卡车和轿车的数量,可以很好地预测相关人群在总统选举中的党派倾向③。这种大数据技术可以高度精确地动态测量经济社会和人口统计特征。
从计算政治学的数据收集来看,与传统数据收集过程相比,大数据的收集过程更加便捷,而且可以实时动态采集多地区、多时段数据,这在传统数据采集过程中耗费巨大且难以完成。例如,Macy基于 84 个不同国家 240 万用户在两年内发布的 5.09 亿条 Twitter 帖子来研究不同国家网民的情绪变化,发现人们的情绪在周末和早晨更为积极,这样的研究能够证实许多之前的推论或假设④。而且这种收集方法成本更低,有助于推动大数据政治学的发展,帮助学者以数据为资源,以算力为驱动力,来发现传统研究中无法发现的现象,形成基于数据驱动的研究范式。
从数据密度来看,大数据的体量较大,其中的有用信息需要进行大量的分析才能获得。但是,数据密度低并不意味着数据价值低,一旦掌握了正确的分析方法,就能得到传统方法无法得到的结论。在2012年总统选举的竞选活动中,奥巴马竞选团队在Facebook上开发了一个应用程序,吸引可能支持奥巴马的用户使用,在掌握了用户资料后,跟进发动这些选民进行投票。此后,越来越多的公司开始关注与选举相关的社交媒体数据。在2016年总统大选中,8700万Facebook用户数据被泄露给政治咨询公司剑桥分析,被认为较大程度上影响了总统选举结果。由此表明,从低密度的数据中可以挖掘具有高价值的信息资源。
从数据真实性来看,许多大数据信息由用户生成,造成数据真伪难辨,影响研究的真实性。但是,从数据获取来说,许多大数据并非研究者的“设计”,而是直接出自用户的自发行为,反映了政治行为主体的行为和话语事件,是真实政治活动中的数据,是一种“发现的数据”⑤,更加接近现实政治实践,且避免引发所谓的实验者“需求效应”和问卷调查中的“社会期许偏差”。此前,问卷数据由受访者自陈,限于问卷结构,问卷的设计和提问过程只能尽可能照顾大多数受访者。同时尽管问卷设计者通过多种方式希望受访者能够更加如实地作答,但问卷调查实际上难以获取部分受访者的真实想法。例如,在传统的实证研究中,研究普通民众的意识形态,通常都是依赖受访者准确、真实地表明主观态度,而这些问题又高度敏感,许多民众倾向于拒绝作答或者隐藏真实态度。在新技术时代,研究者可以利用爬虫技术收集并非出于研究者设计的海量数据,从这些政治行为数据中揭示政治意识形态。有学者基于消费者在亚马逊网站大规模的图书共同购买数据,得到26 467 385组共同购买的关系,1 303 504本书籍消费记录,构建了政治关联性政治倾向、政治极化等多个指标,并通过对这些指标之间关系的梳理来可视化地呈现美国不同党派对科学书籍消费差异,发现科学书籍甚至比政治性书籍对不同党派的预测作用更为显著,而且发现社会网络关系对意识形态影响较大①。
大数据政治学带来了新的研究范式,同时也带来了新的相关问题。比如,如何进行因果推断、如何促使大数据算法更加透明等,这些问题引起了学者的关注。北京大学黄璜教授提出,应该研究“算法政治学”,算法可能导致社交媒体对用户的推送形成“信息茧房”和“回音壁”,甚至导致对传统制度的威胁②。美国政治学者Matthew Crawford指出, “算法正在取代可被追究责任的具体的人类作出的判断”,政府很愿意采取算法治理,因为“算法可以将各种形式的权力与民众的压力隔离开来”,但是“算法统治具有极大的模糊性和很差的可解释性③。”同时,算法问题也面临着相关司法问题、政治问题和伦理问题,算法本身也可能会与政治关联,影响政治过程的结果。因此,在大数据政治学中,算法与政治的结合问题正在逐步成为一个值得关注的新兴领域。
四、智能体仿真模拟:计算政治学的仿真模拟
仿真模拟(simulation)是人类构造出一个客观世界的理论模型,并通过设定规则和参数来验证构造出的仿真模型。在具体应用中,研究者将某些思想建构抽象为数学语言或者程序语言表示的仿真模型,对给定条件下真实系统的行为进行分析和解释④。仿真模拟可以广泛应用于经济学、政治学等相关理论研究;同时,在涉及政治安全、公共突发事件、危机处理等很多实践领域和问题研究中具有应用价值。从时间来看,仿真模拟的发展实际上早于大卫·拉泽尔2009年提出的“计算社会科学”。在21世纪初,计算社会科学本身就等于基于计算机的社会仿真模拟⑤。2002年Macy首次提出“计算社会学”的概念,认为仿真模拟应用到社会学中就是计算社会学⑥。近年来,基于程序语言的仿真模型发展越来越快,尤其是基于计算机程序语言、大量数据得出参数的智能体计算仿真模拟方法不断发展。
20 世纪 80 年代,复杂性科学运动产生。相关研究者认为,传统的定量社会研究分析方法只能分析简单的系统,而社会系统极其复杂,必须依赖复杂适应系统(Complex Adaptive Sys? tems)來进行分析。复杂适应系统认为复杂系统的智能体(agent)能够应对环境的刺激作出反应,在此背景下,智能体之间、智能体与环境之间具有复杂的互动关系,智能体对环境的适应还会造成系统的动态演变,微观个体的自适应过程最终导致宏观层面的多元变化①。在我国,钱学森提出“开放的复杂巨系统”概念,认为智能体在开放的复杂环境中进行信息等多种交换,这些具有异质性的智能体无时无刻不处于非线性关系和动态变化中,导致传统的统计技术根本无从描述其宏观状态②。同时,在复杂适应系统中,涌现性(emergence)问题也是困扰研究者从微观个体到宏观现象认识的因素之一,研究者发现,构成要素的线性加总不等于总体,从单独个体到群体的认识没有固定规则,却又不是完全随机,需要在复杂性系统内考虑多重互动③。政治系统是相互作用的复杂系统,非常适合利用复杂性理论进行分析。
基于复杂性理论,研究者意识到,传统数理统计中的假设简化忽视了环境的复杂性,把许多非线性关系假定为线性关系,并假定环境与主体间的关系是单向的,因而极大地影响了分析的精度和效度。通过将复杂的社会环境模拟为人工系统,研究者可以对社会环境变量和主体变量予以模拟设定,来研究复杂社会中的结构、功能及发展方向。黄璜教授认为,利用计算模拟来研究政治和政府过程,本质上是对传统运筹学和系统分析方法的扩展,这种扩张主要经历了宏观计算模拟、微观计算模拟和基于智能体的建模仿真(Agent-Based Modeling)阶段,并且在公共池塘治理、政治选举、社会冲突、地方自治等诸多方面研究中均有应用④。吕鹏指出,仿真模拟分为三个阶段,即系统动力学、元胞自动机(Cellular Automata)和基于智能体的建模仿真。其中系统动力学是静态的、确定性的数学推演,而元胞自动机在微观视角下采取行为规则定义行为机制,具有一定的动态性和视觉具象性,但是其系统具有封闭性,缺乏对主体间和主体环境间关系的考虑,只有智能体建模仿真才真正能够处理高度复杂、高度智能的社会系统,适应计算社会科学的发展⑤。吉尔伯特等则将社会科学中的仿真模拟研究分为三种类型:微观模拟、系统动力学模拟、智能体建模仿真。微观模拟基于微观个体的真实数据进行模拟,根据系统运行的静态规则和固有参数来运行,用数学模式来描述系统的运行规则及其后果,但是缺乏对互动关系的分析。系统动力学模拟更侧重于观察系统中的互动关系,但是对系统中主体的异质性关注不足,也忽视了不同主体的适应性和多样性。为此,吉尔伯特认为,真正将环境和主体共同考虑在内的计算模拟方法就是智能体建模仿真⑥。总之,在计算社会科学时代,智能体建模仿真能够关注人类的社会特征如主动性、有限理性、交互性和学习特征,能够关注如选举投票等动态过程,能够分析自组织和社会秩序等“涌现性”的形成,如合作演化研究等,作为一种形式模型⑦,可以模仿分析复杂性环境和智能主体的互动关系。
尽管存在复杂性科学的理论,但由于缺乏对特征变量的准确参与估计,传统的智能体建模和仿真技术发展应用范围相对有限,也难以对非常复杂的系统进行解析求解⑧。今天,在计算机编程技术和计算能力迅速发展的态势下,智能体建模仿真可以很方便地运行、停止并重新进行参数调整,这在传统的数学建模和传统建模中是很难做到的。同时,智能体建模仿真在获取数据量、绘制个体特征画像、行为模式预测等方面更加便利,其应用范围和精度都不断提升,从而成为重要的解决问题路径之一①。还有学者指出,智能体建模方法本身脱胎于计算机人工智能研究中的“分布式人工智能”和“机器学习”②。如果与大数据技术结合,智能体仿真模拟可以实现更加方便的可视化展示,海量数据让模型校对和参数调整更为便利,实时数据也使得数据测量免于滞后,数据驱动和模型模拟相互促进,能够更高效地辅助多主体建模。许多政治行为都受到政治环境、社会环境等复杂系统的影响,因此非常适合以智能体仿真模拟的方式来研究。
网络中的政治传播涉及广泛多元的主体,信息传播与演化的路径具有一定的随机性,同时也遵循一定的规律,智能体仿真模拟方法可以分析网络舆情演化过程,充分考虑群体规模、意见领袖规模、意见领袖观点等。例如,学者Ross利用智能体仿真模拟方法发现,在理想状态下仅仅控制2%—4%的核心节点就可以决定舆论的走向,这为价值引导和舆论引导提供了机制支持③。学者郭勇陈等采用智能体建模与仿真方法,在Netlogo仿真平台模拟了网络论坛舆情演化过程, 发现意见领袖在舆情初期的“形成”和“爆发”阶段影响并不大,但是在“高峰”阶段影响力巨大,且能够拉长舆情存续时间④。
政治安全研究的场景在现实生活中难以再现,且出现频次不高;但是,由于主体与环境的交互关系非常明显,因此,非常适合采取仿真模拟的方法进行分析研究。例如,恐怖袭击活动很难通过传统的问卷调查去研究,甚至大数据的统计、应然性的风险评估等也具有宏观性和静态性的特点,无法挖掘遭受恐怖袭击的群体动力学过程。而在复杂适应系统下进行计算模拟,则可以揭示其互动机制并提供决策咨询。学者吕鹏基于微观粒子运动建立智能体仿真模型来分析反恐场景中的微观机理和毁伤机制,得出很多在现实场景中很难发现却具有现实意义的结论。同时,粒子仿真也可以为反恐力量的配置、介入时机、日常演练提供精准依据⑤。
此外,传统的政治研究也可以利用智能体仿真模拟来进行创新性研究。塞尔根蒂等利用智能体仿真技术来分析政治竞选行为,认为政党活动可以被视为智能体主体和主体之间交互的产物,政党可以根据动态策略和行为规则来更新其状态和行动,并且可以据此研究不同政党之间的竞争,分析选民行为和政治环境对选举结果的影响⑥。学者还发现,在大数据时代,研究者能够收集包括个体行为、社会网络、环境因素等多方面的数据,基于这些大数据的智能体建模可以更好地研究政治决策中的群体行为和社会动态,帮助政策制定者更好地了解不同利益相关者之间的相互作用和影响⑦。在冲突政治中,每个个体都有行为的信念、偏好和策略,根据自己的利益和目标行动,而且行为主体之间的互动是在社会网络中实现,不同的社会网络形态会影响他们的行为和决策。学者通过智能体仿真模拟方法研究示威、抗议、暴力事件等冲突性政治事件,并研究不同政策、经济、社会等因素对事件发展的影响,取得了丰硕的成果①。
今天,随着技术的发展,运用现代计算技术进行仿真模拟形成了更加广泛的应用场景,例如元宇宙可以与计算仿真相结合。元宇宙从最初阶段的虚实孪生,发展到虚实相生、虚实融生,建立在生成现实空间镜像的虚拟世界上,这一思路与人为构建仿真模拟的平行系统和人工社会的思路非常接近②。因此,伴随着元宇宙的发展,人们还可以对更复杂的多维空间进行计算仿真,进一步扩展仿真模拟的场景和空间。这都为智能体仿真模拟的发展开创了更为广阔的空间。
五、计算实验:计算政治学的场域创新
2012 年,14 位国际学者在《欧洲物理学刊专刊》发表了《计算社会科学宣言》,指出实验方法与计算方法、计算机平台相结合,将促使社会科学范式发生变化,更能够链接起理论概念、经验事实和研究本身③。随着技术革命的发展,计算方法、计算平台越来越多地影响政治行为的运行规则,从而为计算政治学提供了新的场域和平台。
实验研究主要包括实验室实验、调查实验、实地实验等诸多形式,最早出现在20世纪四五十年代选举投票中的动员投票领域,随后被广泛引入政治学研究的多个领域,如公共舆论、政治传播等,以更好地挖掘政治行为的因果机制。其中,实验室实验主要源于心理学实验,人们期望借此实现更加科学的干预和控制,但其外在效度一直遭受质疑。调查实验将实验设计与大规模的社会调查相结合,包括背书实验、虚拟情境锚定等多种形态,通过受访者阅读到不同的问卷题目来实施干预,调查者可以分析不同干预下的后果,由此识别其中的因果机制。通过与社会调查结合,调查实验避免了实验室实验“方便抽样”的问题,同时也避免了研究局限于实验室的弊端,但是其外部有效性、有限的实验设计、提前暴露干预等问题,也值得研究者关注④。例如在美国实验研究最为普及的选举研究中,就主要与调查问卷结合,更多的受访者基于问卷设计的情境进行“推测”,而很少结合真实的政治情境⑤,这很容易带来对研究效度的质疑。与之相对,实地实验则主要发生在真实情境中,避免了实验室实验、调查实验的人工干预,可以有效结合真实的场景,并利用随机干预的优势,实现因果推断。
在大数据时代,互联网成为政治行为发生的重要场域,越来越多的政治现象依托计算机进行,人们的政治参与和信息传播方式也因此改变,这就给人们提供了從事政治学研究的新的场域。计算机平台的信息传播方式和互动方式,会导致社会成员行为方式的重大变化,这为学者关注政治行为的因果机制提供了新的平台和场域。计算实验平台成为大数据时代实地实验的重要平台,廉价的、可编程的计算机技术的发展促使了实验研究的迅速增加①。
第一,在计算实验平台可以更方便、更贴近现实地进行实验。虽然实验室实验受外界政治环境影响最小,但在计算实验平台进行实验研究,能够进一步扩展实验研究的设计多样化和科学化水平,可以有更多方式进行随机化分配,在智能平台APP或小程序实施干预变得非常便捷且成本很低,这也使实验对象受到的干预与现实生活更加接近。此外,政治心理学的研究,尤其是研究志愿者的招募,也可以借助在线实验室以更低成本的方式获取多元的、大量的数据②。
第二,在计算实验平台可以进行更多元化的调查实验。在计算机实验平台进行调查实验,可以向受试者施加文字、图像、视频、网络关系等非结构化干预信息,从而使实验结果的记录更为丰富和准确,可以保留文本信息、语音信息、视频信息,更好地实现实验实施效果的科学化。这既保障了调查实验的便捷性,又丰富了调查实验的现实性,还可以更好地观察干预的短期效应和长期效应③。
此外,新的计算机方法和技术也可以成为计算机实验平台的研究对象。例如,有学者针对人工智能生成信息的政治说服能力进行了实验。研究者针对4836个在线注册样本进行了三轮调查实验,来检验当参与者读完人工智能程序GPT3生成的自动说服性信息、人工事先编写的说服性信息和人工从GPT3生成信息中主动选择的信息后,改变政策禁令的程度,具体政策领域包括禁止攻击性武器、碳税和带薪产假计划。研究发现,人工智能生成信息和研究者事先编写的信息都能够极大地改变人们的政策态度,有受访者甚至认为,人工智能生成信息逻辑更强、且愤怒情绪控制更加得力。由于人工智能生成的说服性信息几乎无成本且数量无限,如果生成信息背后的算法带有偏见或者传播了错误信息,可能会导致选民改变政策态度,因而必须对基于人工智能生成信息进行规制,必须标注自己为人工智能机器人。研究同时显示,尽管人工智能语言语句连贯、逻辑通顺,但是其政治说服力仍然低于人工参与的说服性信息④。
第三,在计算实验平台进行实地实验可以大幅提高实地实验的适用性。实验研究更多分析特定的政治行为如何引发相应的政治后果,因此,政治行为“设定发生”或者“真实发生”的具体场景就构成实验研究的重要背景知识和场域。在过去的实地实验中,人们需要“设想”行为刺激的出现,同时传统的信息渠道导致产生行为刺激过程较为缓慢。许多政治学的实地实验需要进行多轮严密的设计,且花费很多资金、耗费很长时间,但其研究结果严重滞后于政治实践,使得其应用价值较低。例如,Green发现面对面拉票有助于提升投票率,然而这一结果已经是调查研究开始三年后⑤。在计算实验平台中,研究者可以依托网络设计很多实验研究,且这些研究反馈非常及时,能够及时用于下一步的政治活动。例如,在2007年奥巴马的竞选活动中,在奥巴马的竞选网站首页随机出现了24种不同的广告页面,每种页面下收集了13000多人的后续行为,结果发现当宣传广告内容是奥巴马的家人和孩子时,访问网站的人更可能注册网站并进行政治捐赠。正是基于这些发现,在后续活动中,奥巴马的选举宣传广告也主要采用其家人和孩子的照片①。另外,罗伯特·邦德(Robert M. Bond)在2010年美国国会选举期间利用Facebook向6100万用户推送了政治动员信息,最终提醒34万原本没打算投票的人参加投票。结果显示,该动员信息不仅影响接收信息的用户,还影响了用户的朋友,以及朋友的朋友,投票的动员作用符合“三度影响力”。社会信息传递的互动关系极大地影响了政治行为②。此外,计算实验平台的出现还提高了实地实验的可重复性,因为大量计算机平台上的行为本身并非出自人们的设计,而是人类在计算平台上行为的副产品,这也进一步提高了计算实验平台实地实验数据的可信度。
总之,互联网、大数据、人工智能技术不断影响人们的政治行为、社会生活和市场活动,为此,人们必须认真思考计算机、人工智能的影响。政治学科也必须与互联网平台相结合,将互联网平台作为实验场景展开研究。这就要求人们建立一批文科实验室,重点关注互联网上的政治行为,将计算机科学与政治学相结合,融合国家战略、社会需求与社科理论研究,充分利用互联网平台和人工智能场景,打造更加富有情境化的实验平台,提升政治实验开展过程中的针对性、开放性、交互性与互动性。
六、结语:作为“新文科”的计算政治学
通过梳理和分析计算政治学的发展历程和主要方法,不难发现,计算政治学是特定技术条件发展的产物,也是第四次工业革命条件下政治学发展的必然。人工智能的神经元逻辑模型算法在20世纪40年代就已经产生,但是,在个人计算机强大算力产生和便捷获取海量数据产生以前,计算机方法与政治学研究并没有实现有机结合。在21世纪初,相关研究也主要是计算机学者将政治视为一个应用场景来验证算法,而非直接研究政治行为本身。而随着计算机硬件的改善、计算机算力的提升和相关计算机应用界面的便捷化,大量政治学者开始直接分析海量的大数据,广泛利用仿真模拟方法,直接通过计算实验方法来分析互联网平台和基于人工智能的政治行为,由此形成了计算政治学的研究范式。
美国图灵奖获得者吉姆·格雷将科学研究范式按历史发展依次分为经验范式、理论范式、虚拟范式和数据密集型范式等四大类型。不难发现,计算模擬和大数据技术分别对应虚拟范式和数据密集型范式,计算实验平台则对应着经验范式在新场景下的应用,在这个意义上,范式革命绝不意味着一种范式取代另外的范式,而是意味着新的范式的出现和多种范式的综合。作为新文科的中国计算政治学,应该有机结合经验范式、理论范式、虚拟范式和数据密集型范式③,更充分地结合多种分析方法,更深入地研究新技术时代的传统议题和新兴议题。
在具体研究方法中,计算模拟、大数据分析和计算实验的结合日益紧密,可以更好地分析计算时代的政治现象。与大数据方法的归纳方法不同,计算仿真模拟通过数学推理或程序推理方式,是一种典型的演绎方法。例如,随着大数据政治学的发展,研究者可以从现有大量数据中更好地设定模型和进行参数调整,更好地分析具有自主性、目标性、认知能力和行动能力的实体如何根据其内部状态和环境因素进行智能体间互动①,并且更加科学动态地调整参数,在数据驱动基础上更好地进行智能体仿真模拟。大数据分析一般被认为是相关关系而非因果关系,借助计算实验的分析方法,研究者可以更全面地探索大数据政治学背后的因果机制②。再如,智能体仿真模拟中得出的机制规律,也可以通过计算实验平台的方式进行验证,揭示因果机制的微观实现机制③。因此,计算政治学不仅需要结合政治学和计算科学,还需要更好地结合传播学、管理科学与工程等多学科,构建计算政治学内部的交叉学科,打造符合新技术时代要求的“新文科”。
在研究議题上,计算政治学不仅应该分析具体的网络现象和议题,而且应该利用新的研究方法研究中国特色社会主义政治发展和国家治理现代化的更多新的政治议题,同时为传统政治学议题的研究带来新的分析思路和视角,由此推动中国特色政治学学术的持续创新发展,打造具有“科学性”“本土性”“时代性”和“前沿性”的世界一流的计算政治学学科。
[责任编辑 韩玲]
① 习近平:《论把握新发展阶段、贯彻新发展理念、构建新发展格局》,北京:中央文献出版社,2021年,第176页。
② 李强:《“大数据社会科学”专题主持人语》,《清华大学学报(哲学社会科学版)》2015年第3期。
① I·伯纳德·科恩:《自然科学与社会科学的互动》,北京:商务印书馆,2016年,第139-161页。
② 马克思:《政治经济学批判》,北京:人民出版社,1976年,第37-38页。
③ 苏毓淞、刘江锐:《统计分析方法与美国政治学研究》,《美国研究》2020年第3期。
④ Hayward R. Alker Jr, “Polimetrics: Its Descriptive Foundations”, Handbook of Political Science, vol.7 (1975), pp.140-210.
① Richard Ennals,“Socially Useful Artificial Intelligence”, AI & SOCIETY, vol.1 (1987), pp.5-15.
② Edith Hemaspaandra, Lane A. Hemaspaandra and J?rg Rothe, “Exact Analysis of Dodgson Elections: Lewis Carrolls 1876 Voting System is Complete for Parallel Access to NP”, Journal of the ACM (JACM), vol.44, no.6 (1997), pp.806-825.
③ Edith Hemaspaandra and Lane A. Hemaspaandra, “Computational Politics: Electoral Systems”, MFCS 2000 (Springer,2000), pp.64-83.
④ Patrick H. Winston and Mark A. Finlayson, “Computational Politics”, MIT Computer Science and Artificial Intelligence Laboratory, 2004, pp.783-784.
⑤ David Lazer et al., “Computational Social Science”, Science, vol.323, no.5915 (2009), pp.721-723.
① 严洁:《政治学研究中的抽样调查: 难点,问题与方法创新》,《政治学研究》2018年第3期。
② 李锋:《网络空间公民利益诉求的对象选择与行为特征——以全国网络问政平台的大数据分析为例》,《探索》2019年第6期。
③ 吕程平:《网民留言中的参与性、归属感与自由感——人民网〈地方领导留言板〉10省留言数据分析》,《中国农业大学学报(社会科学版)》2014年第4期。
④ 李锋:《虚拟情景锚定法如何提高问卷调查的可比性——以公民诉求影响力的测度与分析为例》,《甘肃行政学院学报》2019年第3期。
⑤ 马超、于晓虹、何海波:《大数据分析:中国司法裁判文书上网公开报告》,《中国法律评论》2016年第4期。
⑥ 孟天广、李熠:《立案登记制改革与行政纠纷解决司法化》,《中国社会科学院大学学报》2022年第4期。
① 茅明睿:《大数据在城市规划中的应用:来自北京市城市规划设计研究院的思考与实践》,《国际城市规划》2014年第6期。
② Xingjian Liu and Ying Long,“Automated Identification and Characterization of Parcels with OpenStreetMap and Points of In? terest”,Environment and Planning B: Planning and Design, vol. 43, no.2 (2016), pp.341-360.
③ Timnit Gebru et al., “Using Deep Learning and Google Street View to Estimate the Demographic Makeup of Neighborhoods Across the United States”, Proceedings of the National Academy of Sciences of the United States of America, vol.114, no.50 (2017),pp.13108-13113.
④ Scott A. Golder and Michael W. Macy, “Diurnal and Seasonal Mood Vary with Work, Sleep, and Daylength Across Diverse Cultures”, Science, vol.333, no.6051 (2011), pp.1878-1881.
⑤ Matthew J. Salganik, Bit by Bit: Social Research in the Digital Age (Princeton: Princeton University Press, 2019), p.83.
① Feng Shi et al., “Millions of Online Book Co-purchases Reveal Partisan Differences in the Consumption of Science”, Nature Human Behaviour, vol.1, no.4 (2017), pp.1-9.
② 黄璜:《数据计算与治理变革:对政府计算的研究与基于计算的政府研究》,《电子政务》2020年第1期。
③ Matthew B. Crawford, “Algorithmic Governance and Political Legitimacy”, American Affairs, vol. 3, no. 2 (2019),pp.73-94.
④ 王敏、張子柯:《计算传播学的仿真研究范式:优势、挑战与发展》,《新闻界》2022年第10期。
⑤ Steven Bankes, Robert Lempert and Steven Popper, “Making Computational Social Science Effective: Epistemology, Meth? odology, and Technology”, Social Science Computer Review, vol.20, no.4 (2002), pp.377-388.
⑥ Michael W. Macy and Robert Willer, “From Factors to Actors: Computational Sociology and Agent-Based Modeling”, An? nual Review of Sociology, vol.28, no.1 (2002), pp.143-166.
① 罗俊:《计算·模拟·实验:计算社会科学的三大研究方法》,《学术论坛》2020年第1期。
② 钱学森、于景元、戴汝为:《一个科学新领域——开放的复杂巨系统及其方法论》,《自然杂志》1990年第1期。
③ 刘晓平、唐益明、郑利平:《复杂系统与复杂系统仿真研究综述》,《系统仿真学报》2008年第23期。
④ 黄璜:《数据计算与治理变革:对政府计算的研究与基于计算的政府研究》,《电子政务》2020年第1期。
⑤ 吕鹏:《计算社会科学中仿真模拟的三个发展阶段》,《清华社会学评论》2022年第1期。
⑥ Nigel Gilbert and Klaus G. Troitzsch, Simulation for the Social Scientist (Berkshire: McGraw-Hill Education, 2005),pp.6-9.
⑦ 黄璜:《社会科学研究中“基于主体建模”方法评述》,《国外社会科学》2010年第5期。
⑧ 吴彤:《复杂性范式的兴起》,《科学技术与辩证法》2001年第6期。
① 吕鹏:《ABM仿真模拟方法漫谈》,《贵州师范大学学报(社会科学版)》2016年第6期。
② Nigel Gilbert and Klaus G. Troitzsch, Simulation for the Social Scientist (Taylor & Francis Group, 1999), p.13.
③ Bj?rn Ross et al.,“Are Social Bots a Real Threat?An Agent-Based Model of the Spiral of Silence to Analyse the Impact of Manipulative Actors in Social Networks”, European Journal of Information Systems, vol.28, no.4 (2019), pp. 394-412.
④ 郭勇陈、沈洋、马静:《基于意见领袖的网络论坛舆情演化多主体仿真研究》,《情报杂志》2015年第2期。
⑤ 吕鹏等:《反恐场景中的群体效应——基于粒子运动系统的ABM仿真模拟》,《社会发展研究》2021年第3期。
⑥ Michael Laver and Ernest Sergenti, Party Competition: An Agent-Based Model (Princeton: Princeton University Press,2011).
⑦ Lin Qiu and Riyang Phang, “Agent-Based Modeling in Political Decision Making”, Oxford Research Encyclopedia of Politics(New York: Oxford University Press, 2020).
① Eugenio Dacrema and Stefano Benati, “The Mechanics of Contentious Politics: An Agent-Based Modeling Approach”, The Journal of Mathematical Sociology, vol.44, no.3 (2020), pp.163-198.
② 王飞跃:《人工社会、计算实验、平行系统——关于复杂社会经济系统计算研究的讨论》,《复杂系统与复杂性科学》2004年第4期。
③ Rosaria Conte et al., “Manifesto of Computational Social Science”, The European Physical Journal Special Topics,vol.214(2012), pp.325-346.
④ Brian J. Gaines, James H. Kuklinski and Paul J. Quirk, “The Logic of the Survey Experiment Reexamined”, Political Analy? sis, vol.15, no.1 (2007), pp.1-20.
⑤ Alan S. Gerber and Donald P. Green, “The Effects of Canvassing, Telephone Calls, and Direct Mail on Voter Turnout: A Field Experiment”, American Political Science Review, vol.94, no.3 (2000), pp.653-663.
① Janet M. Box-Steffensmeier, Henry E. Brady and David Collier, The Oxford Handbook of Political Methodology (New York: Oxford University Press, 2008), pp.339-356.
② Jason Radford et al., “Volunteer Science: An Online Laboratory for Experiments in Social Psychology”, Social Psychology Quarterly, vol.79, no.4 (2016), pp.376-396.
③ 孟天广:《从因果效应到因果机制:实验政治学的中国路径》,《探索》2017年第5期。
④ Hui Bai et al., “Artificial Intelligence Can Persuade Humans on Political Issues”, February 5, 2023. https://doi. org/ 10.31219/osf.io/stakv.
⑤ Donald P. Green, Alan S. Gerber and David W. Nickerson, “Getting Out the Vote in Local Elections: Results from Six Doorto-Door Canvassing Experiments”, The Journal of Politics, vol.65, no.4 (2003), pp.1083-1096.
① Dan Siroker, “Obamas $60 Million Dollar Experiment”, November 29, 2019, https://www.optimizely.com/insights/blog/ how-obama-raised-60-million-by-running-a-simple-experiment/.
② Robert M. Bond et al., “A 61-million-person Experiment in Social Influence and Political Mobilization”, Nature, vol.489,no.7415 (2012), pp.295-298.
③ Tony Hey, Stewart Tansley, Kristin M.Tolle, The Fourth Paradigm: Data-Intensive Scientific Discovery (Microsoft Re? search, 2009), pp.xvii-xxxi.
① Michael W. Macy and Robert Willer, “From Factors to Actors: Computational Sociology and Agent-Based Modeling”, An? nual Review of Sociology, vol.28, no.1 (2002), pp.143-166.
② 孟天廣:《政治科学视角下的大数据方法与因果推论》,《政治学研究》2018年第03期。
③ Elizabeth Bruch and Jon Atwell, “Agent-Based Models in Empirical Social Research”, Sociological Methods & Research,vol.44, no.2 (2015), pp.186-221.