当人工智能“遇见”计算社会科学
2019-12-16郦全民
【摘要】 计算社会科学和引爆人工智能的深度学习均是在大数据的催生下兴起的。通过对计算社会科学和人工智能的简要考察可以发现,人工智能与计算社会科学的关系是双向的,也就是说,前者能够积极地推动后者的研究和发展,后者也可以对前者产生正向的作用或者将前者作为研究对象。如果能实现人工智能与计算社会科学的“携手”,我们不但能更清晰地描述人与人之间的信息互动过程和模式,而且能更合理地解释社会现象及其发生机制,更准确地预言人的日常行为和社会系统的发展趋势。
【关键词】计算社会科学 人工智能 智能社会
【中图分类号】TP18 【文献标识码】A
【DOI】10.16619/j.cnki.rmltxsqy.2019.20.001
近年来,由深度学习引爆的“人工智能”,迅速成为科技领域乃至日常生活中的流行词;差不多同时,在社会现象的研究中,亦兴起了一门颇受关注的新学科——计算社会科学。从成因上看,深度学习和计算社会科学均是在大数据的催生下产生和走红的。那么,它们之间是否存在内在的关联?或者,是否可以展开实质的互动?如果两者“携手”,对于人类社会的未来又有什么意义?本文中,我们试图对这些问题作些探究。
社会研究的计算进路
中国有句古语:“秀才不出门,尽知天下事”。在信息媒介十分有限的古代,这只是一种夸张的说法。而如今,几乎每个人都成了“秀才”:只要打开手机,天下大事便可一目了然。当我们被各种各样的信息所包围、冲击时,与以往任何时候相比,我们似乎对人世间所发生的事知道得更多也更及时了。但是,我们真的理解人类社会的当下状态及其运作机制吗?我们真的可以预料这个社会将会如何演进吗?答案似乎又是否定的。于是,当许多人面对这个日新月异的世界时,陷入了一种“知情的困惑”("informed bewilderment")的境地。[1]
人类社会之所以很难研究和理解,一个重要原因在于它是一个动态演进的复杂系统。这种复杂性不仅体现在个体层面:每个人具有自主性和决策能力,因而在行为上显得独特,更体现在个体之间、个体与群体之间以及群体与群体之间互动方式的多样性和不确定性,结果,生成了许多突现的社会现象。不仅如此,人类发明的技术(尤其是媒介技术)还使得社会成员之间交往的方式和频度不断发生改变,总体上导致社会系统的复杂性日益增加。
因为缺乏有效的工具和方法对社会成员之间多样的、实时的互动进行实证的考察,传统的社会科学面对社会系统的复杂性时显得“力不从心”,只得依赖于个案研究、抽样调查和宏观分析等局部的或粗略的方法,难以揭示复杂社会现象生成的机制和模式。进入21世纪后,这种情况开始发生改变。
技术导致社会系统复杂性的增加。不过,技术也可以把人的活动限制在所设定的范围,且有些技术产品还能记录处理个体或群体的行为和互动的信息,这样,就为研究社会现象及其产生机制创造了条件和工具。如今,人类正处于技术的这种两重性凸显的时代:以计算机和互联网为标志的信息技术在不断增加社会复杂性的同时,也为我们认识和理解这种复杂性提供了工具和方法。具体一点说,随着互联网等媒介的迅速发展和普及,人类社会中个体或群体之间传播和交流信息变得比以往任何时候都便捷、快速,且极大地突破了地域的限制,社会系统的复杂性和演进的不确定性也大大增加。与此同时,可广泛进行信息收集和记录的工具也应运而生,如目前已普遍使用的各种网络监控设备和传感器,加之计算机处理信息的能力不断提升,这就能为研究复杂的社会现象和人的行为提供大量的、多类型的和实时的数据。正是在这样的背景下,一条社会研究的新进路——计算社会科学——得以产生和发展。
那么,究竟什么是计算社会科学?虽然有关的研究甚至这一概念此前已经存在,但作为一个交叉学科或研究进路的名称,计算社会科学2009年春才开始流行。当时,一群社会科学家和计算機科学家联名在《科学》上发表了“计算社会科学”一文。[2]但在这篇带有宣言性质的文章中,作者们并没有给出“计算社会科学”的定义,而是强调了它的两个特点:它是由数据驱动的研究人的行为和社会互动的新进路,它是由一群计算机科学家、物理学家和社会科学家等协同创立的交叉学科。晚些时候,主要由欧洲学者联合发表的“计算社会科学宣言”中,同样没有关于计算社会科学的界定,也只是强调了它是一门交叉学科,并由信息通信技术所驱动。[3]由于信息通讯技术是数据收集和处理的工具,故数据驱动和信息通信技术驱动之间并没有实质的不同。2011年成立的美国计算社会科学学会的网站上倒是给出了一个定义:“计算社会科学是一门借助社会模拟、社会网络分析和社会媒介分析研究社会的和行为的动态(dynamics)的科学。”[4]不过,这个定义似乎并不十分恰当,因为其没有明示上述两份宣言所强调的特点。在第一本以计算社会科学命名的教科书中,作者乔菲里维拉(C. Cioffi-Revilla)下了这样一个工作定义:“计算社会科学是运用计算手段,在个体到群体的多个尺度上,对社会世界(social universe)进行跨学科研究的新领域”,同时指出它并不限于“大数据,或社会网络分析,或社会模拟模型”。[5]可以看出,这个定义较好地刻画了计算社会科学的特点。
近10年来,这门新兴的交叉学科得到了蓬勃发展。研究成果频频出现在《科学》和《自然》等以往主要刊登自然科学论文的顶级杂志上;2018年,专业性的《计算社会科学期刊》正式面世;研究中心和专业学会相继成立;不少世界著名大学已设立相应的课程或学位。从研究的对象看,计算社会科学几乎包括人类社会的方方面面,特别是经济、政治、文化和社会生活中的复杂现象,形成了计算社会学、计算经济学、计算历史学、计算政治学和计算法学等数量众多的分支。
目前,在计算社会科学中,存在着两种基本的研究策略。一种是通过抽象来建立可操作的基于自主体模型(Agent Based Modeling)。采取这一策略,尽管无法对社会网络的结构和过程进行逼真的复制和再现,但通过抓住体现自主体(个体或群体)之间互动的基本的或主要的属性和关系,在计算机上实现模型的运行,可以探索相对应的社会结构和过程的一般模式。如今,基于自主体模型是进行社会理论研究和为决策提供优化方案的主要方法之一。另一种更为自然的策略是对社会现象进行直接研究。既然一个社会系统可看作自主体之间信息互动的动态网络,那么,只要拥有记录和处理承载信息的数据的工具和方法,就能对信息分布和互动的模式进行直接的描述,从而直观地把握社会现象和过程。事实上,大数据和云计算等技术工具,可为我们理解社会现象提供更广、更深和更丰富的经验数据。正因为如此,运用大数据分析社会现象和人的行为已经成为计算社会科学研究的热点。[6]
引爆人工智能的深度学习
在简要地阐述了计算社会科学之后,我们再来说说人工智能。近年来,在科技界、产业界乃至传媒领域,恐怕再难以找到比“人工智能”更夺人眼球的专业词汇了;国内的高等学校也纷纷成立人工智能专业甚至学院。这中间,当然存在着大量的“虚火”,但有一点是肯定的:一些人工智能技术或产品开始进入人们的生活。
人工智能作为一门学科,如果从1956年正式命名算起,已有60余年。这期间,在大学里,人工智能基本上只是作为计算机科学的一个分支甚至一门课程,而它的发展历史也相当曲折,几起几落。究其原因,主要还是在于人工智能自身的特质。尽管不同的研究者对于人工智能所要实现的具体目标在理解上不尽相同(如有人倾向于对智能本质的探究,而另一些人则更侧重建构有用的智能系统),但该共同体核心的多数成员对基本目标的认识还是一致的:即通过建构人工的智能系统而理解智能,尤其是人类级的智能。就基本目标而言,人工智能理应被看作一门经验科学。[7]不过,与其他经验科学相比,人工智能所运用的方法却是非常独特的。一般地,经验科学是在预设对象存在的前提下,运用实验等手段获取关于对象的数据,提出假设以解释或预言这些数据,并实现两者之间的互动。人工智能则并不着眼于对存在的智能(如人的智能)的直接研究,而是试图通过建构人工的智能系统以达到对智能(包括自然的和人工的)的理解。由于建构这样的系统是一个发明的过程,其方法和产品也可以为人所用,故人工智能又常常被看作是一门技术。正是由于这一独特的方法,人工智能在学科性质上具有科学和技术的两重性。
由于人具有智能,这就为建构人工的智能系统提供了存在证明。而从现象上看,最能体现人的智能似乎是知识和对知识的操作(推理),于是,在人工智能发展的早期,形成了基于知识处理的符号主义范式。在这一范式的指导下,多数研究者将智能视作知识+推理,于是,注意力集中于知识表示、自动推理和自然语言的形式处理等,并且往往只侧重于某一方面。这样的研究虽然发展出了不少有用的技术,也融入了各种应用的计算系统,但却没有形成一个真正能够在实际环境中展现智能(哪怕是动物智能)的人工系统,于是乎,只是“为他人做嫁衣”。结果,在20世纪80年代初,这种主流的人工智能落入了低谷。
也许,理解智能不应先着眼于像知识和知识处理这样到了人的阶段才发展出的高级智能,而应关注像视觉识别和适应性学习这些更为基本的能力。这些能力均由动物(包括人)的神经网络来实现,因此,人工智能应该模拟和建构人工的神经网络。事实上,这种想法比电子计算机的问世还早,但一直未能发展起来。首先改变这种局面的当推物理学家霍普菲尔德(J.J.Hopfield)。他在1982年成功地运用统计物理学方法研究人工神经网络,于是出现了一个研究人工神经网络的小高潮。不过,由于在人工智能领域,基于知识处理的符号主义还占据统治地位,加之人工神经网络的实现条件尚未成熟,结果,这些神经网络的研究者一直处于边缘的地位。
只有到了2012年,“时来运转”的局面才开始发生。对人工神经网络的理论研究表明,要让一个系统(机器)具有较强的学习能力,需要建构具有多个中间层(深度)并带有反馈等机制的神经网络,但这需要所实现硬件具有强大的计算力。2012年前后,人们开始意識到,原本用于图形的处理机(GPU)可以提供这种计算力。同时,要让系统能够通过学习并在此基础上作出决策或预测,还需要输入大量数据对其进行训练,而网络和各种数据收集器可以提供丰富的数据。在计算力和大数据这两个主要条件满足后,基于深度神经网络的深度学习(机器学习的一种)开始引起人们的关注。
2016年春,当谷歌公司旗下的DeepMind基于深度学习和强化学习开发出击败围棋世界冠军的AlphaGo以后,人工智能在大众媒体中迅速走红,并通过人脸识别和语音处理等开始影响人们的生活。目前,深度学习等人工智能技术已经在图像分类和聚类、自然语言处理等方面取得了很大的成功,并在网络安全、自动驾驶、医疗健康、教育和科学研究等领域展示出巨大的应用前景。
人工智能“遇见”计算社会科学
接下来,我们就可以来谈谈人工智能与计算社会科学之间的关联。如前所述,计算社会科学很大程度上是在大数据的催生下兴起的。如今,生成关于人的行为和人与人之间互动的数据最多的场景就是网络世界,特别是社交媒体,而且随着人们的工作和生活越来越依赖网络,可用于研究人的行为和社会互动的数据也就愈加丰富和全面。
因此,计算社会科学的一个主要任务是利用由网络世界提供的大数据来探寻人的行为模式和社会演变的规律。但面对体量极大、类型众多和实时生成的大数据,又该如何处理和分析,以便从中挖掘出有价值的行为模式和社会规律呢?显然,单靠人的能力和传统的统计工具是无法胜任这项工作的。这里,就需要人工智能等技术的帮助。例如,在社交网络中,假新闻或谣言是如何传播的?这是计算社会科学家关注的一个重要议题。借助于人工智能等技术手段,通过对网络中形成的大数据进行分析,研究人员发现:达到相同的传播深度,假新闻的传播速率是真新闻的20倍。[8]近年,人们还基于深度学习开发出辨认谣言的监测模型。
计算社会科学家,运用计算进路寻求社会中成员的行为和成员之间互动的模式,不仅希望借此能对社会现象(特别是社会系统的复杂现象)作出合理的解释,更希望能对社会系统演进的状态或事件作出尽可能准确的预言(预测)。目前,人们之所以热衷于收集和处理大数据,主要目的也是为了预言人的行为或社会演进的趋势。然而,由于人和社会均是复杂系统,这使得作出准确的预言非常困难。事实上,传统的社会科学,即使是运用了大量数学的经济学,虽总能解释社会现象或事件,但这种解释基本上属于“马后炮”,而在预言尚未发生的社会现象方面则几乎是一部失败的历史。那么,计算社会科学是否能够克服传统社会科学在预言上的“无能”呢?这是目前关于计算社会科学以及大数据究竟有多大价值的争论中所关注的一个焦点问题。
近年来的研究和实践表明:如果能与人工智能(特别是机器学习)技术相结合,计算社会科学的预言功能可以得到较大幅度的提升。其实,深度学习就是通过对实现于深度神经网络的学习算法进行大量数据的训练,以便在新的数据输入后,能产生最优的输出,即作出最好的预测或决策。这样,当计算社会科学家获得了描述人的行为或社会现象的更多、更可靠的数据和经验规律后,就可以基于这些成果建构和训练一个具有学习功能的智能系统,从而更好地预言相应系统的状态和行为。这种结合人工智能技术预言人的行为和社会现象的努力是计算社会科学研究的主要任务。目前,借助网络等提供的大数据,在预测消费者的行为、某个区域发生恶性犯罪的可能性和金融市场的趋向等方面大大地提高了效率和可靠性。据报道,最近美国总统特朗普也要求社交网络公司开发可以预言潜在枪击者的软件技术。[9]
显然,预言人(个体和群体)的行为或社会现象对于决策和行动都是极其重要的。如果一种理论或技术能提高预言的精准度,必定会引起人们的关注和重视。正因为如此,2018年春,《科学》杂志推出专题讨论社会科学中的预言问题。[10]可实际上,鉴于人和社会系统都是复杂的,即使运用了大数据和人工智能技术,对人的行为和社会演进的状态等的预言也存在很大的限制。近年来,许多实际应用的成功表明,对于重复性的行为和社会演进的趋勢性(实际上也是重复的)现象,运用计算社会科学的成果,再结合大数据和人工智能技术,确实能够提高预言的精准度。然而,对于人的突现行为和社会系统的突现现象,复杂性理论和计算理论已经告诉我们,原则上无法作出准确的预言,而这是由复杂系统的内在特性决定的。[11]不过,由于人的绝大多数日常行为是重复性的或者是对他人行为的模仿,且在许多情况下,社会系统演进的趋势也往往会持续一段时间,所以,运用大数据和人工智能技术作出更准确的预言仍是大有可为的。
其实,人工智能与计算社会科学的关系是双向的,也就是说,前者能够积极地推动后者的研究和发展,后者也可以对前者产生正向的作用或者将前者作为研究对象。这主要表现在三个方面。其一,由于社会系统的复杂性,对于计算社会科学面对的许多具体问题(如金融领域的突现现象,社交网络中人们观点的极化现象,等等)并不存在通用的人工智能算法,故需要人工智能的研究者针对问题探寻和设计具体的智能算法,因而,可以推动人工智能本身的发展和应用。比如,为了向网络上的用户精准地推送信息,就推动了基于机器学习和贝叶斯推理的智能推荐算法的开发,也促进了对具有一定自主性的智能体的研究。
其二,计算社会科学的成果可以为人工智能的研究提供思想资源或方法。比如,人工智能的主要目标之一是建造具有决策功能的智能体,它能代表设计者或使用者,且有一定的自主性来展开行动。当建造具有多个智能体组成的系统时,研究者就需要赋予每个智能体以自我利益和基于某种理性原则的实用推理机制。而这样的智能体以及其与环境相互作用时表现出的决策行为和影响这些行为的机制正是经济学(特别是计算经济理论)所研究的问题。事实上,前些年,人工智能研究者已经根据经济学的市场原理建构了计算市场模型,用于设计多智能体系统。
其三,随着人工智能技术和产品越来越多地应用于经济、政治、文化以及其他社会生活,势必会改变社会的结构和人们的工作、生活的方式,因此,要求社会科学的研究及时跟进甚至作出前瞻性的判断或预测。而在这方面,计算社会科学可以发挥重要甚至特殊的作用,因为它能对社会结构和人的行为变化作出定量的、实时的刻画,并发现其中的模式。例如,智能机器人在制造业乃至服务业的广泛使用,必将导致就业人员和结构的改变,继而又改变社会中资源和财富的增长和分配方式,而运用计算进路对于这些问题进行研究,不仅可以更好地理解社会现象和社会变迁,而且能够为政策的制定提供思想和理论支撑。
“携手”创建智能社会
诚然,当下人们关于人工智能的聚焦点主要集中在自动驾驶、图像分类和聚类、语音识别和机器翻译等方面,以及具有巨大应用前景的物联网、医疗健康和教育等领域;相对而言,对于其与计算社会科学的关系则关注得并不多。然而,一些有识之士已经敏锐地注意到两者相结合的重要性和巨大价值。比如,著名的人工智能学者、图灵奖得主莱迪(R. Reddy)两年前就在一次国际会议上倡议:“计算机科学和人工智能必须拥抱计算社会科学”。[12]当越来越多的人工智能技术应用于社会生活的各种领域,定会改变人们的行为和人与人之间的互动方式,也会改变人所处的社会环境甚至自然环境。这就要求计算社会科学家探究社会中个体或群体之间相互作用的基本模式,发现这些模式随着智能技术和产品的介入而导致的种种问题,并积极地寻找解决问题的方案;而这中间,他们也可以利用人工智能提供的工具和方法。因此,这种“拥抱”是很有必要也是十分自然的。
不论是从历史还是当下,均可以看出,技术驱动社会演进的趋势是无法逆转的。当人工智能发展到可产生实际应用的技术和产品时,这种驱动力也就开始发挥作用。与以往不同的是,智能技术和产品可以放大人的自然智能,或者替代人的智能活动,而“智能”(严格地说高级智能)通常被看作是人之所以为人的特质。因此,在人的自然智能和人工智能的协同作用下,总体上,人类社会将进入一个智能的新时代。在这样的大背景和大趋势下,拒绝或回避这个时代是不太可能的。所以,现实的选择是积极地拥抱人工智能,并通过社会的计算研究来认识其对人的正向的和负面的效应,并尽力发挥其对于人类社会的正向作用,扼制或避免可能带来的副作用(比如对个人权力的不正当侵犯)。也就是说,让人工智能与计算社会科学之间实现“携手”,来共同设计和建构一个更加美好的智能社会。
我们知道,人类社会的具体制度和规则正是人自身选择和设计的产物,因此,究竟依据什么来指定目标和设计制度就成为社会科学研究的主要任务之一。从理性的角度讲,科学地理解社会现象并弄清其中的机理和规律,在此基础上对社会演进的可能性作出客观的评估,是人们指定社会目标和设计制度的基本前提。人类社会的历史一再表明:倘若基于某种非科学的信仰,或者盲目武断地,指定目标和设计制度,那就不是理性的,通常会对社会和人自身产生可怕的后果;如果仅仅依据经验作出这样的决策,则虽然可以是理性的,却往往显得短视和片面,所设计的制度很可能缺乏效率,或者产生的结果违背设计者的初衷。诚然,传统的社会科学在指定目标和设计制度方面一直发挥着作用,但由于其自身存在的局限,从效果上说并不那么理想。
如今,如果能实现人工智能与计算社会科学的“携手”,那么,我们不但能更清晰地描述人与人之间的信息互动过程和模式,而且能更合理地解释社会现象及其发生机制,更准确地预言人的日常行为和社会系统的发展趋势。特别是,虽然对于人的复杂行为和社会的复杂现象无法作出准确的预言,但这不妨碍我们运用机器学习等手段建立相应的模型,并通过对模型演化的种种可能性进行探索和分析,从中找到产生突现现象的条件和机制,从而为理解和设计社会系统提供可参考的合理依据。
事实上,对如何利用人工智能和计算社会科学的成果来进行社会系统设计,从而为人类建构更好的未来社会,近年来已经有人作了有益的探索。例如,几年前,由计算社会科学家佩特兰(A.Pentland)所带领的团队,运用大数据、智能技术和计算社会科学的方法,对大小不等的社会系统进行了实证研究,发现一个系统的效能(生产能力和创造性输出等)主要取决于其中个体思想交流的参与程度和从外部引进新思想的探索能力。然后,他们将这些成果用于设计或改进公司和商业社交网络中思想交流的结构,结果,生产效率、创造力或盈利能力均有了明顯的提高。[13]可以预期,随着人工智能与计算社会科学的携手发展,在推进社会进步和人类福祉方面,两者均将发挥越来越大的作用。
(本文系国家社科基金重大项目“基于虚拟现实的实验研究对实验哲学的超越”的阶段性成果,项目批准号:15ZDB016)
注释
[1]https://www.edge.org/conversation/john_naughton-the-state-of-informed-bewilderment.
[2]D. Lazer, et al., "Computational Social Science", Science, Vol. 323, Issue 5915, 2009, pp. 721-723.
[3]R. Conte. et al., "Manifesto of Computational Social Science", The European Physical Journal, Special Topics 214, 2012, pp. 325-346.
[4]https://computationalsocialscience.org.
[5]C. Cioffi-Revilla, Introduction to Computational Social Science, London: Springer-Verlag, 2014, p. 2.
[6]C. Cioffi-Revilla, "Bigger Computational Social Science: data, theories, models, and simulations—not just big data", The 8th International ACM Web Science Conference, Hanover, Germany, May 22–25, 2016.
[7]H.A.Simon, "Artificial Intelligence: an empirical science", Artificial Intelligence, 77(1), 1995, pp. 95-127.
[8]S. Vosoughi, D. Roy and S. Aral, "The spread of true and false news online", Science, Vol. 359, Issue 6280, 2018, pp. 1146–1151.
[9]https://www.theverge.com/2019/8/5/20754761/trump-social-media-companies-mass-shooting-predictions-el-paso-texas-dayton-ohio.
[10]Science, Vol. 355, Issue 6324, 2017.
[11]郦全民:《用计算的观点看世界》,广州:中山大学出版社,2009年,第46~48页。
[12]http://static.springer.com/sgw/documents/1652325/application/pdf/WWWJ+CFP+-+Computational+Social+Science.pdf.
[13]A.Pentland, Social Physics, New York: The Penguin Press, 2014, pp. 25-42.
责 编/马冰莹