在线社交网络控制实验的现状与展望
2020-03-12金诚江婷君闵勇金小刚葛滢常杰
金诚,江婷君,闵勇*,金小刚,葛滢,常杰
(1.浙江工业大学计算机科学与技术学院,浙江杭州310023;2.腾讯科技(深圳)有限公司,广东深圳518057;3.浙江大学计算机科学与技术学院,浙江杭州310027;4.浙江大学生命科学学院,浙江杭州310058)
1 在线社交网络的机遇与挑战
在线社交网络是一种具有多功能服务的数字交互社区[1]。在当今社会,在线社交网络已成为观点、信息、行为和文化传播的主要载体[2-7]。至今,大规模在线社交网络(如微博、微信以及Twitter、Facebook 等)已经形成了一个个独立的生态系统,拥有其独特的超空间结构属性和动力学行为[8-11]。这些生态系统对信息传播、群体行为、制度创新以及社会治理产生重大影响[1]。随着移动通信设备和移动网络的发展,在线社交网络的触角已经深入人们的日常生产和生活,从而成为现代社会的基础核心组件之一。然而,由于在线社交网络展现出的独特性质,分析在线社交网络形成和变化中的因果关系和机制成为计算机科学和社会学共同面对的一项巨大挑战[12]。
与传统的线下社交网络相比,在线社交网络具有4项特性。(1)在线社交网络呈现高度的“自组织”性。在线社交网络的基础是用户及其自生产内容(usergenerated content)和基于个体间交互的传播模式,使得在线社交网络本质上是一个去中心化的自组织系统[13]。(2)在线社交网络拥有更高的连接密度和强度。有研究表明,在线社交网络的强联结(strong tie)数量是线下网络的4~5倍[14-15]。(3)在线社交网络的“非对称性”。线下社会关系通常呈现互为朋友的对称性,而微博和Twitter 等在线社交网络服务则使用了“关注/被关注”这样的非对称模式。这种模式导致一些热门用户具有数百万甚至数千万的关注者,从而使得连接度数的长尾分布特征更加明显[16]。(4)在线社交网络拥有更强的“结构动态性”。受益于互联网技术的发展,用户可以快速灵活地调整自身的线上社交关系[17],例如添加或删除好友。这些特征为传统社会科学的研究带来前所未有的机遇和变革;同时,也促进了计算社会学的出现与发展[18]。2018年3月,Science上接连发表2篇论文证明假新闻传播对构建安全信息空间带来的威胁[7,19]。同时,媒体发现Facebook 上数千万用户的隐私数据被违规滥用并影响了美国大选的投票过程[20]。因此,理解在线社交网络的形成与演化机理以及其对信息传播和群体行为、情绪及心理的影响,对于探索现代人类社会规律有着重要的理论意义。同时,也对现代社会治理和经济发展有显著的实践价值。
2 在线社交网络的观测研究
目前,针对在线社交网络的实证研究主要依赖于观测研究方法(见图1)。观测研究(observational study)指在自然状态下对研究对象的特征进行观察、记录,并对结果进行描述和对比分析。观测研究对研究对象不施加任何人工干预,仅仅通过采集观测数据。在社交网络实证研究中,研究者通常利用大量观测样本进行统计分析。例如,BAKSHY 等[21]通过分析1 010万美国Facebook 用户数据,证明了用户选择行为对信息极化的影响。而SCHMIDT等[11]通过分析3.76万用户的新闻消费数据,重构了Facebook的信息传播空间,剖析了新闻消费极化的原因。尽管现代计算机和信息技术的快速发展使得研究者可以获得关于某个社交网络大量而越发完整的信息,但数据量越是巨大,其所涉及的潜在影响因子和噪音也可能越大,这些噪音会对数据分析产生较严重的干扰,从而影响分析结果。在观测研究中,研究人员通常无法控制变量,不能对研究对象施加干预,因而推断大数据中蕴含的因果关系并不容易。同时,大规模使用真实用户数据也面临侵犯个人隐私等道德风险。
图1 社交网络研究方法比较Fig.1 Comparison of social network analyzing methods
为克服纯粹观测方法的缺陷,研究者巧妙地利用了自然实验(natural experiment)或准实验(quasiexperiment)方法获得社交网络数据(见图1)。自然实验或准实验本质上依然属于利用观测数据的研究方法,其中实验组和对照组中的研究对象是由自然或研究人员控制之外的其他因素分配的,但整个过程类似于随机分配[22]。相较纯粹观测研究,自然实验或准实验为因果推断提供了更好的基础。例如,PHAN 等[6]以美国2008年的艾克飓风为背景,通过分析受到飓风影响和未受到飓风影响的地区的Facebook 使用情况,揭示了自然灾害后社会关系的发展动态。VOSOUGHI 等[19]分析了Twitter 上传播的126 000个新闻报道,这些新闻被划分为真实新闻和虚假新闻。研究发现,人类行为比自动转发新闻的社交机器人更能助长虚假新闻的传播。相比于以上利用研究对象自然属性的分组方式,CHEN等[23]利用了亚马逊公司(Amazon)网站的功能变化,研究了产品口碑(即消费者对商品的评分)和观察性学习(即商品的浏览者和最终购买者的比例)这两种社会互动对用户消费行为的影响。
尽管通过巧妙的设计,研究者可以利用观测数据进行对比分析和因果推断。然而,非受控的观测数据依然极大限制了在线社交网络研究的自由度,例如自然实验的对照组和控制组并非人为分组,而是自然条件下形成的分组,本身各组并非均匀分配,实验数据的采集也存在一定限制,研究的延续性和可重复性也受到极大限制。与之对应的,尽管控制实验涉及人为干预,成本较高、样本量有限,在实验设计和实施难度上更为苛刻,但控制实验逻辑程序严密,通过人为控制分离和突出受控变量的作用,能够为因果关系分析提供更加坚实的基础。随着网络应用技术和大数据技术的提升,可控制的在线社交网络实验这一研究思路具备了实施基础。
3 在线社交网络的控制实验研究
控制实验是指在受控条件下进行的科学测试,即在每次实验中,仅有一个或少数几个因素变化,而其他因素保持不变。相较于观测数据分析,控制实验中的研究对象受实验设计者控制,因此,能够通过较少量的样本探索控制因素与实验结果之间的因果关系。由于控制实验要求较高,而在线社交网络环境复杂、用户数量巨大且分布广泛,因此,控制实验方法在大尺度在线社交网络的研究中并不常见。但是,几乎所有控制实验所得到的研究成果都具有很高的理论水平和实践价值。本节将从实验模式、实验方法和工具以及当前研究进展三方面评述当前在线社交网络的控制实验研究。
3.1 实验模式
社交网络实证研究目前可分为2个主流分支:一个是以复杂性科学和大数据科学为基础,以在线社交网络为对象的观测研究;另一个是以控制实验方法为基础,以线下社交网络为对象的实验研究。现有的在线社交网络的控制实验研究模式基本上由这2个分支发展与演化而来。
第1种可称之为“嵌入”模式,该模式呈现出从复杂性科学理论分析和大数据观测研究到控制实验的演进历程(见图1),继承了复杂性理论分析中的抽象模型和模拟研究思路以及大数据观测研究对于数据实时性和真实度的要求。嵌入模式通常直接在真实的大尺度社交网络(如Facebook和Twitter)上进行实验,实验规模巨大,通常涉及数万乃至数千万用户。例如,在ROBERT 等[24]的实验中总共涉及约6 100万Facebook 用户。由于规模巨大,该模式所采取的控制措施通常相对简单,仅对用户操作、信息和界面进行少量干预。同时,该模式通常需要相关社交网络服务提供商进行配合或支持。嵌入模式是一种直接以真实的在线社交网络服务为研究对象,通过对社交网络服务功能的调整将实验干预嵌入到真实网络中,直接探索在线社交网络的特定属性和机制对于信息传播以及用户行为的影响。
另一种可称之为“平台”模式,该模式呈现出从传统线下社交网络到线上社交网络的演进历程,结合了线下实验的严谨控制方式和线上社交平台的便捷性。该模式的规模介于传统线下网络实验和“嵌入”模式实验之间,通常在千人量级。同时,该模式借助互联网技术创造自己的实验社交网络或应用,并不依赖真实社交网络服务提供商。因此,平台模式是一种将传统线下控制实验转移到线上平台执行的模式,充分利用互联网和计算机技术,扩大了线下实验的规模,同时能够对更复杂的影响因子进行控制,并模拟部分在线社交网络的操作与特征,更便于进行社交网络结构演化以及心理学实验研究。例如,CENTOLA 等[3,25]的虚拟健康社区实验就能够针对社交网络的结构进行控制对照实验。
3.2 实验方法和工具
在线社交网络控制实验研究中,应用最为广泛的实验方法和工具主要包括电子邮件服务、自主开发社交网络/应用、社交网络定制和众包服务。
3.2.1 电子邮件服务
在社交网络研究中,最早被利用的互联网工具是电子邮件服务。小世界等经典社交网络理论都依赖于电子邮件得以验证[26]。
3.2.2 自主开发社交网络或应用
自主开发的社交网络或应用指的是研究人员自主开发小型的在线实验社交网络服务(如CENTOLA 等创建的虚拟健康社区系统[3,25]),或利用真实社交网络服务提供者的官方应用接口开发的嵌入式应用(如微博平台上的微盘等应用)开展的控制实验研究。例如,DETERS 等[27]通过让参与者添加一个研究室的Facebook 账号为好友,从而可以通过研究室账号来动态获取用户授权的各类信息或调控用户行为,并开展分析研究。
3.2.3 社交网络定制
社交网络定制是指由在线社交网络提供商主导,通过直接修改现有社交网络服务平台(如微博、微信及Twitter、Facebook 等)某些功能和显示(如新闻排序、好友动态等),进而控制用户的信息获取或行为动作。利用社交网络定制来执行控制实验是最为自然的一种方法,但同时由于受到服务提供商的限制,也是准入门槛最高的一种方法。例如,在2010年美国国会选举期间,ROBERT 等[24]通过定制的Facebook 界面控制用户是否能看见其好友的投票动态,进行了随机对照试验,验证了在线社交网络在政治动员上的巨大潜在价值。
3.2.4 众包服务
众包(crowdsourcing)是指机构把过去由固定人员执行的工作任务,以自由自愿的形式分配给非特定的大众网络的做法。目前的众包平台允许研究者利用互联网技术定制特定实验任务系统,并开放给大众志愿者协作完成。例如,LI 等[28]在众包平台MTurk 上进行了社交困境实验,他们从控制实验的角度,检验2种网络互惠机制和有代价惩罚机制的效果。
表1 在线社交网络控制实验的模式、工具与优缺点Table1 Schema and tool of control experiments in online social network
表1展示了上述4种实验方法和工具所属的研究模式和相应的优缺点。电子邮件服务是最为大家所熟悉的一项互联网应用,准入门槛低,但能够体现真实的社交关系,适合研究网络拓扑结构及其演化、组织架构设计、信息传播以及人类行为等问题。但电子邮件服务最大的问题就是缺乏现代社交网络的一些特征和传播模式,而更多地贴近传统的人对人信息分发模式。自主开发社交网络和应用的方法能显著提高研究人员的控制权,适合控制因子较为复杂的实验需求,然而这种方法前期设计和开发难度大,成本较高。与前两者相比,社交网络定制方法不仅能体现真实的社交关系,而且有很高的可控性、适用性和灵活性,但准入门槛是所有方法中最高的,一般只能由社交网络服务提供商主导。众包服务本身并不是社交网络,但其能让研究人员接触大量用户并建立自主设计的控制实验[29]。基于众包服务的实验环境特别适合平台模式的控制实验,能够有效降低实验难度和成本,性价比最高,适合行为学、心理学和经济学领域的研究人员。
表2 在线社交网络控制实验研究总结Table2 Examples of experimental online social network research
虽然在线社交网络研究和计算机技术关系密切,但是,现有控制实验所使用的计算机技术还是比较原始的。例如,CENTOLA 等[3,25]创建的虚拟健康社区系统,仅仅利用了最基本的数据存储和网页开发技术。而在社交网络定制方法中,实验者更多依赖于现有社交网络服务的架构[24]。在数据分析中,主要采用传统的统计分析工具,对新兴的大数据智能分析和可视化技术应用较少。目前,在实验数据分析中使用频率最高的智能技术主要是自然语言处理相关的算法,包括文本分类和情绪识别等[36]。这主要得益于社交网络分析中主要的内容传播和用户行为心理研究都依赖于对于文本内容的语义分析。相较于比较成熟的行为经济学实验领域,在线社交网络控制实验尚缺乏类似oTree 这样功能丰富且技术先进的开放性实验平台[39]。oTree是利用现代HTML5 前端和数据存储分析技术构建的高度可定制的互联网实验平台,可以让不具备计算机专业技术的研究者便捷地实现和执行多样化的实验设计[39]。未来,如果能针对社交网络控制实验,利用现有互联网技术(特别是移动互联网技术),创新一个高度可定制的实验构架,使得一些关键的参数可以被方便地操作和定制,例如:网络结构、行为控制、信息展示、智能算法介入等,这将对在线社交网络研究起巨大的推进作用。当然,这需要不同学科研究人员的共同合作,特别是计算机技术的支持。
3.3 研究进展
目前,在线社交网络研究控制实验在社交网络结构特征、信息传播以及行为与心理学等领域取得了丰富的研究成果,具有很高的理论水平和实践价值(见表2)。
3.3.1 社交网络结构特征
社交网络的结构特征和演化机制是网络科学、社会学以及物理学关心的核心问题之一[40]。而小世界效应,即网络中任意两个节点间的平均最短路径长度L与节点数量N之间呈现对数关系(L≈logN),是大尺度社交网络控制实验研究中的一个代表性成果[41]。在出现在线社交网络前,MILGRAM 等在1967年利用邮政信件在美国国内验证了小世界效应[41]。随后,一些研究人员针对电子邮件用户进行了全局的社交搜索实验,也证明了小世界效应[26,42]。这些实验研究为之后的复杂网路理论的发展和研究提供了重要的理论基础。
2016年2月,Facebook计算了其用户之间的平均距离约为3.5。该平均距离与小世界效应的控制实验结果存在显著差异。事实上,控制实验不但体现了人群的静态社交关系(类似通讯录或者好友列表),同时也反映了个体基于社交关系的动态行为。在某种程度上,控制实验能够更为真实地刻画人与人之间的关系距离,也更能体现人类认知水平限制的真实社会关系数量(即Dunbar数[43-44],约100~250人)。而利用拓扑结构的统计结果仅仅是静态社交关系的一种量化。因此,尽管大数据方法更为简单直接,但控制实验方法能够更好地体现实验主体人和社交网络的动态交互,具备其独特的价值。
3.3.2 信息传播
现代在线社交网络已成为各类信息传播的主要途径,其结构和功能是影响信息传播速度和范围的关 键因素[34,40]。2009年,IRIBARREN 等[33]通 过 涉 及31 183人的电子邮件实验证明,与理论模型的结果相比,人的传播行为在时间上的异质性能够显著降低信息传播的速度。BAKSHY 等[34]通过大规模的现场实验研究社交网络在信息传播中的作用,证明那些被“曝光”(可接触好友动态信息)的人更有可能传播信息,并且比那些没有曝光的人更快,并且尽管具有强联结的个体间具有更多的相互影响,但新消息的扩散却更多依赖弱联结。可见,在线网络的控制实验研究可以提供更为可靠的方法来区分混杂因素的影响,明确各类效应在信息传播中的作用。
3.3.3 行为和心理学
在线社交网络既是群体行为的演化结果,又是影响人类行为传播和变化的重要途径之一。KRAMER 等[36]在Facebook 上对68万多用户进行了大规模实验,发现当收到的消息中积极词语减少时,用户发布信息中积极表达也随之减少,而消极表达则增加;而当消极词语减少时,则出现完全相反的模式。CENTOLA 等[3,25]研究人类的健康行为在在线社交网络上的传播,并采用控制实验的方法测试网络结构对行为扩散的影响。基于一个包含1 528 名志愿参与者的自建在线健康社区,CENTOLA 等[3]比较了2种典型的结构,即随机网络和聚集网络,发现在聚集网络上的行为传播更快、更广泛。同时,CENTOLA 等[25]也发现人群的同质性会显著增加对新的健康行为的接受程度。一个更为极端的例子是,ROBERT 等[24]主导的Facebook 定制实验表明,在线社交网络的微小变化可以影响数百万人的政治自我表达和现实投票行为。该研究充分展现了在线社交网络对用户线下行为的干预能力。相较于观测和模拟研究,控制实验方法能够更为有效地证明社交网络与人群行为之间的因果关系。
同时,控制实验可以更为有效地探索社交网络对用户心理和情绪的影响。DETERS 等[27]设计实验探究了在Facebook 上发布状态更新对用户心理的影响。在一周时间内,实验组的参与者被要求发布比平时更多的信息,而控制组的参与者没有收到任何指示。结果显示用户增加状态更新可增强其与朋友的联系,从而减少孤独感。为探究社交网络中情绪的传播,MUCHNIK 等[37]设计了一个大规模随机实验,发现负面情绪易激发用户纠正被操纵的评级,而积极情绪更易于导致羊群效应。与普遍的假说相反,该结果说明,面对面的交流和非语言暗示并非情绪传染的必要条件。
在行为学和心理学研究中,另一个重要的主题是博弈与合作行为研究,旨在探索人类社会行为的复杂性,特别是合作的形成机制[39,45]。在线社交网络上的博弈实验主要关注网络选择机制对合作行为的影响。RAND 等[29]利用MTurk 实验以及人工社交网络证实,静态社交网络可以带来稳定的高于均匀混合人群的合作水平;并且,他们发现高度稳定的合作受到邻居收益与合作成本的非线性影响。进一步,LI 等[28]发现网络互惠能够高效提升并维持合作行为,但有代价惩罚机制却非常低效。需要特别指出的是,目前博弈研究更多地将在线社交网络作为研究工具,而非研究对象或关键影响因子。然而,在在线社交网络的活动中,实际充满了多种多样的博弈行为,例如多重信息传播中的竞争传播等。如何探索大规模在线社交网络中的博弈行为和规律是一个既重要又有趣的方向。
4 问题和展望
在线社交网络控制实验模式可以分为以复杂系统科学和大数据科学为基础,在真实大尺度社交网络上进行的嵌入实验模式和通过自主设计虚拟小型社交网络服务或应用以获得更多控制权的平台实验模式。实验方法和工具较为丰富,包括电子邮件服务、自主开发社交网络/应用、社交网络定制和众包服务。电子邮件服务方法准入门槛较低,可以简单地利用发送和接收邮件的方式来进行控制因子较少的实验研究。当实验的控制因子增多,实验条件更为复杂时,研究人员可以通过自主开发社交网络或应用来设计更加严谨的控制实验,操纵更加复杂的影响因子,得到更为有效的因果推断。与自主开发社交网络相比,众包服务方法直接为研究人员提供了能够自主设计控制实验的平台,同时降低了控制实验的准入门槛和技术门槛,相对性价比最高。虽然这些实验模式和工具方法已在在线社交网络的控制实验研究中被广泛应用,但却很难同时兼顾以下几个方面的特征,或者说都存在一定的障碍。这也是大尺度在线社交网络研究中控制实验受限的原因。
首先是准入门槛问题。活跃的在线社交网络无论在国内还是国外都集中在少数大型企业手中,因此,普通研究人员并不具备使用和操作这些社交网络进行控制实验的资格与能力。例如,在VOSOUGHI 等[19]对Twitter 上真假新闻传播的自然实验研究中,主动采集了从2006年到2017年所有经审核过的共计约1.26万条新闻信息。这样的数据采集和使用行为需获得Twitter 官方授权和支持,但这种研究方法是一般研究者无法参考和扩展的。
第二是法律与道德问题。ROBERT 等[24]在Facebook 上进行的政治投票动员实验引发了巨大的社会争议,有相当一部分学者认为,科学研究不应干扰国家政治活动,也不应干预用户的投票行为。因此,在线社交网络上的不恰当控制行为,很可能在现实中造成某种社会不公正或侵犯用户个人隐私,这都有悖于科学研究的道德规范,甚至违反各国法律。
第三是研究成本问题。综合现有实验工作可以发现,目前在线社交网络的控制实验通常需要依靠特定的互联网应用开发,大数据的清洗、甄别、标注和分析以及相关软件等复杂计算机和信息技术的使用。例如,ARAL 等[46]就独立开发了Facebook 嵌入式应用用于开展用户购买行为实验。实验面对的在线社交网络环境规模巨大,涉及用户多,地域覆盖广且内含信息纷繁复杂。庞大的规模和复杂的技术共同导致了高昂的实验成本,从而制约了控制实验的普及。
实际上,要扫除这些障碍,需要重新思考在线社交网络控制实验的路线和方法,并探索新技术在研究中的创新性利用。
人工智能技术的发展为在线社交网络的实验研究提供了新的契机。2018年5月,Deep Mind团队在Nature上发表了一项突破性研究成果[47]。研究人员通过训练循环神经网络,模拟了可在二维虚拟空间中自主移动、并且自主判断空间位置的智能主体(artificial agents);这些智能主体的人工神经网络呈现出与人类生物神经网络细胞非常相似的组织结构。这种相似性为利用人工智能技术模拟人类社交行为提供了理论基础。
目前,高仿真模拟人已经在医学[48-49]和工程学[50]实验中得到了广泛利用,大大推动了相关学科的研究。在商业应用中,以自然语言处理技术为核心的社交机器人(social bot)的价值已逐渐显露,被应用于互联网信息推广和客户服务等领域,以替代高成本的人工服务[51]。目前,社交机器人的价值在社交网络研究中还未获得充分重视。未来,随着人工智能技术的不断发展以及大数据和社会计算技术的兴起,社交机器人能更准确地模拟部分人类行为,从而为在线社交网络控制实验研究提供一种全新的工具和模式(见图2)。该模式以真实社交网络为实验环境,使用具备智能行为的模拟软件机器人为实验主体,最大程度兼顾单纯数值模拟分析的灵活性和可控性、现实社交网络服务的真实性以及相对较低的准入门槛和实验成本。
图2 从实验环境和主体角度对现有研究方法的分类Fig.2 Classification of existing researching methods from the perspective of experimental environment and agent
已有研究表明,目前在线社交网络控制实验研究在网络结构特征、信息传播、行为与心理学等领域都取得了丰富的成果。然而,现有大尺度互联网的控制实验研究都是国外研究者在Facebook 等境外社交网络上开展的,而针对我国社交网络的控制实验研究依然处于空白状态[52-55]。然而,类似微博、微信等国内主流社交网络服务都具有显著的中国特色,其结构和行为都与境外社交网络有显著区别。例如,第1,我国用户对于社交网络模式具有特殊偏好,特别是以微信为代表的私密社交模式与西方的开放式社交模式在结构和功能上存在显著差异,因此需要重新评估和探索控制实验方法和设计。第2,据近几年CNNIC(中国互联网络信息中心,China Internet Network Information Center)发展状况调查显示,我国社交网络用户呈现出同步的老龄化和低龄化[56]。随着大量老年人和青少年的快速加入,用户结构的变化将影响社交网络上的内容传播和互动行为。第3,以今日头条和微信小程序为代表的创新性技术在我国社交网络得到了快速普及和应用[57],其中很多应用模式都属于我国原创。这些新技术对社交网络活动的结构和动态行为的影响依然有待深入分析。对这些具有中国特色问题的探索既具有现实意义,也对在线社交网络的发展有重要的前瞻性作用。由于控制实验能够有效揭示隐藏在大尺度社交网络背后的基本科学原理,并具有广阔的应用前景,因此,发展我国自己的社交网络控制实验模式和方法有重要的理论和实验意义。
5 结 语
从实验模式、实验方法和工具以及当前研究进展的角度对在线社交网络控制实验研究进行了总结和评述,指出了现有的在线社交网络控制实验模式和方法存在准入门槛高、法律和道德风险大、研究成本高等问题,展望了人工智能技术在社交网络控制实验中的应用潜力和发展前景。最后提出了现阶段发展我国自己的社交网络控制实验模式和方法的重要性与必要性。