APP下载

大数据方法与谣言研究

2016-02-02刘文江

民俗研究 2016年3期
关键词:大数据方法

刘文江



大数据方法与谣言研究

刘文江

摘要:科学家们使用定量与数据挖掘的手段研究谣言,已经成为了这一研究领域的前沿热点。通过建立“小世界”的网络信息交流模式,他们精确追索和呈现出了谣言的源头及其传播形态。然而这种研究在方法论上存在着诸如过分追求因果关系等方面的不足,未来的大数据研究则会通过对总体性、相关关系的关注,解决这些问题。同时,大数据的方法也将给谣言的定性研究,以及在口头性与书写性、语境、信仰等关键问题的思考方面带来有意义的启示。

关键词:谣言研究;大数据;方法

从宏观的角度看,近三十年以来的社会科学研究方法发生了显著的变化。在上世纪七、八十年代“社会理论”的繁荣期(或称为“大理论”时代)过去之后,定性研究似乎有所沉寂,而定量研究则借助数据科学的飞速发展获得了令人瞩目的成就。其主要原因是进入到网络时代之后,数据的获取要比之前容易得多,数据规模也显著增大,同时与之对应的数学工具亦获得明显进步。例如,在社会学研究中,社会网络分析(social network analysis)方法的出现,就使社会学在定量研究方面取得了很大进展。①刘军:《社会网络分析导论·导言》,社会科学文献出版社,2004年,第2-3页。

谣言研究属于社会科学,主要在社会心理学和传播学领域发展,同时民俗学、人类学这些人文学科借助体裁研究或民族志的手段也有所涉猎。从学科发展历史看,除美国学者罗斯诺尔和福斯特试图使用上述社会网络分析中的“链接研究”(linkage study)方法去研究谣言和流言外,无论是二战期间美国心理学家们所做的具有开端性质的工作,还是现在比较新颖的带有语言学风格的“会话研究”,主要采用的都还是定性研究以及经验主义的方法。②参见罗斯诺尔和福斯特在美国心理协会网站上发表的谣言与流言研究的综述:R.L.Rosnow and E.K.Foster,“Rumor and Gossip Research”,http://www.apa.org/science/about/psa/2005/04/gossip.aspx。

这一现象在近两年发生了改变,信息科学的学者以数据挖掘的手段介入谣言研究,成为了这一领域的一个新热点。虽然尚属初步阶段,但可以预见的是,随着学术界对“大数据研究”的关注以及进一步的人力物力投入,这方面的研究将会获得更大的发展。

一、形态与起源:“小”数据方法的谣言研究

2009年,谷歌公司利用大数据分析成功地参与了流感疫情的监测,引起了全球轰动,“大数据”因而也成为热门词汇。尽管2014年《科学》杂志报道了其中的研究缺陷,但不可否认,这种研究方法指出了类似流感传播这样巨型社会问题的解决途径。*参见赵斌:《从谷歌流感趋势(GFT)出错看大数据发展之路》,http://blog.sciencenet.cn/blog-502444-776900.html。在这样一种背景下,同样作为宏观社会问题的谣言及其传播,就不可避免地为数据科学家所关注。自2014年起,中国科技大学张文逸研究小组连续发表了数篇关于网络谣言源识别问题的研究成果。*参见Z.Wang,W.Dong,W.Zhang and C.W.Tan,“Rumor Source Detection with Multiple Observations:Fundamental Limits and Algorithms”,in Proc. ACM SIGMETRICS,2014.其他相关文章见张文逸课题组主页:http://staff.ustc.edu.cn/~wenyizha/publications.html。2015年,中山大学大数据传播实验室发布了被举报的微信公众号文章中有关食品类、疾病类谣言的研究报告,均由于被公众媒体报道而引起了一定的社会反响。*中国社会科学网转载:《华南地区首个大数据传播实验室成立 发布“微信谣言”分析报告》,http://conf.cssn.cn/zx/zx_gx/news/201501/t20150116_1482503.shtml。

张文逸教授课题组的研究方向力图解决谣言的“起源”问题。按照公众媒体所介绍的课题组系列文章的意图看,这些成果“希望能够以建立树状网络拓扑模型的方式,在社交网络的多元信息中找到谣言的单一起源。(课题组所使用的)这类检测方法能够大幅提升网络谣言源的识别精度,快速而准确地识别恶意信息的源头”*光明网:《网络谣言源头找不到?中国科大张文逸教授支招!》,http://tech.gmw.cn/2014-07/16/content_11996701.htm。。

中山大学实验室的研究则关注谣言起源和传播链条等问题。他们引入了“文化基因”(meme,又译迷因)的概念,以此解释谣言传播的核心要素;此外,通过对488篇阅读量全部都超过10万的微信“谣言”文章的分析,他们认为:“谣言微信的发布者大部分是微信营销号。”这些制造者的目的是“吸引粉丝,为日后的营销吸引人气”。

作为从民俗学介入谣言领域的研究者,笔者比较关心的是自然科学的研究手段对谣言研究能够提供哪些帮助。由于是不同学科,我们对张教授团队所建立的模型和算法无从置喙,然而由于研究对象相同,他们的研究预设和路径应该还是可以讨论的。

在奥尔波特那里,谣言一开始就被定义为一种传播中的口头形式,它是一种社会现象,事实上更是一种有情感目的的心理现象。*[美]奥尔波特等:《谣言心理学·原著序》,刘水平、梁元元等译,辽宁教育出版社,2003年。从这个定义出发,谣言传播者之间的联系与关系相较其起源更得到学者们的关注。现代的谣言研究者如卡普费雷,则更进一步说明谣言起源在谣言研究里不是一个重要的问题。他认为:“谣言来源问题,从根本上来说其实并不重要。在谣言传播过程的起点,必须解释的是人群的参加与动员。就算存在着一个始作俑者,谣言的基础也还是在于他人,在于听到谣言并且传播谣言的人身上。”卡普费雷还强调“谣言中公众是主要的演员。……最引人入胜的并非其来源问题,而是公众对它的所作所为”*[法]卡普费雷:《谣言:世界最古老的传媒》,郑若麟译,上海人民出版社,2008年,第25页。。在笔者看来,社会科学家们不重视起源研究有他们的原因,而数据科学家对起源问题的关注也有他们的理由和方法。

张文逸课题组的研究建立了一个完美的形式。这个形式有两个预设的前提:一是论文中提到的有关谣言传播的“小世界(small-world)”说法的确成立。*注:这一术语是信息科学研究者们简化了的社会世界中的网络关系,比如一般人们所熟知的“六度分隔”原理,该理论认为两个陌生人完全可以通过不多于六个层次而联系到对方。在网络连接理论中,“小世界”充分体现了“复杂网络”的各类特征,并且也可以有效地“以小见大”。若干个来自小世界的信息之间相互连接构成拓扑结构,可以通过某种观察角度(如信息的密度、传播的距离、多样本检测算法,等)绘制这些结构互相叠加而形成的拓扑图。如果谣言传播也存在这样的连接现象,那么就可以借助这个图形最终去判断谣言初始的起源;二是谣言也像计算机病毒一样有一个单一的制造者,由于他或他们完全在网络世界活动,所以其行为是被网络世界记录与留存的,于是可以按照寻找病毒制造者的思路去寻找谣言的单一起源。

如果只考虑形式,“小世界”观点的切入是有效的,它实际上也就是定性的社会研究中所谓的“理想模型”。然而,如果把这一方法应用于具体的谣言研究时,它可能会产生以下的问题。首先,它只能应用于较小范围的谣言传播,如那些针对个人或公司等小群体的谣言,由于传播范围有限,所以可以完整地观察;但那些大范围的、传统的谣言,则很难断定其根源。因为这些谣言很多并不局限于互联网空间而存在,甚至有些颇为“古老”,远在互联网世界成型以前,它们就已产生,互联网世界流传的只不过是它们的“后代”。如果仅停留在互联网世界去追溯源头,就难免有脱靶误伤的可能。另外,互联网毕竟只是一个新生事物,大量存在于真实生活世界的谣言,还在口头流传,也就是尚在这些“数据”之外。这些谣言有可能潜于冰山之下影响着网上的谣言,使得只把互联网谣言当作目标对象的研究效度下降。就此而言,张教授课题组的研究成果主要价值在于从形态学方面做出了自己的贡献。

其次,如果我们回归到科学研究本体就会发现,这一研究在逻辑上还是立足于因果论、直线论的,这导致了他们在对待研究对象上有简单化的倾向。谣言的演变在最初阶段可能只是内容简单的非叙事性短语,但在传播中不断和传统的故事类型以及人们特定的心理、信仰模式相结合,最终在群体中得到认可,最后人们据此采取行动。因此反观第二个预设,作为一个带有社会性和集体性的概念,谣言是否存在单一起源?即使有单一起源,它们在发生时所传递的信息与最终造成危害的信息之间,可能还有很大的差距,那么不考虑变异,就将元信息界定为“恶意的”,是否恰当?由于谣言变迁本身在学术研究中都还属于难以界定的模糊地带,因此该项研究所提出的理论模式是否可以直接用作法律判定的工具,也值得商讨。

第三,形态学的研究无法直接触及谣言的心理和情感因素,而这些因素其实正是谣言传播链条的核心。因此尽管数据科学家们建立了一个完美的形式,但这类形式在复杂的现实面前,它的匹配度可能还需要进一步完善。显然,这样追求精确性的研究方式,离解决复杂多样的社会现实问题尚有一些距离。所以,类似的研究被有些学者称为“小数据”的研究。

中山大学实验室对谣言数据的处理属于抽样统计的定量研究,在这个基础上加入了定性的主题研究方法。就意图而言,研究者们希望警示谣言的风险,解决公众因为谣言而产生的困惑和焦虑,通过分类的方法来辨析其中的危害。从数据研究角度说,该研究完成了对“食品谣言”和“疾病谣言”的“描述性”的任务,但研究者采用的数据仅限于直接的与字面意义的文本,我们无法获知在这些微信文章阅读链条之外的数据。他们在分析上也主要关心谣言的动机和起源,因此同样体现的是小数据的研究特征。

因果关系当然是最重要的逻辑关系,小数据也是必要的研究手段,但如果我们需要更多的观察事物的角度,就必须在此之外寻找新的理解世界的方法,未来的大数据研究则会帮助我们达到这个目的。

二、总体性与相关性:“大”数据方法的谣言研究

区别于“小数据”的研究方法,用“大数据”思考社会问题,关键在于思维方式的转变。虽然目前仍缺乏以此方式研究谣言的成功范例,但现有的一些成型的思路,特别是英国学者舍恩伯格等在其《大数据时代:生活、工作与思维的大变革》一书中所提出的一系列观点,值得我们认真思考。

首先,应该“利用所有的数据,而不再仅仅依靠一小部分数据”*[英]迈尔-舍恩伯格、库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨艳、周涛译,浙江人民出版社,2013年,第29页。。互联网生活使得人们的语言与言语行为通过网络媒介的方式大范围地留存下来,这是人类历史上从未有过的现象,它使得从总体上研究社会问题成为可能。“总体性”并不代表要研究所有的数据,而是把其中的“异常值”当作最重要的数据,用“异常模式”反证“正常模式”是其最有力的工具。谣言常常隐藏在日常的社交语言中,当它开始大规模传布并且已经造成了实际的社会危害之后,社会管理者往往才有所醒悟,开始辟谣,防范它对社会秩序的动摇。如果我们把谣言当作日常语言交流时的一种异常行为,当有些语词在互联网中出现的频率突然脱离了正常值,甚至是高频出现,这时就需要注意。例如,在社交网络中某些词汇被同时、大规模地搜索,但按照以往经验,它们之间却没有直接关系,那么这也许就是某些谣言会出现的先兆。

“异常”的问题过去也为有些社会科学取向的谣言研究者所关注。如日裔美国学者涩谷保指出,谣言的出现是因为它们无法出现在正常的新闻渠道中,面临危机时的“强烈需求”(exigency)往往促使人们寻找非体制内渠道的新闻。他提出人们应该观察这一“知识的流向”所产生的新的社会变化。*T.Shibutani,Improvisednews:Asociologicalstudyofrumor. The Bobbs-Merrill Company,Inc,1966,p.62.当今时代,互联网具有类似百科全书的特征,提供给了人们更多的知识。因此,搜寻这些“非正常”知识的行为也由寻求身边的权威、书本的指导转向于求助互联网,使得互联网成为获取这些知识的新平台。但与以往不同,这些搜索行为产生了数据,于是谣言传播过程变得“可见了”,研究者们因而可以根据这些“异常”数据预见谣言的产生与传播。

在大数据时代,如果原来社会研究中的样本研究方法(如民族志或个案研究)进而发展成为“全体研究”,那么对谣言研究的方法论(研究程序)影响将会非常之大。在19世纪以来一般科学方法论的演进中,科学研究形成了所谓的“假说演绎法”,它由五个步骤组成:(1)观察收集数据;(2)依据归纳法提出假说;(3)由假说演绎出命题;(4)由经验和反证验证命题;(5)在假说的基础上提出理论。*[日]野家启一:《库恩:范式》,毕小辉译,河北教育出版社,2001年,第85页。舍恩伯格指出:在全数据时代,“样本=总体”*[英]迈尔-舍恩伯格、库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨艳、周涛译,浙江人民出版社,2013年,第37页。。那么在步骤(1)阶段,谣言研究将会获得海量的数据,而这些数据不仅仅是语词,也包括行为;在步骤(2)阶段,由于占有了大量的数据,“异常值”可能会出乎人们的想象。通过归纳法得出的假设,也往往会出人意料,甚至难以理解。在这样的假设基础上提出的理论,也就是步骤(5),就会出现一些全新设想。类似的新突破对人文社科研究者而言也许就意味着一种全新的研究视角的产生。例如,孔飞力的《叫魂》虽然并不是大数据研究,但该书就建立了这样与“全体”相对的“异常值”视野。跟一般历史学家眼中的“乾隆盛世”不同,孔飞力描述的是强大帝国背后的阴影。而通过乾隆皇帝处理江南“叫魂”谣言的前前后后,他让我们看到清王朝在看起来运转良好的经济与政治体制之下,早已为自身埋下了衰亡的种子。*[美]孔飞力:《叫魂:1768年中国妖术大恐慌》,陈兼、刘昶译,上海三联书店,1999年。大数据时代的谣言研究,可能更多地出现这样由微观的“异”切入宏观的“全”的研究事例。

其次,大数据方法所展现的状态主要是数据的相关关系而非因果关系。当然,正如清华大学张晓强等学者指出的,“如果大数据分析的对象恰好本身就有因果关系的话,那么大数据(也)可以发现因果关系的具体模型”*张晓强、杨君游、曾国屏:《大数据方法:科学方法的变革和哲学思考》,《哲学动态》2014年第8期。。只就相关关系而言,它的核心在于只需要知道“是什么”,而无需知道“为什么”。*这其中的内涵可参见上文张晓强等人的论述。本文在此不准备讨论这两种关系在哲学上孰优孰劣,但正像舍恩伯格指出的,作为人们经常使用的思考世界的一种捷径,因果关系难免会带上“个人偏见”,这不可避免地产生理解事物时的遮蔽现象。*[英]迈尔-舍恩伯格、库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨艳、周涛译,浙江人民出版社,2013年,第67-94页。因此,相关关系绕开了人们的思考习惯,挖掘了更多的非线性关系和不确定性,并且提供了新的视角。

就内在理路而言,谣言传播一开始总是起于对“真相”的探寻,按照因果关系的逻辑寻求答案;然而在结束时却往往产生另外的结果,这二者就呈现为相关关系。因此,大数据研究的范式天然地能与谣言研究产生契合。例如2011年,日本发生了福岛核电站核泄漏事件。这一事件的影响传导到中国,却发生了“碘盐能防辐射”的谣言,进而出现了抢盐的小规模社会秩序混乱,有些地方超市里的碘盐被一抢而空。“核泄露会不会影响中国?”这是一连串心理链条的开端,但最终的答案却是“碘盐能防止辐射”,这就是谣言传播中信息内涵由因果关系转为相关关系的典型实例。对社会管理者而言,要平息这一事件需两方面兼顾。一方面解决“为什么”的问题,除了要从因果关系与科学性上说明带有辐射微粒的空气很难吹向中国、并不影响人们的生命安全外,也要说明碘盐同样不能防辐射。另一方面更要解决“是什么”的问题,需要根据大数据考虑人们的需求,提供大量的食盐帮助人们度过社会危机。现在我们所看到的只是针对能防辐射的“碘”这一化学元素所产生的谣言,在大数据研究中,很有可能还会出现其他的与防辐射有关的谣言数据,理解这一点将帮助人们更好地预防和缓解谣言的危害。

大数据研究不追求精确性,使它能够处理谣言产生与传播时的混沌状态。正如前面所云,人们通过囤积碘盐的方式达到防辐射的目的,看上去似乎是偶然的与非理性的,然而这就是非线性的社会现实。过去的谣言研究中也曾经注意到了这方面的情况,比如奥尔波特提出过谣言的强度公式:R~i×a,也就是谣言的传播广度随其对相关人员的重要性和该主题证据的含混性的变化而变化。*[美]奥尔波特等:《谣言心理学·原著序》,刘水平、梁元元等译,辽宁教育出版社,2003年,第17页。那么含混性到底包含着哪些内容?这在过去只能由学者通过个案分析进行归纳总结,但大数据方法的出现恰恰提供了进一步延伸这种研究的手段,它可以把那些在事件逻辑之外的内容也纳入到观察范围。

混沌状态在实践中也可以看作是这样一种景况:谣言语境中的受众处于信息匮乏状态,这时他们会竭尽一切可能寻找相关的信息,即使是超自然力的解释,他们也不会拒绝。例如,施爱东在对“汶川大地震”中出现的38则谣言案例进行分析之后指出,“(地震发生之后传播的)灵异谣言指的是通过猜想和拼凑,将灾难的发生与虚拟的灵异事件或者其他偶发事件联系到一起,解释为一种反科学反现实的、神秘的对应关系”、“灵异谣言的特点之一就是出奇制胜:越是离奇,就越是灵异,越是容易博取部分民众的迷信”。*施爱东:《灾难谣言的形态学分析——以5.12汶川地震的灾后谣言分析》,《民族艺术》2008年第4期。超自然力量和天灾之间的关系在这些谣言的传播者那里就属于事件之外的逻辑,而“离奇”这一概念则包含着不可预见的成分。大数据的手段将会引导我们观察到更多的、令人惊诧的谣言主题。

大数据方法在谣言研究领域的运用,最大的便利是能利用相关关系对谣言进行预测。通过对总体的数据研究,人们可以掌握特定的谣言类别可能流行的概率,从而提前预防。传统的谣言研究方法(如心理学、传播学、民俗学和人类学)基本不具备预测能力,但当大数据研究介入到谣言研究领域内的时候,这方面的能力“从无到有”,这无疑是非常令人期待的。

三、定性和定量方法的相互影响:谣言研究的未来趋势

任何一种科学方法都必须建立在科学的认识论基础上,同时它也不可避免地存在着自己的局限性,近期已经有许多社会科学家开始回应大数据方式的社会研究。例如,潘绥铭教授就激烈地批评了大数据研究应用于社会学领域中出现的“唯科学主义”、“唯量化主义”倾向,特别是其中碎片化的现象,他主张“只有社会研究和人文研究,能够让它变废为宝”*潘绥铭的博客:《“大数据崇拜”批判(1,2,3,4)》,http://blog.sina.com.cn/psm1950。。因此,尽管用大数据方法研究谣言会带来定量研究手段的突破,但是它也必须有定性的前提,否则就是盲目的。也就是说,定性研究前置于定量研究,才能产生更大的价值。

对于大数据研究者来说,谣言该如何定性?在网络世界出现之后,原本主要流传在口头领域的谣言事实上已经发生了重大变化。它的特征已经由主要来自于口语世界的人际间的口头性,发展为口头性与书写性并存的情况。互联网世界中交流与交往方式的变化,使得其中的人们开始构建不同于真实世界的“生活传统”。但是,谣言流传的心理基础——人们对某些信息产生的不安、恐惧以及由此而产生的言语行为并没有发生变化,这就是未来的大数据方法应用于谣言研究时的一个基本定性。也就是说,大数据研究并不在根本上动摇谣言的定义,所以笔者认为,它的出现并不是一场范式革命,而是方法的革命。我们进一步推论,由于数据并不直接反映人们的心理因素,却反映人们的语言和行为特征,那么大数据研究谣言最应着力的领域还是通过“建模”的方法研究谣言在互联网传播中新出现的“规则”(norm),特别是谣言从“可听的”转向“可见的”之后的传播规则。因为听觉认知和视觉认知是不同的。数据科学家们需要在这个基础上建立自己的模型,而把心理和文化的研究领域继续留给社会科学工作者。

另一方面,对社会科学工作者来说,大数据研究方法也促进谣言的定性研究发生改变。

首先,需要重视谣言的口头性与书写性之间所产生的新变化。在书写与口头传统嬗变的历史进程中,互联网可以被看作是书写文化的进一步进化,它把许多原本属于口头传统的体裁书面化了,因而产生了大量可以研究的数据。特别是“个人叙事”(personal narrative)*这是美国民俗学者非常重视的口头体裁,详见Sandra K.D.Stahl,“The Personal Narrative as Folklore”,JournaloftheFolkloreInstitute,vol.14,no.1/2(1977),pp.9-30.这一体裁,原本只是大量出现在口头交际中,但是在当代社交网络上(例如微博)它们被公开化了,并且以简单的书写性形式得到了前所未有的繁荣。民俗学家鲍曼曾经引用语言学家莱鲍夫的观点指出,“个人叙事……显示了讲述者对于自己所讲述的经历所怀有的情感的性质和强烈程度”*[美]理查德·鲍曼:《作为表演的口头艺术》,杨利慧、安德明译,广西师范大学出版社,2008年,第30页。。出现在网络世界里的“个人叙事”充满了个人风格和价值判断,具有鲜明的叙事质感,十分吸引阅读者并促使他们积极转发(传播)。而且书写相较于口头带有权威性,大量夹杂着虚假信息的这类表述,为受众带来了更丰富的“真实性”,这使人们辨识谣言的难度成倍增加了。相对于口头世界的谣言传播,这也意味着变异性大大增强;同时,谣言的传播速率也因此而大大加快,这会令传统的定性研究有力不从心之感,因而需要求助于大数据研究。

其次,需要重新思考如何进行谣言的语境研究。社会科学对谣言的研究,不仅仅关注语词与文本,也会关注与它相关的社会事实(social action),这就是语境研究。美国民俗学家丹·本-阿莫斯提出,语境可以看成是一种“指涉的框架”,它包含了人们之间共享的知识、行为习惯、精神原则、历史与信仰、隐喻和熟悉的体裁等等。他同时还认为,语境只可被观察,而不可被搜集,因为它是被整合在语词里的。*Dan ben-amos,“Contextual Approach”,in Jan Harold Brunvand(eds.),AmericanFolklore:AnEncyclopedia. Garland Publishing,Inc.1996,p.335.人们在网络世界中留下的种种印迹(数据),同样可以被看作是语境。然而与现实世界的讲述活动不同的是,由于互联网的记录特征,决定了语境既可以被观察,也可以被搜集,并且它的“全体性”是前所未见的。另外,决定语境框架的重要的时空因素在网络中被削弱,交流事件背后的宏观历史、社会及文化语境*这里的语境划分层面采用鲍曼的理解,见[美]理查德·鲍曼:《语境中的民俗学田野研究》,转引自《作为表演的口头艺术》,杨利慧、安德明译,广西师范大学出版社,2008年,第250页。与个体所叙之事之间的关系显得更为立体,谣言的隐喻意义往往被安排在这样的宏大背景中进行阐释。因此哪怕是些看起来微小、局部的事件,都可能会被互联网空前放大。信息在“总体性语境”背景下的展开,将会传递出更为复杂的意义。

第三,数据挖掘方法给谣言传播中的信仰(belief)或相信性的研究提供了启示。人们之所以相信谣言的理由很多,传统的人文社科研究者卡普费雷给出了他的观点:一是谣言拥有一个看上去可靠的信息来源;二是它是一个似乎是真的信息;三是谣言传达了一个我们所希望的信息。*[法]卡普费雷:《谣言:世界最古老的传媒》,郑若麟译,上海人民出版社,2008年,第72-96页。除了这些可以被概括为社会和心理认知的因素之外,谣言还借助语境与体裁形式产生了令人相信的因素。*刘文江:《作为实践性体裁的传说、都市传说和谣言研究》,《民俗研究》2012年第2期。这些内在因素无法从定量角度分析,因为信仰本身和信仰程度是无法量化的,它们可以描述,但无法确证。然而,信仰的外在体系和它的建构特征却可以从社会行为中被观察到,这些可以依靠大数据方法得到实现。例如,周辉曾借助复杂网络分析中的小世界模型,对广州大学有关课题组2003年一项有关“非典”期间流言(即谣言)的调查进行了分析。她的研究说明,“代表流言传播过程中极其活跃的个体(在她的拓扑图中称为少数拥有与外界大量联系的节点)占到总数的5%左右”*周辉:《流言传播的小世界网络特性研究》,《武汉科技学院学报》2005年第1期。。对于这些积极的谣言传播者,研究者无法确证他们本人是否相信谣言,但他们以自身为节点,通过与他人的连接所完成的谣言传播过程,无疑也构成了一个相信性的体系。在数据挖掘及其结论的基础上对此进行进一步的内外结合的研究,可以成为未来谣言研究的一种创新性的个案。

总结起来,在互联网愈发与人类生活相融合的时代,谣言的产生与传播都发生了变化。那么相应地,研究本身也应该随之发展。在研究者们不断调适自己的研究方法之后,海量的数据和高运算能力的计算机将帮助人们更深入地了解自身存在的这个社会。

[责任编辑龙圣]

作者简介:刘文江,兰州大学文学院副教授(甘肃兰州730020)。

基金项目:本文系教育部人文社会科学研究青年基金项目“谣言、传说与神话的比较研究”(项目编号:13YJC751032)的阶段性成果。

*本文在写作过程中得到了兰州大学信息科学与工程学院程建军博士的热情帮助,特此致谢。

猜你喜欢

大数据方法
学习方法
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
用对方法才能瘦
四大方法 教你不再“坐以待病”!
赚钱方法
捕鱼
上台前,你用什么方法消除紧张