APP下载

微博谣言传播网络研究

2018-02-27王晗啸

图书情报研究 2018年1期
关键词:单条网络分析谣言

王晗啸 蔡 培

(江苏大学科技信息研究所 镇江 212013)

1 引言

微博作为一种通过关注机制即时分享信息的社交媒体,近年来已成为公众讨论公共事务,发表自身观点的主要场所。在官民沟通机制相对缺失的大环境下,微博有力的成为了改进政府工作作风、健全协商民主政治的助推器,为公民有序参与政治生活搭建平台。

与此同时,由于互联网自身所具有的匿名性、开放性,缺乏把关人的限制,微博也成为滋生谣言的温床。CNNIC发布的《第38次中国互联网络发展状况统计报告》显示[1],截至2016年6月,微博用户规模高达2.42亿人,在如此庞大的用户群体面前,任何一丝波纹都有可能引发蝴蝶效应,掀起滔天巨浪。以2016年9到10月这两个月间发生的谣言为例,影响力比较大的包括“年收入十二万加税”、“全国银行成为失联儿童安全守护点”、“武钢裁员引发暴动”、“柿子与酸奶不能同食”等,类型涉及到社会生活的方方面面,一次次消费用户的信任进而损害政府的公信力,破坏市场经济的良性发展[2]。

目前,治理微博谣言的对策是:一方面做到即时辟谣,相关利益单位及个人第一时间进行澄清,新浪微博的“微博辟谣”、果壳网的“谣言粉碎机”等也专门设立帐号,实时跟进辟谣;另一方面,对谣言传播较广、造成危害较大的谣言发布者实行惩治性措施。2013年9月,最高人民法院、最高检察院公布《最高人民法院、最高检察院关于办理利用信息网络实施诽谤等刑事案件的司法解释》[3],该《解释》规定,利用信息网络诽谤他人,同一诽谤信息实际被点击、浏览次数达到5 000次以上,或者被转发次数达到500次以上的,应当认定为刑法第246条第1款规定的“情节严重”,可构成诽谤罪。但从实际实施的效果来看,影响力较大的谣言由于传播范围较广,参与人数较多,谣言传播的梳理所需耗费的人力成本较高,许多谣言最终不了了之,网络造谣在国内依然是一件低成本的事情,造谣事件依然时有发生。因而研究微博谣言的共同特征及其发展规律,为相关机构提供决策依据,对微博谣言的治理与干预程序化、常态化有重要意义,也有一定的社会价值。

2 微博谣言传播网络的构建及其分析维度

2.1 社会网络分析法

社会网络分析研究的是人际关系,最早由一群社会计量学家所创立。与统计学家的观点不同,社会计量学家认为社会不只是个体的简单集合,而应包含个体以及个体所拥有的各种社会、经济或文化纽带。基本单元借助纽带形成社会群体,再由社群间的相互联系形成社会[4]。

社会网络分析法因其结构化的视角与可视化功能,在谣言的传播过程及其模式研究中备受相关领域学者的推崇。雷宏振等对传染病经典模型SIR模型进行改进,并以吴法天发布的一条微博为例,发现该传播网络关键节点单一,传播路径分散,节点与节点之间相互依赖程度高,信息传播整体呈松散性[5];许玉等除了对微博评论关系,还对微博用户粉丝数、关注数、微博数等信息进行抓取,得出这些信息与用户的中介中心度呈正相关[6];刘金荣将社会网络分析与信息生命周期理论相结合,对谣言传播拓扑结构进行测度,总结出可以通过引导和控制网络中的关键节点改变网络中心度、聚类系数等,进而减少信息传播与扩散,降低谣言所带来的负面影响[7]。

当前使用社会网络分析进行微博谣言传播研究的文献主要存在两点局限:其一是对相关谣言的传播结构研究多是从单条微博转发评论或是关键节点之间的转发评论关系入手,并非对相关主题下整个谣言传播路径进行全景式呈现。一方面研究群体过于狭小,有“管中窥豹”之嫌,单条微博或关键节点之间的谣言传播网与整个谣言传播网相比,指标测度可能存在一定的差异。另一方面容易忽略一部分低粉丝数、无认证但在谣言传播过程中起重要作用的普通用户,而这部分用户有可能是事件的直接利益相关者。其二是虽然在微博传播研究中已有文献对其传播模式进行归纳,但并未查阅到专门总结微博谣言传播模式的文章,而这类总结对于谣言传播干预与治理对策的制定有较强的参考价值。

2.2 微博谣言传播网络的构建

社会网络由节点和连线构成,对网络的构建首先是要考虑节点和连线间的关系。转发与评论是表征微博活跃度的重要指标,更能体现微博传播的扩散性。因而,本文以转发作为表征,网络中的节点是参与原微博转发的用户,连线为用户间的转发关系。在确定节点和连线间的关系之后,接下来就是讨论微博谣言传播网络的构建流程。

如图1所示,微博谣言传播网络的构建大致可以分为三个步骤,依次是对数据的抓取、数据预处理以及数据的导入及检验。

图1 微博谣言传播网络构建流程

(1)数据抓取。本文采用深度优先遍历算法(DFS)和新浪微博API接口对微博节点数据与边数据进行采集,节点数据可以根据具体的研究进行选择,包括用户的昵称、ID等信息;边数据则是转发人与被转发人间的转发关系。需要注意的是,对用户信息的获取应坚持“用户授权”+“平台授权”+“用户授权”的三重授权原则,如果是通过非常规渠道抓取微博用户信息并用于商业用途,将有可能引发诉讼[8]。

(2)数据预处理。由于数据是从新浪微博上直接抓取的,所以一般不存在数据异常与缺失的状况。但有一种情形需要考虑进去,那就是人为因素造成的数据缺失,这常见于一些内容涉敏微博,其中就包括了微博谣言。新浪微博管理员会对该类型微博下的部分转发评论甚至整条原微博进行屏蔽、删除,这里面也存在用户自我审查的可能,用户将自身不恰当的言论自行删除。这种状况在数据预处理时不易被发现,但在数据导入及检验时可以很容易看出。

(3)数据的导入及检验。在数据导入之后,可以通过“组元”验证网络是否连通,组元的定义会在下文微博谣言传播网络分析维度中做具体阐释。在数据完整的情况下,单条微博的传播路径应是连通的,网络中的任意一个用户都可以通过其传播路径回溯到原微博的发布者上。如果整条微博的传播路径是非连通的,存在孤立的节点和边,则该份数据是不完整的,存在用户的自我审查或者新浪微博的官方审查。在网络不连通的情况下,继续使用该数据将会对接下来一系列的指标分析造成影响,产生误差,并做出错误的判断,因此需要将非连通的网络节点及边删除以保证传播路径的完整性。这也提醒我们,在面对微博的选取尤其是一些有研究价值的涉敏主题微博时,需要即时抓取,防止信息被删失效。当然,不完整的数据也并非完全没有意义,这也能从侧面印证该主题下的讨论引起了舆情部门的注意与干涉;如果某些网站以牟利为目的,协助一些公关公司或利益相关企业删除负面转发评论,这类数据也将成为有力的佐证。

2.3 微博谣言传播网络分析维度

本文对微博谣言传播网络的研究分为同一主题下微博谣言传播模式分析以及单条微博谣言传播模式分析。由于以转发为表征,转发是从被转发者流向转发者,是有方向性的,因此所有涉及到网络的讨论都是指有向网络。

结合社会网络分析的常用指标与微博传播特征,本文对微博谣言传播网络的分析维度分为8种,如表1所示,分别是组元、节点数、弧数、密度、平均点度、聚类系数、测地线以及直径。

表1 微博谣言传播网络分析维度

组元可以用来验证网络连通性。如果一个用户在起点和终点之间仅出现一次,那么就形成一条路径;如果网络中每一对用户之间都存在一条路径,那么这就是一个连通网络,而组元是最大的连通子网络。组元可以用来检验网络连通性,判断一个网络是否存在多个成分。一旦存在多个成分,那就意味着该传播网络存在微博官方审查或用户自我审查的可能。

节点数是参与微博转发的用户人数,弧数是微博转发数,二者是判断微博参与热度最直观也是最常用的指标;密度、平均点度、聚类系数与网络的凝聚性有关。密度是指网络中实际存在的转发数量,以其占最大可能转发数的比例,反映用户间紧密程度;平均点度是网络中所有用户的点度的平均值,反映用户间互动的频繁程度;网络的聚类系数是该网络中所有节点聚类系数的平均值,反映网络疏密程度,探寻该网络是否存在中心趋势。

测地线与直径则是用来衡量节点间的距离。测地线指该网络中两个用户之间的平均最短路径长度,反映用户间建立联系的难易程度;直径是指网络中任意两个用户之间距离的最大值,反映微博传播深度。

3 微博谣言传播案例分析

3.1 案例选取

本文以“年薪十二万加税”谣言为例,对事件发生的整个过程以及数据采集标准与结果进行讨论,根据结构特征对单条微博谣言传播网络进行归纳总结,并分别制定相应的舆情应对策略。

以“年薪十二万加税”谣言为例主要出于两方面的原因。其一是该谣言下的原微博结构类型多样,案例本身具有一定的代表性;其二是微博谣言由于其特殊性,随时都有被删除的可能,而该谣言下的原微博数据抓取较为及时,其中就包括了一些之后被删除的原微博,尽可能保证了数据的完整性,在最大程度上对谣言传播经过进行还原。

3.2 数据采集标准及采集结果

对数据的采集标准依照2013年9月由最高人民法院、最高检察院公布的《最高人民法院、最高检察院关于办理利用信息网络实施诽谤等刑事案件的司法解释》,对被转发次数达到500次以上、可构成诽谤罪的微博进行抓取。数据采集的具体要求按照社会网络分析以及微博的特征,以转发作为微博活跃度表征,共分为用户数据和转发数据两部分。用户数据信息包括用户的名称与ID;用户转发数据是转发用户与被转发用户之间的关系。数据采集结果见表2,按转发数由高到低进行排序,共采集原微博11条,总计用户参与人数19 927人,微博转发数20 632条。“财经网”和“新浪财经”各发布2条微博,按照发布的先后顺序在其微博昵称后标注(1)、(2)。

表2 数据采集结果

3.3 同一主题下微博谣言传播网络分析

将11条原微博的全部用户数据和转发数据导入Gephi,执行“YiFanhu”布局可以得到图2,即“年薪十二万加税”转发数大于等于500的原微博谣言传播路径图。由于节点数较多,如果显示全部节点名称将显得较为混乱,因此在对谣言传播路径进行可视化制作时,只对原微博的用户名进行了显示。

图2 “年薪十二万加税”谣言传播路径

之前学者在开展微博传播模式研究时,研究对象多是单条微博。这主要是因为在数据完整的情况下,单条微博的传播路径是连通的,网络中的任意一个用户都可以通过自己所在的传播路径回溯到微博的发布者上;而以同一主题下微博谣言为研究对象时,由于微博的发布者不同,不同的用户只会与其参与转发的传播路径相连,整条传播路径理应是不连通的。在路径不连通的情况下,社会网络分析的诸多指标就无法进行计算或者计算出的结果没有意义。

但引入组元对网络连通性进行检验,可以发现该主题下的微博谣言传播路径是相连的(见图3)。在对该主题下的微博谣言传播路径进行计算时,可以看到网络中只有一个成分,所有的节点都包含在该成分中。

图3 组元验证路径连通性

这一研究结论表明,虽然在同一谣言主题下参与讨论的用户众多,但这种讨论并不是孤立存在的,有一定数量的用户同时参与了该主题下多条热门微博的讨论,而正是这批用户让整个传播路径相连接。

3.4 单条微博谣言传播网络分析

目前已有一些文献以网络结构特征为依据对微博传播特点、路径模式进行归纳。于洪利用NodeXL构建传播网络,总结为一触即发式、多级传播式以及多点触发式这三种路径模式[9];孙娜绘制微博生命轨迹曲线,概括为单点传播、接力传播以及病毒传播[10]。本文对单条微博谣言传播网络进行归纳,将其总结为三类,分别是单点爆发式、多点触发式以及多点连爆式,接下来各选一例进行分析。

3.4.1 单点爆发式 单点爆发式选取的是南京市委宣传部官方帐号“南京发布”于2016年10月24日11点50分发布的一条微博(http://weibo.com/2097024354/EeilN65Gf?ref=collection&type=c omment#_rnd1477643934111),传播路径见图4,共有530位用户进行了542次转发。网络的平均点度为2.04,密度为0.001 9,聚类系数为0.071,其中有96.9%的转发都是集中在第一层级,网络凝聚性较高;直径长度为4,传播深度较浅;测地线长度为1.06,用户之间极易产生互动。

图4 单点爆发式

从图4中可以看出,虽然参与该微博转发的用户众多,但互动主要集中在发布者“南京发布”和其转发者之间,网络中也没有出现其他的关键节点和凝聚子群,微博的扩散并不明显,影响力相对有限。因此,对待该类型微博应暂时采取观望的态度,没有必要做过多的干预,可以根据微博接下来的传播走势以及是否有意见领袖的介入再做判断。

3.4.2 多点连爆式 多点连爆式选取的是地方资讯博主“北京人不知道的北京事儿”于2016年10月24日9点46分发布的一条微博(http://weibo.com/1662214194/Eehxv25Fz?ref=collection&type=comment#_rnd1487236128482),传播路径见图5,共有600个用户进行了607次转发。网络的平均点度为2.02,密度为0.001 7 ,聚类系数为0.022,第一层级转发占总转发数的65.7%,第二层级转发占30.1%,与“南京发布”相比,网络凝聚性稍低一些;直径长度为5,测地线长度为1.33,用户之间较易产生互动。

图5 多点连爆式

对待多点连爆式微博,本文建议应将传播链中类似于“陈震同学”这样的意见领袖转发内容进行屏蔽或者直接删除,通过控制关键节点的方式切断微博的传播链,防止微博谣言的进一步扩散。

3.4.3 多点触发式 多点触发式选取的是“yuange1975”于2016年10月22日12点整发布的一条微博(http://weibo.com/2246379231/EdZxGaftp?ref=collection&type=comment#_rnd1477640756720),传播路径见图6,这也是在该主题下最早出现的微博谣言,共有2 662个用户进行了2 769次转发。网络的平均点度为2.08,密度为0.000 4 ,聚类系数为0.005 ,其中一级转发占转发总数的20.9%,二级转发14.6%,三级转发10%,四级转发9.5%,五级转发10.8%,层级分布均匀,由于微博参与和转发数要明显高于另外两条微博,传播规模相对较大,因而网络凝聚性较低;直径长达14,传播深度较深;测地线长度为3.76,用户彼此间距离较远。

图6 多点触发式

对于该类型网络,由于存在多个高中心度的用户及凝聚子群,本文建议直接屏蔽或删除原微博以此阻断传播。另一个值得注意的问题是,微博发布者“yuange1975”不仅拥有较高的被转发,还有三条主动转发,表明他对这一谣言传播事件的参与和讨论较为积极,即使将他发布的原微博全部删除也不足以阻止他继续评论该事件。本文认为,对待该类型用户,除了对原微博进行处理,还可以对其进行禁言甚至采取临时性封号的处理方式,根据其表现再决定是否解封、何时解封。

11条原微博各项社会网络分析指标结果如表3所示,网络的凝聚性上,密度和聚类系数与微博的参与人数、转发数直接相关,而平均点度由于不受网络规模的限制,在测量网络凝聚性上更具有优势;在网络的距离上,多点触发式、多点连爆式的直径长度一般要长于单点爆发式,传播深度更深。单点爆发式由于传播局限于发布者和粉丝之间,测地线长度相对更短。

表3 原微博社会网络分析指标结果

4 结论与对策

本文运用社会网络分析法,构建以转发为表征的微博谣言传播网络,指出了构建微博谣言传播网络时可能出现的一种特殊情况——非连通网络,该网络通常是由于用户的自我审查以及新浪微博的官方审查而造成的数据缺失。

结合社会网络分析法与新浪微博的特征,从组元、节点数、弧数、密度、平均点度、聚类系数、测地线以及直径这八个维度对同一主题下微博谣言传播网络以及单条微博谣言传播网络进行分析。

在同一主题下微博谣言传播网络上,发现有一定数量的用户同时参与了该主题下多条热门微博的讨论,而正是这批用户让原本应该孤立的单条微博谣言传播网络相联系,并连通了整条微博谣言传播路径。

在单条微博谣言传播网络上,根据其结构特征归纳为单点爆发式、多点连爆式以及多点爆发式,并给出相应的舆情策略。在面对单点爆发式微博时,应持观望态度,因为该类型结构的微博互动一般局限于发布者和粉丝之间,扩散性较低,影响并不大,应当留意将来是否有意见领袖参与其中;在面对多点连爆式微博时,需要密切关注意见领袖的动向,由于该类微博呈“链条状”,在必要时可以切断微博中的关键节点,以防止微博谣言的进一步扩散;相较于另外两种结构,多点触发式微博治理相对困难,由于其结构呈“辐射状”,因而切断其中的某个节点也无济于事,此时可以直接对微博源节点进行屏蔽或删除。

2012年,国家互联网信息管理部门对16家造谣传谣的网站进行了关闭,并对新浪和腾讯这两家谣言传播集中的网站点名严肃批评,受此影响,新浪发布公告,从3月31日至4月3日关闭微博转发评论功能以示警戒。个人以为,在面对新时期网络造谣问题,不应再采取关停微博转发评论功能这类“一刀切”的方法,该方法过于简单、粗暴,极易引起网民的抵触情绪甚至愤怒。而应借助类似于社会网络分析这些更加精密的研究工具对症下药,在对谣言传播者依法严惩的同时,应保证网民使用互联网的合法权益,不要去阻碍社交媒体平台上用户之间的正常交流。

考虑到数据样本量,本文可能只是例举了其中几种常见结构,并没有罗列出全部的谣言传播形态;此外,本文并没有对网络添加时间序列,缺少对异构网络在不同阶段的发展变化的比较研究,这些都是本文的不足,也是作者下一阶段需要努力的方向。

[1]第38次中国互联网络发展状况统计报告.中国互联信息中心[EB/OL].[2016-08-03].http://www.cac.gov.cn/2016-08/03/c_1119326372.htm.

[2]董玉芝.群体极化视域下微博谣言的成因、危害及治理[J].当代传播,2014(3):81-83.

[3]网络谣言转发超500次可构成诽谤罪.新华网[EB/OL].[2013-09-10].http://news.xinhuanet.com/tech/2013-09/10/c_125355073.htm.

[4][荷]沃特·德·诺伊,[斯]安德烈·姆尔瓦,[斯]弗拉迪米尔·巴塔盖尔吉.蜘蛛:社会网络分析技术[M].林 枫,译.北京:世界图书出版社,2014:3.

[5]雷宏振,章 俊,兰娟丽,等.基于谣言传播模型的“微博社区”负面信息扩散效应及案例研究[J].现代情报,2015,35(5):30-34.

[6]许 玉,宗乾进,袁勤俭,等.微博负面口碑传播研究[J].情报杂志,2012,31(7):6-10,24.

[7]刘金荣.基于SNA的突发事件微博谣言传播研究[J].情报杂志,2013,32(7):78-82.

[8]脉脉非法获取微博用户信息终审败诉赔偿200万.[EB/OL].[2017-01-11].http://companies.caixin.com/2017-01-11/101042900.html.

[9]于 洪,杨 显.微博中节点影响力度量与传播路径模式研究[J].通信学报,2012(S1):96-102.

[10]孙 娜,饶培伦,陈 驰.微博客信息传播特点和评价方法研究[J].情报杂志,2013,32(12):31-34,30.

猜你喜欢

单条网络分析谣言
中国使馆驳斥荒谬谣言
基于ISM模型的EPC项目风险网络分析
11 例单条脐动脉栓塞产前超声特征及临床分析
单条板凳躺着,才好看星星呢
当谣言不攻自破之时
铁路有线调度通信的网络分析
谣言
2016年社交网络分析
谣言大揭秘
大班幼儿同伴交往的社会网络分析