APP下载

自然灾害事件信息在微博中的传播规律发现与研究

2016-02-06张大瀚顾益军

网络安全技术与应用 2016年9期
关键词:信息内容信息量新浪

◆张大瀚 顾益军 刘 岩

(中国人民公安大学网络保卫学院 北京 102623)

自然灾害事件信息在微博中的传播规律发现与研究

◆张大瀚 顾益军 刘 岩

(中国人民公安大学网络保卫学院 北京 102623)

随着互联网技术的飞速发展,在线社交网络已与每个人的生活密不可分。当发生重大事件时,许多在线社会网络用户会在社交平台上发表与该事件相关的信息,然而社会网络关系错综复杂,信息量如洪水猛兽般,给舆情管控工作带来重大困难。本文将关注点聚焦到微博中自然灾害类事件,通过统计分析的方法挖掘潜藏在事件表面下的信息传播规律,为舆情管控提供合理有效的建议。

在线社会网络;微博信息传播;信息扩散;信息传播规律

0 引言

信息网络技术的迅猛发展极大地提高了现代人的生活质量,伴随着互联网正逐渐遍布世界的每一个角落,人们每天的社交活动不仅仅局限于现实生活,在线社交网络也成为人们日常社交的主会场。就目前国内发展成熟的OSN(Online Social Network)来看,新浪微博无疑是国内最大的在线社会网络平台。微博中每条信息字数被限制在140字内,其中用户可以发布携带照片、视频链接、音乐链接的内容,每条微博也可设置主题,亦可称之为标签或话题。可不要小看了这“一句话微博”,正是因为字数的限制反而大大提升了可阅读性,使得每一条微博言简意赅,为其方便传播提供了先天条件。微博时效性很强[1],用户通常发表的内容与实时发生的事件有关,而其他用户可能会因为时间同轴而参与讨论,从而形成舆论热点。

学者研究发现,微博舆情发展过程可分为五个时期[2],所有舆情都是要经过高潮到消亡的过程,这是必不可少的。本文根据新浪微博话题平台,统计了近五年内新浪微博十大热门话题,见表1。

表1 2011年—2015年新浪微博十大热门事件

通过对2011年至2015年新浪微博十大热门事件的统计,我们发现舆情焦点主要集中在社会民生、灾害事故、文教体育、时事政治、违法犯罪这些领域,见图1。其中灾害事故类事件共计11件,占全部事件的22%,见图2。当灾难事故发生后,大多数人们愿意关注相关新闻信息,并参与讨论转发。鉴于此本文将自然灾害事件作为研究重点。

图1 2011至2015年新浪微博热门事件比例

图2 2011至2015年新浪微博热门事件分类统计

1 研究问题与研究方法

微博中信息传播的网络是一个复杂网络,网络中信息内容和节点属性对信息传播都起着至关重要的作用。因此,本文以节点属性和信息内容为切入点,对微博中自然灾害事件的信息规律进行研究。

微博信息传播过程中,信息内容是决定微博是否被广泛传播的重要因素。经研究[4]发现,一些信息质量高的微博即使该节点关注度不高,仍会获得较高比率的转发,而一些没有实质内容的微博信息即使是拥有很多粉丝的节点,其转发比率仍差强人意。然而,信息质量的好坏究竟如何评定?通过对信息多维度的特征提取才能保证信息质量的有效评定。本文从以下三方面对微博信息内容进行特征提取:

(1)提取微博信息关键词,设定信息的情感属性研究信息内容。如带有幸福、快乐、坚持、正能量等字眼标记为情感正向;带有郁闷、倒霉、伤心、道德缺失等字眼标记为情感负向。

(2)微博信息中是否带有链接,是否带有标签也是研究信息内容的重要指标。

(3)信息互动指数,表示信息在节点传播时与其他节点的互动性,即点赞数,评论数和转发数的加权之和。

除了信息内容,节点属性也是影响信息传播的重要因素。OSN早期研究者[5]以粉丝数量来衡定用户的传播影响力,认为粉丝数越多,传播覆盖面就越广。实际上,这只是主观上的猜想。如微博名称为“新浪体育”的博主发表关于NBA的信息就会得到大面积的转发,但如果其发布其他领域信息其传播量将极其有限。可见,不光粉丝数量,节点的其他属性也很重要。马俊[6]等将节点属性划分为行为属性和状态属性两种,由于节点的属性参数较多。

本文将节点属性细化为两类:

第一类是性质型属性:节点的性别属性;节点的入度属性,即关注数,表示节点接收信息时的入度值(这里要说明的是,新浪微博为所用用户设置了关注最大值2000,这是为了保证OSN中不出现信息泛滥的现象,同时间接提升了用户接收信息的质量);节点的出度属性,即粉丝数,表示节点i发布信息时的出度值。

第二类是传播型属性:节点的传播影响力,表示节点的信息被转发的次数,被转发的次数越多,说明其传播影响力越强。节点的权威性,转发该节点微博信息的粉丝占总粉丝数的比例。节点的活跃度,该节点多久发布一次微博信息,用平均每天发布的微博数量表示该节点的活跃度。

以信息内容和节点属性为切入点,对新浪微博中自然灾害事件的舆情演化过程做具体分析,找出此类事件信息传播规律,为官方稳控舆情提供科学有效的建议。

2 实验结果分析

2.1 实验数据获取

本文通过新浪微博开放的API接口,编写爬虫代码,先以广度优先再以深度优先爬取数据。选取2015年1月至2016年5月新浪微博中影响最为广泛的十件自然灾害事件,见表2。为保证数据的丰富性,事件6、8、10是发生在国外的自然灾害事件,其余事件是发生在国内的自然灾害事件。

表2 新浪微博2015—2016十大自然灾害事件

2.2 实验结果分析

为更准确的对微博中自然灾害累类事件舆情进行分析,将上述十个事件分成两类:一类是国内自然灾害事件,另一类是国外自然灾害事件。每个事件从初始期到消解期的周期长度不尽相同,为更直观地呈现事件舆情走势,将国内自然灾害事件分短周期和长周期表现,其中短周期事件为北京房山2.7级非天然地震、福建泰宁山体滑坡、台风苏迪罗来袭;长周期事件为超强双台风登陆中国沿海地区、全国寒潮疯狂来袭、东方之星沉船事故、天津港爆炸事故,如图3,图4。短周期事件从初始期到消解期大约经历9天左右,即一周多。

从图3可以清晰看出,事件发生后的前两天,每日的信息量以对数函数xyln=形式迅速增长,达到每日信息量的顶峰。这说明,事件发生后由于各种社会媒体的直面报道,信息传播非常迅速,微博信息覆盖面积迅速扩大,引起众多网友的热议,形成舆情初始规模,达到事件的高潮期。在之后的时间里,每日信息量迅速降低,直至事件进入消解期,舆情解除。这种“来得快,去得也快”的短周期自然灾害类事件,会在事件发生后迅猛引起用户的关注,但这种关注持续时间很短,1至2天左右,此后用户便逐渐退出讨论,不再关注此类事件,导致事件很快进入消解期。而长周期事件从初始期到消解期大约经历25天左右,即三周多。

从图4可以直观观察到,事件发生后的前两天,每日的信息量以对数函数xyln=形式迅速增长,达到每日信息量的顶峰。但与短周期事件不同的是,在达到每日信息量顶峰后,之后的每日信息量时多时少,并不是稳定的减少。这是因为事件发生后,即使达到舆情高潮期,也有可能再次出现伪“高潮”,此“高潮”大多是因为事件发生后舆论发生分支,而引起用户再次讨论。以天津港爆炸事故为例,爆炸发生后,舆情关注重点始终在伤亡情况,波及范围,事态现场等方面。但随着救援队前赴后继,用户出现新的舆论点:“最帅逆行”,至此引起了事件的伪“高潮”。随后的15至20天,逐渐进入事件的消解期,直至舆情解除。总结长周期事件的特点是:“来势汹汹,反复无常,最终消亡”。

再来分析国外自然灾害事件在微博中的舆情走势,如图5。国外自然灾害事件的信息传播周期大约为12天左右,事件发生后的前两天,每日的信息量以对数函数xyln=形式迅速增长,达到每日信息量的顶峰。舆情高潮期到消解期与长周期事件相似,“反复无常”,但时间较短,十天左右。国外自然灾害事件舆情的规律特点不如短周期和长周期事件鲜明直观,但考虑到以下不足:一是本次数据采集平台——新浪微博不是国外主流在线社会媒体平台,因此收集到的数据基本上算是国外自然灾害事件在中国微博用户中的舆情信息。二是国外自然灾害事件关乎中国公民较少,不足以引起国内大面积用户的关注。甚至实际情况是“谁相关谁关注”,使得研究对象很难平衡到所有群体。但国外自然灾害事件舆情的整体走势与我们总结的规律仍然相符,以下就是针对图3,图4,图5所总结出的规律:

(1)自然灾害类事件发生突然,没有明显的舆情初始期,关注期。

(2)自然灾害类事件发生后1至2天,每日信息增量迅猛,微博中覆盖面积迅速扩张,舆情规模扩大,舆情达到高潮期。

(3)短周期自然灾害事件舆情周期大约为9日左右,呈现“来得快,去得也快”的规律。

(4)长周期自然灾害事件舆情周期大约为25日左右,呈现“来势汹汹,反复无常,最终消亡”的规律。

(5)国外自然灾害类事件舆情周期大约为12日左右,事件周期介于短周期时间与长周期时间之间,每日信息增量情况不稳定。

在对自然灾害事件舆情走势分析后,我们对参与事件的节点属性做了详细分析,如图6。通过对参与事件的OSN节点性别属性分析,笔者惊奇的发现,所有的自然灾害事件参与节点的男女比例呈4:1,男性参与自然灾害事件讨论者所占比例在70%—80%左右。可见,自然灾害类事件舆情参与者大多数为男性,少数为女性参与者。

除节点的性别属性外,节点的地理属性也呈现明显规律,如图7。自然灾害类事件舆情的地域分布图清晰显示出,事件参与者大多分布在东南地区,尤以浙江省,广东省,福建省人员为主。其次,节点地域分布在京津冀地区也较多,以北京市,天津市为主。该规律明显,对自然灾害类事件舆情管控有很大帮助,对其他类别事件的研究也有借鉴意义。

图3 短周期自然灾害事件舆情走势图

图4 长周期自然灾害事件舆情走势

图5 国外自然灾害事件走势图

图6 参与事件评论者男女比例

图7 自然灾害事件舆情地域分布图

图8 信息每日统计量占比图

为计算自然灾害类事件的传播速率,考虑到每个事件的信息数量级不相同,如天津港爆炸事件的信息总量为12903条,迪拜航空客机在俄罗斯坠毁的信息总量只有655条,我们对数据进行处理。如图8所示,设定函数)(tfy=,其中t表示事件发生后的第t日,)(tf表示第t日前事件的信息量占事件总体信息量的百分比,该函数的斜率则表示t日的信息传播速率,该方法巧妙地将数量级问题由百分比方式解决。从图8可以清晰观察到自然灾害类事件发生后1至4天,信息传播速率呈指数型增长,传播速率迅速达到最大值后,传播速率很快逐渐趋近于0,即。所以在舆情形成伊始,事件发生后的第5日即可看出事件整个舆论规模的大小,即做到提前预估舆情规模。对官方掌握舆情引控主动性具有很大帮助。

图9 自然灾害事件情感值分布

自然灾害类事件发生后,受众对信息的情感态度也是呈明显规律的。本文计算文本情感属性使用斯坦佛大学自然语言研究团队开发的Stanford Core NLP算法,通过自然语言分析库对获取的微博信息进行情感属性值的计算。结果如图9所示,当灾难发生后,带有积极情感的信息更容易得到受众的传播,以天津港爆炸事故为例,灾难发生后,微博中多数人传播以“祈福”“平安”等为标签的信息,这种积极情感会迅速感染周围节点,营造一种“1+1>2”的氛围,使得事件中的信息传播形成正能量的舆情引导。与此同时,图9可以清晰反映出事件的发生必然会产生多维多向的情感倾向,这时候需要官方积极做出引导,开诚布公,击碎负面谣言,利用“羊群效应”,将公众信息传播情感引入正途。

3 总结与展望

本文视角独特,以自然灾害类事件为切入点,深度挖掘信息在微博中的传播特点和传播规律,爬取2015年下半年—2016年上半年热度最高的十件自然灾害类事件。从信息内容和节点属性两个角度,探究此类事件的信息传播规律。发现此类事件传播周期为10—30天,短周期和长周期事件的传播规律各不相同,但都是在事件发生后的两天内舆情大面积爆发,关注度攀升,随后便逐渐冷却,直至舆情消亡。同时,此类事件的传播速率也呈明显的特征规律,其速率以指数函数上升,随后传播速率随时间增长而趋近于0。节点的性别属性与地域属性也呈明显规律,事件参与者以男性居多,参与讨论者大多以东南省市居多。

舆情管控形势日益严峻,如何在舆情爆发后做出有效疏导工作一直是众多学科研究的焦点。对于微博中自然灾害类事件的信息传播规律已经有了初步分析与研究,未来的工作将会根据本次发现的规律建立行之有效的信息传播模型,以期预测舆情发展趋势,引导受众舆论,管控微博舆情。

[1]Crandall D,Cosley D,Huttenlocher D,et a1.Feedback efIects between similarity and social influence in online communities//Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York,USA,2008.

[2]文卫华,张杰.“微博事件”及其传播特征研究[J].新闻爱好者(下半月),2011.

[3]李坤.自媒体时代微博舆情演化与应对策略[J].中国电子商务,2013.

[4]D.Centola.The spread of behavior in an online social network experiment,2012.

[5]孙睿,罗万伯.网络舆论中节点重要性评估方法综述[J].计算机应用研究,2012.

[6]CHA M,GUMMADI K P.Measuring user influence i n Twitter:the million follower fallacy[J].Artificial Intelligence,2010.

[7]马俊,周刚,许斌,等.基于个人属性特征的微博用户影响力分析[J].计算机应用研究,2013.

[8]戴光全,梁春鼎.基于网络文本内容分析的重大事件意义研究——以2011西安世界园艺博览会为例[J].旅游学刊,20 12.

猜你喜欢

信息内容信息量新浪
重磅!广东省发文,全面放开放宽落户限制、加大住房供应……信息量巨大!
猴子虽小
浅析知识仓库及其在企业管理中的应用
信源、信息内容、情绪特征对微博转发的影响探究
论《网络信息内容生态治理规定》的创新与完善
基于信息理论的交通信息量度量
新浪读书排行榜
如何增加地方电视台时政新闻的信息量
微信公众平台推送信息内容对顾客品牌忠诚的影响
遥感影像信息量与空间分辨率的关系研究