APP下载

基于大数据的危险化学品事故网络舆情研究

2016-06-02孙康张超张英菊

东北财经大学学报 2016年2期
关键词:网络舆情大数据

孙康 张超 张英菊

〔摘要〕百度指数和新浪微指数是以海量网民行为数据为基础的大数据开放平台,是公共管理领域实时、快捷地研究网络舆情的主要来源之一。本文采用K-均值聚类方法和波特五力模型,以天津港“8·12”爆炸事故为例,借助百度指数和新浪微指数平台,研究危险化学品事故网络舆情的演变规律和影响因素。研究结果表明,危险化学品事故发生后,网络舆情迅速爆发,事故发生后的第七天或首个周末,关注度出现小幅反弹,随后逐渐消退;网络舆情演变过程的主要影响因素是危险化学品事故自身的影响力、关注网络舆情的网民和掌握事故稀缺信息的政府,其中政府是处理网络舆情的主导力量。大数据平台的出现为政府实时监管和控制网络舆情走向提供可能,基于大数据的网络舆情研究为完善危险化学品事故应急管理预警系统提供科学支撑。

〔关键词〕危险化学品事故;网络舆情;大数据;舆情热度;天津港爆炸事故

中图分类号:F0626文献标识码:A文

章编号:10084096(2016)02006407

一、引言

大数据开启了一次重大时代转型与社会变革,对网络舆情和公共管理领域研究提出新要求。根据CNNIC最新报告,截至 2015年6月,中国网民规模达 67 亿人,手机网民规模达59亿人,手机上网使用率为 889%[1]。移动智能终端设备迅速普及推广,进一步加快了中国迈向全面网络化大数据时代的步伐。论坛、微博、微信等新型社交媒体的涌现,网络日渐成为公民情感宣泄、利益表达、话题跟进的重要场所。网民主动发布、传播舆情信息的规模大幅增加。网络舆情更加快速、真实地反映社会各个层面的舆情态势。某一危险化学品事故在网上曝光后,互联网凭借其集散效应和放大效应,将局部和区域性问题转变为全国性公共话题。2006年上线的百度指数和2014年上线的新浪微指数以海量用户行为数据为基础,分别以关键词的搜索规模或热议度为指标来反映相关新闻舆论或微博舆情的变化趋势,关注网民的分布趋势,为网络舆情的研究提供了大数据搜索平台。

网络舆情是指在一定的社会空间内,以网络为平台围绕中介性社会事件的发生、发展和演化,作为主体的网民对公共问题和作为客体的社会管理者产生和持有的情绪、意愿、意见和社会政治态度[2]。易承志[3]将群体性突发事件网络舆情划分为形成、扩散、爆发和终结四个阶段。 兰月新和邓新元[4]从实证角度建立突发事件网络演进规律的微分方程,将突发事件网络舆情分为发生期、扩散前期、扩散后期和平稳期。Ma等[5]在研究了国内23次火灾事故后得出特大火灾事故发生后24小时内社会公众关注度达到峰值,之后10天内下降至平均水平。张一文等[6]基于系统动力学建模分析,认识了非常规突发事件涨落规律。卢体广等[7]提出一种模拟浏览器登录微博抓取网页数据的方法,以方便获取任意微博用户网页上的所有数据。钱爱玲等[8]给出了基于多时间序列关联分析论坛舆情趋势预测的方法(TPMTSA)。具体到大数据环境下网络舆情研究,唐涛[9]归纳了当前网络舆情的大数据特征和分类,分析了大数据舆情研究面临的机遇与挑战。李金海等[10]从大数据预测核心技术层面运用拓展的MapReduce对网络舆情文本进行挖掘。王艺[11]和王国华等[12]分别以温州动车事故和上海踩踏事件的微博传播为例,分析了大数据

下微博舆情在重大突发事故中的传播属性、情感立场和舆情结构以及政务微博如何应对网络舆论危机。针对突发事件以及网络舆情研究,主要采用生命周期理论、系统动力学、计算机仿真和时间序列关联分析等方法,关注点集中于大数据的挖掘和网络舆情的发展规律。

二、研究方法与数据来源

大数据时代数据的实时存储和流转为网络舆情和公共管理的决策及预测提供了即时性可能,基于网络舆情分析要向大数据方向发展的现实需求,本文采用K-均值聚类方法和波特五力模型,借助百度指数和新浪微指数大数据开放平台,研究危险化学品事故网络舆情发展规律,实时监控舆情走向,引导网络舆情朝着积极、理性方向发展,稳定网民情绪,满足公众期望,为危险化学品事故及其引发的群体性事件预警系统提供科学支撑。

K-均值聚类方法是根据事先确定的K个类别反复迭代直到把每个样本分到指定的类别中的聚类方法,该聚类方法的特征是快速、简单,时间复杂度近于线性,适合挖掘大数据集。波特五力模型是由波特(Michael Porter)于20世纪80年代初提出,它最早用于研究某一行业中存在的决定竞争规模和程度的五种力量,波特理论更多被用于制定竞争战略规划等商业领域。随着其理论框架的不断成熟,其适用领域也延伸到网络舆情的影响因素研究方面[13]。

根据新浪微指数和百度指数8月12—21日天津港爆炸相关话题和热词的搜索次数,以及天津滨海新区官方微博@滨海发布在8月13—31日发布与事故相关的617条微博,采用分层抽样和系统抽样方法,选取68条微博按照内容分类,研究政务微博如何通过对事故全面、客观、及时报道来应对网络舆情危机。首先,采用K-均值聚类方法分析危险化学品事故网络舆情的发展阶段。其次,采用波特五力模型分析网络舆情的影响因素,契合了危险化学品事故网络舆情的大数据实时、海量特征,分析和挖掘危险化学品事故网络舆情的演变规律。

三、危险化学品事故网络舆情演变规律

根据新浪微指数检索数据得知,天津港“8·12”爆炸事故发生后新浪微博话题榜中榜出现的相关话题达163个,阅读次数超过16亿次的便有10个。其中天津塘沽大爆炸的话题阅读量最高,达到756亿次(如表1所示)。

根据K-均值聚类方法,对天津港爆炸的搜索数据进行标准化处理后,针对以往网络舆情演变规律研究经验和危险化学品事故发生偶然性大、演变不确定性大、环境危害性强和群体扩散性快等特征,赋值K=3,使用SPSS160进行K-均值分析,结果显示危险化学品事故网络舆情分为爆发期、持续期和沉降期(如图1所示)。

作为特大突发事故,天津港爆炸发生24小时内,微博网民予以强烈关注。事故发生于12日深夜,微博提及度在事故发生次日达到高峰,此后明显下滑,爆发期共持续3天。14日,舆情进入持续期,18日微博提及度出现小幅攀升。自19日起舆情关注度明显下降,舆情也进入沉降期,在沉降期舆情的关注度没有再度反弹。

在危险化学品事故网络舆情的爆发期,通过对12—14日新浪微指数实时数据分析,事故发生后的两小时内微博提及度迎来首个高峰,13日上午8—11时及晚上7—8时又先后迎来两次高峰。14日网民对事故的关注度出现明显下滑(如图2所示)。不难看出,若危险化学品事故发生在深夜或凌晨,网民对事故的关注度主要集中在事发后两小时内,次日上午工作时间和下午下班后的晚餐时间。

危险化学品事故网络舆情的持续期,针对18日事故微博提及度再次提升这一反常趋势,通过检索《中国青年报》、《新京报》等传统纸质媒体以及新华网、人民网等新闻网站得出如下结论。首先,按照中国传统习俗,18日为天津港爆炸事故遇难者“头七”祭奠日,天津市及全国多地举行了悼念仪式,网上也发起了相应祈福活动。其次,8月16日,李克强总理到爆炸现场视察,面对大众所关心的牺牲编外消防人员的抚恤问题,李克强总理指出:“牺牲的现役和非现役的消防人员履行同样的职责,也应一视同仁对待,让他们得到同样的抚恤和荣誉,英雄没有编外”。这一话题的迅速传播提升了话题的热议度。最后,中央纪委监察部网站于18日15时20分发布消息:国家安全生产监督管理总局局长、党组书记杨栋梁涉嫌严重违纪违法,已接受组织调查。该事件本身与事故并无直接关联,但是信息发布时间正好处于舆情持续期,因而消息发布后引发公众猜想(如图3所示)。

通过选取天津爆炸为关键词在百度指数中搜索频次统计,发现事故网络舆情信息传播数字特征大体与新浪微指数相同。然而,8月15日搜索指数出现小幅反弹,随后呈现下降趋势,且不存在新浪微指数所显示的18日拐点。15日出现小幅反弹的主要原因是当天为星期六,居民有更多的闲暇时间去关注新闻报道。

危险化学品事故网络舆情的沉降期,自8月19日开始新浪微指数和百度指数同时出现网络舆情的消退特征,下降至平均水平。由于舆情爆发期和持续期政府及时有效的处理,最后再无反弹现象出现。

四、危险化学品事故网络舆情热度影响因素

根据波特五力模型对网络舆情整个生命周期进行分析,可以发现危险化学品事故网络舆情的影响因素主要包括突发事故自身的影响力、关注舆情的网民作为主体的驱动力、以门户网站和新闻网站为代表的网络媒体作为载体的展现力、以电视和报刊为代表的传统媒体作为引体的牵引力、处理事故和舆情的政府机构作为客体的应对力。这五种力量综合起来影响着危险化学品事故网络舆情热度(如图4所示)。

危险化学品事故网络舆情热度的根本决定力是其自身的影响力。对于此类事故或状态的分析,可以从以下三个维度考虑:事故的危害程度、事故的影响方式、事故的影响范围[14]。天津港第一次爆炸发生在2015年8月12日23时34分6秒,近震震级ML约23级,相当于3吨TNT;第二次爆炸发生在30秒钟后,近震震级ML约29级,相当于21吨TNT。数千辆进口汽车在事故中损毁,预估受损新车价值超过20亿元。爆炸造成的保险损失可能高达15亿美元,使其成为中国近年来损失最高的灾难事故。截至8月18日,爆炸导致门窗受损的周边居民户数达到17万多户,另外还有779家商户受损。周边3个小区、6千多名居民转移安置。如此重大的人员伤亡和财产损失引发了国内外高度关注,舆情热议天数也达到了8天之久,远远超过其他公共安全事件。

关注舆情的网民作为危险化学品事故网络舆情的主体展现出强大的驱动力。普通网民仅仅是从人性、道德、法律的角度出发通过评论、转发微博等行为来表达自己对事故的关注。网民中的意见领袖作用甚大。意见领袖凭借其独到的见解、广泛的社交圈、众多的粉丝对突发事件的传播过程和舆情的发展演化具有重要的影响力。以天津港爆炸事故中的热门话题世界上最帅的逆行为例,该微博最早由@妖妖小精于8月13日上午9时28分发布,并配上一张消防员身着橙色消防服逆行火场的漫画。博主为某知名漫画组负责人,在事故发生前就拥有300多万粉丝,再加上这条微博独特的视角,微博发出后总计73万条评论,453万次点赞,更有777万次转发,而阅读量更是达到了94亿次。其他意见领袖也在微博的间接转发过程中起到了重要作用。相关话题的阅读总量则达到了惊人的597亿人次。从年龄结构来看,根据新浪微博的统计,对此次事故关注的用户中90后占到了783%,80后、90后和00后总共占到了962%。青少年群体已经成为关注网络舆情的主体。

以门户网站、社交网站、新闻网站为代表的网络媒体为网民平等参与危险化学品事故讨论提供展现力。一方面,网络媒体去“中心化”的特征可以使公众平等地参与到危险化学品事故的披露和讨论中来,形成政府、公众、媒体的良好互动,推动事故的有效解决。另一方面,它也是负面言论的滋生地。负面言论的传播引发民众恐慌,造成社会秩序紊乱,民众对政府决策产生抵触情绪等负面影响。这一情况在以微博、微信为代表的社交网站尤为凸显。例如,这次事故最早是由当地博主@奏耐天津于8月12日23时39分发布。@天津消防、@天津发布等相继发布相关事故微博将事故始末完整展现出来。而截至8月14日,国家互联网信息办公室严肃查处了360多个传播事故谣言的微博、微信账号,对有关账号采取关停措施。纸质媒体的官方微博在这次事故的舆情传播过程中承担起沟通渠道这一重要职责(如表2所示)。

掌握与事故相关的稀缺信息的政府作为危险化学品事故网络舆情的客体展现出强大的应对力。政府既要充分搜集信息,适时召开新闻发布会介绍事故最新进展,又要通过互联网了解民情,遏制谣言传播,引导网民舆论。

在这次事故中,天津市政府在事故发生后的11天内,总共召开了14场新闻发布会,对事故伤亡情况、医疗救助情况、环境监测、危险化学品处理、周边居民安置、现场清理等公众所关心的问题做出解答。天津市滨海新区管委会官方微博@滨海发布在事故发生之后,以全天候跟踪报道的姿态介绍事故发生前后处理状态,积极回复网民所关注的热门话题,从而保证了公众了解事故真相的透明性和准确性。@滨海发布在8月13—31日的19天内共发布和事故相关的微博 617条,微博转发总量为31 388条,评论总数为19 073条(如图5所示)。

针对选取的67条微博样本,按照微博内容分为事故进展、环境监测、谣言传播、医疗救助、英雄事迹、现场状况、伤亡情况、事故处理方案、灾后注意事项、突发状况、事故调查、灾后重建规划和居民安置13个方面(如表3所示)。

由表3可得,在危险化学品事故发生后,网民对于事故伤亡情况、医疗救助和事故发生地及其周边环境监测的关注贯穿舆情始终。从事故发生到政府召开正式新闻发布会期间,当地官方媒体在应急反应上并不一致,这时也是谣言滋生和传播的最佳时期。从天津港发生爆炸事故到天津市政府召开第一次新闻发布会,在短短11个小时内,网络上散布大量谣言。例如,女孩谎称父亲爆炸中身亡骗 “打赏”;滨海新区秩序混乱,某商场、超市被劫;因北京市离天津市较近,在风的影响下,有害气体可能影响北京,等等。

舆情爆发期,网民更关心的是事故进展、现场状况以及英雄事迹。灾后注意事项以及政府相关部门的联系方式也是网民关注的重点。例如,@滨海发布在13日凌晨5时8分发布题为塘沽中心血站提醒微博,告知欲参加献血的爱心市民献血预约电话,献血前注意事项。从13日16时30分起,@滨海发布采用图文的形式对天津市政府第一次新闻发布会做了全程直播。这两条微博都获得了较高的转发量。

危险化学品事故发生后的第四天舆情进入持续期,在这个时期,网民对事故的关注度不像爆发期那样集中。除了网民持续关心的焦点问题——事故周边区域的环境监测外,灾后重建规划成为网民关心的重点。在经历了舆情爆发期后,政府对事故相关情况得到了全方位了解,结合搜集的数据制定出科学合理的处理方案成为这一阶段的重中之重。

舆情的沉降期,网民对事故的关注度进一步下降。网民重点关注一些突发状况、事故调查、相关责任人的处理、灾后重建以及房屋受损住户的安置、赔偿问题。8月20日,事故周边水库发现大量死鱼;8月26日,事故周边街道出现“臭味”都曾引发一定的关注度。滨海新区政府和相关房地产开发商针对受损住宅善后处置工作的落实更是得到了周边住户的称赞。

五、结论与政策建议

结合天津港“8·12”爆炸事故,采用K-均值聚类方法,以新浪微指数和百度指数大数据开放平台为依据,研究危险化学品事故网络舆情的演变规律,发现危险化学品事故网络舆情分为爆发期、持续期和沉降期;根据波特五力模型将危险化学品事故网络舆情的影响因素归结为危险化学品事故自身的影响力、关注舆情的网民作为主体的驱动力、以门户网站和新闻网站为代表的网络媒体作为载体的展现力、以电视和报刊为代表的传统媒体作为引体的牵引力、处理事故和舆情的政府机构作为客体的应对力。通过对危险化学品事故网络舆情演变过程和舆情热度影响因素分析,得出以下主要结论和政策建议:

首先,事故发生后的第二天属于网络舆情的爆发期,舆情热度达到最大值,随后属于网络舆情的持续期,舆情热度开始衰减。由于危险化学品事故往往造成较大的人员伤亡,在事故发生的爆发期和持续期,包括首个周末和第七天,舆情热度容易出现反弹。对于政府而言,在舆情热度出现小幅反弹的时间段内,应尽量避免发布事故相关的敏感话题,否则会引起舆情热度再一次提升,带来不安定因素,甚至引发群体性事件。

其次,危险化学品事故发生后的整个网络舆情生命周期内,政府应针对事故的不同等级采取应对措施。持续不断地召开新闻发布会,对事故危害程度和周边环境监测结果及时通报,采用科学数据代替主观判断。加强与传统媒体合作,增加电视直播中特约评论员点评和报刊中特别评论员文章,通过对事件的有利报道积极引导网络舆情走势。

最后,政务微博作为政府与网民的沟通平台,应及时答复网络舆情生命周期各个阶段网民所关心的问题。采取文字加图片、链接、视频的多元化形式对事故最新进展、政府召开的新闻发布会进行通报。重视网民中意见领袖的作用,遏制负面言论的传播,关停涉及事故负面言论的微博、微信账号,引导和营造客观、积极的网络舆情环境。

参考文献:

[1]中国互联网络信息中心第36次中国互联网络发展状况统计报告[EB/OL]http://wwwcnnicnetcn/hlwfzyj/hlwxzbg/hlwtjbg/201507/P020150723549500667087pdf,2015-07-22

[2]王来华舆情变动规律初论[J]学术交流,2005,(12):155-159

[3]易承志群体性突发事件网络舆情的演变机制分析[J]情报杂志,2011,(12):6-12

[4]兰月新,邓新元突发事件网络舆情演进规律模型研究[J]情报杂志,2012,(8):47-50

[5]Ma, YP, Shu ,XM, Shen ,SF Study on Network Public Opinion Dissemination and Coping Strategies in Large Fire Disasters[J] Procedia Engineering, 2014, 71(1):616-621

[6]张一文,齐佳音,马君,等网络舆情与非常规突发事件作用机制——基于系统动力学建模分析[J]情报杂志, 2010,(9):1-6

[7]卢体广,刘新,刘任任,等微博数据通用抓取算法[J]计算机工程,2014,(5):12-16,20

[8]钱爱玲,瞿彬彬,卢炎生,等多时间序列关联规则分析的论坛舆情趋势预测[J]南京航空航天大学学报,2012,(6):904-910

[9]唐涛基于大数据的网络舆情分析方法研究[J]现代情报,2014,(3):3-6,11

[10]李金海,何有世,熊强,等基于大数据技术的网络舆情文本挖掘研究[J]情报杂志,2014,(10):1-6,13

[11]王艺对微博舆论场的传播学解构——以“温州动车事故”的微博传播为例[J]新闻界,2012,(1):6-9

[12]王国华,魏程瑞,杨腾飞,等突发事件中政务微博的网络舆论危机应对研究——以上海踩踏事件中的@上海发布为例[J]情报杂志,2015,(4):65-70,53

[13]张义庭,谢威基于熵理论的高校突发事件网络舆情五力模型构建[J]情报杂志,2012,(11):19-22

[14]薛澜,钟开斌突发公共事件分类、分级与分期: 应急体制的管理基础[J]中国行政管理,2005,(2):102-107

(责任编辑:韩淑丽)

猜你喜欢

网络舆情大数据
数据挖掘技术在网络舆情管理中的研究
“互联网+”背景下高校平安校园建设研究
浅析网络舆情治理
基于社会稳定视角的网络舆情预警机制构建的思考
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
突发事件网络舆情的演化规律与监控