APP下载

基于新浪微博的2017年四川九寨沟7.0级地震舆情情感分析

2020-04-30齐文华苏桂武

华北地震科学 2020年1期
关键词:九寨沟博文灾情

齐 珉,齐文华,苏桂武

(中国地震局地质研究所,北京 100029)

0 引言

中国互联网信息中心(CNNIC)2019年发布的第43次《中国互联网络发展状况统计报告》显示:截至2018年12月,中国网民规模为8.29亿,互联网普及率达59.6%;网络新闻用户为6.75亿,占网民总数的81.4%;微博用户3.51亿,占网民总数的42.3%[1]。随着互联网和移动通信技术的高速发展和日臻成熟,越来越多人通过网络获取新闻资讯,并在网络上表达个人对于新闻事件的观点、看法、情感态度等。网络的开放性、便利性、互动性等特点促使其成为舆情孕育、产生、变化和消亡的承载平台,网络舆情应运而生[2]。关于网络舆情的概念,不同学科领域学者有不同的见解,但都体现了网络空间、多元化的生成模式和传播路径等共性特征[3-5]。本文将讨论地震灾害网络舆情方面的研究,主要关注网络平台/空间上传播的多元主体对地震灾害事件的相关报道、态度、情感和行为倾向等。因此,这里将地震灾害网络舆情界定为由公众(包括个人和各种社会群体)、各类媒体和政府机构,由于地震事件的刺激而产生,通过互联网传播的对于该地震事件的所有认知、态度、情感和行为倾向的集合。

微博是在Web2.0上兴起的一个基于用户关系的信息分享和传播平台,用户可以通过WEB、WAP以及各种客户端组建个人社区,以140字左右的文字更新信息,并实现即时分享。微博的实时性、互动性、强扩散性等特点,特别是地震等重大灾害性事件发生后,大量用户在微博平台上发表言论,使得网络舆情成为反映灾害特征、社会行为活动、公众情感倾向等的重要数据源。及时、充分地挖掘和分析地震灾害网络舆情信息,不仅能快速了解灾区灾情特征,还能及时把握社会各层次主体对具体地震事件的关注点等,对于政府进行舆情监测和引导具有十分重要的意义。新浪微博是由新浪网于2009年推出的提供微型博客服务的类Twitter网站,是当前中国用户数最多、活跃度最高的微博产品。本文在简要综述中国学者针对地震灾害网络舆情相关研究的基础上,以2017年四川九寨沟7.0级地震为例,基于新浪微博数据,重点分析了微博用户对于此次地震事件表现出的情感倾向特征,总结了影响用户情感波动的主要因素。

1 网络舆情在地震灾害中的应用概述

1.1 灾情信息挖掘和分析

快速、动态、准确地获取震后灾情信息是地震应急工作的关键之一;震后快速产生的地震相关网络舆情数据可为获取灾情信息提供一种途径。一方面,地震灾害网络舆情中含有大量灾情相关的文本、图片和视频信息,如人和各类器物的反应、房屋破坏、生命线破坏等等;另一方面,网络舆情的实时性也可满足灾情信息的快速和动态获取。因此,充分挖掘地震灾害网络舆情中的灾情数据,可为地震应急决策提供有效的辅助。胡素平等[6]、帅向华等[7-8]构建了网络地震灾情信息智能获取和处理模型,通过对互联网上2008年汶川地震灾情信息的获取和处理,快速估计了汶川地震的有感范围,并实现了利用网络地震灾情信息进行地震烈度判定。2013年四川芦山7.0级地震后,这方面的研究引起了相关学者和地震行业人员的高度关注,之后历次破坏性地震都有相关论文发表。基于互联网网站数据的主要研究有:张颖等介绍了四川省舆情监控系统在芦山地震中的应用,由该系统产出的舆情简报为地震应急指挥系统和灾情上报系统提供了重要的灾情信息补充[9];张方浩等制定了互联网地震灾情信息分类编码规则,以2014年云南鲁甸6.5级地震为例,利用互联网地震灾情信息生成了灾区范围和受灾程度分布图[10]。基于新浪微博等社交媒体数据的主要研究有:徐敬海等[11]、褚俊秀等[12]发展了一套基于位置微博的地震应急灾情提取方法,分别以2014年云南永善5.0级地震和2014年云南鲁甸6.5级地震为例,实现了微博地震灾情的快速提取与展示;曹彦波等[13-15]通过调用新浪微博API,获取了2014年云南景谷6.6级地震、2017年四川九寨沟7.0级地震和2018年云南通海5.0级地震的灾区范围内微博舆情信息,分析了上述地震相关微博数据所反映的灾情时空演变特征,其结果为救灾决策部署提供了宏观参考。上述研究表明,基于网络舆情数据,尤其是移动/手机微博信息,快速、动态挖掘和分析地震灾情信息正逐渐成为相关学者和地震行业人员的研究热点,并得到了初步的应用;但仍需借助计算机技术和语义分析等其他学科的成熟技术方法,进一步深入和细化相关提取结果,为地震应急工作提供更加及时、准确和动态的灾情信息。

1.2 地震灾害舆情演化与监测

网络舆情主题演化是一个周期性的过程,但随时会受到周围环境扰动,而产生动态变化,且这种变化具有随机性、衍生性、难预测性。因此,随着事件的发展及时识别网络舆情的主题及其关键节点,一方面有助于深化对网络舆情的认知,更好地掌握网络舆情的演化动态,另一方面有助于实现网络舆情的及时疏导。对于地震灾害而言亦是如此。地震发生后,海量的网络舆情中,除上述震情、灾情信息外,还含有数量庞大的以社会行为为主题的相关信息,以及大量衍生信息,如社会捐助、寻人、祈福、灾区需求、谣言、质疑等主题的信息。关于这方面的研究,有学者主要关注地震灾害网络舆情的主题提取方法,如王昊等利用HITS算法对日本“3·11”地震发生后一周内爬取的新浪微博数据进行事件分析,得到每日的主题词[16];苏晓慧等提出了一种改进的TF-PDF算法,通过发布微博的博主影响力以及微博的关注度确定地震主题特征项的权重,从而获得地震信息的热门主题词,并以2013年四川芦山7.0级地震和2012年云南彝良5.7级地震的微博信息为例进行了对比研究[17]。有学者主要研究了地震灾害网络舆情的主题/议题演进,如李紫薇等以2017年四川九寨沟7.0级地震网络舆情为例,基于Matlab软件拟合的地震舆情周期和Gephi软件绘制的地震舆情可视化云图,利用网络结构分析了该次地震网络舆情话题的演进规律[18];刘丽群等以2010年青海玉树7.1级地震、2013年四川芦山7.0级地震和2014年云南鲁甸6.5级地震中的微博舆情为例,借助内容分析法,通过主题类目构建和分析,研究了3次地震灾害网络舆情的主题演进[19];崔满丰分析了国内不同区域网络用户对2015年尼泊尔8.1级地震热点事件的关注程度和舆论走向[20]。也有学者就地震灾害网络舆情中的某个或几个特定主题的产生、发展和消亡开展研究,其中,以地震相关谣言为主题的研究居多,如余欢欢[21]、韩国良等[22]、秦琦琅[23]、徐昕等[24]借助不同震例中出现的地震微博谣言,详细探讨了微博等新媒体网络社交平台中,地震相关谣言传播的特点及传播的生成动因和防范与解决措施。及时动态识别地震灾害网络舆情的各类主题,分析其演化规律,并针对性加以引导,对于灾后应急救援工作也至关重要。当前,开展地震灾害舆情演化与监测方面研究的人员多为新闻传播学或信息与情报学背景的学者,亟需地震行业或应急管理方面研究人员的介入,以从灾害学视角深入理解地震网络舆情的演化和应对。

1.3 地震灾害舆情情感分析

情感分析是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程[25]。新媒体为社会各层次主体提供了自由发表观点/见解和充分表达情感/情绪的广阔平台,也为地震灾害社会影响与响应议题注入了新的内容,分析了解这些内容有助于掌握相关的网络舆情演化情况,为舆情监测、引导和应对等提供科学支持。刘雯等以2013年四川芦山7.0级地震为例,基于新浪微博博文内容,通过情感分析与时间序列联合建模的方法,对此次地震中各类舆情情感走势进行分析,为灾后情报服务和应急管理提供建议[26];沙勇忠等仍以芦山地震为例,借助微博数据情感分析,研究了震后红十字会的公众信任问题,揭示了网民情感与公众信任存在映射关系,可将网民情感作为公众信任的测度工具和诊断手段[27];Cheng等以2011年日本东部9.0级大地震为例,调查了社会媒体如何影响人们对灾难的看法,及其在灾后恢复活动方面的行为意图,分析了人们对灾难感知产生的不同影响[28];Li等获取了2011年日本地震和2010年海地地震的Twitter数据,基于情感词典分析了随着时间的推移人们在地震中的情感反应特征[29]。

1.4 其他方面

除上述3个方面,不同学者还从多个角度开展了地震灾害网络舆情研究,但整体而言系统性不强。如,张群燕等[30]、苏晓慧等[31]利用微博平台用户群大、公众参与性强和实时性等特点,以四川芦山地震为例,尝试了在网络微博平台中及时提取地震前后宏观异常信息,结果表明,微博信息可以作为地震宏观异常信息的一个及时来源,有助于发挥群测群防在防震减灾工作中的作用;杨菁等以四川芦山地震为例,采用内容分析法,探索了重大突发事件中微博舆情结构和应急反应特征[32];张芝霞等[33]、车玥[34]定性论述了微博类新兴网络自媒体在地震应急处置工作中的作用,如广泛调动社会力量参与应急救援、有力推动线下活动等。类似研究也说明了地震灾害网络舆情包含了多方面、多层次的相关信息,如能从多个角度对其进行深入和细致地挖掘和分析,得到的结果将会为地震应急救援、社会影响分析、甚至恢复重建提供关键支持。

综上所述,由于目前地震灾害网络舆情传播的覆盖面及社会影响日益扩大,其既能够及时提供一些灾区灾情或救助需求信息,同时也会存在一些负面因素,影响应急救灾工作及灾区社会秩序,因此及时地收集、分析和管理地震灾害网络舆情,可为多视角、多主体地震灾害响应提供必要的信息补充,这对于减少自然灾害损失和维护社会稳定具有重要意义。需要说明的是,本文所列文献只是网络舆情在地震灾害中的相关研究,且不全面;即便如此,仍能反映出网络舆情在助力地震灾害减灾救灾工作方面的巨大潜力。因此,今后如能充分借助数据挖掘等先进技术和借鉴传播学等相邻学科对于网络舆情的理论和实践研究,将大力提升网络舆情在减轻地震灾害方面的作用。

2 九寨沟地震相关新浪微博的情感倾向分析

2017年8月8日21时19分四川省九寨沟县发生7.0级地震(33.20°N,103.82°E),共造成25人死亡,525人受伤(截至8月13日20时)[35]。震中九寨沟县是全球著名旅游景点九寨沟景区所在地;震时又恰逢暑期,国内外大量游客聚集,该次地震得到社会各界的高度关注。微博用户亦是如此,腾讯微博热搜榜显示:至8月9日热搜榜前十均为该次地震相关信息。除该次地震的震情灾情信息外,大量微博用户发布了对该次地震相关议题的评论、观点等舆情信息,蕴含了丰富的情感内容。分析这些富有情感信息的观点、评论和见解有助于掌握相关的网络舆情演化情况,为舆情监测、引导和应对等提供科学支持。在前人研究成果的基础上,本文以四川九寨沟7.0级地震为例,以新浪微博博文内容为数据来源,分析了微博用户对于此次地震事件表现出的情感倾向特征。

2.1 九寨沟地震微博数据获取和预处理

采用网络爬虫技术[36-37]和调用新浪微博应用程序接口[15,38]是获取新浪微博内容的2种常用方法。本文以“九寨沟地震”为话题关键词,采用Python语言编写网络爬虫,获取了此次九寨沟地震震后7天(即2017年8月8日震后至8月14日)的新浪微博博文数据。

上述通过网络爬虫技术直接获取的新浪微博数据存在重复、无效的信息和异常符号,如同一用户发布的多条内容相同的博文、各种广告信息、特殊符号或句子内空格等。这些重复或无效信息会对博文情感分析的有效性造成影响,因此需要去除。同样采用Python语言编程进行数据去重,删除重复、无效和异常数据,将预处理后的数据存储为csv格式,最终得到用于“九寨沟地震”情感分析的新浪微博博文4 256条。

2.2 九寨沟地震微博数据特征分析

本文从博文数量的时间变化特征、博文词频特征和博文发文者区域特征3个方面简述了九寨沟地震震后新浪微博数据特征。

2.2.1 博文数量的时间变化特征

九寨沟地震震后7天微博发布数量的时间变化特征如图1所示。震后当天和第2天(即8月8日和8月9日)是微博发布的高峰期,相关微博发布数量总计达2 604条,占总数的61%;其中,在8月9日达到顶峰。之后,随时间推移,微博发布数量逐渐减少,微博用户对该次地震事件的关注度降低,但在震后第7天(即8月14日)出现小幅度反弹。分析相关博文发现,小幅度反弹与九寨沟景区自然景观恢复有关—“8月13日,中科院成都山地灾害与环境研究所专家陈晓清对九寨沟景区实地勘察发现,包括五花海、金铃海、镜海等许多海子的水,几乎已经跟地震前一样。”。该条微博首先由“四川日报”在微博平台发布,并引起不少微博用户关注。

图 1 九寨沟地震震后7天新浪微博发布数量分布图

2.2.2 博文词频统计特征

利用Python的jieba库对上述4 256条博文进行中文分词和词频统计,词频超过100的词语如表1所示。

表1所列新浪微博博文高频词不仅直接反映了九寨沟地震,如“地震”、“九寨沟”、“四川”的词频均过千,更涵盖了此次地震造成的社会影响和各主体的响应。社会影响方面有“受伤”“遇难”“生活”“震后”等;社会响应方面有“救援”“应急”“撤离”“祈福”“宣传”“捐款”等,既有政府的响应又有社会组织和社会公众的行动。“游客”“景区”等高频词则反映出景区游客是此次地震的主要受灾群体之一。

2.2.3 博文区域分析

图2显示了不同地区微博用户针对九寨沟地震事件的发博数量。从图2可以看出,九寨沟地震灾区所在的四川微博发布数量最高;北京作为各类国家级地震科研和业务部门、各大媒体所在地,是高活力城市,来自该地区的微博数量仅次于四川;而其他发博数量较多的省份多为东部经济较发达地区,如广东、江苏、山东、福建、上海、浙江、湖北等。值得注意的是,海外微博用户对该次地震也表现出很高的关注度。

2.3 九寨沟地震微博数据情感分析

本文使用沈阳教授团队开发的Rost CM软件进行九寨沟地震相关新浪博文情感倾向分析[26]。Rost CM软件是一款开源的文本挖掘工具,可以实现文本或其他形式内容的情感分析、聚类分析、语义网络和社会网络分析等。该工具利用语义词典将情感词分类,构建了词语权重词典、自定义的否定词词典、程度词词典和感叹词词典;对待分析文本的每一个子句计算权重,将所有权重相加得到整句或整个文本的情感指数。Rost情感分析工具可以将博文情感分成积极、中立和消极3类,其定义的各类情感值区间分别为:积极情绪(5,+∞)、中性情绪[-5,5]和消极情绪(-∞,-5)。该工具交叉检验的结果表明其微博情感值计算准确率达到80.6%。

表 1 九寨沟地震新浪微博舆情词频统计表

图 2 九寨沟地震新浪微博博文区域分布

将上述预处理后的4 256条微博数据导入Rost情感分析工具,计算得到每条博文的情感值(图3),并统计3类博文情感倾向的结果如表2所示:在抓取到的7天微博数据中,表达积极情绪的占了最大比例,为75.30%,表明网友对于九寨沟地震事件整体情绪是趋于积极的。

图 3 九寨沟地震新浪微博舆情网民情感值分布及情感极性统计

表 2 九寨沟地震新浪微博舆情网民情感极性统计表

中性情感博文所反映的网民情感不明显,因此本文只对积极和消极的博文内容进行分析。此外,单纯转发的博文不计入分析范围。通过对九寨沟地震发生后抓取的7天微博文本内容的分析,将表达积极情绪的微博分为4类(图4),分别是表达祝福、灾后救援、灾后重建、其他。

通过对九寨沟地震相关积极情感的微博内容分析,发现网民主要针对灾后救援、灾后重建等信息发表了自己的观点;当然,还有相当一部分网民在地震发生后表达了自己对受灾群众的祝福和希望。整体来看,在积极博文中,表达祝福这一类积极文本占最大比例,为29%;其次是灾后救援和针对灾后重建工作发表的观点,分别是23%和7%。这主要是因为本次研究选取的是震后7天的数据,所以对于灾后重建的内容会比较少,而实时的关注和祈福是最多的微博内容,同时人们也十分关注灾后的救援。

图 4 九寨沟地震新浪微博中积极博文内容的分类及占比

通过对九寨沟地震发生后抓取的7天微博文本内容的分析,将表达消极情绪的微博分为5类(图5),分别是缅怀悼念、政府公信力问题、对社会各界的质疑、灾后救援重建问题、其他。

图 5 九寨沟地震新浪微博中消极博文内容的分类及占比

分析九寨沟地震相关的消极情感的微博内容可知,灾后救援问题主要表现在应急效率、物资、医疗、志愿者、救援道路拥堵、防疫以及灾后重建等方面;分析消极情感的微博内容可知,对社会各界的质疑主要包括对中国各地地震局、非营利机构的作用和意义的质疑;政府公信力问题主要包括面对灾害应急管理政府存在不作为的现象、对政府的相关决策不信任、反对强制捐款、认为相关政府部门上报的灾害损失数额过大,存在贪腐倾向。

3 结论与讨论

地震等重大自然灾害发生后,越来越多的民众通过网络来获取和发布灾情信息、表达个人观点和情感等,产生海量的地震灾害网络数据。本文简要概述了中国学者针对地震灾害网络舆情数据的相关研究,其多围绕地震灾情信息挖掘和分析、地震灾害舆情演化与监测、地震灾害舆情情感分析3个大的方面。此外,不少学者还从多个角度开展了地震灾害网络舆情研究,但整体而言系统性不强。基于研究者从事具体工作视角,地震行业人员主要关注地震灾害震情和灾情提取,传播学及管理学人员多重视地震灾害舆情演化、监测和舆情内容情感分析。虽然本文所列文献只是网络舆情在地震灾害中的相关研究,且不全面,但仍反映了网络舆情在助力地震灾害减灾救灾工作方面的巨大潜力。因此,今后如能充分借助数据挖掘等先进技术和借鉴传播学、管理学等相邻学科对于网络舆情的理论和实践研究,将大大提升网络舆情在减轻地震灾害方面的作用。

基于本文综述,以2017年四川九寨沟7.0级地震为例,将从新浪微博获取的该次地震7天内的4 256条微博作为分析数据,分析了社会民众对于此次地震事件表现出的情感倾向特征。结果表明,对于此次九寨沟地震灾害网民整体表现了积极的情绪:有75.30%的博文表现为积极情感倾向,17.95%表现为消极情感倾向。通过对积极和消极博文的内容分析,初步总结影响网民情绪波动的主要因素有:政府有效响应、救援进度、政府公信力、媒体报道形式、其他衍生话题等。

猜你喜欢

九寨沟博文灾情
2022年6月全球灾情
第一次挣钱
2021年12月全球灾情
长庆油田:灾情就是命令
己亥秋日九寨沟采风得句
赴九寨沟道上(外四首)
题九寨沟(外五首)
震后九寨沟纵览(外四首)
谁和谁好
灾情再显城市短板