一般性与反转类突发事件网络舆情主题及情感演化对比研究
2023-11-09张浩周睿
张 浩 周 睿
(江苏科技大学经济管理学院 镇江 212100)
0 引言
根据《中华人民共和国突发事件应对法》的规定,突发事件是指突然发生,造成或者可能造成严重社会危害,需要采取应急处置措施予以应对的自然灾害、事故灾难、公共卫生事件和社会安全事件。2020 年以来,突发事件频发,因其具有引发突然性、行为破坏性、瞬间聚众性等特点,亟须相关部门高度关注,一旦发生,政府应当即刻关注舆情走向、安抚民众情绪、稳定社会安全。
在信息网络技术落后的时代,对于突发事件的处理更多在线下进行,群众消息相对闭塞,信息传播渠道与速度都受限制,舆情难以在短时间内爆发。如今社交媒体与网络发展迅速,根据第48 次《中国互联网络发展状况统计报告》显示,截至2021 年6 月,我国网民规模已超10 亿,其中手机网民规模达10.07 亿,占比99.6%[1]。自Web2.0 时代以来,互联网应用去中心化、开放、共享等特点,使用户不断从信息接收者转变为信息创造者、传播者,角色的转换使互联网开放活跃的同时也使信息越发纷繁复杂、真假难辨,舆情反转事件时有发生。鉴于此,突发事件,尤其是涉及到广大群体利益的事件,在网络中往往会迅速引起激烈而持久的讨论,裹挟着丰富而波动的情感,形成网络舆情。
本文着眼于一般性突发事件网络舆情与反转类事件网络舆情在生命周期过程中的情感与主题演变规律的异同,根据生命周期理论,聚焦网络舆情演化呈现出阶段性特征,回顾舆情演化阶段的讨论主题及情感演变。一方面,对调节矛盾关系、把握及引导舆情风向、及时预警以规避重大风险等具有重要理论支撑意义。另一方面,有助于探讨两类事件网络舆情治理的针对性措施,为加强网络空间治理与网络内容建设,构建天朗气清、生态良好的网络空间提供指导意见。
1 文献综述
习近平总书记在2016 年4 月19 日的网络安全与信息工作座谈会中提出新网络舆论观,高度强调了做好网络舆论工作的重要性,提出“让互联网成为我们同群众交流沟通的新平台,成为了解群众、贴近群众、为群众排忧解难的新途径,成为发扬人民民主、接受人民监督的新渠道。”[2]因此,对于突发事件网络舆情的研究不可小觑。
1.1 反转类突发事件网络舆情研究
当今互联网环境鱼龙混杂,信息发布者缺乏责任担当与法律意识,公众判别真假信息能力有限。与此同时,追求“流量至上”的理念使得权威信源可靠性降低,专业媒体人职业素养下滑,真相往往落后于公众情绪,在一定程度上,舆论取决于公众的情绪和态度,而非事实。近年来,舆情反转事件频频发生,如“重庆公交坠江事件”“德阳女医生自杀事件”“广州方圆小学哮喘女孩遭体罚致吐血事件”等均引起社会广泛关注。学界对舆情反转事件的研究开始于2013 年《济南日报》 发表的一篇题为《大妈讹老外:新闻真相反转谁之过》的文章[3],此后学者对舆情反转事件展开深入研究。研究方向基本分为舆情反转的内涵、形成与传播、反转预测等方面。黄远对网络舆论反转的形态及其原因进行归纳分析,从原因、时间、效果三维度将网络舆论反转类型划分为单中心 V 型反转、双中心 N 型反转、螺旋式 S 型反转和次生舆论 U 型反转四类[4]。黄传超等人基于Deffuant 的交互模型与CODA 行为选择机制,构建舆情反转模型,将事件存在反转可能性的指标归纳为认知偏差与个体选择行为的变化率,模拟舆情反转动态过程[5]。宋凯研究了社交媒体中“后真相”舆情事件的传播机制,总结出社交媒体导致传播者复杂化、传播内容生产的“编码——解码”过程、社交媒体传播渠道及受众的社群化、圈层化四方面的规律[6]。夏一雪通过微分方程定性分析网络舆情反转机理以及数值仿真定量分析反转效应,提出微博用户影响力的量化评估方法,较好地预测舆情反转趋势[7]。
以上研究综述表明,研究者对舆情反转现象的研究大多集中在成因、预测及治理,尽管也有学者对舆情反转中网民情绪作用的影响进行探析[8],但对于舆情反转过程中,网民讨论主题及情感演变的研究仍有较大空间。
1.2 一般性突发事件网络舆情研究
对于一般性突发事件的研究,学界多从舆情主体、形成与演化、预警及应对治理等方面展开研讨。舆情主体方面,学者们一是对识别高影响力用户[9]——“话题发起者”“意见领袖”“意见扭转者”及分析其引导舆情、转变舆论风向的作用展开研究[10];二是研究普通舆情参与者的行为选择、观点演化、情绪演变。研究微博舆情时,可以发现微博转发内容占微博内容的很大比例,因此学者对于转发行为的研究投入大量关注。赖胜强[11]对影响用户微博信息转发的因素进行研究,发现信息内容特性、传播者特性以及受众特性与转发行为息息相关。郭亚基于LDA 模型,综合微博作者、用户兴趣、微博热度因素,对用户转发行为进行预测,并得到较好的性能[12]。在舆情演化方面,国内外学者在生命周期阶段划分[13,14]、主题挖掘与情感演化[15-18]、演化模型[19-21]等方面收获颇丰。
1.3 网络舆情对比分析
在网络舆情对比研究分析方面,李博诚[22]将突发公共卫生事件按照是否为人为过失型划分,分析舆情演化过程,对比两类事件的舆情演进方式、热点讨论话题以及情感演化。汤尚对高校意识形态网络舆情进行对比分析,研究发现涉事高校的回应时间、回应主体、回应方式对回应效果产生影响[23]。贾亚敏选取38 个城市突发事件案例进行统计分析,揭示了城市突发事件网络信息传播的生命周期与时序变化规律[24]。杨奕[25]选取Twitter 和Weibo 两个平台的数据,对比复杂公共议题的主题分布、时间演化和关键影响者的表现形式及属性差异。
尽管当前学者已经做出网络舆情对比分析,但少有对舆情反转事件与一般性突发事件的比较分析,难以挖掘出两类典型事件的演化规律以及提出针对性的应对对策。
本文将生命周期全过程未出现事件反转、舆情反转的突发事件定义为一般性突发事件,将在生命周期过程中出现由于谣言、误报等产生事件反转、网民态度反转的突发事件定义为舆情反转突发事件。意图通过对比一般性突发事件与舆情反转突发事件的网络舆情传播与演化规律,探析两类事件主题与情感演变的相似与不同之处,厘清以下问题:(1)两类事件的生命周期阶段特征、演进特征如何?(2)舆情演化过程中,两类事件的主题数量、热议焦点、情感态度变化有何不同?(3)对两类事件的治理与监管方式有何异同?
2 研究设计
2.1 研究框架
本文选取2016-2020 五年间发生的典型舆情反转事件与高影响力的一般性突发事件,利用数据采集工具——后裔采集器,获取国内信息承载量大、传播速度快且范围广、影响力大的微博平台数据,构建评论语料库与博文语料库。在划分舆情演化生命周期基础上,结合TF-IDF 模型和Word2Vec 模型挖掘博文主题,构建情感词典追踪演化过程中网民的情感演变。本文意图寻求舆情演变一般性规律,并对两类事件在生命周期阶段划分、主题及情感演化方面的异同进行比较分析,研究流程框架如图1 所示。首先分别在舆情反转突发事件案例与一般性突发事件案例中选取典型的、适合研究的事件。在微博搜索中,利用关键词检索,筛选出阅读量、讨论量高的话题,并爬取其中的博文与评论数据,对采集到的数据进行清洗及预处理;其次,根据生命周期理论及事件舆情发展热度情况划分舆情演化阶段,并将Word2Vec 训练的词向量结果导入K-Means 聚类,结合TF-IDF 模型的词频结果筛选主题词;再通过构建并扩充完善领域词典判断评论文本情感极性;最后分析对比结果并提出应对策略。
图1 研究流程框架图
2.2 研究方法与步骤
2.2.1 突发事件网络舆情生命周期划分
生命周期能够描述事物从产生到消亡所经历的一系列过程,应用到网络舆情中,反映为信息从产生到失效的全过程,生动地表现出网络舆情信息的不同发展阶段及信息生命力[26]。
根据不同事件类型,其生命周期阶段划分也存在一定差异,一般分为三或四阶段。B.T.Burkholder[27]提出三阶段模型最为知名,即发生、爆发及消亡。国内学者贾亚敏将城市突发事件网络舆情信息传播生命周期划分为起始、爆发、衰退、平息四阶段[24]。廖海涵[26]提出一般意义上的微博舆情划分情况:萌芽、成长、衰退、平稳。本文选取多个事例,观察不同类型的舆情生命周期情况。
2.2.2 突发事件舆情主题提取
本文对微博文本数据预处理后,利用Python中gensim 模块提供的Word2Vec 工具包进行词向量训练,并将训练结果导入K-Means 聚类,计算词之间的欧氏距离,聚类主题,并结合LDA 模型识别话题,得出不同阶段的舆情主题。突发事件舆情主题提取过程如图2。
图2 突发事件舆情主题提取
Word2vec 模型是由T.Mikolov[28]等提出的,属于神经网络的范畴。通过将文本映射为空间向量,使得词语间的联系可以用向量间的运算得出其相似度表示,即训练模型将词语转化成词向量形式。从核心语言模型来说,有Skip-gram和CBOW 两种模型[29],分别如图3(a)和图3(b)。前者是输入词语,预测上下文概率;后者是将词语的上下文作为输入,预测该词语概率。该模型因为考虑了上下文语境,因而有丰富的语义。邓君[29]结合Word2vec 和SVM 提取“滴滴温州女孩遇害”事件微博文本中与五类主体对象的高相似度词语,获得较好效果。本文的研究文本是微博评论文本,Word2vec 方法对该类文本的词向量转化具有较高的准确率。
图3(a) Skip-gram 模型
图3(b) CBOW 模型
LDA(Latent Dirichlet Allocation) 是2003 年由Blei[30]等提出的一种挖掘文本中隐含主题的层次贝叶斯模型,包含文档、主题、词三层,在中文话题提取中应用广泛,其概率图模型如图4 所示。其中,M 为文档数量,K 为每个文档的潜在主题,N 为文档中所有词汇数量。经过LDA 模型之后会生成主题与关键词文档,其生成过程可以总结为4 步:
图4 LDA 文档生成过程
1.从Dirichlet 分布中取样,得到文档m 的主题分布;
2.从多项分布中取样,生成文档m 第n 个词的主题;
3.从Dirichlet 分布中取样,得到主题的词语分布;
4.从多项分布中取样,生成关键词;
2.2.3 突发事件情感演变
目前,国外对网络舆情研究发展起步早,因而其情感词典较为成熟,有LIWC、SentiWordNet等。国内常采用大连理工大学情感词汇本体库、知网HowNet 情感词典、台湾大学NTUSD 简体中文情感词典等[31]。本文情感分析通过对用户发表的评论进行识别,判断其情感倾向:积极、中立、消极。选取适合分析微博、论坛、新闻等社交媒体文本的BosonNLP 情感词典作为基础情感词典,该词典收录大量网络用语,适合本文研究对象——微博数据。结合哈工大停用词表、Hownet词典中的否定词及程度词,并对程度词赋予相应权重,对生命周期各阶段微博评论内容计算情感值。其中,一条评论的情感值根据评论中每句的情感词、否定词及程度词权重计算累计分值,制定情感计算规则如公式(1),当得分大于0 时,判定为积极情感,小于0 时,判定为消极情感,否则,为中立情感。
3 实证分析
3.1 数据获取与预处理
本文选取四类突发事件中易发生舆情反转的事故灾害事件与社会安全事件两大类型。事故灾害事例选取了贵州安顺公交坠湖事件与重庆公交坠江事件;社会安全事件选取了拼多多23岁员工猝死事件与广州方圆小学哮喘女孩遭体罚致吐血事件。
以新浪微博作为数据来源,采用高级搜索,限定关键字、时间、是否为“热门”、是否为“原创”等条件,利用后裔采集器获取相应博文及评论数据。使用Excel 对原始数据进行人工清理,去除重复内容、剔除与事件不相关的带话题营销、蹭热度等内容,通过Python 去除空值、仅@其他账号无评论、“展开全文”、“收起全文”等无效内容。清洗数据后,利用jieba 分词工具,对文本初步分词,并添加新词、不断完善停用词表及自用户定义词典,实现分词结果最优化。
表1 一般性舆情事件与反转类舆情事件描述
3.2 数据结果分析
3.2.1 突发事件生命周期划分
为方便阐述,本文首先对事件进行编号。将一般性突发事件中的安顺公交坠湖事件编号为1-1,拼多多23 岁员工猝死事件编号为1-2,将反转类突发事件中的重庆万州公交坠江事件编号为2-1,广州方圆小学哮喘女孩遭体罚致吐血事件编号为2-2。根据相关事件发生前、中、后期的浏览、讨论量,结合生命周期划分方法,划分两类事件舆情生命周期,结果呈现如图5(a)、5(b)、5(c)、5(d)。
图5(a) 事件1-1 舆情演化热度图
图5(b) 事件1-2 舆情演化热度图
图5(c) 事件2-1 舆情演化热度图
图5(d) 事件2-2 舆情演化热度图
统计7 月7 日至7 月14 日的微博博文发布量,发现事件1-1 事发突然,并无发生征兆及预警,因此并无潜伏期。将演化阶段划分为爆发期(2020 年7 月7 日)、波动期(2020 年7 月8 日至2020 年7 月11 日)、二次爆发期(2020 年7 月12日至2020 年7 月13 日)、衰退消亡期(2020 年7月14 日之后)。
事件1-2 最先在网络中出现是由脉脉用户于2020 年12 月29 日发布,直到1 月3 日才在微博中激起水花,且该社会事件涉及广大的打工人士,讨论周期较长,设置为14 天。本文将采集微博数据时间设置为2020 年12 月29 日-2021年1 月16 日。将生命周期划分为潜伏期(2020 年12 月29 日-2021 年1 月2 日)、爆发期(2021 年1 月3 日-2021 年1 月5 日)、衰退消亡期(2021年1 月6 日-2021 年1 月16 日)。
事件2-1 发生于2018 年10 月28 日,本文以14 天为生命周期,爬取10 月28 至11 月10日的博文及评论数据。该事件生命周期划分为爆发期(2018 年10 月28 日=2018 年10 月29 日)、衰退期(2018 年10 月30 日=2018 年11 月1 日)、二次爆发期(2018 年11 月2 日-2018 年11 月3日)、长尾平息期(2018 年11 月4 日-2018 年11月10 日)。
事件2-2 事件生命周期短,以3 小时为单位划分时间窗,根据讨论热度图将该事件舆情生命周期阶段划分为:潜伏期(2020 年5 月30 日0:00-2020 年5 月30 日9:00)、爆发期(2020 年5月30 日9:00-2020 年5 月30 日15:00)、回落期(2020年5月30日15:00-2020年5月31日3:00)、二次爆发波动期(2020 年5 月31 日3:00-2020年5 月31 日21:00)、长尾期(2020 年5 月31 日21:00-2020 年6 月2 日9:00:)。可以归为三阶段:舆情爆料与回应、舆情反转阶段、舆情平息期。
通过比对一般性突发事件及反转类突发事件的网络舆情生命周期长度及演进方式,发现反转类突发事件网络舆情通常比一般性突发事件网络舆情的生命周期长且复杂。由于一般性突发事件相关责任方明确、事件发生前因后果清晰,爆发快且初期阶段热度高,但伴随着舆情逐步深入发酵,讨论持续时间短,讨论热度达到峰值后便走向衰退平息,而反转事件在爆出反转后讨论热度比事件起初爆发更高。另外,由于事件1-1与2-1 均属于事故灾害事件,存在官方通报的后续,往往会引发再次讨论,因此均有二次的爆发周期。从演进方式看,结合杜洪涛[32]等人对突发事件网络舆情演化模式研究,影响舆情演进方式的因素主要有人群范围、地域面积、事件严重等级等静态因素以及政府或企业等利益主体介入及舆情衍生等动态因素。一般性突发事件主要受静态因素影响,其演进方式以单峰型为主,而反转类突发事件往往在官方发布消息后出现二次峰值,呈现双峰甚至多峰的演进形式。
3.2.2 突发事件文本内容分析
从微博用户对社会性事件讨论的文本内容,即舆情本体角度出发,结合Word2vec 模型与K-Means 聚类,识别舆情演化各阶段的主题数量及内容,再比对LDA 主题模型结果,观测一般突发事件网络舆情与反转类事件网络舆情主题演变的异同。两类事件主题数量统计结果如表2 所示,主题内容提取选择部分结果呈现,如表3、表4 所示。此外,为增强主题演变的可视性,本文绘制舆情演化各阶段关键词词云图,选择部分结果呈现,如图6 所示。
表2 两类事件主题数量统计结果
图6 事件1-1 舆情演化各阶段关键词词云图
表3 事件1-2 舆情演化各阶段主题抽取结果
表4 事件2-1 舆情演化各阶段主题抽取结果
1司机 大妈 泼妇 素质 冲动过站第三阶段官方发布视频后,网友对肇事者冲动与司机争执表示愤怒2乘客 冷漠 制止 素质 责任保护讨论车内乘客的态度3司机 刹车 停车 法律 隔离故意讨论司机偏激的处理方式1实事求是 寓言故事 女司机疑邻偷斧对事故原因反转的反思第四阶段2无辜 生命 安息 逝者 乘客回家同情无辜生命的逝去3负责 赔偿 司机 大妈 法律责任对事故责任划分和赔偿问题的讨论
本文从主题数量、主题内容两方面对一般性突发事件及反转类突发事件的文本内容进行对比研究。不难发现,反转类突发事件的主题数量普遍多于一般性突发事件。究其原因,主要有:
(1)情绪驱动机制
我国社交媒体传播实践赋予了“后真相”本土化特色,即“后真相”舆情事件的出现领域从政治事件延伸到社会公共事件。网民对涉及教育问题、公共卫生、公共安全、劳资关系、两性关系等方面的社会公共事件表现出强烈的转发扩散、想法表达、情感倾诉的需求,而情绪驱动下的海量碎片信息传播使事件很难以原本的样貌在舆论场中运动,故网民讨论的话题五花八门。此外,信息过载带来的“信息茧房”用同质化的信息将网民的思想认知禁锢,使其难以辨别事件真假、更难以用辩证思维看待事件,取而代之的是用同质化的,尤其是负面的情绪去宣泄、传播以引发更多衍生话题的讨论。在反转事件网络舆情中,网民情绪更为复杂多变,因此讨论的话题也多于一般性突发事件网络舆情。
(2)反沉默螺旋理论
早在1974 年,德国传播学家诺埃勒·诺依曼遍提出了“沉默螺旋”理论[33],即当人们发现自己处于大多数人的阵营中时,更倾向于积极表达观点,反之,则趋向于沉默。而后起的“反沉默螺旋”理论则是在舆论主体多元化、个性化、发表观点匿名化等基础上建立的。根据“反沉默螺旋”理论,即使自身观点不符合主流群体的情况下,网民也敢于抒发己见,畅所欲言。当事件发生反转时,无论此前是否发表过观点,网民都倾向于表达对事件本身及反转的看法。
从主题内容看,对于一般性事件,民众关注焦点主要在:①各大媒体对事件的报道及求知发生原因;②对事件中利益受损方的同情及责任方的指责;③对事件处理结果及解决方案的讨论;④对以往类似事件的讨论。对于反转舆情事件,民众对以下主题讨论更多:①对官方回应的关注;②对恶意发布及传播虚假信息行为的唾弃;③对反转原因的反思;④对事件处理结果的关注;⑤对以往类似事件的回顾。尽管两类事件关注主题各有侧重,但也有一些共同之处,如对事件处理结果的关注及对以往相似事件的回忆。本质上看,目的都是为了避免类似问题的发生,并且都遵循着“事件引起关注——追踪事件走向——关注调查进展、官方报道——事后复盘”的一般规律。
3.2.3 突发事件评论情感分析
本文根据情感计算规则计算出情感值后,分别统计出各阶段的积极、消极、中性的评论条数,根据微博用户评论信息中包含的情绪,发现并总结两类事件生命周期演化阶段的情感极性变化情况。
如图7(a)、7 (b)、7 (c)、7 (d),研究结果表明:①无论是一般性突发事件还是舆情反转突发事件,消极情绪占比普遍高于积极情绪,直到事件进入衰退长尾期,依然是负面情绪占优势。由事件1-1 和2-1 的舆论情绪占比情况可以看出,在官方发布通告后,网民消极情绪占比甚至超过通报之前,可见故意引发重大交通事故、危害人身安全、造成社会恐慌的事件足以引起公愤,甚至导致对社会安全感的怀疑。②从对比角度出发,舆情反转突发事件在事件发生反转后网民表达情绪比反转前成倍上涨,且负面情绪完全爆发,其中包含个人情感被欺骗、被利用的愤怒及对谣言信息发布与传播责任方的斥责。而在一般性突发事件网络舆情中,网民表达情绪热情与时间呈现负相关趋势,且负面情绪相较于反转事件有所减弱。③在舆情反转事件中,积极情绪在演化阶段后期呈现出上升趋势,表明官方发布公告对于舆情的正向引导发生一定作用。事件2-2 是关于校园安全、教育问题的事件,在经过官方介入,指出恶劣事件为造假后,积极情绪表现在对相关部门作为的支持与对社会向上向善向好的美好愿景。
图7(a) 事件1-1 阶段情绪分布情况
图7(b) 事件1-2 阶段情绪分布情况
图7(c) 事件2-1 阶段情绪分布情况
图7(d) 事件2-1 阶段情绪分布情况
4 结论与建议
本文以突发事件中易发生反转的事故灾害事件与社会安全事件为案例,按照讨论热度划分演化阶段,利用LDA 方法提取各阶段主题,构建情感得分规则判断各阶段情感倾向,结合主题与情感分析两类事件演化规律的异同结合本文研究结论,对两类突发事件网络舆情治理提出对应策略:
(1)把握共同特征,抓住关键角色
从应对措施共同点角度出发,无论是一般性突发事件,还是舆情反转突发事件,都需要牢牢抓住意见领袖、媒体人、政府部门[34]等关键点。意见领袖对引导其粉丝群体的作用不可小觑,应当在对事实真相有所把握的情况下,结合自身具备的专业知识理性发言,正确引导粉丝。媒体人作为发布、追踪事件的领头角色,应当不以“流量密码”为首要追求,而以探寻事实真相为永恒目标;不以看戏态度刺激民众情绪,而以职责担当纠正民众价值偏差。这要求媒体人坚定树立责任意识、不断提高专业素养、不忘初心科学求真。政府部门面对网络舆情,应当及时、正面、正确回应,规避以往删帖、清空话题等阻止信息传播的方式,利用好网络这把双刃剑,把握民生关切、引导公众情绪。
(2)加强舆情动态监测,做好舆情危机预警
在网络普及程度极高、民众参与网络治理的时代,舆情演化的生命周期也在不断缩短,但这并不意味着可以放任舆情发酵、坐等其自灭,因为恶劣事件的传播虽然在网络世界中暂时停下脚步,却会在人们心中埋下一颗随时爆炸的地雷。得益于网络的发展,大数据在舆情监测方面能够大展拳脚,相关部门应当加强舆情监测的技术手段,对热点信息、热议焦点、网民情绪实时把控,及时关注事件进展,做好舆情危机预警,谨防事态严重化、不可控化。
(3)提高政府办事能力,积极应对舆情反转
由于公众素质难以短时间普遍提高,且限制信息发布人群可执行性低,而公众群体数量庞大、影响范围广、发声渠道多、互联网传播速度快,所以舆情反转无法避免。对于反转类突发事件,相关部门更应当提高办事效率、及时公开调查进展,减少谣言滋生传播机会,不断提升公信力;加强舆论监督工作,对媒体报道及公众言论进行严格审查;建立惩戒机制、加强对造谣者的打击力度。
本文创造性地提出一般性突发事件网络舆情概念,对一般性突发事件及反转类突发事件网络舆情进行了初步对比研究,通过对两类事件的生命周期阶段划分、主题与情感演变情况的比较,探究两类舆情事件的演化规律,并提出治理建议。一方面,本研究丰富了网络舆情研究的现有内容;另一方面,也为相关部门结合已有的对舆论反转预测的研究,在事件发生发酵时,依据该事件是否有反转的可能性,做出有的放矢的舆情治理应对决策提供理论支持,使其能够在事件反转前做出紧急预警,以防舆论发酵衍生带来的严重后果。