突发公共事件背景下网络舆情感知与演化
2020-12-24程冬玲
申 晨,程冬玲,张 倩
(1.河北金融学院 金融科技学院,河北 保定 071000;2.河北金融学院 信息工程与计算机学院,河北 保定 071000;3.河北软件职业技术学院 互联网商务系,河北 保定 071000)
0 引言
截至2020年3月,我国网民数量已达9.04亿,网络成为公众抒发情感、表达立场的重要渠道,也逐渐成为舆情产生、发展和演化的重要场所。网络中的信息传播具有实时、便捷和互动性强的特点。面对传染性疾病、食品安全等重大突发公共事件,网民的情绪和观点会在网络中迅速传播和感染他人,并可能导致舆情的迅速爆发。如果不能对舆情进行准确的研判和及时有效地引导,可能会产生舆情危机并导致严重的社会问题。
通过网络爬虫和分词等技术对网民的观点进行信息提取,并通过情绪感知技术进行舆情感知,最后对网络舆情的演化趋势进行建模和预测,可以及时有效地掌握网络舆情的现状和发展态势。这对于把握舆情的特点和演变规律,并进一步进行有效的引导具有重要意义。
1 信息提取和舆情感知
综合搜索引擎、新闻媒体和社交网络3类数据作为信息来源,以文本信息为主要数据源。一定时间范围内,某些关键词的搜索次数表明了网民对某一热点人物或事件的关注程度。采用百度搜索引擎内置的“百度指数”可以方便地统计网民的搜索情况;新闻媒体的一些文章和观点体现了社会主流舆论;以微博为代表的社交媒体则代表了网民的情绪和观点表达。当研究某一领域的特定问题时,还可以加入与此领域高度相关的专业媒体和社交平台数据。如对于突发公共卫生事件,可以加入丁香园论坛等专业医疗平台作为社交网络数据。对于新闻媒体和社交网络,可以使用Python语言结合Beautiful Soup库进行信息的爬取,并通过Jieba库进行分词;然后利用得到的分词,根据情绪极性词典,对其中的情绪极性词进行提取和计算,进而获得对应来源的情绪极性和程度的分布情况[1]。最后,通过主成分分析法等手段,综合一定时间范围内上述3种来源的信息,即可得到该时间范围内某一特定主题的网民情绪极性和程度的分布情况。
2 构建演化模型
构建舆情演化模型对于研究舆情的发展变化趋势并进一步对舆情进行正向引导具有重要意义。朱毅华等[2]根据舆情传播的一般过程,将网络舆情的演化过程划分为3个阶段,即爆发期、持续关注期和消退期。在此,引入元胞自动机(Cellular Automata,CA)以更准确地对舆情演化过程进行建模。
首先,初始化元胞空间。利用元胞代表网络空间中的个体。通常的做法是,假定元胞极性(cell-polarity)服从二项分布,元胞情感强度(cell-strength)服从均匀分布,这种假定可能与实际情况并不完全吻合。因此,本研究使用上一节得到的舆情感知数据替代原有假设,使元胞的极性和情感强度的分布与所得真实数据一致。元胞个数、元胞知识素养(cell-knowledge)和权威值参数等参考实际数据设定。元胞免疫力、传播可能性服从0到1的均匀分布。设定元胞初始接触次数为0、传播范围为4、初始传播次数为0。
然后,进入元胞演化传播阶段。此时,在T0时刻随机选择某一元胞N0作为舆情发出个体,将其情感强度设置为1,极性设置为-1,接触次数设置为1。自T1时刻起,挑选接触次数大于0的元胞向其范围内的其他元胞施加影响直到系统到达稳定状态。
以2020年长江中下游汛情这一公共事件为例,指定7月1日0至24时作为时间范围,选取百度搜索引擎、新浪新闻和微博作为数据来源,使用上述流程对网络舆情进行信息提取和舆情感知,得到网民情绪的极性和程度分布情况。然后使用元胞自动机模型进行建模,得到舆情规模与时间变化关系如图1所示。从图中可以看出。与一般热点事件相比,突发公共事件具有传播迅速、规模广、持续期长的特点。且从中可以明显分辨出爆发期、持续关注期和消退期的演化趋势。这与舆情演化的一般理论相符合。
图1 舆情规模与时间变化
3 结语
上述方法利用网络爬虫、分词和情绪感知等技术,并结合元胞自动机模型对网络舆情的演化进行建模,可以有效地掌握网络舆情的现状并预测其发展态势,这对于有效地引导突发公共事件导致的网络舆情,并做好舆情预警[3],具有重要意义。
以上方法仍然存在一些不足,一是对于元胞自动机的一些初始参数设置,可以根据突发公共事件背景下网络舆情的特点进行进一步有效调整;二是上述方法在初始化元胞空间时,默认网络舆情的传播处于初始阶段。对于实践中,已经处于爆发期或其他阶段的网络舆情可能并不适用,这也是今后改进的方向。
突发公共事件背景下的网络舆情受众广泛、传播迅速、持续期长,一些担忧和恐慌等负面情绪极易迅速放大。因此,相关部门一定要充分利用好网络空间传播迅速的优势,及时公开真实信息,充分满足公众知情权,传播正能量,做好舆情引导工作,力争在舆情爆发期完成舆情引导工作,把握主动权。