基于改进SEIR模型的网络舆情传播研究
2023-07-03徐雅斌
梁 冉,徐雅斌
(1. 北京信息科技大学网络文化与数字传播北京市重点实验室,北京 100101;2. 北京信息科技大学计算机学院,北京 100101)
1 引言
随着移动互联网的飞速发展和Web3.0技术的普及,社交网络以其分布范围广、传播速度快、信息获取便捷等特点,开拓了一种全新的信息传播模式。近年来,各种社交网络平台相继出现,逐渐成为当前舆论生成、发酵、传播最活跃的阵地[1]。据新浪微博发布的《2021年第一季度财报》统计,截止到2021年3月,作为社交网络典型代表的新浪微博平均月活跃用户数为5.30亿,较上季度末月增长2%[2]。在大数据时代各种社交网络平台的兴起,使得信息的传播渠道更加多元化,信息的传递更加便捷。目前,微博已成为用户表达个人情感、相互交流的重要平台,也成为新媒体时代舆情信息传播的重要途径。通过对舆情的传播进行研究,构建适当的传播模型,有助于准确的掌握网络舆情传播的内在规律,帮助监管机构了解舆情的走向。
2 相关研究
对于社交网络中的舆情传播的研究主要集中于对信息传播过程的建模。网络信息传播模型主要分为三类:传染病动力学模型、计算机病毒传播模型以及谣言传播模型[3]。StehléJ[4]等发现舆情信息的传播与病毒传播过程具有相似性,利用微分方程建立的传播动力模型可以用于解决信息在网络中的传播和控制问题。因此其收到了国内外舆情网络传播研究学者的广泛关注。
1927年McKendrick和W.O.K.G[5]在研究黑死病的传播规律时共同构建了经典的传染病动力学模型(Susceptible Infected Recovered Model,SIR),该模型将传播主体分为易感者S、感染者I以及免疫者R。为了解决SIR[6,7]模型传播假设人群是均匀混合的局限性,Anderson和May通过在SIR模型中增加潜伏节点E,共同创建了传染病模型SEIR(Susceptible Exposed Infected Recovered Model)。随着信息技术的不断发展,SEIR模型也已经无法准确的描述舆情传播过程中诸多外界因素的影响,因此学者们根据目前社交网络的特点,不断对SEIR模型进行如下改进。
在针对传播主体间状态转移规则更新的研究中,Lin[8]等引入网民群体动力学和非线性发生率,提出非线性发生率SEIR网络传播模型。Zhang[9]等依据传播主体节点地位的不平等以及受感染节点具有不同程度的传播能力,将感染节点分为高影响感染节点和普通影响感染节点,并根据Pareto原理提出SE2IR信息传播模型。Zhang[10]等发现节点的状态转移由意见值的变化而决定,从而提出了引入媒体与人际关系的MI-SEIR模型。
在针对个体记忆效益与遗忘机制的研究中,Lv[11]等考虑到传播主体的个体差异,从记忆效应、社会加强作用和非冗余接触等角度对SEIR模型进行了改进。王更[12]等将社会加强效应影响后的信息传播概率作为遗忘机制的初值引入SEIR模型,并发现社会加强效应期间的遗忘机制会导致信息的传播范围变小。卢新元[13]等从信息传播网络的三大要素出发,构建了融合用户信息机制与遗忘机制的社交网络传播预测模型,为信息的趋势预测提供了重要依据。
通过针对SEIR模型改进现状的研究发现,目前的改进方案主要有以下不足之处:
1)目前探究动态情绪感染现象对舆情传播过程影响的研究少之又少,且均没有充分考虑舆情传播主体间情感的相互转化、交叉感染对于舆情传播特有的导向性影响。
2)对于遗忘机制的研究成果通常将遗忘率设置为常数,将对舆情信息的遗忘视为一个持续均匀增加的过程,与实际的遗忘效应不符。
针对上述改进方法存在的问题,本文基于BA无标度网络提出了一种融合情感与遗忘机制的舆情传播模型EF-SEIR(Emotion and Forgetting Mechanism-SEIR)。本文的创新点如下:
1)根据感染者在舆情传播过程中所发言论情感倾向的不同,将感染者节点I重新划分为积极感染者Ip以及消极感染者In。并提出了动态情感冲突理论,研究结果可有效阻止情绪极化现象的发生,为避免陷入舆情治理困境提供新思路。
2)考虑到个体记忆效应以及遗忘效应的差异,在舆情传播的免疫阶段引入了改进后的艾宾浩斯遗忘机制。将遗忘过程划分为四个阶级,量化了不同时间间隔下,由于同一事件的再次刺激而阻止用户遗忘的干扰遗忘量。有效弥补了现有研究成果普遍将遗忘量视为一个持续增长过程的缺点,从而使模型对舆情传播过程的仿真结果更符合社交网络中的实际情况。
3 舆情传播影响关键因素分析
3.1 情感冲突
情绪性动机是信息传播的主要动机之一,带有情绪渲染的信息在一定程度上会推进信息传播,加强信息发布者、信息传递者之间的纽带[14]。情感冲突是指感染者节点微博评论的大致情感走向,与其本身发博的情感初衷不一致,而产生的正向情感值与负向情感值的差异。
在实际生活中,由于人与人之间的情感认知程度存在异质性,因此可能会导致感染节点对接收的消息持相反意见。并且同一感染者也会因为受到与其态度相反感染者的多次刺激,进一步自发性产生情感态度的转变。当感染者节点所发微博本身情感走向为正向Wp,而其微博评论中负向评论Cn多于正向评论Cp时,用DIFn来描述当前舆情的情感倾向差异。反之,可用DIFp来描述当前舆情情感倾向差异。
3.2 情感共鸣
情感共鸣是指观察者在他人情感表现的刺激作用下,所引起的情感或情绪上相同或相似的反应倾向[15]。在特定舆情事件的传播过程中,感染者通过观点的表达及互动,彼此会在舆情传播的大环境下获得认同感,短时间内会产生较强的情感共鸣。情感共鸣又可分为正向情感共鸣与负向情感共鸣。在感染者相互获得了认同感并产生情感共鸣后,感染概率β和转化概率α往往会伴随着舆情大环境的变化而发生不同程度上的改变。
3.3 遗忘机制
在现实生活和社交网络中,人与人之间的信息交流网络是十分复杂的,传播过程会同时受到传播主体、客体的异质性和传播媒介等各方面因素的影响[13]。由于人类具有独特的异质性差异,导致每个人对于信息的记忆效果和遗忘量各不相同。Ebbinghaus[16]通过重学法揭示了信息价值会随着时间的流逝而呈现出非线性衰减特征,反映出衰减特性以及遗忘效应对信息传播具有显著的影响[13]。Ebbinghaus[16]研究发现,遗忘在学习之后即开始,并且遗忘的进程并非均匀,记忆量和遗忘均是关于时间的函数,他用无意义音节作为记忆材料,计算记忆和遗忘的数量,得到了记忆遗忘实验数据[15]。
本文为了弥补现有的研究方法仅将接收信息的遗忘量视为一个持续均匀增加的过程的缺点,综合考虑时间间隔及记忆量二者之间的关系,对8类时间间隔进行遗忘梯度划分,共划分为四类,划分的结果如表1所示。
表1 Ebbinghaus记忆遗忘实验数据
本文在参考广大用户实际生活中对于微博的使用习惯以及实际使用情况后,考虑将用户发布微博的时间与该微博收到最新一条点赞、评论与转发时间的平均时间间隔τ,与其对应遗忘梯度的权重φi的线性乘积作为影响遗忘的干扰因子,融合到用户免疫概率下的遗忘机制中。在信息传播过程中,由于遗忘机制引起的传播遗忘概率函数fi(t)的计算如式(1)所示。
(1)
每个遗忘梯度的权重参数值可通过AHP层次分析法确定。首先,根据两两属性之间的重要程度,得出层次判别矩阵如表2所示。
表2 遗忘梯度权重的层次判别矩阵
表3 一致性检验结果汇总
因为计算得到的CR值为0.012<0.1,由此证明本判别矩阵通过一致性检验。进而每个遗忘梯度的权重参数值如表4所示。
表4 AHP层次分析结果
4 舆情传播模型构建
4.1 SEIR模型
SEIR模型将用户和状态分为4类:易感者节点S、潜伏者节点E、感染者节点I、免疫者节点R。SEIR传播模型的基本结构如图1,模型的动力学微分方程如式(2)~(5)所示。
图1 传统SEIR模型
4.2 EF-SEIR模型
由于网络舆情主体在社交网络中社交行为的自主性较强,带有情感态度的舆情信息影响范围更加广泛,并且舆情主体记忆效应以及遗忘效应存在的差异,必然会影响到舆情信息的传播过程。为此,本文构建的EF-SEIR模型的构造如图2所示。
图2 EF-SEIR模型构造
模型中涉及到的主体及其意义见表5,模型中使用的参数及5类状态节点之间的状态转化过程说明见表6。
表5 模型主体因素
表6 各参数含义
基于上述两条假设,可得到t时刻5类状态节点之间的关系满足S(t)+E(t)+Ip(t)+In(t)+R(t)=N。其中,S(t)表示t时刻处于易感状态的节点数,E(t)表示t时刻处于潜伏状态的节点数,Ip(t)表示t时刻处于积极感染状态的节点数,In(t)表示t时刻处于消极感染状态的节点数,R(t)表示t时刻处于免疫状态的节点数。改进后的EF-SEIR模型动力学微分方程如式(6)~(10)所示。
5 实验与分析
刘志明[19]等认为微博的网络结构与BA无标度网络结构性质相符,BA网络的连接度分布函数具有幂律形式,其无明显特征长度且具有增长特性和优先连接特性[20]。因此本文使用MATLAB构建初始BA无标度网络来代替真实的微博网络环境,BA无标度网络模型参数设置为:总节点数N=1000,初始网络节点个数m0=10,每引入一个新节点s生成的最小边数m=4。并对本文提出的EF-SEIR舆情传播模型进行仿真验证,模型初始值设置为:总节点数N=1000,S(t)=990,E(t)=0,Ip(t)=10,In(t)=0,R(t)=0。本文通过如下三组仿真充分探究了各参考因素对舆情传播的影响。
5.1 情感冲突对传播过程影响
不同用户之间的情感倾向的差异程度越大,用户之间产生冲突的可能性就越大。因此,当情感倾向差异为DIFn时,会激化Ip向In转化。相反,当情感倾向差异为DIFp的情况下,会激化In向Ip转化。为了分析情感倾向差异为DIFn及DIFp两种情况下,积极转化率α1以及消极转化率α2对模型的影响,本文设置了以下多个参数方案,如表7所示。
表7 模型参数设置方案
假设其它初始条件不变,将模型参数初始值设置为:λ=0.3,θ=0.3,δ=0.1,β1=0.4,β2=0.2,γ1=0.05,γ2=0.01。探究情感倾向差异为DIFn时,通过增大α1、减小α2激化情感冲突程度,研究各传播节点密度随时间的变化曲线如图3所示。由图3可以看出,在刺激情感冲突激化后,对于Ip,In以及R节点均有较明显的影响。
图3 情感冲突差异DIFn变化的影响
由图3(c)可得,本实验设置的三种方案对于到达曲线Ip峰值的时间并无太大影响,但是均会使得Ip峰值减小。当微博评论中Cn占比越大,α1、α2差值越明显,Ip点的曲线走向越平缓,情感冲突激化的效果越强烈。相反,对比图3(d)可得,In的峰值在舆情传播的初始阶段,随α1、α2差值的增加同样呈现出正相关增长趋势,并且In节点的转换速率也随之增加。
由图3(e)可以看出,免疫节点R密度曲线的走向相较于对照组实验更加平稳。说明当Ip的博文评论中Cn占比较大时,会增加负面舆情信息的传播能力,必要时需舆情监管部门及时介入,避免部分消极感染者In故意煽动负面舆论的爆发。情感倾向差异为DIFn时,情感冲突会导致In节点以及R节点以更慢的速度趋于稳定。说明公众对于负面舆论的关注度更高,负面情绪也更易刺激公众产生认同心理,从而增加了舆情传播的不稳定性,不利于掌控舆情走向。
同样假设模型初始条件不变,情感倾向差异为DIFp时,通过减小α1、增大α2激化情感冲突程度,发现对于S、E、R节点无明显影响。Ip、In传播节点密度随时间的变化曲线如图4所示。
图4 情感冲突差异DIFp变化的影响
对比图3、图4可得,当评论中Cp占比较大时,本文设置的三种方案均会使得E节点以及Ip节点的峰值增加,但整体变化趋势不会有较明显变化。对比图4 (b)可得,情感倾向差异为DIFp时,情感冲突对于In节点的峰值有较强的抑制作用,并且In节点趋于零的转化速率明显加快。由此可见,在舆情传播初期阶段,正向情感可以在一定程度上压制负面情绪的传播。在t=200左右,四条曲线均已趋于零点。但对比图3(c)(d)以及图4发现,负向情感的传播相较于正向情感传播不稳定性更强,舆情传播范围更广泛,会延长事件趋于稳定的时间。因此,应坚定积极感染者Ip的立场,使其不受外界的因素干扰,尽量避免情绪交叉感染现象的发生。
5.2 情感共鸣对传播过程影响
当前舆情传播大环境处于正向情感,即β1大于β2时,在舆情参与者相互获得认同感的同时,会伴随着β1、β2的大幅度增加。由此本文考虑了舆情传播大环境分别处于正向共鸣及负向共鸣时,β1、β2、α1、α2共同变化对模型的影响。本文设置了如表8所示的6种参数方案。
表8 模型参数设置方案
假设其它初始条件不变,当舆情传播大环境以正向情感为主,且β1增大时,通过调整α1、α2增加舆情参与者产生情感共鸣现象的概率,四种方案中各传播节点密度随时间的变化曲线如图5所示。
图5 正向情感共鸣变化的影响
由图5可以看出,本文设置的四组实验方案对于S、E、R节点没有明显的影响效果。虽然正向情感共鸣现象的产生对Ip节点的峰值有增加作用,但并无较大差异。然而,随着β2、α1与α2差值的逐渐增大,对峰值的增强效果越明显。正向情感共鸣现象对于抑制用户转变为消极感染者In的效果更加明显,对比方案三与对照组两条曲线可得,曲线In的峰值约降低了56%。因此,正向情感可以在负面情感产生的萌芽阶段对其起到一定程度的净化作用,可有效阻止情绪极化现象。
同样,当舆情传播大环境以负向情感为主,且β1减小时,四种方案中各传播节点密度随时间的变化曲线如图6所示。可以看出,本文设置的四组实验方案对于Ip、In节点有较为明显的影响效果。在同样减小β1的情况下,随着α1与α2差值的逐渐增大,对曲线Ip峰值的抑制效果越明显。负向情感共鸣对曲线In的峰值有增强效果,虽然不会出现大幅度增长,但是从整体看来,模型趋于稳定的时间仍要增加1倍。并且,消极感染者In的数量在短时间呈现爆炸式增长,说明负向情绪信息在舆情传播的过程更加引人关注。因此,负向情感共鸣现象的发生会导致舆论平息周期加长,容易造成舆情治理困境。相关管控部门要及时介入,引导舆论正确的走向,避免消极感染者In肆意增长而错失治理的最佳时机。
图6 负向情感共鸣变化的影响
5.3 遗忘机制对传播过程影响
假设其它初始条件不变:λ=0.3,θ=0.3,β1=0.4,β2=0.2,δ=0.1,α1=0.3,α2=0.2,γ1=0.08,γ2=0.04。本文设置了以下多个参数方案,如表9所示。
表9 模型参数设置方案
通过对比方案一与方案二的实验结果,探究不同遗忘梯度对模型的影响,此时方案一中的γ1=0.077,γ2=0.037;通过对比方案二与方案三,探究同一遗忘梯度下不同时间间隔τ的变化对模型的影响,此时方案二中的γ1=0.068,γ2=0.028;方案三中的γ1=0.047,γ2=0.007。三种方案中各传播节点密度随时间的变化曲线如图7所示。
图7 改进遗忘机制变化的影响
由图7可以看出,随着时间间隔τ以及遗忘梯度αi的增加,其对遗忘速率γ1、γ2的干扰效果越明显,更加符合遗忘机制对于舆情传播的影响规律。例如,对于某一处于免疫阶段的用户来说,虽然此时该用户正处于对其某一舆情言论的遗忘过程,但是该舆情言论此时仍处于传播阶段。当其他用户接收到舆情信息并进行评论、转发等操作后,由于微博内置的提醒板块,博主本身会再次接收到其原创微博的内容,甚至受到同一信息的二次乃至多次刺激,干扰遗忘速率γ1、γ2的变化规律,从而阻止其对于舆情信息的遗忘过程。
对比三条曲线发现,S、E节点转换速率均有提升,以更快的速度趋于零点,并且E节点曲线峰值有所增加;当时间间隔τ最大时,R节点的曲线最为缓和,说明模型趋于稳定的时间有所延长,更加符合舆情事件在短暂平息后还要经历几次小波动,最终才会逐渐平息的特点。且In的数量相较于Ip更容易发生波动,增长更为明显,说明在舆情事件假性平息后的波动期间,负向情感更容易占领舆情传播的走向,网民也更容易被负向情感左右。因此相关部门应该在舆情事件处于假性平息期间,做好网络舆情的监测与分析,避免负向情绪占据传播主体而错失把控舆情的最佳时机。
6 结束语
本文针对传统SEIR模型没有充分考虑多层级用户之间的情感交叉感染,以及传统遗忘机制在舆情传播免疫阶段存在的不足,重新定义了SEIR模型的节点状态转移规则。构建了引入情感因素与改进遗忘机制的EF-SEIR舆情传播模型。引入改进后的遗忘机制可以描述出由于干扰遗忘量而引发的舆情传播波动,更加符合舆情信息实际的传播过程。
本文提出的EF-SEIR模型为更好地分析舆情的传播机理,有效的控制舆情的传播提供了新的研究思路。建议相关监管部门首先要严防负面评论过多而导致负面情绪的二次爆发,将偏激信息对网络造成的不稳定概率降到最低;其次要在舆情假性平息期间做好舆情的监测与分析,避免负向情绪占据传播主体而错失把控舆情的最佳时机。后期可对模型中存在的二次感染现象进行研究,进一步优化节点转移规律。