考虑兴趣偏好和多事件影响的网络事件推演模型研究
2022-02-08臧洁,任旭
臧 洁,任 旭
(辽宁大学 信息学院,辽宁 沈阳 110036)
0 引言
随着互联网的快速发展和手机等智能设备的普及,互联网已成为我国民众日常生活中必不可少的信息获取渠道和交流方式.民众通过互联网发表和传播各种观点情绪,其中流行于互联网上对于某些事件不同看法的总和,称为网络舆情.网络舆情是由于各种事件的刺激而产生并通过互联网传播,人们对于该事件的认知、态度、情感和行为倾向[1].互联网信息的传播方式极大地缩短了社交距离,如何准确捕捉网络舆情动态、掌握相关规律并及时进行应对,成为众多学者的研究热点.
同时,随着计算机建模仿真技术的发展,越来越多的学者尝试将其应用到网络舆情研究中.尽管网络舆情的传播是一个整体过程,但是从模型仿真角度对其进行研究,需要同时兼顾社交网络结构不同、网民特征属性不同、事件特征属性不同和传播过程的随机性等诸多因素;并且每一项因素的变化都会使最终的网络舆情传播结果产生变化,对于这样一个复杂系统的仿真难度可想而知.针对此现状,学者们提出了各种有针对性的模型进行仿真,其中Bolzern等[2]提出了一个动态的随机多智能体模型,研究社交网络中群体行为存在的特征;赵磊等[3]采用BP神经网络的理论构建模型,使得模型能够对舆情事件热度变化趋势有更精确的仿真效果;兰月新等[4]采用多维函数构建出网络舆情演化高维模型;Wang等[5]在舆情传播模型中引入博弈论,提出基于一对多博弈的舆情传播模型;马宇红等[6]建立了基于BA无标度网络的谣言传播模型,对网络谣言的传播规律进行仿真分析;魏德志等[7]将博弈论与传染病SIRS模型相结合,探寻热点话题传播过程中的规律;Chen等[8]使用SIRS模型对信息扩散过程中的舆论极化现象进行研究;何英等[9]使用Matlab构建网络舆情扩散方向估计模型,可以提高网络舆情突变扩散方向的判断精确度;秦涛等[10]采用排序学习的方法实现了对网络舆情事件演化态势的评估;董靖巍[11]、索琪等[12]着重于研究复杂网络结构下的舆情演化;曹海军等[13]、哈达等[14]应用系统动力学理论构建舆情传播模型.上述研究中所采用模型以及研究对象的多样性,也印证了网络事件传播研究内容的广泛程度.
但是在这些研究中,大部分模型弱化事件区分,将模型构造的关注点落在用户影响力差异化以及社交关系中.首先,模型忽略了用户的个体兴趣偏好对网络事件传播的影响,根据网络舆情的特点,整体网络用户的兴趣偏好对于网络事件的传播会产生不同的影响;其次,忽略了不同类型事件在互联网中受关注的程度,模型中仅能容纳单一事件,但是根据研究发现互联网中各种事件共享同一网络空间,这些事件对于民众的注意力呈现竞争关系,对于网络事件的传播会产生影响.因此,本文在以上研究的基础上,考虑用户个体兴趣偏好和多事件影响,采用元胞自动机(Cellular Automata,CA)原理,首先提出兼顾平台总体用户兴趣特征与个体偏好差异性的CA矩阵;其次在经典SIR传染病模型的基础上,针对多事件容量改进得到多重SIR状态转换关系,构建了适用于网络事件的传播推演模型,并通过实例进行了验证,仿真实验验证了模型的有效性.
1 基础理论
1.1 CA模型
因其上述特征,多年来众多学者将其应用于社会学、生态学和计算机科学等领域.网络事件的传播过程可以看作网民所代表的网络节点间对于事件信息的交换过程,在CA模型中体现为元胞间进行信息传递、改变自身状态的过程.Alves等[15]于2002年将CA理论应用于自由选举舆情分析;王根生等[16]也在CA网络舆情应用中进行了一系列研究.近年来,CA在网络舆情方面的应用更加细化,毛乾任等[17]关注于网络舆情观点聚合,后续还针对导控策略影响下的网络舆情传播[18]进行了研究;姚翠友等[19]提出基于用户属性的微博舆情演化CA模型;滕婕等[20]将CA模型应用于群体辟谣信息的扩散效果预测.上述研究从不同角度均取得了一定的成果,展现出了CA应用于网络舆情研究的潜力.
但对于网络舆情的元胞矩阵构建,在个体差异化的表现形式上,重点区分普通用户、舆论领袖、政府等个体属性影响力[18-19],或者是将元胞区分为传谣个体和辟谣个体[20].这两种方式都存在自身不足,首先元胞矩阵容量不足,过于区分普通用户、舆论领袖等个体差异化元胞,会过渡放大舆论领袖以及政府账号的传播作用,非普通用户元胞的数量稍有变化就会对推演结果产生较大影响.而且,在当前网络社交平台中,不良事件传播很少经过已有舆论领袖进行,都是网民之间自发传播造成影响力.对于传谣辟谣用户,在不清楚信息是否真实的状态下,普通用户无法确认事件真假,所以并不能给予普通用户属性上的认定,对此,本文构建了具有个体偏好差异化的元胞矩阵用以改善上述问题.
1.2 SIR传染病模型
SIR模型是传染病模型中经典的模型之一,由Kermack与McKendrick在1927年用动力学方法构建.其原理为,假设总人数N不变,将总人数分为S(Susceptible)代表易感者、I(Infective)代表感染者、R(Removal)代表移出者等3部分.易感者S会受感染者I影响,依据传染率β变为感染者I,感染者I在依据恢复率γ被治愈后,会变为移出者R不会再被感染,如图1所示.因传染病在人际中的传播过程与网络事件在网络空间中传播的过程类似,网民在整个过程中对于事件的感知也可以划分为对应状态,所以近年来SIR模型在网络舆情方向有诸多研究.Zhao等[21]将SIR模型应用于新型传播网络中,使用数值分析法进行动力学分析;王谢宁等[22]对SIR模型应用平均场理论以及小世界网络,进行有针对性的假设,并对社会化网络中的规律进行探究;陈波等[23]提出SEIR(Susceptible Exposed Infected Removed)传播模型,考虑到传染病存在一定潜伏期,用状态E表示潜伏,对SIR模型的网络舆情应用进行了扩充;丁学君[24]在研究了微博平台网络舆情传播过程及其特点之后,增加了接触状态,构建了基于SCIR的微博网络舆情话题传播模型;Kumar等[25]增添了谣言缓解者以及反对谣言概念,提出SMIR模型,用于对社交网络中谣言传播过程的模拟;田世海等[26]结合信息生态理论对SIR模型进行改进,通过构建网络舆情信息生态群落的横向和纵向衍生模型,探寻舆情信息衍生规律.上述研究虽对SIR模型各自进行了有针对性的改进,但是并未脱离模型最初只针对单一传染病推演的本质,全程围绕单一事件进行研究.
图1 SIR状态转换规则
经过研究发现,同一时刻内网络空间中存在众多事件同时进行传播,这些事件整体共享网络空间,但彼此之间存在对于用户关注度的竞争关系.各类网络平台热点榜单从侧面反映出了事件在经过传播竞争后所受关注度的情况,这种多事件共存关系已有研究但并未得到具体体现,对此本文改进SIR模型以增加模型事件样本量.
2 改进的网络事件传播推演模型
2.1 考虑用户兴趣偏好的个体差异化元胞矩阵构建
对网络用户个体进行合理描述是模型合理性的基础,CA模型应用于网络舆情研究,需要通过构建元胞矩阵对真实网络空间进行微缩来描述用户间的社交关系.但是矩阵所包含的元胞数量有限,既要体现出不同用户所具有的个体差异,又要在有限数量的元胞之间构建起合理的用户比例,这需要对元胞矩阵进行重新构建.现有研究多基于用户权重对该问题进行研究,本文将用户个体兴趣偏好作为个体差异化指标进行元胞矩阵构建,提出了考虑用户偏好的具有个体差异化的元胞矩阵.
初始元胞偏好的构建不随后续事件推演发生变化,不同用户对于不同事件具有不同的偏好排序,首选偏好类型,元胞感知度强,次选偏好类型的感知度弱.个体元胞偏好受整体矩阵元胞偏好比例限制且随机分布,该特征具有平台通用性,如新闻资讯服务平台、社交网络平台、网络文化平台、综合性社区等,可根据不同平台自身用户画像进行比例重构.以微博为例,根据微博平台给出的2021上半年微博热搜榜趋势报告,2021年6月热搜统计中,26%为娱乐热点,36%为社会热点,38%为垂直热点.其中垂直热点涵盖众多垂直话题,如企业、美食、科技、文化等,根据此比例可以逆推微博用户偏好比例.应用于个体差异化元胞矩阵中首选偏好构建的比例为:社会36%、明星13%、综艺13%、美食8%、文化、军事、科技、情感、财经各6%;次选偏好比例相同,且保证同一元胞中首选偏好与次选偏好不同.
根据上述比例构建的初始元胞矩阵,宏观上表现出整个矩阵用户群体兴趣比例,微观上体现出每个元胞自身兴趣偏好不同,充分展现了元胞代表的用户个体间存在的差异化特征.
2.2 考虑多事件影响的多重SIR状态转换
为了体现多事件的竞争关系,使得事件容量更大,本文将多事件传播情况考虑在内,重构了多重SIR状态转换.单一用户可以同时暴露在多个事件信息的影响之下,根据个体偏好不同决定后续受到哪一具体事件影响进行传播或免疫.而且,针对辟谣信息的推演,改进后的多重SIR状态转换,能够将谣言信息与辟谣信息同时作为信息源放入网络空间中进行传播.
图2 改进后的多重SIR状态转换图
表1 改进后的状态转换关系及参数
离线用户状态S0表示对当前所有信息免疫,当元胞进入在线状态S1之后变为事件信息易感者,暴露在不同的事件传播空间之中,会受到邻域内其他元胞状态的影响.当在线用户邻域内出现首选偏好事件a的信息传播者时,系统生成随机数,将其与首选偏好感知度阈值P12进行比较,判断状态是否转换为受首选偏好事件影响但未传播状态S21.S21状态为过渡态,处于此状态的元胞会在下一推演时刻进行选择,选择过程系统生成随机数与受首选偏好传播阈值P2I以及首选偏好免疫阈值P2R进行比较,决定后续状态转换为受到首选偏好事件影响并传播状态S22或事件免疫状态S23.进入事件免疫状态S23后元胞对事件a不再关注,重新对其他类型事件易感,专注度参数PConcentration大小决定元胞能否被其他类型事件所感染.
重构后的多重SIR状态,上述以首选偏好事件分支为代表的单一事件传播过程与传统SIR状态相吻合,有向转换不可逆.但对于在线用户状态S1,因其可能同时暴露在多个事件影响下,即邻域内存在首选偏好事件传播元胞以及次选偏好事件传播元胞,因此后续状态存在多条分支及竞争关系.具体关系表现为,在线用户状态S1受偏好排序优先级影响,以P12、P13概率感知首选或次选偏好事件影响,进入对应分支,此部分在后续实验推演中会控制推演矩阵变化,作为整个模型的动态参数.
2.3 基于个体差异化元胞矩阵与多重 SIR状态转化的网络事件推演模型
本文考虑用户个性化兴趣偏好与多事件对网络事件发展趋势的影响,在改进的网络事件推演模型中,使用的元胞空间是二维空间元胞矩阵A,其中A={C1,1,C1,2,…,C1,j,C2,1,…,Ci,1,…,Ci,j},为二维有限元矩阵,以横纵坐标i,j确定矩阵中每一个元胞个体的位置.采用Moore型邻域对初始时刻矩阵中在线用户比例Dt0进行控制,在此基础上构建基于用户偏好的个体差异化元胞矩阵,作为模型初始化状态,如图3所示.
图3 元胞矩阵示意图
通过上述过程最终得到改进的网络事件推演模型,通过对每次迭代后不同事件、事件不同状态个体数量进行统计,绘制全过程元胞状态变化曲线,展现不同事件推演结果、量化事件覆盖范围与整体传播趋势.
3 实验
3.1 实验环境
本文构建的模型开发工具为Matlab,运行环境为Windows 10 20H2版本64位操作系统,计算机采用2.30GHz,Intel(R)Core(TM)i7-10 875H处理器,16GB内存.
本文3.2、3.3节所使用的有效元胞矩阵大小设置分别为200×200和300×300,元胞偏好比例如2.1节所示,初始元胞在线状态密度为Dt0=0.70.
3.2 模型事件趋势拟合
基于本文提出的网络事件推演模型,对网络事件扩散趋势进行研究.案例选取为2021年11月23日发生的网络热点事件:甲——“中演协公布网络主播警示名单”,乙——“谭咏麟发生辟谣网传消息”.模型转换参数设置依次为:P01=0.001;P10=0.000 5;P12=0.2;P13=0.1;P2I=0.8;P2R=0.2;P3I=0.7;P3R=0.3;PConcentration=0.5.模型进行2 000次迭代推演,以求得长时间跨度下事件扩散趋势.其中,事件甲包含社会与明星复合属性,初始信息源为政府,爆发点数量为4;事件乙为单一明星属性,初始信息源为明星个体,爆发点数量为1.两事件同时放入模型中进行同步扩散推演,统计事件扩散过程中的累计传播范围,结果如图4所示.
图4 事件甲乙传播推演曲线
为了验证本文模型合理性,参照第三方舆情监测平台“知微事见”所给出的事件七日声量走势曲线,对量化曲线进行归一化,然后与本文提出的推演曲线放入同一坐标系中进行比较,结果如图5所示.忽略前200次迭代结果作为事件扩散潜伏期,对不同类型事件处于同一网络空间扩散过程进行推演.从图5中可以看出,本文提出的模型表现出了较好的性能,曲线中前期事件处于爆发期,曲线变化幅度与整体曲线趋势相比较大,模型推演与实际声量走势存在一定误差,但针对不同类型事件同时期扩散程度对比指标表现良好.
图5 事件扩散归一化拟合曲线
3.3 辟谣情况推演
为了进一步验证改进的网络事件推演模型的有效性,对辟谣信息也进行了推演.辟谣信息扩散具有特殊性,即网络谣言与辟谣信息发生时间点不同,各自可以被看作是单独事件同时进行传播,但辟谣信息的传播可以对谣言分布区域产生覆盖作用,受到辟谣信息影响的用户观点会产生变化.对于这种情况,本文提出的网络事件推演模型需要作出具有针对性的调整,即将先发生的网络谣言作为普通事件进行推演,辟谣信息延迟出现且在扩散过程中对于已有谣言传播用户有较大强度影响力.在谣言信息与辟谣信息整体存在竞争关系的基础上,辟谣信息也作为谣言信息传播的后续状态,修改后能够将谣言信息与辟谣信息放在模型中进行同步推演.实验分为不同辟谣方式推演和辟谣时间差推演两部分.辟谣信息转换关系对应参数如表2所示,调整后的元胞状态转换如图6所示.
表2 辟谣信息状态转换关系及参数
图6 辟谣信息传播状态转换图
假设谣言为事件甲,辟谣信息为事件乙,甲传播起始时刻先于乙.具体模型转换参数设定P23=0.9,其余参数值与实验3.2节相同,谣言爆发点数量为2,每次实验模型进行1 000次迭代.以谣言初始传播时间t0为参照,辟谣信息发布时间为推演开始300次迭代后.
辟谣方式分为当事人辟谣、第三方辟谣以及当事人和第三方混合辟谣3种.当事人辟谣表现为谣言初始传播点发布辟谣信息,第三方辟谣表现为谣言信息与辟谣信息初始传播点不同,混合辟谣为上述两种辟谣方式共同作用.辟谣时间差实验,以谣言初始传播时间t0为参照,辟谣信息发布分别延后150、300、450次,模型迭代开始进行混合辟谣,统计每次迭代谣言覆盖范围并绘制曲线.通过模型推演,观察不同辟谣时间差效果,结果如图7、8所示.
图7 辟谣方式比较结果
图8 时间差推演结果
根据模型推演可知,图7中所显示的3种辟谣方式中,混合辟谣效果最优,第三方辟谣效果最差.通过具体模型推演过程中元胞矩阵各状态分布变化可知,当事人辟谣过程以对受谣言影响区域进行覆盖为主,能够及时对谣言信息传播产生影响;第三方辟谣过程主要对未受谣言影响区域进行保护,在与谣言传播区域接触过后再对其进行覆盖,有效干扰时间延后,在及时干预谣言传播方面表现不佳;而混合辟谣方式则结合两种单方面辟谣方式的优点,既有对已受影响区域的覆盖,也有对未受影响区域的保护,对于限制谣言传播范围以及数量具有最优效果.同时,图8中通过控制变量对比不同辟谣时间差推演实验部分的结果可以看出,采用混合辟谣方式可以及时对谣言扩散程度产生影响.谣言曲线的不同变化幅度以及峰值差异,体现出在辟谣信息发布前,谣言信息会随着时间推移发类指数增长方式进行传播.辟谣信息发布时间越晚,谣言信息传播程度越难以进行及时控制.尽管推演后期谣言传播均得到了抑制,但传播峰值差异极大体现了谣言所造成的负面影响程度,因此,及时采取有效的辟谣方式,能够有效限制谣言传播量,使谣言造成的负面影响降到最低.
4 结语
针对目前在网络舆情建模领域研究中存在的模型事件容量小、忽略个体偏好差异性的问题,本文提出了一种关注于网络用户个性化偏好差异性、可容纳多事件共同传播的网络事件传播推演模型.通过实验,本文提出的模型对于不同类型事件共同扩散方面具有良好效果,并且模型能够将谣言信息与辟谣信息放在模型中进行同步推演.本文对于事件类型划分略显粗糙,仅通过理论说明模型具有不同平台通用性的问题.在未来的研究中,会收集更多真实数据对模型进行改进,发挥模型自身优势以适用于更多网络舆情应用场景.