APP下载

基于改进SEIR模型的微博舆情衍生话题传播研究

2022-09-24王筱莉赵来军夏志杰

信息资源管理学报 2022年4期
关键词:传播者比率舆情

王筱莉 张 静 赵来军 夏志杰

(1.上海工程技术大学管理学院,上海,201620; 2.上海理工大学管理学院,上海,200093;3.上海交通大学安泰经济与管理学院,上海,200030; 4.上海交通大学中美物流研究院,上海,200030)

1 引言

微博作为我国主要社交平台,具有“碎片化”信息、“病毒式”传播、多样化信道等特点[1],是当前国内舆情主要发生地。微博提供的“热搜、话题、热点流”三大应用功能使无任何关联的用户进行信息交互,从而加快了舆情传播速度,使舆论在短时间内迅速扩散。而舆情当事人的回应、政府对舆情事件的介入、网络推手和意见领袖的引导等因素,使舆情在传播过程中产生多个话题,这些话题此消彼长、相互关联,从而使得舆情衍生话题传播现象逐渐涌现。如2021年1月18日“郑爽张恒代孕”事件,在证据发布、官方评价和当事人回应多方影响下,至1月23日共出现九个高热度微博话题传播。微博舆情衍生话题的存在扩大了舆情传播的深度和广度,其带来的负面情绪和不实言论极大地干扰着网民日常生活,给社会稳定造成影响,因此,微博成为我国政府舆情管理的重中之重,对微博舆情衍生话题传播规律的研究十分必要。

近年来,基于传播动力学模型在社交网络信息传播方面的研究受到了学界广泛关注,由于在线社交网络中的信息传播机制与传染病传播机制相似,大多数网络传播动力学研究主要基于经典的传染病传播模型,如Kermack等[2]提出的经典的SIR模型,将模型中的人划分为三类:S(易感染者)、I(传播者)、R(免疫者);陈波等[3]、Witbooi[4]考虑接收到舆情但并未传播的群体,在SIR模型中加入E(潜在传播者)构建了SEIR舆情传播模型。之后,不少学者基于不同考虑在上述经典模型基础上进行了改进,如Zhao等[5]考虑遗忘和记忆机制对个体的影响,提出SIHR模型。随着网络舆情研究的不断深入,不少学者对特定环境下微博舆情进行了研究,魏静等[6]构建改进的SIR模型对微博网络结构和信息传播进行分析;刘泉等[7]构建了考虑反从众心理因素的微博舆情演化模型;张志花等[8]基于唤醒机制,构建“冬眠者”被意见领袖唤醒再次进行传播的微博谣言传播模型;马宁等[9]将微博舆情划分为两个阶段,分析网络推手和官方微博在舆情中的博弈,并基于SIR模型和Lotka-Volterra竞争模型进行分析。

在人人触媒时代,微博舆情衍生话题传播逐渐盛行,不少学者开始研究微博舆情话题的衍生特性,朱恒民[10]和李青等[11]基于SIR模型构建了微博舆情单一话题传播演化模型;王治莹等[12]考虑多种异质信息在出现时间差异情境下的竞争传播规律,构建了非正式信息和正式信息的两阶段竞争传播模型;丁学君[13]以SIR模型为基础,通过引入网民接触状态,构建了基于SCIR的微博舆情话题传播模型;陈富集等[14]在SEIR模型基础上加入舆情话题衍生率,构建了SEIRS微博舆情传播演化模型;崔金栋等[15]以SEIR模型为出发点,考虑话题的二次传播,构建了微博话题式信息传播H-SEIR模型;田世海等[16]对SIR模型进行改进,分别构建了网络舆情信息生态群落横向和纵向衍生模型;Jiang等[17]将人群划分为敏感、消极、积极、恢复四个状态,依据真相是否出现将舆情传播过程划为两个阶段,分别建立模型进行研究;Zhang等[18]基于SEIR模型,建立初始话题传播层与衍生话题传播层双层舆情传播模型,研究主题推导率及主题连接方式对传播趋势的影响。

虽然以上研究成果对舆情传播的研究作出了重要贡献,近几年关于微博舆情衍生话题的研究也逐渐增加,但有些研究[15-19]未考虑将原始话题与衍生话题分离为两类不同传播人群,或者未考虑到免疫者接触到新话题时再次转化为衍生话题传播者的现象,且同一舆情不同话题的传播也会存在竞争情况。因此,本文基于已有研究提出改进的微博舆情衍生话题传播模型,改进之处有两点:①加入免疫者接触到新话题会转化为新话题传播者的情况;②将同一舆情不同话题传播者进行区分,划分为不同传播人群,并构建Lotka-Volterra模型,分析不同话题传播之间的竞争。

1 传统的传播模型

1.1 SIR模型

SIR模型是最为经典的传播模型,其将全体人群分为三类: 未知者S,指尚未得知舆情信息的人群;传播者I,指正在传播舆情信息的人群;免疫者R,指对舆情信息不感兴趣或已经传播过舆情信息的人群。SIR模型的传播路径为S→I→R,未知者S以α的比率变为传播者I,传播者I再以γ的比率变为免疫者R。当传播过程结束后,网络中只存在S和R两种状态。其传播路径如图1所示。其传播动力学微分方程表示如下:

图1 SIR传播模型

(1)

(2)

(3)

1.2 SEIR模型

SEIR模型是基于SIR模型的一个扩展模型。该模型在SIR模型的基础上加入了潜伏人群E,其表示已经知道了舆情信息但尚未决定是否传播信息的人群。SEIR模型的传播路径为S→E→I→R,未知者S以α的比率变为潜伏者E,潜伏者E若对舆情感兴趣以μ的比率变为传播者I,否则以β的比率变为免疫者R,传播者I以γ的比率变为免疫者R。其传播路径如图2所示。其传播动力学微分方程表示如下:

图2 SEIR模型

(4)

(5)

(6)

(7)

2 改进SEIR模型的微博舆情衍生话题传播构建

2.1 微博舆情衍生话题传播模型描述

由于在线社交网络中信息传播机制与传染病传播机制相似,考虑微博舆情传播过程中存在潜在传播者人群和舆情在平台中扩散后产生衍生话题的实际情况,本文对传统SEIR模型进行改进。若话题得到进一步深入或反转,舆情新话题的出现会增加网民对该舆情事件的关注,进入的新话题使免疫者重新转化为传播者。与已有研究将传播者划分为谣言传播者和辟谣者不同的是,本文考虑了同一舆情在话题方向上的差别也会存在传播的竞争,因此在构建模型时将不同话题传播者进行区分。

微博平台信息传播过程中,每个节点(网民)状态会随着事件信息的发布、传播而发生转变,从而对传播过程及微博网络结构带来一定的影响[17]。依据舆情传播特点[3],将网民划分为S(未知者)、E(潜在传播者)、I(传播者)和R(免疫者)四类,S表示对舆情事件并不知情的微博用户,E表示接收到舆情信息后点赞、评论而并未转发的微博用户、I表示对舆情信息进行传播的微博用户,若同一舆情有差别较大的不同话题扩散时,分别用Ia、Ib、Ic……In表示舆情不同话题传播者,其中I=Ia+Ib+Ic+……+In。R是指对舆情信息不感兴趣的微博用户。用S(t)、E(t)、I(t)、R(t)表示四类群体在t时刻所占比例,N表示社交网络平台中总人数,则S(t)+H(t)+I(t)+R(t)=N。

2.2 微博舆情衍生话题传播模型建立

当舆情只有一种话题传播方向时,则为最基本的SEIR传播模型,微博舆情单一话题传播模型如图3所示,网民在微博社区进行舆情传播的规则为:①S(未知者)遇到I(传播者)后,若对舆情感兴趣以α1的比率转化为E,否则以α2的比率转化为R(免疫者)。未知者遇到传播者后,则已获取了舆情信息,其状态发生改变,故α1+α2=1;②E(潜在传播者)经过考虑后以μ的比率转化为I(传播者),以β的比率转化为R(免疫者),μ代表了潜在传播者参与舆情传播的意愿,其中μ+β=1;③考虑到当前舆情传播速度快、周期短的特点,I(传播者)在遇到R(免 疫者)后以γ的比率转化为R(免疫者),其中I表示舆情事件所有话题传播者,k表示微博网络平均密度。

图3 微博舆情单一话题传播模型

当一种舆情话题传播得到质疑或新证据散布后,舆情往往出现不止一种话题传播方向,根据舆情事件的发展不断衍生出新话题,微博舆情双话题传播模型如图4所示,传播模型中各符号含义如表1所示,网民在微博社区进行双话题传播的规则为:①S(未知者)遇到I(传播者)接触到舆情信息后若对舆情话题感兴趣,则以α1的比率转化为E(潜在传播者),否则以α2的比率转化为R(免疫者),其中α1+α2=1;②(潜在传播者)E经过考虑后以μ1的比率转化为Ia(传播者),以μ2的比率转化为Ib(传播者),以β的比率转化为R(免疫者),其中μ1+μ2+β=1;③Ia、Ib(传播者)遇到R(免疫者)时分别以γ1、γ2的比率转化为R(免疫者);④R(免疫者)遇到Ib(新话题传播者)时,若对新话题感兴趣,则以θ的比率转化为Ib(新话题传播者)。同理,微博舆情事件出现多话题传播时,其传播模型如图5所示。

图4 微博舆情双话题传播模型

图5 微博舆情多话题传播模型

表1 微博双话题传播模型中各符号含义

基于图3微博舆情单一话题传播模型和传播规则,给出状态转移微分方程如下[8]:

(8)

(9)

(10)

γkI(t)R(t)

(11)

基于图4微博舆情双话题传播模型和传播规则,给出状态转移微分方程如下:

(12)

+β)E(t)

(13)

(14)

θkIb(t)R(t)

(15)

+γ2kIb(t)R(t)+E(t)-θkIb(t)R(t)

(16)

基于图5微博舆情多话题传播模型和传播规则,给出状态转移微分方程如下:

(17)

+μn+β)E(t)

(18)

(19)

θ1kIb(t)R(t)

(20)

θn-1kIn(t)R(t)

(21)

+…+γnkIn(t)R(t)+E(t)-…

-θn-1kIn(t)R(t)

(22)

3 微博舆情衍生话题传播模型分析

3.1 单一话题和双话题的传播阈值分析

为了详细研究不同参数对传播阈值的影响,对阈值分析部分进行可视化,图6展示了参数 在[0,0.5]范围时对传播阈值的影响,其他参数取值参考朱恒民等[10]的研究,其中新话题转化率θ取值为0.3,新话题传播者Ib转化为免疫者R的比率γ2取值为0.2,潜在传播者E转化为新话题传播者Ib的比率μ2取值为0.4。由图6可知,随着免疫率 的增加,两种话题传播模型的传播阈值均明显增加,从而促使传播人数减少,达到减少舆情事件影响的作用,且由于γ2<θ,可以明显看出,在相同条件下,双话题的传播阈值低于单一话题的传播阈值,说明在此情况下,双话题更易传播扩散。

图6 参数β传播阈值的影响

3.2 原始话题与衍生话题的竞争分析

微博舆情在不同传播时期存在不同群体和信息之间的竞争,使用Lotka-Volterra竞争模型研究舆情进入发展期时不同话题传播演化过程。若舆情传播时两种舆情话题都得到了扩散,则舆情话题1与舆情话题2之间存在两种力量的竞争,属于不同信息之间的竞争。借鉴Lotka-Volterra竞争关系模型可得两种信息之间的竞争关系如下:

(23)

(24)

其中,x1(t)、x2(t)分别是话题1和话题2通过微博信息交互争取到的追随者数量,即传播者Ia、Ib。γ1、γ2分别为两者的增长率,K1、K2为对应的传播者数量上限,σ1为舆情话题2对舆情话题1的竞争参数,σ2为舆情话题1对舆情话题2的竞争参数。

表2 模型平衡点稳定性

3.3 与现有衍生话题模型对比分析

现有衍生话题模型研究多是基于SEIR模型进行改进,依据衍生话题的传播特点考虑免疫者转化为传播者或未知者,而很少将原始话题与衍生话题传播者区分为两类人群。为了体现本文研究的先进性,将本文所提出的模型(图4)与仅考虑一种传播者模型(图7)进行比较,利用Matlab进行仿真模拟,参考陈福集等[14]的研究,设置参数α1=0.8,α2=0.2,μ=0.7,β=0.3,γ=0.3,θ=0.1,μ1=0.4,μ2=0.3,γ1=0.3,γ2=0.2。

图7 现有衍生话题传播模型

图8展示了两种模型下各人群密度比例变化,图8(a)表示现有衍生话题传播模型各人群密度变化趋势,从中可以看出,传播者人数上升至峰值后开始下降,免疫者人数不断上升。图8(b)表示将传播者划分为原始话题和衍生话题传播者时各人群密度变化趋势,从中可以看出,在传播过程中,先是原始话题传播者人数达到高峰,随着时间的推移,原始话题传播者人数逐渐下降,而衍生话题传播者人数开始上升,达到高峰后开始下降,免疫者人数不断上升。由图8可知,将传播者划分为原始话题传播者和衍生话题传播者,可以更加清晰地看出不同话题传播者密度变化趋势,更加符合微博话题随时间变化的衍生特性,从而帮助政府等有关部门对衍生话题传播进行精准干预。

图8 不同衍生话题传播模型仿真

4 微博舆情衍生话题案例分析

4.1 微博舆情衍生话题案例选取

微博社交平台中舆情信息众多,关于道德及教育安全的事件极易引起人们的关注,造成快速扩散。2020年5月30日,“广州方圆实验小学老师体罚学生至吐血”事件快速引起媒体、公众人物的关注及转发,引起较大的影响。且该事件在传播过程中衍生出多个话题,舆论发展随着话题扩散存在较大反转,对当地教育部门、公安部门及媒体公众的形象都造成了一定的影响,对网民的从众发言也有警醒作用。因此,选择该案例进行分析不仅符合模型描述假设,也可为微博舆情衍生话题现象的处理带来一定的理论参考。

案例描述:2020年5月30日6点43分,账号名为@小岛里的大海发布一条有关“女儿患有哮喘,但被老师体罚致吐血抢救”的微博,反映广州市方圆实验小学一名教师涉嫌体罚学生。广州市白云区教育局于当天发布《声明》,成立专项调查组对该事件进行调查。5月31日01点44分,广州白云警方发布通报称网传相关信息为发帖人故意编造的谎言。事后官方证实,该舆情初始话题为发布者雇买网络推手扩散形成,而广州白云山公安局发布调查声明时,网民对该舆情的负面情绪并未下降且引起新话题传播,当舆情传播范围下降后,官方发布声明证实该舆情为谣言,舆情再次得到关注和扩散。

在此舆情传播过程中,微博平台出现了该案例引起的多个衍生话题,选取三个具有代表性且内容差别较大的话题进行研究,话题1为“广州一小学体罚哮喘儿童至吐血抢救”,话题2为“广州市教育局回应小学教师涉嫌体罚学生”,话题3为“警方通报教师涉嫌体罚学生为家长造谣”。其中话题2在话题1发展期时开始,话题3在话题1、2进入消亡期之后开始。使用“八爪鱼采集器”对该舆情事件三个热搜话题分别进行采集,采集时间设置为:2020年5月30日0点—5月31日24时,采集数据2850条,包括三个热搜阅读数、讨论数、每个用户发布内容、点赞数、转发数、评论数、发布时间等信息。其中“知微事见”平台发布该事件传播中参与话题人数的变化趋势如图9所示。

图9 舆情传播过程中传播者人数变化趋势

4.2 舆情传播过程的案例仿真

微博作为当前国内舆情主要发生和讨论的平台,网民可在平台上浏览不同用户发布的信息,根据刘志明等[20]研究可知,微博网络与初始无标度网络相似,因此利用Netlogo构建无标度网络。节点初始化为1100,网络结构示意图如图10所示,主体turtles表示该舆情事件中六类不同状态网民:S(未知者)、E(潜在传播者)、Ia(话题1传播者)、Ib(话题2传播者)、Ic(话题3传播者)、R(免疫者)。

图10 构建初始无标度网络界面

在建立好的无标度网络中构建舆情传播规则,参考马宁等[9]的参数设置计算依据、“知微事见”中的数据,并结合案例本身特殊性,模型中各参数取值根据其含义设置如下: 由于该案例初始传播时存在网络推手,初始化舆情话题1传播者Ia为30;考虑网络推手和网民对该事件的激化和同情心理,设置未知者转化为潜在传播者和免疫者的比率α1、α2分别为0.9、0.1;潜在传播者转化为话题1传播者和免疫者的比率μ1、β分别为0.9、0.1;话题1传播者的免疫率r1为0.05。在话题1传播者比例达到20%时,官方发布声明后话题2开始传播,潜在传播者转化为话题1传播者比率μ1为0.07,话题1免疫率r1增加至0.3,潜在传播者和免疫者转化为话题2传播者比率μ2、θ为0.2,话题2免疫率r2为0.2,官方辟谣声明发布后话题3开始传播。

根据以上设置,模拟六种人群变化如图11所示,从中可知,在0-ts之间,话题1(“体罚儿童”)开始传播时,网络推手扩散了信息传播范围,吸引大量网民加入传播,话题传播速度加快,未知者人群极速下降,其他人群数量开始增多,舆情在短时间内达到较大规模。当地政府发布调查声明后,话题2(“教育局回应”)开始传播和扩散,两种话题存在较长时间的共同传播,且下降趋势缓慢,在ts时刻舆情传播缩小至一定范围。而ts之后,官方发布辟谣声明,话题3(“警方辟谣”)得到传播和扩散,同时话题2传播者人数也有所上升,但舆情在较短时间内快速得到下降,免疫者人群不断增多,舆情危机消失。

图11 模拟舆情传播过程中不同群体人数变化

该舆情传播者人数(所有话题传播者)变化如图12所示,从中可知,该舆情传播人数比例较大,在官方发布调查声明后引起网民对舆情的不断讨论,该期间内传播峰值较高,传播人数下降缓慢,舆情传播持续时间久,对社会造成了一定的负面影响。而当辟谣声明发布后再次引起舆情的传播,但传播峰值有所减少,下降速度较快。且图12中传播者趋势与图9中真实数据传播趋势相同,从而验证了本文构建的微博舆情衍生话题传播模型的有效性。

图12 模拟舆情总传播人数变化趋势

4.3 原始话题和衍生话题的竞争仿真

根据“八爪鱼采集器”采集该舆情事件的三个热搜话题的转发数、点赞数、评论数,参考王治莹等[12]的参数设置,本文设置话题1(“体罚儿童”)传播者和话题2(“教育局回应”)传播者初始值分别为600和50,话题1和话题2的竞争系数分别为0.4和2。设置话题2和话题3(“警方辟谣”)竞争时初始值分别为400和50,竞争系数分别为2和0.1。使用Matlab软件进行仿真可得话题之间进行竞争的传播趋势,两种竞争结果如图13所示。

图13 不同话题竞争结果分析

从图13(a)可知,舆情话题1传播者和话题2传播者之间的竞争较弱,话题1迅速上升后与话题2在较长时间内同时传播,促进了网民话题的讨论,扩大了舆情传播规模。从图13(b)可知,话题3的竞争系数较大,促进网民迅速转化为话题3传播者,话题3的产生虽然也引起了较大规模的舆情传播,但舆情在较短时间内得以控制。

5 微博舆情衍生话题传播应对策略

随着微博、微信、论坛等平台的发展,网民对舆情事件的讨论使舆情话题不断增多,国内许多“群体事件”的重大舆论影响都始于微博,加上微博主推的“微博热搜话题”功能,舆情可在短时间内爆发,并不断产生新话题,不同话题之间也存在竞争使舆情下降缓慢,具有虚假信息的衍生话题的传播会使网民陷入舆论争端,引起网民的悲愤情绪,扰乱社会秩序,严重影响政府的公信力,对相关当事人造成极大的心理冲击,且有可能导致突发事件的爆发。通过对微博衍生话题传播模型的研究,并根据实例分析提出在微博舆情衍生话题危机治理过程中可从以下方面入手:

(1)加强异常用户检测

当前,网络推手对舆论、新闻进行操纵的现象已经十分普遍[21],其以故意操纵新闻和舆论达到谋利的目的,传播虚假信息,在网络媒体上霸占话语权,煽动网民传播虚假信息,不断破坏着网络舆论各方面的真实性,妨碍网络舆论的正常秩序。如本案例中学生家长为了提高所编造谣言的阅读量,仅花费760元雇佣网络推手便实现了5.4亿假信息阅读量,可见网络推手造就的舆情影响是不可忽视的。因此,国家相关机构、各级政府部门应联合制定舆论检测专项行动工作方案或开展综合治理行动,在遇到舆论危机时及时检测是否有异常用户的存在,采取法律手段坚决打击操纵网络舆情、网络违法信息传播等非法行为,维护正常的社会秩序,建设积极健康的互联网信息传播环境。

(2)提高媒体、意见领袖和网民素养

随着互联网的发展,在进入人人触媒的社交媒体时代后[22],网络信息传播中存在不同主体,媒体首先在平台上散发舆情信息,快速引起网民的注意从而引起舆情扩散,而意见领袖以较高影响力引导舆论走势,网民之间的互动交流更加频繁深入,媒体、意见领袖和网民三方主体在推进舆论、扩大影响方面均有举足轻重的地位。如本案例中在初始虚假信息扩散时,不少微博领袖、媒体在未判断信息真伪时便进行了转发,引起大比例网民跟风转发,扩大了舆论影响。因此,建设积极健康的信息传播环境的根本途径在于培养媒体、意见领袖及网民的综合素养,形成“不信谣、不传谣”的批判意识,提升自我管理,政府应与各社交平台合作加强公民的媒介素质教育,定时定期开展知识科普、防范谣言等违法行为的培训。

(3)及时关注衍生话题及网民情绪

舆情事件引起大规模扩散后形成舆论,伴随着事件的进展和舆论走向不断产生新的衍生话题,且极有可能发生突发事件。在舆情事件发生时,政府及事件当事人应积极采取措施增加传播者转化为免疫者的比率,减少网民对舆情新话题关注度,对于一些网民比较敏感的舆情话题,如社会型、安全型等与网民利益密切相关或情感传递较容易的舆情,政府应加强舆情的监测和预防,做到对事件的公开化、透明化。同时,减少网民对舆情话题的讨论,舆情话题数量越多政府越不易管控,在舆情爆发时,政府应及时对舆情事件进行调查并作出详细描述,同时要注意网民情绪,与微博媒体和意见领袖合作发声,提高政府的公信力。如本案例中官方察觉到舆情时仅发布了调查声明,对网民情绪并未留意,造成网民对官方调查的不信任,负面情感并未下降且增加了舆情的话题讨论,导致舆情传播规模增大。

6 结语

在“互联网+”背景下,舆情事件引起多个衍生话题传播现象,对于舆情事件处理及网络舆论环境具有较大影响,对衍生话题采取积极有效的控制和引导是十分关键的。本文以微博舆情衍生话题为研究对象,分别构建微博舆情单一话题传播和多话题传播模型,建立微分方程对其传播阀值进行求解,同时,利用“八爪鱼采集器”对真实案例进行数据采集,运用Netlogo软件对改进的SEIR模型进行仿真模拟,并运用Matlab软件基于Lotka-Volterra竞争模型进行模拟。本文的理论贡献在于基于衍生话题传播现象构建了衍生话题传播模型和不同话题竞争传播模型,并利用数学理论推导出具有衍生话题的模型其传播阈值低于单一话题的传播阈值,且人们对新话题的兴趣越大传播阈值越低,说明衍生话题扩大了舆情传播规模和影响。实践贡献在于利用真实案例验证了本文提出的舆情衍生话题传播模型的可行性,以及舆情不同话题之间存在竞争现象。

本文研究不足之处在于模拟仿真节点数较少,与真实微博网络结构仍有一定差距,同时衍生话题传播时会受多方面因素影响,在接下来的研究中,将会进行更加深入的研究。

猜你喜欢

传播者比率舆情
误传了几千年的俗语,你也是传播者吗?
时传祥纪念馆:做好三种精神的记录者和传播者
引导者 传播者 担当者——新年寄语《人大建设》
比率分析公司财务状况——以步步高及永辉超市为例
数字舆情
数字舆情
消费舆情
千点暴跌 两市净流出逾7000亿资金
美拭目以待的潜力城市
做党的创新理论的忠诚传播者