APP下载

有限群体内舆情危机扩散SIR模型及仿真模拟实现

2018-10-17

统计与决策 2018年18期
关键词:感染者感染率舆情

尹 楠

(南京晓庄学院 商学院,南京211171)

0 引言

SIR模型是一种经典模型,该模型中S代表易感染者,I代表感染者,R代表移除者。利用该SIR模型,可以研究传染病的传播扩散机制,并建立数学模型去模拟其传播过程。目前众多学者基于传染病的SIR模型,研究其他问题。比较经典的应用有如下几种:①基于SIR模型对股市、银行等危机传播的研究。如马源源,庄新田等(2013)[1]构建上市公司股东交易数据的SIR复杂模型,模拟出当股东的资金流出现问题或资金链断裂时影响整体股市交易的情况,推导出股市危机蔓延的传播路径。乜洪辉(2012)[2]借鉴病毒传染的SIR模型去模拟银行危机的传播过程。②基于SIR模型对微博、微信等网络社交媒体传播机理的研究。如王超,杨旭颖(2014)等[3]借鉴传染病学中的SIR模型,模拟社交网络中用户信息的传播路径,构建SNS扩散传播的理论模型,该模型为社交网络中信息传播的控制提供了理论参考依据。杨子龙,黄曙光(2014)等[4]基于微博用户的转发信息行为与特征,提出一种SIR改进模型,该模型能够很好的预测用户的信息转发概率与行为。丁学君(2015)[5]分析了微博网络中用户信息交互与话题分享的传播机制,基于改进型的SCIR模型,模拟了微博网络中用户信息互动及传播的路径。③研究社会人为风险与自然风险的传播机制。如赵晓晓,钮钦(2014)[6]构建了水利工程项目社会风险的SIR理论扩散模型并模拟其风险传播路径,得出在社会风险发生之前采取有效的预控措施是控制社会风险扩散的最优选择,并对此提出了建议和对策。姚洪兴,孔垂青(2015)等[7]基于金融系统的网络结构特征与传染病SIR建模的思想,在无标度网络上构建了企业间风险传播的复杂模型,通过计算风险传播的一个系数,并分析平衡点的全局稳定性。尹楠(2016)[8]根据传染病研究中的SIR模型,并结合森林火灾发生的特点,建立森林火灾SIR模型并对森林火灾燃烧扩散状态进行仿真模拟,并根据仿真模拟的结论,得出了有效预防和控制森林火灾的手段。

本文基于传染病的SIR模型,并结合有限群体内舆情危机蔓延的方式,建立有限群体内舆情危机扩散的SIR模型,并对建立的模型进行仿真模拟演示。利用该有限群体内舆情危机扩散的SIR模型,可以对一个特定群体内舆情危机扩散的状态进行预测,并得出有效预防和控制有限群体内舆情危机的发生或扩散的条件。

1 有限群体内舆情危机扩散SIR模型的建立

1.1 有限群体内舆情危机发生的特点

有限群体指的是某个特定群体,比如一个公司、一个学校、一个医院等,其内部的成员作为特定群体内的成员,比如公司内部的员工、学校的学生、医院的医生等。有限群体内舆情危机是指在某个特定群体内发生的负面突发事件,在特定群体内面对突发事件,特别是负面事件,作为特定群体内成员对作为客观存在的事件或现象表达自己的信念、态度、意见和情绪等,当这些信念、态度、意见和情绪聚集汇总,其舆论影响在特定群体内逐渐扩大,并给群体内的当事人造成危机感的现象。

在一个有限群体内,发生舆情危机时,舆情危机的扩散和传播迅速向四周蔓延,其传播模式类似于传染病的感染传播模式,因此可以利用SIR模型建立数学模型,并进行仿真模拟演示。

1.2 有限群体内舆情危机扩散SIR模型的假设条件

(1)在有限群体内舆情危机发生时期,假设不考虑群体的出生、死亡、移动等种群动力因素,这些因素作为非重要因素,只考虑舆情危机随时间发生变化的主要因素。

(2)总群体个体数N(t)保持不变,假设群体一直保持一个常数N。有限群体内舆情危机SIR模型就是针对某类舆情危机将特定群体内的成员分成以下三类:易感染者(尚未感染),其数量比例记为s(t);感染者(已受感染),其数量比例记为i(t);移除者(感染终止),其数量比例记为r(t)。

(3)假设时间以小时为基准时间,群体成员的感染率为l,移除率为m,感染期接触数为σ=λ/μ。

1.3 有限群体内舆情危机SIR模型的构成

在以上三个基本假设条件下,易感染者(未感染)从感染到移除的经过如下所示:

根据假设条件可以得出:

可以建立s(t),i(t),r(t)的两个公式,如式(2)和式(3)所示:

对于移除者(感染后)的数量应为:

假设初始时刻的易感染者(未感染),感染者(受感染),移除者(感染终止)的比例分别是s0(s0>0),i0(i0>0),r0=0,可以得到SIR模型为如下微分方程组初值问题:

而由 s+i+r=1有 dr/dt=-di/dt-ds/dt,于是式(5)中的第三个方程变为恒等式,从而模型可以简化为:

i0+s0≈1 (通常r(0)=r0很小)

从式(6)模型中消去dt,其中σ=λ/μ,可以得到SIR模型为:

1.4 数值模拟计算

由于SIR模型中s(t),i(t)的求解比较困难,可以做数值计算来预估计s(t),i(t)的一般变化规律。根据方程(6)和方程(7)假设λ=1,μ=0.3,i(0)=0.02,s(0)=0.98,通过R数据分析软件,输出结果如表1所示。i(t),s(t)可以得出图1和图2。i~s图形被称为相交线,初值i(0)=0.02,s(0)=0.98对应于图2中的P0点,随着t的增加,(s,i)沿轨线从右向左移动。通过表1、图1以及图2显示,i(t)由初值增长至约t=7时达到最大值,然后逐步减少,t→∞,i→0,s(t)则缓慢的减少,t→∞,s→0.04,结合图形可以分析i(t),s(t)的一般变化规律。

表1 s(t)和i(t)的数值计算结果

图1 s(t),i(t)舆情危机感染者比例

图2 i~s图形

1.5 原理分析

基于数值计算基础,根据相交线得出i(t),s(t)的含义,相交线在i~ s平面上的定义域(s,i)∈D为:

在方程(6)中消去dt并观察到σ的定义,可得:

所以:

利用积分特性可以求出方程(9)的解为:

在定义域D内,式(10)表示的曲线即为相交线,如下页图3所示,箭头表示了随时间t的增加s(t)和i(t)的变化趋势。

可以得出相交线:

相交线i(s)的定义域为:D={(s,i)|s≥0,i≥0,s+i≤1} ,可以在图3中D区域内作出相交线i(s)的图形进行分析。

图3 相交线i(s)

当s(t)单调减趋向于相交线i(s)的方向,s=1/σ,i=im,t→∞,i→0,s∞满足

图3中P1为s0>1/σ→ i(t)先上升然后逐渐趋于0,代表有限群体内舆情危机可能会扩散;P2为s0<1/σ→i(t)逐渐下降到0,代表有限群体内舆情危机不太可能会扩散。据此可以得出预防有限群体内舆情危机扩散的条件,即为s0<1/σ。因此可以通过提高固定值1/σ达到降低σ=λ/μ的目的,即降低群体成员的感染率λ,提高移除率μ。

2 实验采样数据仿真

本文选取某高校内部论坛中抓取到的用户访问日志数据构建实验所用的数据集合,校内论坛可以被看作是一个有限群体,其构建过程如下:

选取2015年7月到2016年7月间,由学校内部突发性危机事件所引发的一个校内学生交通事故突发事件(危机1)和一个学生宿舍引发的事故(危机2)作为目标舆情危机事件的研究对象,并从两个危机事件中分别提取出相应的关键词,如表2所示。

表2 实验数据

首先根据表2给出的采样关键词,可以利用该校内论坛的记录搜索功能,得到采样区间内309条与事件1相关的论坛记录;168条与事件2相关的论坛记录。另外,本文构建的论坛数据集还包括:访客每天访问论坛的日志记录、每天访问论坛的用户数量、针对论坛内危机事件进行发表相关言论的用户数量记录等,并且样本收集的时间和地点都是固定的。

其次对危机事件的原始数据进行筛选,分别得到每个采样时刻未知群体U、易感染群体(未感染)S、感染群体(受感染)I及免疫群体R的用户数量。图4中(a)、(b)分别描述了危机事件1和危机事件2的不同用户群体的用户规模随时间的变化关系。

图4 不同群体的用户数量规模随时间的变化关系

假设校内网络论坛的用户总数N=10000,其余用户全部为未知状态。各参数设置如下:接触率λ=0.5,受外界影响概率σ=0.2,传播率λ=0.1,免疫率μ=0.5。可以得到的未知群体、易感染群体、传染群体以及免疫群体的用户规模随时间变化的关系,如图5所示,实验迭代次数为1000次。由图5可以直观的看到,未知群体在舆情危机传播刚开始的时候就会下降,易感染群体随着时间变化,舆情危机的传播首先缓慢的上升,然后逐步的下降。感染群体的舆情危机变化也呈现这种趋势,免疫群体的传播比较特殊,呈现逐步的上升,并逐渐趋向于1。从中可以发现有限群体内舆情危机时间的传播扩散也具有突发性和时效性的特点,在较短时间内迅速的传播,而后逐步的减缓传播的速度,最终时效性下降到零。

图5 不同群体的用户规模随时间的变化关系

3 有限二维平面中舆情危机SIR模型的模拟仿真

有限群体内舆情危机SIR模型的主要特点表现在舆情危机的发生对空间个体相互作用的模拟。根据建立的有限群体内舆情危机SIR模型,感染者(受感染)只能感染触及与其相邻的易感染者(未感染)。在每一步中,每个感染者个体以概率λ感染触及与其相邻的易感染者(未感染)个体。令x表示与一个易感染者(未感染)个体相邻的感染者(受感染)总数,则该易感染者(未感染)个体以概率(1-λ)x保持未被感染。在导致其他个体被感染后,每个感染者(受感染)以概率μ被移除。

假设有限群体内舆情危机限制在一个空间为二维的矩阵网格中,令Xt表示在时刻t时的一个二维矩阵,并且令Xt(i,j)=2 时,表示个体在点 (i,j)为易感染者;Xt(i,j)=1时,表示个体在点 (i,j)为感染者;Xt(i,j)=0时,表示个体在点(i,j)为移除者。在数据分析软件R语言中对有限群体内舆情危机SIR模型进行模拟仿真实验,得出如下的一系列输出结果散点图。

图6 λ=0.2,μ=0.4的有限群体内舆情危机模拟扩散图

假设在二维矩阵图中,在网格中心位置存在单一的舆情危机感染源,图6表示在5、10、15、20小时四个时点分别模拟的舆情危机扩散的状态,在群体成员的感染率λ=0.2,移除率μ=0.4时模拟舆情危机蔓延的四个状态。图6中深色和浅色点分别表示感染者(受感染)和移除者(感染终止)。

图7 λ=0.7,μ=0.4的有限群体内舆情危机模拟扩散图

从图7可以看出,当群体成员的感染率λ=0.7,移除率μ=0.4时,模拟舆情危机的扩散速度和面积变大,仅仅在5和10小时模拟舆情危机扩散的两个时点过后,扩散的面积已经几乎感染了整个区域。因此可以得出这样的结论,随着λ的增加,舆情危机的扩散,即发生群体内严重的舆情危机的概率将大大增加。

图8 λ=0.2,μ=0.7的有限群体内舆情危机模拟扩散图

从图8可以看出,当群体成员的感染率λ=0.2,移除率μ=0.7时,模拟舆情危机的扩散速度和面积明显减小,在5、10、15小时分别模拟舆情危机扩散的三个时点之后,扩散已经基本终止,且扩散的面积不大。因此可以得出这样的结论,随着μ的增加,舆情危机的扩散,即发生群体内舆情危机蔓延的概率将减小。

4 结论

本文选取某高校内部论坛(仅校内IP地址具有访问权限)中实际抓取到的数据构建实验数据集,构建了实际的高校内部论坛的SIR传播路径图,对模型进行了实验仿真,并分析了模型中参数的变化对传播扩散路径的影响。实验结果表明:高校内部有限群体内网络论坛中舆情危机事件传播过程与现实社会中舆情危机的传播规律相符,舆情危机一般是由某个突然性的危机事件所引发,然后在较短的时间内引起用户讨论的兴趣,使得该危机事件逐步的扩散,并迅速形成传播的最高峰值;随着时间的推移,由于舆情事件的热度减退,用户将不再对该舆情危机时间有兴趣,从而不再关心该事件。

然后本文根据SIR模型建立有限群体内舆情危机扩散的模拟仿真,在一个空间为二维的矩阵网格中模拟舆情危机的发生状态。结论表明,当群体成员的感染率λ增加,或者移除率μ减小时,舆情危机将很快会扩散开来,导致发生严重舆情危机的概率将会增加。同时,根据建立的有限群体内舆情危机SIR模型在R数据分析软件中能够模拟舆情危机发生的演变状态。从分析中可以看出,有限群体内舆情危机的扩散不是直线型的移动,而是没有规则的方式移动,如果假设舆情危机的发生是沿着一种直线的方向扩散,那么每一个未感染个体,即易感染者(未感染)都与周边三个已感染的个体,即感染者(受感染)临近,该个体感染的可能性为1-(1-λ)3,考虑到个体,即每个感染者(受感染)以概率μ被去除,因此1-(1-λ)3>μ,有限群体内舆情危机将会逐渐扩散。

根据上述建立的有限群体内舆情危机SIR模型的模拟仿真结果及分析结论,可以看出,为预防和控制舆情危机的发生或蔓延,可以通过降低群体成员的感染率λ和提高移除率μ两个基本途径,其中降低群体成员的感染率可以通过抑制群体内舆情危机消息源的传播,例如通过禁止群体内舆情危机的传播等途径降低感染率,达到预防或者控制舆情危机的目的。提高移除率可以通过在群体内实施新的控制手段,比如颁布新的群体内部政策、法规等手段去更好地控制舆情危机的发生或蔓延。

猜你喜欢

感染者感染率舆情
英国:55岁以上更易染疫
48 353例幽门螺杆菌感染状况分析
健康女性人乳头瘤病毒感染的状况研究
艾滋病感染者就医和就业歧视状况调查
警惕新冠病毒无症状感染者
某地区体检女性人乳头瘤病毒感染及亚型的分析
数字舆情
数字舆情
消费舆情
艾滋病感染者管理新模式