APP下载

基于SIJRD -系统模型的COVID -19流行研究

2020-12-02李丹阳姚斌杜雷鸣

关键词:感染者隐性病例

李丹阳, 姚斌, 杜雷鸣

(云南师范大学 物理与电子信息学院,云南 昆明 650500)

1 背景简介

2020年1月起,COVID -19逐步在全球范围内流行,已累计确诊40 675 337例,累计死亡1 119 412人(截至2020年10月20日除中国以外数据).宋倩倩等人[1]推测,COVID -19的传播路径不是单一的,而且人自身条件的差异,可能导致感染情况不同,所以公开数据可能只是确诊病例的数据,还有一些例如无症状感染者自愈及有症状感染者非确诊死亡等筛查困难的数据,称为隐性数据,对应人群称为隐性患者,这在Yang 等人[2]和Ivorra等人[3]的研究中得到证实,但他们的研究仅得出无症状感染者在病毒传播中的作用不能忽视,所以本研究利用公开数据来估计隐性数据,以探究隐性患者对整个疫情的影响,对未来可能出现的类似疫情以及其他信息传播的研究提供参考.

2 模型建立

2.1 SIR模型

SIR模型[4-6]是基于微分动力学的最基本的传染病模型,它将所研究人群分为3类,易感者(S)被感染成为具有传染性的感染者(I),感染者(I)死亡或者治愈后移除传播系统成为移除者(R).设当前环境总人口数为N(忽略自然出生和死亡、迁入和迁出带来的影响),则N=S+I+R.

SIR模型只能描述疫情的大体传播流行过程,无法描述隐性患者在疫情过程中起到的作用,因此在SIR模型基础上,基于二叉树原理,建立SIJRD -系统模型,将人群从4类逐步细化为8类,增加了4个求解函数,提高数据拟合度.

2.2 SIJRD -系统模型

SIJRD -系统模型由3个子模型构成,分别是SIRR、SIIR和SIIJRD模型,它们均是以SIR模型作为基础进行延伸的模型.

2.2.1 SIJRD -系统模型架构与假设

将所研究地区的人群分类(如表1所示).

假设:

(1)当前环境总人口数为N=S+I+R.即整个研究地区看作一个封闭系统,忽略自然出生和非COVID -19死亡以及人口迁入、迁出带来的影响.

(2)移除者对该病具有终生免疫能力,即可排除在传染系统外.

(3)感染率为a,即单位时间内一个感染者传染给一个易感者的概率,t时刻传染者占总人口的I(t)/N,则t时刻单位时间内被感染者传染的易感者的人数为aI(t)S(t)/N.

Fanelli等人[7]研究得到隔离措施对疫情控制有效,即实行隔离措施可以降低感染率a.定义基础感染率γ为COVID -19的自然传播速度.隔离率β为所研究地区的感染者未被有效隔离的概率,当β=1时,说明没有任何隔离效果,此时a=γ.感染率a与隔离率β的关系可以记为a=βγ[8].

(4)定义隐性输出率b1为感染者I转变为隐性移除者R的概率,则t时刻单位时间内感染者没有确诊隔离而输出的人数为b1I(t).定义显性输出率c1为感染者I转变为确诊输出者R3的概率,则t时刻单位时间内感染者I被确诊隔离,治愈或死亡的人数为c1I(t).

(5)定义无症状输出率b为无症状感染者I1输出(死亡和自愈)的概率,则t时刻单位时间内从无症状感染者变成移除者的人数为bI1(t).定义有症状非就诊输出率d为有症状感染者I2未被确诊而直接输出(死亡和自愈)的概率,则t时刻单位时间内从有症状感染者I2转变为有症状隐性输出者R2的人数为dI2(t).

(6)定义发病率c为无症状感染者I1转变为有症状感染者I2的概率,则t时刻单位时间内出现症状的感染者人数为cI1(t).其倒数1/c表示病毒的平均潜伏期τ(单位:d).

表1 当前环境地区人群分类

(7)定义确诊率d1为有症状感染者I2被确诊成为隔离者J的概率,则t时刻单位时间内有症状感染者I2被确诊隔离的人数为d1I2(t).

(8)定义治愈率e、病死率f分别为被隔离的确诊者J治愈成为隔离治愈者R4的概率、死亡的概率,则t时刻单位时间内被隔离的确诊者J治愈的人数为eJ(t),死亡的人数为fJ(t).

由于b1和c1均为I的输出率,而I类人群每天的输出的数量不可能超过它本身的数量,所以有b1+c1≤1;同理有b+c≤1,d+d1≤1,e+f≤1.

基于SIR模型及假设(1)-(8),给出SIJRD -系统模型的流程图及微分方程组(图1).

图1 SIJRD -系统模型流程图和微分方程

2.2.2 SIJRD -系统模型参数和初值的确定

确定参数最常见的方法是输入假定参数值用所建模型对实际数据进行拟合,拟合度最高的一组参数即为最优参数.本研究采用最小二乘法进行拟合,以可决系数S2来评价拟合效果.这一方法被Batista[6]和Peng等人[9]所采用并证实可行.确定初值的方法同参数确定的方法一样.

2.2.3 基本再生数

对传染病流行的研究可以用基本再生数R0来评价疫情的规模.基本再生数R0定义为在自然条件下,一个传染者在其整个传染期内平均传染的易感者的数量.R0越大,传播速率越大,如果R0小于1,则意味着该疾病将逐渐消失[3].根据SIJRD -系统模型的特点,得到SIJRD -系统模型的基本再生数的公式:

(1)

当没有任何隔离效果也就是疫情刚开始爆发时,即隔离率β=1时,a=γ.此时的R0为:

(2)

由(9)式,从R00到R0的变化趋势,可以判断疫情的规模和疫情的发展情况.

3 SIJRD -系统模型对国内COVID -19疫情的研究

本研究的全部数据均来源于中国国家卫生健康委员会和各省市区卫生健康委员会的官网.将得到的相关数据(从2020 年1月27日至2020年3月20日的国内各地每日确诊、死亡、治愈人数以及2019年总人口数)进行整理.考虑到国内的行政区划较多,不同行政区经济发展程度不同,则疫情传播流行情况也各不相同,因此依据官方报道的疫情数据利用聚类分析方法对行政区进行分类.由于港澳台和湖北的前期数据不完整,西藏和青海的COVID -19流行不明显,所以在进行分类研究时选择将这些地区排除在外,将其他28个行政区分为三类,分类结果如表2.

表2 28个行政区分类情况(除港澳台、青海、西藏、湖北以外的行政区)

根据表2的分类,对三类地区进行参数和初值确定.图2-4分别是A、B、C三类地区的确诊、确诊隔离、死亡和治愈人数自2020年1月27日至3月20日的数据拟合结果,其中“*”号表示实际数据,实线为拟合曲线.

图2 A类地区模型拟合图

图3 B类地区模型拟合图

图4 C类地区模型拟合图

结合图2-4及其对应的可决系数可以看出,SIJRD -系统模型能够较好地拟合每日确诊人数,但对死亡人数、确诊隔离人数、治愈人数的拟合度相对较差,这可能是因为防疫措施的加强[10]会导致疫情发展出现分隔期,分隔期前后的疫情发展不同,使得部分参数发生改变.

表3和表4为拟合及计算得到的三类地区疫情的初值和参数值(COVID -19的基础感染率γ大约为1[9]).

表3 三类地区COVID -19疫情的初值

表4 三类地区COVID -19疫情的参数值

利用得到的表3和表4中的初值和参数使用SIJRD -系统模型对每一类地区进行各类人数预测,由于传播并未涉及大部分人,由此把易感人群排除,通过图2中微分方程组,得到三类地区的其他类人群人数—时间变化图(图5).

图5 三类地区的其他类人群预测人数

由表4: C类地区的感染率a最小,病死率f最小,治愈率e最大,说明C类地区防控措施实行较好导致a小,医疗条件较优导致其病死率f低而治愈率e高.C类地区包括广东和浙江等经济发达省份,还包括防疫措施到位的河南等省份,与实际情况相符.三类地区的病毒潜伏期τ分别为τA=3.414 1 d,τB=3.752 3 d,τC=4.472 2 d,均在现有研究得到的该病毒的潜伏期2-14 d[2]内.B类地区的R00最大,即疫情刚开始时,B类地区疫情规模较大,传播速率较快.三类地区的R0均小于1,说明各地的防疫措施行之有效,国内的COVID -19在逐步消亡.且C类地区的R0减少量是最多的,进一步说明C类地区的防疫措施实行最有效.

由图5:三类地区的各类人群变化趋势相似,无症状感染人数I1随时间在减少,说明易感者被感染的人数减少,有症状感染人数I2的人数在2月初就达到峰值.确诊隔离人数J的变化趋势图描绘的是确诊人数输入与输出的情况,A类和C类地区的确诊隔离者J在2月8日达到峰值,B类在2月10日达到峰值,说明这三类地区COVID -19疫情的输出均早已大于输入,疫情发展已逐渐良化.3月初确诊人数(R3)和治愈人数(R4)增加变缓,即每日新增确诊和新增治愈均在减少,说明此时三类地区疫情基本得到控制.A、B和C三类地区的治愈人数的变化曲线与确诊隔离人数的变化曲线分别相交于2月15日、2月17日和2月15日.同官方所得结果:2月12日新增确诊病例达到峰值,2月18日新增出院病例数开始超过新增确诊病例数[10],相差不大.说明SIJRD -系统模型能够较好地描述确诊隔离人数的整体变化趋势.C类地区的I1、I2、R1和R2在2月25日左右趋于平和,变化微小,A类和B类地区的I1、I2、R1和R2则在2月底3月初趋于平和,变化微小,与实际数据走向吻合.

SIJRD -系统模型预测出截至2020年3月20日与隐性患者有关的如下比例:

(1)A类、B类和C类地区隐性患者(R1+R2)占总病例的50.00%、50.29%和50.32%.

(2)A类、B类和C类地区的无症状输出病例(R1)占总病例的21.38%、25.59%和30,32%;有症状非就诊输出病例(R2)占总病例的15.25%、12.8%和8.21%;确诊输出病例(R3)占总病例的63.37%、61、61%和61.47%.

可见在国内虽然确诊输出是感染者主要输出路径,但非就诊输出也占较大的比例.

4 全球疫情发展预测

基于对国内COVID -19疫情的研究,利用SIJRD -系统模型拟合全球相关数据获得相应的初值和参数,预测全球的疫情发展趋势(2020年5月23日—2021年6月26日,共400 d).预测图如图6所示.分别用虚线和实线代表模型预测的R3和J.

图6 全球新冠肺炎疫情发展预测图

由图6可知,全球的确诊隔离人数J将在2020年10月5日(图中预测第136天)达到峰值,即在此之后各地的输入病例将小于输出病例,意味着开始疫情良化,2021年5月以后(图中预测350天后)J增长极其缓慢,表明疫情得到基本控制.模型预测在2020年10月20日时,全球累计确诊人数达到39 453 869人,而实际在10月20日时,全球累计确诊人数为40 675 337人,预测与实际误差约为0.03,SIJRD -系统模型对全球COVID -19疫情趋势预测较为准确.

5 小结

由于SIJRD -系统模型是以SIR模型为基础将其R进行细化至SIRR模型,进而不断细化至SIIJRD模型,所以SIJRD -系统模型描述的实际还是SIR模型描述的各类人群数据走向;较SIR模型而言,细化后的SIJRD -系统模型能够找到导致这些人群数据走向的原因;由得到的隐性患者变化趋势及相关比例推知国内确诊输出是感染者主要输出的途径,但非就诊输出也占较大比例,即隐性患者在疫情传播中起的作用不可忽视,其中未检测出的病例占总病例的50%左右,与Ivorra等人[3]研究的结果接近.

SIJRD -系统模型预测COVID -19在全球的疫情将继续发展.2021年5月以后(图中预测350天后)得到基本控制.

综上,SIJRD -系统模型可以对各地实施措施的有效性进行探讨和评估,模拟隐性人群的数据走向,探究无症状感染者在疫情传播中起到的作用,同时也能预测COVID -19的后期发展趋势,对今后可能出现的类似传染病的疫情防控有指导作用.

猜你喜欢

感染者隐性病例
让“隐性课程”会说话
浅析书籍设计中的“隐性”表现
艾滋病感染者就医和就业歧视状况调查
论高中语文隐性知识教学策略
“病例”和“病历”
也门霍乱疫情更新
利用“隐性”圆,巧解一类题
HIV感染者48例内镜检查特征分析
艾滋病感染者管理新模式
妊娠期甲亢合并胎儿甲状腺肿大一例报告