二次疫情到来的预测模型
2020-03-15龙杰邓浩陈加英
龙杰 邓浩 陈加英
西华大学 机械工程学院,四川 成都
摘 要 通过建立几个数学模型,评估第二次疫情高峰到来的隐患大小,并给出合理的复工复产时间点以及讨论哪些参数是最重要的,而这些参数如果不准确,会对防疫工作和疾病传播的过程带来怎样的影响。最后,结合对无症状感染者的预测模型,然后再引入SIR模型对日治愈率和日接触率进行分析,推出被传染比例的影响因素,再通过相应措施来降低被传染的概率,从而来对重大赛事能否重启进行合理评估。
关键词 SEIR仓室模型 再生数的阈值 网络流动结构 SIR模型
中图分类号:R-3 文献标识码:A 文章编号:1007-0745(2020)02-0028-07
1 问题重述
问题一:建立数学模型,选择三个国家进行研究,评估它们出[1]现第二次高峰的风险大小,并给出复工复产的政策性建议,以避免第二次高峰的出现;
问题二:建立合理的数学模型并讨论哪些参数是最重要的,而这些参数如果不准确,会对防疫工作和疾病流行的过程带来怎样的影响;
问题三:我国的无症状感染者的数量持续降低,但是并未清零,也有一些无症状感染者未被发现,请结合第一阶段的模型,充分考虑我国的疫情现状,评估重启大型体育赛事(比如中超足球联赛或者 CBA 篮球联赛)的可能性,并给出分阶段(无观众赛事、部分观众赛事、全部观众但要求戴口罩赛事、全面放开赛事)重启的时间表;
问题四:为了能够顺利重启一些大型体育赛事,给有关部门写一份有关于疫情防控的备忘录。
2 问题分析
2.1 问题1分析
2.1.1 总体分析
首先问题1是一个非常值得深度关注的问题,因为“二次高峰”的影响力或许会远超第一次疫情爆发所带来的影响并可能会随着病毒的变异以及各类指标的失效而更难以控制[2]这样显然是对整个国家乃至全球都是相当不利的,因此需要给定一个阈值,针对不同的国家来评估其“二次高峰”的风险大小,结合各个国家的医疗水平以及社会形势然后做出相应的措施以及复工复产规划来避免二次高峰的到来。
2.1.2 影响因素分析与联系
在第一次疫情得到有效缓解后,各个国家各个地区便会陆续开展复工复产。因此随着人流量的逐步上升,个体的日平均接触率也会有所上升,各地区的无症状感[3]染者此时便会穿插在人群中,感染率不由的有所增长,而此时隔离率却并没有迅速跟进,病人的恢复率也没有大幅度上升。这些因素与第“二次高峰”到来的隐患大小密切相关。虽然此时医疗条件相比于疫情初期会有很大提升,但是如果未能正确把控复工复产的时间,那么第二次高峰的到来或许是必然的。因此在上一阶段模型的分析基础上,需要着重考虑在疫情期间各国人流量的移入移出,然后做出相应的措施。
2.2 问题2的分析
2.2.1 总体分析
建立了加入个人防护因素的SEIR模型,对基本再生数、潜伏期时间、代间隔等几个重要的参数进行变量控制,讨论出最重要的参数以及会对防疫工作和疾病流行的过程带来怎样的影响。
2.2.2 影響因素分析与联系
通过建立模型考虑重要的参数,对防疫工作和疾病流行的过程给出了具体的预测,对后面的疫情防控工作起了重要的预防工作。
2.3 问题3的分析
当前我国疫情还存在无症状感染者,这些无症状感染者的存在严重影响了我们的生活,使得整个社会的管控不确定性越来越大,并且这个因素不仅仅会造成感染人数急剧增加和疫情的二次爆发,也影响着一些重大赛事是否能重启。重启的时间,重启后怎么制定观众的观看方式等等,因此引入SIR模型来对被传染率的影响因素进行研究,从而可以分析得出重启重大赛事的时间和防护措施。
无症状感染者的概念:根据国家卫生健康委发布的《新型冠状病毒肺炎防控方案(第六版)》,无症状感染者是指无相关临床症状(如发热、咳嗽、咽痛等可自我感知或可临床识别的症状与体征),呼吸道等标本新冠病毒病原学(通常指核酸检测)或血清特异性免疫球蛋白M(IgM)抗体检测阳性者。无症状感染者不是确诊病例,因此不算新增感染病人。2020年3月4日国家卫生健康委公布的第七版中,对这一规定没有[4]改变(参考于百度百科)。
3 模型假设
(1)假设地区和国家的总人口数不变。
(2)将境外输入病例作为该国家的初始患病人数。
(3)与感染者密切接触的人群若被感染则其定位为易感染内(Sk)或者潜伏内(Ek)。
(4)复工之前本国人口流动为0。
(5)新冠肺炎对不同年龄组的感染率略有不同,对健康人的感染率一样。
(6)处于潜伏期的患者在一定时间后会出现患病特征成为患病者。
(7)SI服从均值的指数分布。
(8)人群中所有人都有被感染的概率,康复人群不会再被感染。
(9)真实的感染者=感染者I-假阳性患者I2+假阴性患者I1。
(10)假设假阴性率为36%(数据根据日本医生上昌広所说,在所有被检测的患者中,真实的新冠病毒感染者占20%,而检测的灵敏度为70%,特异度为90%所计算出来)。
(11)潜伏期患者与以表现出症状的的传染能力是相同的。
(12)隔离的患者都是住院患者。
(13)假设武汉的患者人数接触率的额影响曲线等于中国的患者接触率的影响。
(14)附件中所给的数据真实有效。
(15)不会出现超级感染者,如果出现,会被第一时间隔离,不会造成大范围传播。
(16)新型肺炎病毒在此阶段不会出现变异。
(17)确诊者被完全完全隔离,不再具有传染性。
(18)境外输入病历已基本得到控制,不再是影响我国疫情的主要因素。
4 定义与符号说明
5 模型的建立与求解
5.1 问题一的模型建立
从新冠病毒疫情爆发开始,世界全球各个国家都陆续在积极整合疫情实时大数据报告,主要针对了各国疫情的新增趋势、确诊疑似趋势、累计死亡和治愈人数、治愈率和死亡率、境外输入输出比例和累计趋势等。我们主要收集了我国和美国还有意大利的各项数据,并且进行了数据整理与选择。由于我国是首先发现该病例,因此我们以我国为中心,并考虑境外输入输出的影响来研究各国的疫情的发展趋势。我们从微信公众号青柠疫服上收集到[5]了我国境外输入新增趋势和境外输入累计趋势(参考微信程公众号青柠疫服)。为了估计各个国家的初期患病人数,我们从“世界人口网”(https://www.renkou.org.cn/)上收集了三个国家截止到2020年4月11日的总人口数量(见表格一所示)。
依据目前疫情的发展情况,以及各国政府采取的控制措施,我们建立了一个SEIR仓室模型。针对于各个国家的隔离措施,如果有近似k比率与感染者接触的人被隔离了且被感染,则其自动转为Ek,反之不变。对于被隔离的个体,如果被感染则会以A*B*O的速度被送到Ek内,如果没有被感染则会以A*(1-B)*O的速度转移到Sk内。同时感染者从被确诊(确诊速率E1参数估计为0.133)到恢复到健康水平,其恢复率为F3(参数估计为0.1022),考虑到迁入迁出其SEIR具体模型如下所示:
其中下标i可取值分别为1、2、3分别代表中国、美国、意大利。人口的流动用表示,其中j表示人的状态(分别包含易感染者、潜伏期者、有感染症状者和无症状感染者)。由于疫情从1月28日在中国发生,并在之后的一段时间内美国和意大利并没有报告病例数。所以我们只考虑我国人口的境外输入量和输出量(参考微信程公众号青柠疫服),则表示人口从我国流向第i个国家。我国在3月28日正式宣布封国,因此,可以假设在3月28日以后没有人口流动了。此时=0。考虑到复工复产时人口重新开始流动了。此时有境外的输入输[6]出比例又呈上升趋势,大约有700人出入中国,其中黑龙江、上海等地所占比例最大,大约占了52%。由此根据人口的流动趋势和分布可以计算出函数矩阵,这里矩阵表示人口流动的邻接矩阵,一共分为三段(1月28-3月28)。由我国的迁入迁出趋势图,以及人口数量表可以计算出不同国家的控制数,并假设在中间阶段人口没有流动,取值为0。
根据所给模型,利用再生矩阵的方法,我们可以计算出控制措施实施过程中再生数的取值。其公式如下:Rc=[(BAp(1-k))/(E1+g+F1) ...+(BA(1-p)(1-k)τ)/F2...+(BAω(1-k))/C]S(0)
5.2 模型一的求解
其中S(0)表示易感染者的初值,然而考虑到前期社会整体对这种新型病毒的认识不足(此时重视程度较低), 再加上医疗资源紧张, 因此导致前期我国的报告病例数相对较低, 而其它国家疫情暴发比我国晚, 报告病例数据相比我国较为模糊。因此,我们基于除我国外的其他国家的累计病例数(参考微信程公众号青柠疫服), 采用最小二乘法来估计系统参数。由于大部分国家的报告病例数基本都是从2月 15 日开始,并且前几天的数据也不太准确, 所以我们采用从2月15 日至 4 月 30 日 的数据进行参数估计。我们将数据分为三个阶段以期评估各国逐步加强的控制措施的影响, 第一阶段为 2 月 15日至 3 月 5 日, 第二阶段为 3 月 6 日至 4 月 12 日,第三阶段为 4 月 13日至 4 月30日。首先,根据所建模型我们先分析第一阶段包含数据的所有参数。为了考虑各地不断加强的控制措施对疫情的影响, 而控制措施的影响主要体现在接触数A和隔离率k的变化, 假设各国家间的参数A和k的取值不同,固定其他参数不变, 分别利用这三段数据重新估计每个国家的参数A和k. 模拟的起始时间 为 2 月 15 日, 我国的模型初值见表2 , 其他国家易感者的初值假设为当地总人口数, 其余初值为 0 (见表3). 具体参数估计值和三个时间段期间的控制再生数的估计值见表2和3, 利用Matlab仿真软件进行模型拟合。表3中的数字下标1、2、3分别代表3个不同的阶段。
在疫情初期,由于需要花大量的时间在病毒的研究上,因此统计出来的病例数是明显低于实际的病例数的。并且由于我国是第一个发现病例的国家,因此从其它国家的病例数来估计我国的实际病例数也是很重要的[7],根据模型可以知道在我国在3月28日封国以后,我国疫情已经得到了较好的控制。根据估计的参数值,我们得到了中国、意大利、美国三个国家的三个阶段的再生数(表三)[8]。从表中可以看出,在全球疫情初期美国的再生数为5.15,明显大于我国和意大利,因此美国的疫情恶化趋势有着很大的潜伏性。而我国的再生数较小,一方面由于一部分病例流入了其它的国家(占很小的比例),另一方面可能为核酸检测试剂并没有完全检查出所有的病例(与社区宣传效果、检查范围等因素密切相关)[9]。而对于之后的阶段,我国再生数已经有了明显的下降,意大利也是如此,但是美国还在上升(由于各国的疫情防治的重视程度不同以及医疗体系的因素)。对于再生數小于1表明:目前新发感染率比较低,疫情已经得到了有效的控制。
5.3 问题二的模型建立
SEIR模型,将人群分为:(如图4)
基础的SEIR模型没有考虑到防控隔离、假阳性、假阴性对防疫工作和疾病流行过程的影响,因此在原有的基础上新增了几类人群,如图4所示。
在疫情初期,基本再生数R0的均值由公式⑧和第一阶段计算所得指数增长K指,计算的出初期的基本再生数均值为3.4,即为在初期指数增长阶段,一个典型的患者可以传染大约3.4个人。
疫情爆发期由建立的模型可得,基本再生数R0=2.8,即为一个典型的新冠患者可以传染2.8个易感人,代间隔均值约为5.0d。
5.4 问题三的模型建立
结合一阶段问题2对无症状感染者预测的模型来分析无症状感染者的人数的范围。由第一阶段的模型可知,无症状感染者的人数在四月份基本得到控制,现在每日新增人数基本控制在个位数,整体疫情基本得到控制[10]。
当病毒高度适应人群后,无症状感染者是否更难发现,是否会造成疫情的二次爆发这些种种的问题都值得去勘测。为了更好预估赛事重启时间,我们决定研究被传染比例的重要影响因素,如何来降低被传染的比例是最赛事能否重启的重[11]要参考。以CBA篮球联赛是否能重启为例,如果要重启该赛事,我们需要对有足够的应对能力来降低感染者的日接触率,足够的医疗能力来提高日治愈率,只有这样,才能为重启赛事提供切实可行的保障。由此我们引入SIR模型[12]。
6 结果分析
6.1 问题一的结果以及模型检验
为了研究复工对各个国家的疫情的影响,我们基于我国在疫情期间的流动网络结构和流动量的模拟模型,并且考虑了不同的复工时间以及控制强度的影响分别采用第一阶段和第二阶段的人均接触数A和隔离率k在模拟时只考虑其它国家对我国的境外输入量得到,在复工时间分为3个时间段,分别为2月3日、3月15日、4月3日对各个国家疫情的影响用Matlab软件进行预测分析[13]。
可得,在前两个时间段内复工的话,只有我国的疫情扩大趋势没有过大的增幅,其它两个国家都有明显的上升,因此如果控制措施不严格的话[14],病情将会在20天内再次爆发。对于在最后一个时间段内复工的话,我国和意大利的疫情并不会严重化,但是对于美国来讲,这段时间复工仍然是非常的不乐观。
因此由于各个国家从2月15日才相继给出疫情发展情况(我国较为提前),为了不断加强防控措施的有效性,我们分阶段的给出了三个国家的控制再生数。并有数据分析,模型仿真可以知道,在前两个时间点里开展复工复业的话,再生数除了我国在第二个阶段比较低以外,其它国家都比较大。有很大的传播风险,然而对于第三个时间点即4月3日复工,我国和意大利的再生数均小于1,则新发感染率明显降低。因此模型仿真完毕,与实际情况近似相符[15]。
6.2 问题二的结果及模型分析
哪些参数是最重要的:
时间段不变,根据各个参数的变化值,控制变量法可以得出最重要的参数有:基本再生数、感染规模加倍时间、个人防护。
对防疫工作和疾病流行程度带来了什么影响:
假阴性率为36%(数据根据日本医生上昌広所说,在所有被检测的患者中,真实的新冠病毒感染者占20%,而检测的灵敏度为70%,特异度为90%所计算出来),这部分假阴性患者不能被检测计检测出来,所以可能会造成的危害较大。个人防护和隔离措施一定要做好。
假阳性率虽然也是检测计的故障,容易造成感染患者统计数据上的夸大,但是假阳性的危害没有假阴性的危害严重。
时刻关注潜伏期时间,有特殊患者的潜伏期时间超过了14天。对于无症状患者的分布要时刻采取注意。
6.3 问题三的结果
由于每只球队都会有自己的主场地,并且现在每个地方的疫情情况不太一样,有感染率相对高一些的地方,这个时候就需要每个地方的球队董事会根据当地情况来设置一个阈值k0,当计算所得的值高于这个阈值时,就可以考虑开赛。由问题一的模型我们可知,我国疫情可能在二次爆发,这个时间段应该尤为注意防护措施。满足什么条件时能不带口罩呢?一是在无人员聚集的地方可以不带口罩,二是在通风条件良好地方可以不带口罩。显然,对于CBA的举报地就不满足第一点,如果由模型3评估可以重启赛事时,那么每个观众席之间的距离需要间隔一米以上。仅仅如此还不够,也需要满足良好的通风条件以及相应的应急措施。由此我们可以制定出CBA赛事的重启时间表。
6.4 问题四的结果
给国家安全局的备忘录:6月初就可以举行赛事了,但是有几点必须要注意的事项:限制现场观众的人数(根据场地限制,以及该地区近段时间的疫情控制情况而定);观众于观众之间的位置距离要设计>1.5米;在进场处进行温度检测,温度超过37.2摄氏度请移步网上观看;现场设置医护人员,处理应对紧急状况;赛前对于运动员的身体状况一定要反复检查,确保不能有一点疏漏,举行赛事时不可避免的时队员与队员之间的接触。[16]
7 模型评价与推广
7.1 模型的优点
(1)在建模过程中,模型一巧妙的运用SEIR模型,结合人口流动矩阵,评估了二次疫情高峰的隐患大小。
(2)模型二引入了个人防护因素的SEIR模型更加贴近实情,考虑了基本再生数、潜伏期时间、代间隔几个重要的参数。
(3)模型三建立SIR模型,引入了被传染率,较准确的评估出重大赛事的重启时间。
(4)各个模型之间紧密联系,和真实情况较为贴近,仿真结果进行了多次测量更具有可行性。
(5)将国内外的疫情情况相结合,使得防疫指标更具有普遍性。
7.2 模型的缺点
(1)模型一的評估结果,主要是以我国为中心,而没有特别注重其他国家之间的相互的影响。
(2)模型二的参数考虑涉及不全面,数据不是特别准确。
(3)模型三仅仅是从理论进行分析,没有进行仿真实验,结果与实际可能存在偶然性误差。
(4)关于潜伏期患者和无症状患者的数据难以获得,因此模型具有一定的局限性。
7.3 模型的改进
(1)对各问题的模型进行优化,使得拟合精度更高。
(2)对于模型二多考虑一些参数。
(3)对模型三进行Matlab仿真,使得结论更加准确。
(4)整合各个国家几个月以来的人口流动,多去查阅国外的疫情数据以及国家间的人群流动数据再与国内疫情展趋势相联系,使得评估指标适用性更强。
参考文献:
[1] 唐博,Bragazzi N L,Li Q等.新型冠状病毒传播风险的最新估计(2019-nCoV)[J].Infect Dis Model,2020(05):248-255.
[2] 唐乙,王新,李奇,等.估计2019-新冠病毒传播风险及其对公众的影响,健康干预[J].J Comput数学,2020(09):462.
[3] 中华人民共和国国家卫生健康委员会.疫情通报.
[4] 基于多源数据分析,隔离病例和疑似病例的演变决定了2019- ncov疫情的最终趋势.数学Biosci,2013,246: 105-112.
[5] 马之恩,周义仓.传染病动力学的数学建模与研究[M].北京:科学出版社,2004.
[6] 湖北省卫生健康委员会.武汉:单日样本检测能力从200份提升至2000份.
[7] 世界卫生组织(WHO)关于《国际卫生条例》会议的声明(2005)关于新冠病毒(2019-nCoV)爆发的紧急委员会.
[8] 世界卫生组织(WHO).冠状病毒.
[9] 严阅,陈瑜,刘可伋等.基于一类时滞动力学系统对新型冠状病毒肺炎疫情的建模和预测[J].中国科学:数学,2020,50:385-392.
[10] 世界卫生组织(WHO).情况报告.
[11] 严阅,陈瑜,刘可伋等.基于一类时滞动力学系统对新型冠状病毒肺炎疫情的建模和预测[J].中国科学:数学,2020,50:385-392.
[12] 同[9].
[13] 肖艷,Tang S吴.传染病暴发中的媒介冲击转换面[J].科学代表,2015(05):78-38.
[14] 唐波,王晓,李琪等.2019-新型冠状病毒传播风险的估计及其对公共卫生干预的启示[D].综合数学学报,2020(09):462.
[15] 唐波,Bragazzi N L,Li Q等.新型冠状病毒(2019-nCoV)传播风险的最新估计[J].传染病模型,2020(05):248-255.
[16] 湖北省卫生健康委员会.2020年2月12日湖北省新冠肺炎疫情情况.