关于埃博拉病毒传播的分析与预测模型
2018-01-02梁晴宋彦辰
梁晴 宋彦辰
摘 要:埃博拉病毒所致疾病傳播速度远远高于其控制的速度,本文通过分析其传播过程建立了埃博拉病毒传播模型,并使用拉丁超立方抽样对疾病传播进行预测估计。首先,根据Sir Epidemic动态系统-seiifr模型建立了一个模型,在这个模型中,考虑了暴露于人群中的易感人群、埃博拉病人以及患者的自愈恢复。为了确定最优参数,构造了最小二乘法优化方案。结果显示该模型短期预测效果较好。
关键词:埃博拉病毒传播 拉丁超立方抽样 最小二乘法
引言
2014年西非全面爆发的埃博拉疫情(EVD)是世界近年来见证的规模空前、规模巨大、范围广泛和严重后果的公共卫生危机。本轮埃博拉疫情主要突击西非几内亚、利比里亚和塞拉利昂三个国家。 这是自1976年人类首次发现并命名埃博拉病毒以来历史上最严重的公共卫生灾难,显示出与过去的许多不同特征。
1 埃博拉传播模型
为了研究埃博拉病毒传播的规律性,本文建立了分阶段的埃博拉传播模型,明确纳入疾病的自然病史和动态ETU能力,同时考虑到诸如报告率、症状评分和高危人群比例问题等因素。可以使用本文模型来评估预测病例的不确定性、死亡和床位预测,估计疾病的每个阶段对传播的影响,并检查ETU能力供应,减少传染病对EVD爆发的影响动态的关系。
从图1所示的结构模型可看出,该模型包括分阶段感染过程,以反映随着感染进展而增加的感染症状和传播。埃博拉经常经历多个阶段的疾病:第一阶段是感染的初始阶段,并且症状趋于轻微,并且常常发展成腹泻和呕吐;第二阶段是更严重的阶段,伴有更严重的症状(例如出血和多器官衰竭),典型的进展约5-7天。受感染的人最有可能在第一阶段复原,而第二阶段通常是致命的。图1的相应等式:
其中S代表易感人群比例,E代表暴露人口比例,R代表最近恢复的人口F代表已经死亡和正在被埋葬的人的比例。
最后,将模型与世卫组织提供的关于累计病例和死亡的数据联系起来。
2参数估计
本文期望有一个广泛的模型参数,特别是截至10月1日的数据仍处于指数增长阶段,在这个阶段,它只能有两个参数。 这个想法已被用于开发简单的双参数预测模型的流行,这代表了这一流行期间内在的不可识别性问题,因为大量参数值可用于产生相同的初始流行病增长率,但在流行病动态开始偏离指数增长时可能有不同的时间点。
因此,本文使用拉丁超立方(LH)抽样方法,其中抽取了实际范围内的大部分参数,然后对于每个样本,只计算两个参数,即传输参数和总体死亡率。这使我们能够检查与数据和所有参数的已知实际范围一致的潜在模型行为范围。
实际值的范围非常广泛,上限为1(代表完美报告和完全处于危险中的人群),并且其下限通过取得仍然产生良好拟合的最低值来确定。本文对每个案例(采样了1000个参数集,同时测试数据中每个范围的极值,以说明模型在实际范围内产生的全部潜在行为。
图中,红色表示累计病例总数,绿色表示累计死亡总数,蓝色×表示实际的累计病例总数,紫色×表示实际累计死亡总数。
从图中可以看出,自2014年11月12日以后,该模型计算得到的数据与利比亚的实际数据非常吻合,表明该模型具有较好的适应性。
结论
本文模型中存在大量参数,并且仅使用简单的加速度方法可能无法获得全局最优解。且拟合结果仍然存在一些差异,应该引入更多变量,并且对于参数估计,选择遗传算法如群算法进行求解,从而可以得到更好的全局最优解。
参考文献:
[1]World Health Organization.Ebola response roadmap - Situation report,http://www.who.nt/csr/disease/ebola/situation-reports/en/, 2014.
[2]Marisa C.Eisenberg,Joseph N.S.Eisenberg,JeremyP.DSilva,EdenV.wells.”Modeling surveillance and interventions in the 2014 Ebola epidemic”The Lancet Infections Diseases(2015)