Logistic 微分方程模型在结核病疫情预警中的应用
2020-04-02王明斋余珊珊芮佳杨蒙王瑶王琦琦陈田木郑蓉蓉张小芬
王明斋,余珊珊,芮佳,杨蒙,王瑶,王琦琦,陈田木,郑蓉蓉∗,张小芬∗
结核病是由结核分枝杆菌引起的一种呼吸道疾病[1]。近年来我国结核病疫情形势虽有所下降,但是结核病特别是耐药结核病负担仍很严重[2],与世界卫生组织提出的消除结核病目标仍有较大差距[3]。由于结核病在3 ~6 月存在一个明显的发病高峰[4,5],疾病防控人员可以在流行高峰前提前采取干预措施以控制疾病流行。因此,对各地结核病流行高峰进行早期识别和预警具有重要意义。近年来,已经越来越多的数学模型运用到结核病预测预警研究中,常见的基于数理统计方法的预测模型有灰色GM(1,1)模型[6]、自回归移动平均模型[7]、Azuma 模型[8]等。基于微分方程的模型有SEIT 模型[9]等。
Logistic微分方程模型(以下简称LDE模型)早期主要用于描述人口的增长模式,后被陆续应用在医学等多个领域。该模型由于实操性强、操作简便,在手足口病[10]、流感[11,12]、流行性腮腺炎[13]、感染性腹泻疾病[14]等急性传染病中已经有一定的预测应用,但在慢性传染病中的研究尚未见报道。本研究尝试利用该模型对结核病进行模拟研究,为开展类似研究和指导防控提供参考。
原理与方法
1模型原理
模型模拟两条曲线,一条为累计病例曲线(图1中的虚线),另一条为新发病例曲线(图1中的实线)。其中,模型描述的新发病例曲线出现先增加,达到高峰后逐渐下降;而疾病累计发病数随着时间推移,呈现出“慢—快—慢”的过程,整体曲线呈现出“S”型(图1)。
图1 Logistic微分方程模型累积和新发结核病病例数曲线(虚拟数据)
LDE模型可以精确计算疫情加速时间,进而判断流行周期的早期、中期和晚期节点,这有助于实施针对性防控措施。因此,对于疾控部门应对结核病等公共卫生事件中具有重要参考意义。Logistic微分方程模型如下:
其中,dy/dt为t时刻传染病累计病例y的变化速率。y为累计病例数,x为病例变化速率参数,Y为累计病例上限。方程(1)的通解为:
其中,a为微分方程求解过程产生的常数。将方程(2)分别求二阶、三阶导数,可以获得模型的3个拐点,其横坐标分别为:
结核病的疫情发展被t1、t2、t3这三个节点分为渐增期、快增期、缓增期3个阶段。在渐增期采取相应措施防控效果最优。而越往后的时期不仅成本高昂,而且防控难度大、效果不佳。因此,Logistic微分方程模型能够分期的这一优势无疑具有重要的流行病学意义。t1为“疫情加速时间”,在该时间点结核病流行周期内的疫情发展速度由慢变快。鉴于落实卫生决策和实施干预措施需要时间,若放任疫情发展到“疫情加速时间”时才进行预警会导致滞后。因而,鉴于以往研究和专家意见,将“疫情加速时间”提前1-2个标准差作为“建议预警时间”,如图2 所示。该模型详细推导过程参照文献[10-14]。
图2流行时期内结核病预警时间的确定方法示意图(s为标准差,设为1个月)
2建模步骤
Logistic微分方程模型建模步骤包括:确定研究目的、分析流行特征、建立模型、收集数据、参数估计与初始值设置、模型拟合优度检验、疫情加速和建议预警时间计算。
结果
1确定研究目的
以厦门市2005-2018年结核病月发病例数为例进行模型研究。计算厦门市2005-2018年各年间结核病疫情加速时间和建议预警时间。
2分析流行特征
由图3可知,厦门市每年结核病疫情存在一个明显的冬春季节流行高峰。
3建立模型
如上述方程(1)所示模型。
4收集数据
搜集厦门市2005-2018年月报告发病数,数据包含14年共168个月。
5参数估计与初始值设置
采用Berkeley Madonna 软件进行模型和数据拟合,微分方程求解方法为4阶龙格库塔法,容忍度为0.001,模型收敛方法为最小均方根(least rootmean square,LRMS)。经模型拟合,得到相应参数x、Y、a置为1月,则冬春季建议预警时间为上年度末月或下年度首月。值。如表1所示。
图3 Logistic微分方程模型拟合效果
表1厦门市2005-2018年结核病疫情Logistic微分方程模型拟合结果
表2厦门市2005-2018年结核病疫情预警时间
根据方程(2),求得y值。再由方程(3)和(5)求得t1和t3值。T1为疫情加速时间,T3为疫情放缓时间,以月为单位。如2005年的T1=2,T3=9表示2005年2月厦门市结核病疫情出现加速而9月开始放缓,如表2所示。
6模型拟合与优度检验
图3展示了实际发病率与Logistic微分方程拟合的效果。采用SPSS 13.0软件进行决定系数计算,结果显示拟合效果较好(R2=0.577,P<0.05)。
7疫情加速时间和建议预警时间计算
t1为疫情加速时期,其值为1 ~2月,因而夏门市结核病疫情加速时间为第1或第2 个月。若s设
讨论
本研究采用Logistic微分方程模型,结合结核病流行特征,建立各个周期内的Logistic微分方程模型,利用实际周发病数据计算疫情发展速度参数x和流行周期结束时的累计病例数的理论值Y,并确定了结核病的“疫情加速时间”和“建议预警时间”,这为结核病控制工作提供了一定参考。评价模型适用性时,结合既往学者研究结果推荐拟合优度检验,它基于Excel 和SPSS软件即可进行,对于基层人员而言更加容易理解、易于推广。未来在进行实际建模研究时可以加入疾病传播动力学特征、干预的效果、气候因素等数据,从而为结核病的防控提供更精细的证据。
Logistic微分方程模型总体思路是:首先利用结核病发病数据分析其流行周期规律、明确流行高峰,随后采用数学模型拟合,分析每个流行周期内的疫情加速时间以确定建议预警时间。Logistic微分模型在现实防控工作中具有独特的优越性,主要表现在两个方面:一是模型使得基层在疫情评估时更加可靠。在我国基层公共卫生单位,受专业水平的限制,靠传统的专家疫情评估方式实施有一定的难度;二是该模型简便易操作。目前研究的数学建模方法相较均复杂,模型仿真结果需要精确判断,且未能定量给出疫情具体的分期。但该模型也有着自身的缺陷,主要体现在其对数据资料要求较为严格,如要求疾病高峰出现时其左右波形要对称分布。而在现实中,当结核病疫情呈现上升趋势,相关部门势必会采取干预措施,从而导致疾病发病例数比自然状态下减少,左右两边会不对称,进而拟合效果受影响。这时需要尝试引入广义Logistic微分方程模型进行校正,从而提高模型预测精度。
尽管如此,Logistic微分方程模型仍能在一定程度上帮助基层工作者进行结核病疫情预警工作,通过明确疫情早期速度由慢变快的时间点,为科学采取防控措施提供有益参考。