时间序列分析及模型构建在预测手足口病方面的应用
2018-05-24黄平冯慧芬王斌赵敬
黄平 冯慧芬 王斌 赵敬
郑州大学第五附属医院消化内科(郑州 450052)
手足口病(hand-foot-mouth disease,HFMD)是一种以柯萨奇病毒A16型(CoxA16)和肠道病毒71型(EV71)多见的肠道病毒引起的儿童传染病[1],通过消化道、呼吸道及各种密切接触途径传播,其传染源可以是患者或隐性感染者[2]。由于其传染性强、传播途径复杂,短期内可造成暴发流行。HFMD第一次在我国暴发是发生在2007年的山东省临沂市,接着在2008年安徽阜阳又出现大范围的流行,2008年5月HFMD被列入了法定报告传染病的丙类[3]。近年来,根据我国疾病预防控制机构的监测数据显示,HFMD发病率及重症、死亡病例逐年升高,防控形势十分严峻。最新公布的2016年发病人数为244万,死亡人数为199例,为我国传染病管理控制及社会医疗带来了不少压力。政府对手足口病的防治给予了高度重视,社会也非常关注,重症手足口病已成为我国重要的公共卫生问题。对于手足口病的治疗,目前仍没有确切有效的抗病毒药物,且没有安全有效的疫苗应用于人群。建立高度敏感的监测系统,对疾病的暴发流行进行预测,对于降低手足口病病死率、制定防治策略和措施具有重要意义。
HFMD的流行有明显的季节差异,即在夏秋季节出现高峰[4-5],温度和湿度对手足口病发病有重要影响。时间序列分析通过将某一变量按时间顺序排列,观察研究对象随着时间变动表现出来的规律特性,从而预测事物的发展趋势,特别适用于时序规律不明显,或有明显季节性和周期性的情况。季节性自回归移动平均模型可引入自变量提高模型的预测精确度,其过程简便、经济、预测精度较高。本研究拟通过时间序列分析构建手足口病季节性自回归移动平均模型,研究结果将为手足口病的预测和制定预防、控制手足口病的长远或近期应对策略提供依据。
1 对象与方法
1.1 研究对象 分析所用数据来源于郑州市某医院住院部和门诊信息管理系统,检索2009年1月至2016年10月通过传染病信息填报卡确诊的所有HFMD患儿信息,导出符合条件的信息资料用于进行时间序列分析。
1.2 统计学方法 所有数据使用SPSS Statistics 23.0软件处理分析,先将下载的数据进行预处理,将所有HFMD患儿的确诊日期以月份为周期进行数据的分类汇总,生成月发病例数,同时在SPSS里定义日期变量,选择年份、月份的日期格式。在模型构建时,选用带有季节因子的ARIMA模型,简写符号表示为 SARIMA(p,d,q)(P,D,Q)s模型。其中p为自回归阶数,q为移动平均阶数,d表示平稳化时的差分次数;P、Q分别为季节性的自回归和移动平均阶数,D表示季节性差分次数,s为季节周期。s在本研究中取值12,即代表数据以12个月为1个周期。其余各参数的取值围为0~2,需要根据经验来多次取值,探索不同的组合。最后根据模型的拟合度量中平稳R2来筛选最优组合。平稳R2用于比较模型中固定成分与简单均值模型之间的差别,其最大值为1,取值越大则意味着模型拟合效果越好。
2 结果
2.1 模型构建 如上所述,在对模型参数经过多次的探索后,最终确定最佳拟合模型为SARIMA(1,0,1)(1,0,1)12,其模型拟合统计量,平稳R2为0.734;Ljung-Box Q(18)统计量值为10.497,P=0.725,差异无统计学意义,提示残差彼此独立,不存在自相关性。模型参数估计值见表1。残差的自相关函数图(ACF)及部分自相关函数(PACF)图的结果见图1,其中X轴代表相关系数,介于-1到1之间,Y轴表示滞后的数量(月),两条竖实线为95%可信区间。
2.2 模型拟合评价 在模型建立完后,为了更好地了解模型的预测能力,使用原始发病数据进行内部验证,结果见图2,可以看到HFMD出现较明显的季节周期性,在每年的4~6月出现一个高峰的波动,拟合值和实测值的两条曲线较为接近,提示模型具有较好的拟合能力。
表1 SARIMA(1,0,1)(1,0,1)12模型参数估计值列表Tab.1 Parameter estimate list of the SARIMA(1,0,1)(1,0,1)12model
图1 SARIMA(1,0,1)(1,0,1)12模型的残差ACF图与PACF图Fig.1 Autocorrelation function(ACF)and partial autocorrelation function(PACF)of the residual series of the SARIMA(1,0,1)(1,0,1)12 model
图2 SARIMA(1,0,1)(1,0,1)12模型的拟合图Fig.2 Observed and fitted value of the SARIMA(1,0,1)(1,0,1)12 model
3 讨论
流行病学的疾病分布特征包括地区分布、时间分布以及人群分布。在地区分布方面,HFMD在国内各地区都存在分布,以东南沿海城市较多,尤以城市周围的区县以及农村、城乡结合部分布集中[6]。在时间分布方面,HFMD以春季和初夏为主要高峰,在我国北方集中在6月,而南方为5月和10月两次高峰,表现出较强的半年一次的周期性[3],目前较多研究[7]认为,气象条件以及所处的地理位置是导致该病周期性的重要因素,其中维度的影响最大[8]。在人群分布方面,HFMD以5岁以下儿童为主,男性的发病人数约为女性的1.5倍。
时间序列分析作为一种统计方法,在流行病学的研究中使用较为广泛,可以直观地揭示出疾病的分布特征,探索可能的影响因素。在众多HFMD 的预测模型[7,9]中,SARIMA模型在国内应用较为广泛[10-12],它通过综合考虑序列的周期性、各种趋势的变化以及随机干扰因素,对数据的一系列平稳化处理,最终实现多种参数进行量化表达,相比于普通回归预测模型,在传染病的预测中表现出较广泛的适用性。此外在HFMD预测方面还有一些是时空聚集性扫描分析的方法[13],对反应空间层面变化有优势。
在疾病的诊断治疗和预防控制方面,医院扮演着重要角色,医院对疾病的确诊、收治情况可以大致反映该区域整体疾病分布及发病情况。以往较多的研究侧重于通过收集疾病控制中心的资料描述该地区的发病情况,这样对整体把握HFMD的流行趋势较为方便。但是,由于疾病控制中心的资料往往来源于该地区各医院的间接传染病报卡,因此各医院作为防控传染病的第一责任单位,更应该掌握本医院每年的传染病流行趋势,做到及时调整医院的人力及医疗资源的分配以应对相关传染病的流行。
本研究通过完整地调用郑州市某医院从2009-2016年期间HFMD的总发病数据,应用时间序列分析方法,构建了SARIMA(1,0,1)(1,0,1)12模型。从模型拟合度量的统计量,平稳R2来看,模型拟合较好;通过绘制拟合图,可以看出模型的整体预测效果较好,同时也反映出该医院这8年期间HFMD发病率的整体波动情况。根据国家疾病控制中心公布的数据,2008年HFMD发病例数约为48.9万,2009年约为115.6万,约为2008年的2.4倍,这与各地区的小范围暴发流行有关。相应地在模型拟合图中,我们可以看到该医院在2009年也出现了一次明显增幅,而近年来,随着国家疾病控制中心的各种预防控制措施的完善,虽然HFMD总体发病人数仍然处于增长趋势,但其变化比较趋于平稳。本研究的结果表明,运用季节性自回归积分移动平均模型对HFMD的发病情况进行预测是可行的,有利于卫生部门提前制定相应的防治策略及应对措施,在一定程度上控制疾病的暴发流行,降低发病率与病死率。
综上所述,SARIMA模型对HFMD具有较好的预测价值。但作为流行病学方面重要的基础研究工具,除了分析时间因素对HFMD发病的影响,还要考虑到各种气象因素和人群、地域的分布情况,因此,还需要更多深入的研究,引入不同参数,将多种复杂的预测模型结合,为疾病的预防控制提供更精准的参考依据。
参考文献
[1]WANG J,HU T,SUN D,et al.Epidemiological characteristics of hand,foot,and mouth disease in Shandong,China,2009-2016[J].Sci Rep,2017,7(1):8900.
[2]李斌,欧维琳.手足口病病原学及检测方法研究进展[J].中华实用儿科临床杂志,2016,31(6):477-480.
[3]XING W,LIAO Q,VIBOUD C,et al.Hand,foot,and mouth disease in China,2008-12:an epidemiological study[J].Lancet Infect Dis,2014,14(4):308-318.
[4]蔡艳艳,周卫芳,尤海章,等.2010-2013年苏州地区儿童手足口病的流行病学及病原特征[J].实用医学杂志,2014,30(23):3875-3876.
[5]邓坤仪,范汉恭,黄桑,等.中山市2011-2015年儿童手足口病流行病学调查及分子病原学研究[J].实用医学杂志,2017,33(11):1861-1864.
[6]覃秋琴,金玉.手足口病的相关研究进展[J].中华传染病杂志,2015,33(9):575-576.
[7]杨朝晖,王成宝,王新丽,等.临沂市2012年上半年手足口病流行病学及临床特点分析[J].实用医学杂志,2012,28(24):4172-4174.
[8]LIU L,ZHAO X,YIN F,et al.Spatio-temporal clustering of hand,foot and mouth disease at the county level in Sichuan province,China,2008-2013[J].Epidemiol Infect,2015,143(4):831-838.
[9]杨仁东,胡世雄,曾小敏,等.手足口病疫情预测预警模型研究进展[J].实用预防医学,2015,22(11):1399-1402.
[10]LIU S,CHEN J,WANG J,et al.Predicting the outbreak of hand,foot,and mouth disease in Nanjing,China:a time-series model based on weather variability[J].Int J Biometeorol,2017(6):1-10.
[11]张康军,刘昆,邵中军,等.我国手足口病时空分布特征及预测模型研究进展[J].解放军预防医学杂志,2017,35(6):683-686.
[12]刘峰,朱妮,邱琳,等.ARIMA乘积季节模型在陕西省手足口病预测中的应用[J].中华流行病学杂志,2016,37(8):1117-1120.
[13]GUI J,LIU Z,ZHANG T,et al.Epidemiological Characteristics and Spatial-Temporal Clusters of Hand,Foot,and Mouth Disease in Zhejiang Province,China,2008-2012[J].PLoS One,2015,10(9):e0139109.