义乌市手足口病流行趋势组合预测模型研究
2013-09-07董选军余运贤朱列波
董选军 余运贤 朱列波
义乌市手足口病流行趋势组合预测模型研究
董选军1余运贤2朱列波1
目的 构建义乌市手足口病流行趋势最优预测模型。方法 通过对义乌市2009-2011年手足口病按月发病数进行ARIMA时间序列、GM(1,1)灰色模型以及2者的组合模型进行建模,并预测2012年1-5月份发病数与实际比较。结果 ARIMA(1,1,1)模型的 r(曲)91.26%,GM(1,1)灰色模型的r(曲)为1.86%,组合预测模型的 r(曲)为94.55%;ARIMA(1,1,1)预测的 MAPE为 56.39%、MSPE为 27.28%,GM(1,1)预测的 MAPE为 42.09%、MSPE为22.91%,组合预测模型预测的MAPE为53.29%、MSPE为25.10%。结论 在进行手足口病流行趋势建模中,组合预测是一个较好的方法。
手足口病 ARIMA GM(1,1) 组合预测
1.义乌市疾病预防控制中心(322000)
2.浙江大学公共卫生学院
手足口病是多种肠道病毒(以EV71和COXA16型为主)感染引起的一种常见急性传染病,好发于婴幼儿及学龄前儿童,以发热和手足口臀部丘疹或疱疹为主要症状,该病传染性强,传播速度快,短时间内可在人群密集的地区引起大流行,因此了解手足口病的流行趋势,建立模型并进行预测有利于更好地防控手足口病。本文对义乌市2009-2011年的手足口病按月发病数进行ARIMA时间序列、GM(1,1)模型和组合模型建模,预测2012年1-5月份发病数,并与实际进行比较,结果如下。
资料与方法
1.资料来源 2009年1月-2012年5月义乌市手足口病疫情资料来源于中国疾病监测信息报告管理系统。
2.方法 对2009-2011年义乌市手足口病流行趋势进行描述性统计分析和按月手足口病发病数建立ARIMA、GM(1,1)和组合预测模型。
3.统计分析 使用DPS7.05软件进行ARIMA时间序列、GM(1,1)和组合预测模型分析,SPSS19.0进行有关系数计算。
结 果
1.疫情概况 2009-2011年义乌市共报告6122例,报告发病率分别为48.95/10万、179.23/10万和95.00/10万,年报告平均发病率108.47/10万。2012年1-5月共报告4500例,远远超过历年同期平均水平,并呈现逐月上升趋势。
2.时间分布 2009-2011年每月均有发病,4-7月份和11-12月份呈现2个小高峰,其中4-7月份占63.85%。
3.ARIMA时间序列模型分析
用DPS7.05软件对2009-2011年手足口病按月进行ARIMA模型拟合,根据多次拟合,ARIMA(1,1,1)相对较好,得拟合方程Z(T+L)=-0.0021+0.30Z(T+L-1)+e(T+L)-0.058e(T+L-1)。曲线相关r(曲)=1-(Q/Lyy),其中Q为实际值与拟合值差的平方和,Lyy=∑(Y-)2,得到ARIMA模型的r(曲)为91.26%。预测得平均绝对百分比误差为56.39%,均方百分比误差
4.GM(1,1)灰色模型分析
用DPS7.05对2009-2011年手足口病进行灰色模型分析,得Z(K+1)=135.18e-0.014k,r(曲)为1.86%,预测的MAPE为42.09%,MSPE为22.91%。
5.组合模型
设Y11,Y12分别是 ARIMA(1,1,1)和 GM(1,1)模型的预测值,Yt是最优组合预测值,预测误差分别为e1t、e2t、et,以预测误差平方和最小为最优准则,即使E=取最小,k1,k2(k1+k2=1)为相应的权系数,则有:et=k1e1t+k2e2t,将k2用1-k1代入可得:
对于E==∑[k1(e1t-e2t)+e2t]2
关于k1求偏导数,则∑2(e1t-e2t)[k1(e1t-e2t)+e2t]=0,得k1= -[∑(e1t-e2t)e2t]/[∑(e1t-e2t)2],得组合模型为Yt=0.84Y11+0.16Y12,r(曲)为94.55%,预测的MAPE为53.29%,MSPE为25.10%。
6.三种模型和预测比较
从 ARIMA(1,1,1)、GM(1,1)和组合模型比较,组合模型的曲线相关系数94.55%大于ARIMA(1,1,1)的91.26%和GM(1,1)的1.86%,拟合情况详见图1。
图1 3种模型与实际比较图
讨 论
在卫生统计研究中,需要从大量的数据中寻找出隐藏的规律,最好能够用数学模型表示出来〔1〕。不同的预测模型各有其优点和缺点,组合预测模型综合利用每种预测方法提供的有用信息,对所组合的各单项预测方法取长补短,在当前预测领域是一个研究热点〔2〕。而基于数据挖掘的组合预测模型可以从原始数据中挖掘出更多的信息,有利于解决不同情况下的实际应用问题〔3〕。
ARIMA时间序列分析因突出时间序列暂不考虑外界因素影响,当外界发生较大变化时,常会有较大偏差,因而时间序列预测法对于中短期预测的效果要比长期预测的效果好〔4〕,同样 GM(1,1)模型也不太适宜作长期预测〔5〕。本文用ARIMA、灰色模型和二者的组合模型对2009-2011年义乌市手足口病疫情进行了建模,并进行了比较,得出虽然灰色模型远远不如ARIMA模型,但是当用适当的方法把灰色模型和ARIMA模型组合起来的时候,所达到的效果最好,这也为我们优化模型提供了新的方向。
1.管总平,陈芳,吴卫红,等.基于组合预测模型对门诊量的预测.中国医院统计,2009,16(3):226-230.
2.郭秀英.预测决策的理论与方法.化学工业出版社,2010.
3.张世强.基于数据挖掘的组合预测模型的建模方法.中国卫生统计,2009,26(5):470-471.
4.刘晓东,景睿,孟祥臻,等.ARIMA模型对中国入口死亡率预测的研究.中国卫生统计,2008,26(5):630-631.
5.任正洪.孕产妇死亡率的灰色预测,中国卫生统计,2005,22(1):22-22.
(责任编辑:郭海强)