灰色模型GM(1,1)和ARIMA在拟合全国婴儿、5岁以下儿童死亡率中的应用
2015-01-27庞艳蕾张惠兰李向云
庞艳蕾 张惠兰 李向云△ 赵 晶
灰色模型GM(1,1)和ARIMA在拟合全国婴儿、5岁以下儿童死亡率中的应用
庞艳蕾1张惠兰2李向云1△赵 晶1
目的 比较分析灰色模型GM(1,1)、ARIMA模型在全国婴儿死亡率(IMR)和5岁以下儿童死亡率(U5MR)拟合过程中的适用性,为儿童保健工作提供科学依据。方法 以1991-2012年全国IMR、U5MR为原始资料,统一运用SAS分析软件。采用灰色模型GM(1,1)和ARIMA模型进行拟合分析,分别计算各模型拟合MPE、MAPE值,比较各模型的适用性和精确性。结果 婴儿死亡率GM(1,1)和ARIMA模型MPE分别为0.32、1.18,MAPE分别为3.09%、5.34%;5岁以下儿童死亡率GM(1,1)和ARIMA模型MPE分别为0.57、0.89,MAPE分别为3.11%、4.33%。结论 GM(1,1)模型对儿童保健指标拟合效果优于ARIMA模型,模型拟合要充分考虑数据特征。
GM(1,1) ARIMA 婴儿死亡率 5岁以下儿童死亡率 拟合
2000年9月世界各国领导人在联合国千年首脑会议上通过“联合国千年宣言”[1]并制定了八项千年发展目标(MDGs)。其中一项就关系到儿童保健方面,要求到2015年在1990年的基础上使五岁以下儿童的死亡率降低三分之二。控制和降低婴儿死亡率(IMR)和5岁以下儿童死亡率(U5MR)既是改善和增进人民福利的内在要求,又是我国人口与社会发展的重要内容[2]。国内大多数学者运用单一模型对儿童死亡率进行拟合分析,且缺乏横向比较。本文旨在运用模型GM(1,1)和ARIMA对IMR和U5MR拟合分析,比较两模型在拟合儿童死亡率中的适用性和精确性。
资料与原理
1.资料来源
资料来源于中国国家卫生和计划生育委员会卫生信息中心《2013中国卫生统计年鉴》和《2013年中国卫生统计提要》,真实可靠。利用1991-2012年全国婴儿死亡率(IMR)及5岁以下儿童死亡率(U5MR),作为建模分析的原始数据。
2.模型原理
(1) 灰色模型GM(1,1)
②模型检验 根据小误差概率(P值)和后验差检验计算方差比(C值)检验模型的精确性,详见表1。
* 以C值或P值对应的最优精度等级作为模型精度等级
(2) 模型ARIMA
②模型检验 纯随机性检验(白噪声检验),对模型检验时,残差序列为白噪声序列则模型拟合较好,说明充分提取了数列信息。若残差序列不是白噪声序列要重新建模,直到残差为白噪声序列为止。
3.统计分析
两种预测模型都通过SAS软件编辑程序并分析。根据两种模型拟合结果计算出与实际值误差,以拟合误差来判定模型拟合的优劣性。
4.模型比较
各指标数据拟合后,以拟合值与真实值的差值作为误差,然后计算各模型拟合预测平均相对误差MPE和平均相对误差绝对值MAPE。前者是将每个预测值的误差以误差的倍数放大,这样单个误差较大的预测值就可以使预测误差的方差大幅增加,这更适合模型比较;与前者相比后者不存在正负相抵消的情况,所以应用起来更优越。因此,将MPE和MAPE结合起来共同作为模型评价标准。
结果与讨论
1.拟合婴儿死亡率
(2)建立ARIMA模型 利用全国1991-2012年IMR数据,先进行白噪声检验并结合序列ACF和PACF进行分析,结果序列为有很强的递减趋势的非白噪声序列。然后对序列进行差分运算,2阶差分后,表现为平稳非白噪声序列。观察差分后序列ACF和PACF,并结合表2和拟合结果残差白噪声检验结果,最终选择ARIMA(0,2,2)模型拟合,即2阶差分2阶移动平均模型:(1-Β)2χt=(1-0.72067Β+0.81441Β2)εt。模型残差和参数检验均通过检验详见表3,拟合结果详见表4。
2.拟合5岁以下儿童死亡率
(2)建立ARIMA模型 同ARIMA建模原理步骤,经过白噪声检验、差分运算、拟合结果白噪声检验以及AIC值和BIC值比较,最终选择最优ARIMA(0,2,1)模型,即2阶差分1阶移动平均模型:(1-B)χt=0.12478 + (1-B)εt。模型残差白噪声检验:延迟6阶χ2值为10.68,P值为0.0582,延迟12阶χ2=19.14,P=0.0587,P值均大于0.05,模型通过检验。模型参数显著性检验:均值(常数)t=2.96,P=0.0084,θ1检验t=6.42,P=0.00001,P值均小于0.05,参数通过检验。拟合结果详见表4。
3.模型比较
根据各模型预测结果和拟合误差,计算各模型拟合MPE、MAPE值。为使结果比较更有说服力现统一采用2005年以后拟合数据进行误差分析。婴儿死亡率GM(1,1)和ARIMA模型MPE分别为0.32、1.18,MAPE分别为3.09%、5.34%;5岁以下儿童死亡率GM(1,1)和ARIMA模型MPE分别为0.57、0.89,MAPE分别为3.11%、4.33%。可见,GM(1,1)模型在IMR和U5MR拟合方面优于ARIMA。图1、图2直观展现了两模型在IMR和U5MR方面拟合效果。
讨 论
GM(1,1)或ARIMA都适用于短期序列拟合,均曾被学者用在儿童死亡率的研究中[5-6],也有学者将两者共同运用于疾病或入院人数预测的比较分析[7-8]。本次研究将两模型同时用于IMR和U5MR拟合,在各模型均通过检验情况下,比较其精确性。两种模型拟合均通过了模型检验,均可用于IMR和U5MR拟合,但GM(1,1)在IMR、U5MR的拟合时MPE、MAPE值均低于ARIMA模型。所以说在拟合儿童死亡率方面,GM(1,1)拟合效果优于ARIMA。
GM(1,1)对样本含量和概率分布没有严格的要求,适应性强,可广泛应用于农业、工业、气象、医学等领域的预测[9],并允许较少数据预测,对影响因素不明确或结局不明朗的事件均可以展开预测[10]。而ARIMA对数据要求相对较高,需要相对较多的连续序列数据,且过程相对GM(1,1)复杂。依据两种模型的适用条件,数据无波动或波动较小的时间序列宜用GM模型、波动较大的时间序列宜用ARIMA模型[7]。当序列存在周期波动或季节波动时ARIMA更是首选。由原始数据可以看出,IMR、U5MR均表现很强的递减趋势,没有很大逆向波动,因此原始数据特征和模型自身特点是选择合适拟合模型的关键。
儿童死亡率受到多方面的影响,比如社会经济发展水平、卫生资源的配置利用、以及家长经济状况和文化程度等,并且各种因素对儿童死亡率影响程度、方式、途径等都有各自的特点。模型拟合儿童死亡率只是单纯从模型拟合角度探究模型拟合历史数据的精确程度,数学模型主要是反映数据的规律性,不能完全反映各种非规律性的社会因素对预测数据的影响[11]。因此在拟合乃至预测过程中要慎重。
[1]联合国千年宣言.A/55/L.2,http://www.un.org/chinese/ga/55/res/a55r2.htm.
[2]刘元元.2010年我国孕产妇、婴儿及5岁以下儿童死亡率的统计预测研究.成都:四川大学,2005.
[3]徐国祥.统计预测和决策.第二版.上海:上海财经大学出版社,2005:202-224.
[4]王燕.应用时间序列分析.第二版.北京:中国人民大学出版社,2008.142-173.
[5]刘洁,曲波,郭海强,等.ARIMA模型在中国5岁以下儿童死亡率预测中应用.中国公共卫生,2011,27(2):237-238.
[6]李向云,刘晓冬,马丽敏,等.GM (1,1)灰色模型在拟合我国婴儿死亡率中的应用.中国医院统计,2009,16(1):33-35.
[7]金如锋,邱宏,周霞,等.ARIMA模型和GM(1,1)模型预测全国3种肠道传染病发病率.复旦学报(医学版),2008,35(5):675-680.
[8]梁景星.GM(1,1) 灰色模型和ARIMA模型在我院季度入院人数预测中的比较分析.中卫生统计,2014,31(1):107-109.
[9]许筱红,金小林.GM(1,1)数学模型在疟疾疫情预测中的应用.中国寄生虫病防治杂志,2005,18(3):178-179.
[10]杨婷,王玉贵,杨丹,等.基于灰色成分数据模型的医疗费用结构变动趋势预测研究.中国卫生统计,2011,28(1):58-60.
[11]张冬艳,卢亦愚,冯燕,等.应用灰色系统模型预测麻疹的流行时间.数理医药学杂志,2011,24(1):7-9.
(责任编辑:郭海强)
1.潍坊医学院公共卫生学院(261053)
2.山东省潍坊市奎文区妇幼保健院(261041)
△通信作者:李向云,E-mail:lixy@wfmc.edu.cn