APP下载

ARIMA乘积季节模型在郑州市肺结核月发病趋势预测中的应用*

2021-10-09梁士杰

中国卫生统计 2021年4期
关键词:乘积郑州市残差

周 扬 梁士杰

【提 要】 目的 建立郑州市近年肺结核月发病的ARIMA乘积季节模型(SARIMA)并进行预测,探讨该模型在郑州市肺结核早期预测预警中的可行性。方法 以郑州市2011-2018年肺结核月发病数为基础,建立适合郑州市肺结核ARIMA乘积季节模型,利用R语言的auto.arima( )代码自动得到最优模型后对2019年肺结核发病数进行预测。结果 构建的郑州市肺结核月发病预测模型为ARIMA( 2,0,0) (0,1,1)12,模型参数均有统计学意义( P<0.05),模型拟合优度AIC=78.45,BIC=94.04,残差序列为白噪声( Ljung-Box test Q=17.285,P=0.3674 ),2019年1-12月实际值与拟合值的动态趋势高度吻合。结论 本研究建立的ARIMA( 2,0,0) ( 0,1,1)12可用于郑州市肺结核月发病的早期预测。

结核病是由结核分枝杆菌引起的传染病,主要导致肺部病变,是我国农村居民因病致贫、因病返贫的主要疾病之一[1]。我国是全球第二大结核病高负担国家,肺结核是我国重点关注丙类呼吸道传染病[2]。目前,肺结核作为一种慢性传染病,在我国每年均有大量病例报告。本研究利用季节性自回归滑动平均模型法( seasonal auto regressive integrated moving average,SARIMA)对郑州市2011年1月-2018年12月肺结核发病情况进行拟合,旨在为郑州市肺结核防控工作提供精准预测的科学依据。

资料与方法

1.数据来源

数据来自中国疾病预防控制信息系统,按发病日期统计的2011年1月-2019年12月报告的郑州市肺结核发病数。

2011年1月-2018年12月的数据用于建立SARIMA预测模型,2019年1-12月的数据用于模型效果检验及预测评价。

2.研究方法

ARIMA乘积季节模型是ARIMA(p,d,q)模型与季节性模型ARIMA(P,D,Q)s的混合效应模型[3]。

SARIMA建模过程包括平稳性检验、模型识别、模型诊断、模型预测[4],发病数经自然对数转换后,利用R中的tseries和forecast包,对郑州市2011-2019年肺结核的发病数据建立SARIMA模型,利用auto.arima( )代码结合模型参数估计和残差诊断选择最优模型,模型构建采用R3.6.3软件。

结 果

1.流行特征

经自然对数转换后,发现郑州市2011年1月-2018年12月肺结核发病有明显的季节趋势,呈现年周期性波动,总体呈缓慢降低趋势。每年11月份至次年3月份为发病高峰,随后逐月下降。去掉季节性因素后,郑州市2013年1-2月发病达到高峰,随后明显下降,2013年11月后逐渐增加,到2013年6-7月达到最高峰,随后逐年下降,但2017年有所增加,2018年迅速下降。从残差趋势图来看呈现明显的规律性自相关趋势。

图1 郑州市肺结核发病趋势分解图

2.SARIMA 模型的构建及评价

利用R软件中的auto.arima( )代码自动选取的模型为ARIMA( 2,0,0) ( 0,1,1)12,模型的残差诊断图显示残差在0附近随机波动且呈正态分布,对残差经 Ljung-Box 检验后,残差为白噪声(Q=17.285,P=0.3674),从残差自相关图(ACF)来看,此模型残差大部分都落入95%可信区间内,说明序列信息已经被充分提取。同时,平均绝对百分误差MAPE=0.071<10,说明模型的预测精度较高。因此该模型拟合郑州市2011年1月-2018年12月肺结核发病数据是合适的。

图2 SARIMA模型残差分布图

3.模型预测

图3为整个样本期内肺结核的真实值与模型估计值的序列图,可以看出拟合序列与原序列的变化趋势基本一致。因此ARIMA(2,0,0)(0,1,1)12模型可用于预测2019年肺结核流行趋势。

图3 郑州市肺结核预测值与实际值拟合图

利用建立的ARIMA(2,0,0)(0,1,1)12模型对2019年肺结核1-12月发病数进行预测,除2月份外(相对误差为43.06%),其他月份实际值与预测值相对误差幅度均低于20%,实际值与预测值误差率最小0.869%。

2019年郑州市肺结核用该模型预测合计为3349例,实际发生3399例,差值百分比为1.48%,说明总体预测效果理想。

表1 2019年1-12月肺结核发病数与预测数比较

讨 论

1.肺结核以ARIMA乘积季节模型进行短期预测是可行的,对于识别慢性传染病的暴发或流行具有重要意义,有利于提前开展有针对性的传染病健康宣传教育和干预措施。目前郑州市肺结核发病趋势与全国肺结核总体发病趋势相同,均呈缓慢下降趋势,但存在明显的季节性,本次预测模型预测结果相对精准,可作为预测肺结核的参考模型。

2.利用R语言中的auto.arima( )功能结合模型参数检验选择的最优模型是可行的,可以替代传统判断模式,并可提高ARIMA模型中参数确定的效率。

3.本次模型拟合评价中,残差为白噪声过程统计检验显著性P=0.3674,但该模型依然存在可能的外界影响因素,如气象因素、空气污染物、人口流动等,下一步可考虑探索使用广义加性模型(GAM),将气象因素和空气污染物因素纳入模型进行拟合[5]。

猜你喜欢

乘积郑州市残差
基于双向GRU与残差拟合的车辆跟驰建模
乘积最大
基于残差学习的自适应无人机目标跟踪算法
郑州市
最强大脑
最强大脑
郑州市创新推进“八大群体”入会工作
基于递归残差网络的图像超分辨率重建
Dirichlet级数及其Dirichlet-Hadamard乘积的增长性
郑州市