APP下载

基于EGARCH模型的烟台市人群死亡率波动非对称效应分析及预测应用

2020-06-28烟台市疾病预防控制中心264003刘海韵张红杰陈远银于绍轶曲淑娜王倩倩王茂波

中国卫生统计 2020年3期
关键词:烟台市月度波动

烟台市疾病预防控制中心(264003) 刘海韵 张红杰 陈远银 于绍轶 曲淑娜 王倩倩 徐 颖 王茂波

【提 要】 目的 揭示人口及非人口影响因素对烟台市人群死亡率波动的非对称效应,预测死亡率变化趋势。方法 以2007-2017年全市死亡数据作为样本数据,建立季节调整月度死亡率ARIMA-GARCH时间序列模型,绘制信息冲击曲线,预测2018年死亡率。结果 在偏正态分布假设下拟合的ARIMA(1,1,1)(1,1,0)12-EGARCH(1,2)模型较好地捕捉到死亡率波动性,且预测效果优于单纯ARIMA模型。结论 烟台市人群死亡率的波动对人口因素的影响较非人口因素更加敏感,模型的短期预测结果可对死亡率的变化趋势起到一定的指示作用。

死亡率变化同人口因素及非人口因素密切相关[1]。目前国内相关研究主要采用死亡率差别分解法[2]定量分析人口和非人口因素对死亡率变化的影响,但该法只能计算两大类因素对起始年和终末年死亡率差异的贡献和比例,无法表达其在死亡率变化过程中引起的死亡率波动。本文以烟台市人群月度死亡率作为子年度数据样本建立ARIMA-EGARCH组合时间序列模型,获取信息冲击不对称曲线,在死亡率差别分解定量分析的基础上,直观揭示人口及非人口因素给死亡率波动带来的非对称效应。

资料与方法

1.资料来源

2007-2009年常住人口数据和死亡数据来源于2009年烟台市死因回顾性调查[3],2010-2018年死亡数据来源于烟台市死因网络登记报告。人口数据来自烟台市公安局,标准人口采用中国2000年第5次人口普查数据。

2.方法

(1)总体死亡状况

分别计算2007-2018年粗死亡率、年龄标化死亡率和月度死亡率,月度死亡率由每月死亡数除以当年人口数求得;采用Joinpoint模型计算粗死亡率和标化死亡率的平均年度变化百分比(average annual percent change,AAPC)及其95%可信区间;采用直线回归评价月度死亡率的总体趋势。

(2)死亡率差别分解

对死亡率差别的影响因素进行定量分解,解释死亡率的上升或下降在多大比例上是由人口或非人口因素作用的。其中,人口因素主要是指人口年龄结构老龄化因素[4];非人口因素统称为非人口年龄结构因素,具体是指除人口因素外的所有影响死亡率变化的因素总和,主要包括社会经济因素、医疗卫生服务因素、环境因素和人群行为因素等[2]。计算公式为:

其中,Cu为终末年年龄组人口构成,C0为起始年年龄组人口构成,Ru为终末年年龄组死亡率,R0为起始年年龄组死亡率;由贡献值判断人口因素与非人口因素对死亡率的作用方向。

(3)时间序列分解

采用加法模型对月度死亡率进行分解,从中剔除季节变动项,形成季节调整月度死亡率用以满足后续建模分析和预测的需求。模型公式为:Yt=Tt+St+It。其中,Yt表示原始时间序列,Tt表示长期趋势项,St表示季节变动项,It表示随机干扰项。

(4)EGARCH(esponential generalized autoregressive conditional heteroskedasticity)建模流程

传统计量模型无法捕捉到死亡率的异常波动[5],而 GARCH模型在处理数据变异性方面具有独特优势,但其对模型参数的要求比较严格,且假定了方差具有对称性。能够反映非对称性的GARCH扩展模型有很多,其中EGARCH模型是研究杠杆效应的基准模型。与其他扩展模型相比,EGARCH模型稳定性最好[6],其主要优势在于方程系数不受任何限制,能同时表达死亡率的时变方差和非对称效应,因此本研究选择该模型进行分析和预测。具体建模流程如下:

①建立季节调整月度死亡率ARIMA模型[7];②建立不同条件分布假设下的低阶(滞后2阶以内)EGARCH模型,以最小AIC(Akaike’s information criterion)值为原则筛选模型,采用拟合优度检验判断EGARCH模型标准残差的实际条件分布与假设分布是否一致,假设分布依次为正态分布(normal distribution,norm)、偏正态分布(skew normal distribution,snorm)、标准学生t分布(student′st-distribution,std)、偏态t分布(skew student′st-distribution,sstd)、广义误差分布(generalized error distribution,ged)及带偏广义误差分布(skew generalized error distribution,sged);③采用指示偏误检验[8]判断模型捕捉死亡率波动的稳健性与正确性,包括偏误检验(sign bias test,SBT)、正偏误检验(positive size bias test,PSBT)、负偏误检验(negative size bias test,NSBT)和以上三者联合检验(joint test,JT);最终建立模型公式如下:

条件分布方程:εt=σtηt

条件方差方程:

(5)死亡率预测及效果评价

利用2007-2017年月度死亡率数据作为季节调整和建模样本,提取模型拟合值与真实值进行样本内拟合效果评价;做出2018年1-12月预测,并与真实值进行样本外预测效果评价;此外,对未进行季节调整的原始月度死亡率建立ARIMA模型,进行预测效果对比。预测效果评价采用均方根误差(root mean square error,RMSE),公式为:

(6)统计软件

应用Joinpoint Desktop Software(4.7.0.0版本)拟合Joinpoint模型;应用R语言(3.6.0版本)的decompose函数以及forecast包、rugarch包、fUnitRoots包和TSA包编程实现时间序列的分解及模型建立、检验和预测。

结 果

1.人口老龄化概况

根据区域人口老龄化程度和速度分类[10],2018年烟台市≥65岁人口构成(16.77%)大于14%且小于等于20%,与2007年相比年均变化百分比AAPC=4.88%(95%CI:3.74%~6.04%,P<0.05)大于4%,属于快速老龄社会型,即本地区人口进入老龄社会阶段,并且很快会进入下一个人口老龄化阶段。如图1。

图1 2007-2018年烟台市≥65岁人口构成变化趋势

2.总死亡水平变化趋势

2007-2018年烟台市人群粗死亡率总体呈明显的上升趋势(AAPC=2.15%,95%CI:1.56%~2.74%,P<0.05),而标化死亡率总体明显下降(AAPC=-4.95%,95%CI:-6.20%~3.69%,P<0.05),如图2。

图2 2007-2018年烟台市人群粗死亡率及年龄标化死亡率变化趋势

2007-2018年全市粗死亡率差别分解可得,人口因素导致死亡率上升362.40/10万,占人口和非人口因素共同作用的65.00%;非人口因素导致死亡率下降195.15/10万,占35.00%。

3.月度死亡率季节调整

2007-2017年烟台市原始月度死亡率分布具有明显的周期性规律;经季节调整后的月度死亡率周期波动幅度较原始序列明显缩小,随年度变化总体呈明显的上升趋势(F=150.30,P<0.05),如图3。

图3 2007-2017年烟台市人群季节调整月度死亡率变化及回归趋势

4.季节调整月度死亡率ARIMA模型建立

经季节调整月度死亡率的1阶差分平稳时间序列自相关函数(autocorrelation function,ACF)和偏自相关函数(partial autocorrelation function,PACF)图判断,如图4,依据AIC值最小原则进行筛选,选定乘积季节ARIMA(1,1,1)(1,1,0)12为最佳模型。

图4 季节调整死亡率1阶差分时间序列的ACF和PACF图

5.EGARCH模型建立

对不同条件分布假设下的模型进行对比,EGARCH(1,2)-norm和EGARCH(1,2)-snorm模型系数全部呈统计显著性(P<0.05),依据AIC值最小原则,选择EGARCH(1,2)-snorm模型,见表1。拟合优度检验显示,EGARCH(1,2)-snorm模型标准残差分布假设与真实分布相一致(χ2=61.94,P=0.10>0.05)。

指示偏误检验均不具有统计显著性(P>0.05),提示EGARCH(1,2)-snorm模型成功捕捉了死亡率波动的非对称杠杆效应(表2)。

最终选择snorm分布的EGARCH(1,2)模型,条件方差方程如下:

表1 不同分布假设下EGARCH模型系数估值及检验结果

*:表示p<0.05;括号内为最大似然结果估计的稳健标准误;“-”表示不存在。

表2 EGARCH(1,2)-snorm模型指示偏误检验结果

其中,杠杆效应系数γ1=0.54>0,提示外界信息冲击存在杠杆效应,正面信息比负面信息对波动产生更大影响;死亡率信息冲击曲线显示,x轴负轴表示负面信息,正轴表示正面信息,负轴和正轴的曲线走势不对称,死亡率在信息冲击小于0(负面信息)时,曲线下降平缓,受正面信息冲击时曲线上升陡峭。如图5。

图5 2007-2017年烟台市人群季节调整月度死亡率信息冲击曲线

6.模型预测及评价

RMSE值显示,ARIMA-EGARCH模型在整个样本期内RMSE值最小,预测精度最高;季节调整ARIMA模型样本内拟合效果不及未季节调整ARIMA模型,但样本外预测效果好于未季节调整ARIMA模型;未季节调整ARIMA模型样本外预测效果较样本内预测效果变差,见表3。

表3 三种模型对烟台市人群月度死亡率预测的RMSE评价

图6显示,利用ARIMA-EGARCH模型做出为期1年的短期预测值与2018年实际值相比,吻合程度较高,周期波动的变化趋势一致,月度死亡率预测值仍呈震荡上升趋势。

图6 烟台市人群月度死亡样本内拟合与样本外预测值与实际值对比

讨 论

2007-2018年烟台市人群年龄标化死亡率呈明显的下降趋势,且下降幅度远大于标化前粗死亡率的上升幅度,反映出年龄结构因素对死亡率的明显影响,死亡率差别分解显示人口老龄化极大程度掩盖了非年龄结构因素对人群健康水平起到的积极作用,最终导致了全市死亡率总体上升,这与上海市闵行区死亡率变化分析结果一致[11]。

在建立EGARCH模型时,由于目前对该类模型的定阶方法研究还不多,低阶模型已能满足大多数的应用[12],且拟合程度并不差于,甚至好于高阶模型[13]。因此考虑到模型构造的简洁性,并未尝试建立其他更高阶的EGARCH模型。死亡率的非对称杠杆效应是指死亡率受到外界正面信息的冲击与受到同等强度负面信息的冲击所产生的波动程度会表现出明显的不同,全市死亡率差别分解显示老龄化因素为促进死亡率上升的正面信息,非年龄结构因素为负面信息。结合杠杆效应系数γ值和信息冲击曲线可判断出,外界信息冲击产生的死亡率波动存在杠杆效应,全市老龄化因素产生的死亡率波动大于同等强度的非年龄结构因素。换言之,死亡率波动对人口老龄化因素更为敏感,意味着年龄结构上的小变动能转化为死亡率上的大波动,而同一时期内促进死亡率下降的非年龄结构因素无法抵消老龄化因素对全市死亡率上升的冲击,若仅通过改善非年龄结构因素来刺激全人群死亡率产生下降的波动将收效甚微。目前,积极推进养老保障体系建设,着力提升老年人群健康,最大程度减缓年龄结构性死亡的消极波动,是改善烟台市人口死亡率水平的首要路径。

ARIMA-EGARCH联合模型的预测效果优于单纯ARIMA模型,结合指示偏误的检验结果,反映出模型正确捕捉到了死亡率变化过程中的波动性。另外,虽然季节调整ARIMA模型在样本内拟合效果不及未季节调整ARIMA模型,但其样本外预测效果提升,同时未季节调整ARIMA模型样本外预测效果较样本内拟合效果变差,反映出季节因素可能会让预测模型误判其为不规则变动,从而降低模型的预测精度,体现出以月度死亡率为子年度数据,对其进行时间序列分解并进行相应季节调整的必要性[14]。

猜你喜欢

烟台市月度波动
《灌木丛篁图》
烟台市苹果种植存在的问题及建议
博物馆在公共文化教育中的探索——以烟台市博物馆为例
羊肉价回稳 后期不会大幅波动
微风里优美地波动
2019年国内外油价或将波动加剧
对烟台市旅游业发展的探析与思考
干湿法SO2排放波动对比及分析
月度聚焦
月度聚焦