基于ARIMA模型的上海市人均期望寿命预测分析
2021-04-02赵妍
摘 要:期望寿命是评价人口健康和福祉的综合指标,研究期望寿命的变化,对人口政策的实施和调整具有重大意义。选用上海市1978—2018年人均期望寿命数据为研究对象,利用自回归综合移动平均数ARIMA时间序列模型对上海市人均期望寿命进行短期预测。结果表明,未来几年上海市人均期望寿命将呈现缓慢上升的趋势。在2019—2023年,上海市人均期望寿命将分别达到83.890岁、84.150岁、84.410岁、84.670岁和84.931岁。
关键词:期望寿命;ARIMA模型;上海市
中图分类号:C924.2 文献标志码:A 文章编号:1673-291X(2021)34-0064-03
引言
人均预期寿命是衡量一个国家或地区经济社会发展和医疗卫生服务水平的综合指数。它不仅代表了一个地区在一定时期内的人群健康水平、衡量该地区的卫生状况,也综合反映了该地区的社会经济发展水平。上海市作为我国优质医疗资源分布多、医疗技术能力与质量水平双提升的大都市之一,其人均期望寿命更是位居全国榜首,也处于世界前列地位。2018年,上海市户籍人口平均期望寿命83.63岁,领先于同期全国水平(77岁)。上海市是我国户籍人口老龄化最严峻的地区,人口老龄化不但会引起消费结构的变化,而且在一定程度上也抑制了经济的增长。因此,对上海市人均期望寿命的未来走势进行预测,不仅可以为上海市制定社会发展规划及决策提供重要参考,也为做好上海市老龄社会的人口健康、疾病防控、老年服务需求等工作提供理论参考依据,提高应对人口老龄化的效率。
陈国伟等探讨了自回归综合移动平均数(ARIMA)模型预测厦门市居民人均期望寿命的可行性,结果表明,ARIMA模型可用于对厦门市居民期望寿命的短期预测[1]。翁浩等通过分析贵州省2012年死因监测数据,发现心脑血管疾病、慢性疾病会造成期望寿命的严重损失,而很少涉及期望寿命的预测分析[2]。时间序列数据是指由不同时点上的观测值按照其先后顺序组合而成的一系列数据,其分析依赖于数据间的相互关系[3]。朱奕奕等验证了ARIMA模型是应用日臻成熟的时间序列分析方法,它无须事先了解资料的典型特征,只需预设一个可能适用的模型,再不断调整参数获取最优模型,在疾病发病或死亡的预测中应用广泛,很少应用于对期望寿命的趋势预测[4]。本文根据上海市1978—2018年人均期望寿命数据建立ARIMA模型,对其期望寿命进行研究预测,了解上海市人均期望寿命的变化情况,为上海市制定社会发展规划及决策提供重要参考。
一、研究方法
(一)ARIMA模型简介
自回归综合移动平均(ARIMA)模型是由博克思和詹金斯于1976年共同提出的一种非平稳时间序列预测方法,因此又称之为Box-Jenkins模型,它适用于短期预测且精度较高。不平稳的时间序列经过平稳化后建立的模型称为ARIMA(p,d,q)模型,其本质上是差分运算与ARMA模型的结合。其中,自回归模型用AR表示,移动平均模型用MA表示,I代表结合两种方法。对于模型中的参数,p是自回归阶,d是差分阶,q是移动平均阶。
(二)ARIMA模型建立步骤
1.数据平稳性检验(确定差分阶d值)。时间序列数据必须是平稳的数据,这是建立ARIMA模型的前提条件。因此建模之前,首先应该对数据进行平稳性检验。ADF检验验证时间序列是否平稳,其原假设为序列不平稳。其标准有两点:第一,一般p值小于0.1或0.05为标准,说明0.1或0.05水平下拒绝原假设,即序列平稳;第二,若序列不平稳,可进行一阶或二阶差分后,再进行ADF检验,直至序列平稳。
2.确定模型的阶数(确定自回归阶p和移动平均阶q)。ARIMA模型的定阶即确定p、q的过程,主要依赖于自相关图(ACF)和偏自相关图(PACF)的特点。定阶原则有以下三点:第一,若PACF在p阶处截尾(某一滞后阶数后PACF为0),并且ACF拖尾,则ARIMA模型可简化为AR(p);第二,若ACF在q阶处截尾(某一滯后阶数后ACF为0),并且PACF拖尾,则ARIMA模型可简化为MA(q);第三,若ACF和PACF都显著拖尾,可选择ACF中最显著的阶数作为q值,选择PACF中最显著的阶数作为p值。
3.建立ARIMA模型。ARIMA模型的构建应符合模型参数、Q统计量和信息准则三项标准:第一,ARIMA模型要求模型残差为白噪声,即残差不存在自相关性,可通过Q统计量检验进行白噪声检验(原假设:残差是白噪声);第二,Q6用于检验残差前6阶自相关系数是否满足白噪声,通常其对应p值大于0.1则说明满足白噪声检验(反之则说明不是白噪声);第三,信息准则AIC和BIC值用于多次分析模型对比,此两值越低越好。本文利用SPSS.23遍历出各种可能的模型组合进行模型构建,并且结合AIC最小这一规则,最终得到最佳模型。
4.模型的检验和预测。本研究利用上海市1978—2017年上海市人均期望寿命确定最优模型,用2018年的期望寿命进行组外回代以进行检验,计算预测误差并判断预测精度。最后,利用1978—2018年的数据对模型进行修正,预测未来5年上海市居民的人均期望寿命。
二、上海市人均期望寿命预测
上海市是中国的魅力之都。自1978年进入改革开放时代,上海走上快速发展的轨道,欣欣向荣,新世纪一座新兴的全球化都市应运而生,其常住人口规模在2018年末已达2 423.78万。研究预测上海市人口的期望寿命,对上海市人口结构和经济发展具有重要的意义。本文以1978—2017年上海市期望寿命数据建模,2018年数据作为检验使用,本文数据来源于《上海统计年鉴(2019)》。
时间序列数据必须是平稳的数据,这是建立ARIMA模型的前提条件,因此在建立模型之前,需要对数据进行平稳性检验和微分处理。从表1可知,针对人口期望寿命,该时间序列数据ADF检验的t统计量为0.303,p值为0.977,1%、5%、10%临界值分别为-3.616、-2.941、-2.609,p=0.977>0.1,不能拒绝原假设,时间序列数据不平稳。因此,需对该时间序列数据进行一阶差分后再进行ADF检验。一阶差分后数据ADF检验结果显示p=0.000<0.01,有高于99%的把握拒絕原假设,此时时间序列数据平稳。即模型中的差分阶d值为1。图1正好验证了这一点,上海市人均期望寿命经一阶差分后的变化趋势趋于稳定,此时满足ARIMA模型建立的前提条件。
根据一阶差分后该时间序列数据的自相关函数和偏自相关函数的拖尾及截尾性质,对模型进行初步定阶,得出自回归阶p值为0、移动平均阶q值为1。
针对人口期望寿命,结合AIC信息准则(该值越低越好),对于存在的潜在备选模型,通过SPSS.23软件进行建模和对比分析,最终找出最优模型为:ARIMA(1,1,0)。根据表2,从Q统计量结果来看,Q6的p值大于0.1,在0.1的显著性水平下不能拒绝原假设,模型的残差是白噪声,说明ARIMA(1,1,0)模型满足要求。
为了检验ARIMA(1,1,0)模型的预测效果,利用建立的模型对上海市2018年人口期望寿命进行动态预测,并与实际值进行比较。2018年上海市人均期望寿命的真实值为83.63岁,预测值为83.656岁,绝对误差为0.026岁,相对误差为0.03%。检验结果显示绝对误差和相对误差均非常小,说明ARIMA模型的预测效果良好,可用于对上海市人均期望寿命进行短期预测。
加入2018年期望寿命值重新拟合模型,模型可表示为:Yt=0.260-0.358*Yt-1。其中,Y表示人均期望寿命,t表示年份。根据该模型,预测2019—2023年上海市人均期望寿命分别为83.890岁、84.150岁、84.410岁、84.670岁和84.931岁。
三、结论与建议
本文利用ARIMA模型对上海市人均期望寿命进行短期预测,结果表明,未来几年上海市人均期望寿命将呈现缓慢上升的趋势。在2019—2023年,上海市人均期望寿命将分别达到83.890岁、84.150岁、84.410岁、84.670岁和84.931岁,这与人口老龄化与医疗服务水平逐步提高的现实情况相符。
通过上述分析得知,上海市人均期望寿命呈现缓慢增长的变化趋势。因此,为促进上海市人口结构向合理方向发展,提出以下政策建议。一是教育能够提高国民总体素质,加强人们的健康意识,从而有效防止疾病。因此,合理配置教育资源,促进健康生活方式的养成有利于人均期望寿命的提高。二是医疗卫生服务水平和医疗资源利用率直接影响人们的身体健康,健全和普及医疗保障体系、减轻人们的医疗经济负担是增加人均期望寿命的有效途径。三是人均期望寿命的延长依赖于人们生活习惯、饮食习惯的改善。因而,大力发展经济水平、提高人民收入至关重要。四是延长退休年龄或为老龄人口创建再就业岗位,以缓解养老金的压力,改善老年人的生活品质。
参考文献:
[1] 陈国伟,伍啸青,林艺兰.ARIMA模型在厦门市居民人均期望寿命预测中的应用[J].中国卫生统计,2015,(12).
[2] 翁浩,张益霞,潘昀熙,谢兴忠.2012年贵州省死因监测点居民主要 死因对期望寿命的影响[J].现在预防医学,2014,(7).
[3] 王成璋,等.时间序列分析预测与控制[M].北京:机械工业出版社,2011.
[4] 朱奕奕,冯玮,赵琦,徐飚.ARIMA乘积季节模型在上海市甲肝发病预测中的应用[J].复旦学报:医学版,2012,(5):460-464.
[责任编辑 辰 敏]
收稿日期:2021-01-06
作者简介:赵妍(1997-),女,陕西渭南人,硕士研究生,从事应用经济学研究。