APP下载

基于优势组合模型的“十三五”期间全国卫生总费用预测研究*

2021-05-08石福艳梁益嘉满晓玮秦骁强孔雨佳王素珍

中国卫生统计 2021年2期
关键词:总费用十三五卫生

苗 淦 石福艳 梁益嘉 满晓玮 秦骁强 孔雨佳△ 王素珍△

【提 要】 目的 通过对“十三五”期间我国卫生总费用趋势的描述和分析,探究预测分析的优势组合模型,并对2019-2020年卫生总费用的变化趋势进行预测,为卫生政策的调整提供科学的依据。方法 构建ARIMA模型、GM(1,1)模型、BP神经网络模型,比较拟合度并组成优势组合模型,对卫生总费用进行分析和预测。结果 GM(1,1)模型和ARIMA模型的组合模型拟合度最高,预测显示“十三五”期间我国卫生总费用逐年持续上升,预测2019-2020年我国卫生总费用为69259.02亿元、79285.36亿元。结论 “十三五”期间我国卫生总费用在国内生产总值的占比能够达到预期,通过深化医疗卫生改革,加大政府卫生投入,拓宽社会卫生筹资,使个人卫生支出和疾病负担继续下降。

卫生总费用是从全社会角度反映卫生资金的总体活动进程,分析评价卫生资金的筹集、分配和利用效果,由政府、社会和个人三部分卫生支出构成。卫生总费用标志一个国家整体对卫生领域的投入高低,是了解一个国家卫生状况的有效途径之一[1]。

《“健康中国”2020战略研究报告》指出,“十三五”期间,“健康中国”的建设非常重要,是达成“健康中国”的开局阶段。通过对卫生总费用运用科学合理的方法进行预测分析,可以为卫生部门提供数据支持,对“十三五”时期卫生经济健康增长具有重要意义,对“健康中国”2020战略目标的顺利实现也具有积极意义。

目前关于卫生总费用预测的文章基本采用单预测模型,构建的模型虽具有不错的拟合度,但单预测模型各有其局限性。本文将最常用的三种预测模型:ARIMA模型、BP神经网络和GM(1,1)模型的预测效果进行比较,并构成优势组合模型对全国卫生总费用进行更为精准的预测。

资料与方法

1.研究数据

本研究的数据来自《中国统计年鉴》和《中国卫生总费用研究报告》。

2.分析方法

采用1978-2009年32年的卫生总费用数据作为训练集构建时间序列,构建ARIMA预测模型、BP神经网络、GM(1,1)模型以及相应的组合模型。选取2010-2018年9年卫生总费用作为验证集进行模型检验,选择平均绝对误差(mean absolute deviation,MAE)作为模型评价指标[2],对预测结果进行验证与评价。采用SPSS 23和R 3.6.1软件进行统计分析。

(1)ARIMA模型

ARIMA模型是一种线性序列,根据变量本身的变化规律,不考虑以经济理论为依据的解释变量的作用,是一种简单但预测精准度较高的时序短期预测方法,但必须要求数据是稳定的,且只能捕捉线性关系[3-4]。

ARIMA建模的步骤包括:序列平稳化处理、白噪声检验、模型定阶、拟合分析等。通过单位根检验(ADF test)评价模型的平稳性,Box检验模型分析白噪声序列,同时参考赤池信息量准则(Akaike information criterion,AIC)与贝叶斯信息准则(Bayesian information criterion,BIC)进行模型的筛选[3]。

运用R语言中的“auto.arima”包进行模型参数的确定,最后确认AIC与BIC均最小的ARIMA模型为ARIMA(1,2,0)。此时,AIC=319.47,BIC=422.27。使用ADF检验,ADF=-3.14,P<0.01,说明该时间序列为平稳序列;同时,Box检验中,P>0.05,证明该序列为白噪声序列,建模成功。

(2)GM(1,1)模型

GM(1,1)模型由单一变量的一阶微分方程构成,简单实用、易于操作,是应用最为广泛的灰色模型,但对历史数据依赖度过高,主观性较强,中长期预测误差较大[5]。由于我国卫生总费用呈明显的递增趋势,且训练集时间跨度太大,导致模型系数偏高、误差较大,所以选择1979-2009年全国卫生总费用进行年增长率模型构建,间接预测卫生总费用。

GM(1,1)建模过程步骤包括[6-7]:

(1)

其中,α、u分别为灰度系数、灰度作用量,是可以使用最小二乘法确定的待定系数。同时可以得时间响应函数:

(2)

如果模型有较好的拟合精度,则可以用来进行预测,否则就需要进行剩余矫正。进行GM(1,1)预测模型精度检验的方法主要包括绝对相对误差(absolute relative error,ARE)、平均绝对误差、平均绝对百分误差(mean absolute percentage error,MAPE)以及后验误差检验法(posterior difference test,C value)[8]等。

利用R软件通过1979-2009年我国卫生总费用的年增长率构架预测模型,获得预测数据数列,对预测结果进行精度检验,最大值为8.96%,最小值为0.78%,MAE=4.46%,介于精度检验等级一级(MAE≤1%)和二级之间(MAE≤5%),说明GM(1,1)模型拟合度较好,可用于预测分析[9]。

(3)BP神经网络

BP神经网络是目前最常用的神经网络模型,按照误差逆向传播算法训练,主要采用梯度搜索,通过调整权重使总误差最小[10]。由于它主要解决复杂非线性函数的全局极值以及对训练样本要求很高,因此很容易得不到最优结果,造成误差。

BP神经网络的步骤为:首先,给予一个输入样本,计算隐含层各神经元的输入输出;其次,利用网络期望输出和实际输出,计算误差函数对输出层各神经元的偏导数δo(k);再次,利用隐含层到输出层的连接权值、输出层的δo(k)和隐含层的输出计算误差函数对隐含层各神经元的偏导数δh(k);然后,利用输出层各神经元的δo(k)和隐含层各神经元的输出来修正连接权值Who(k);最后,计算全局误差,判断网络误差是否满足要求,当误差达到预设精度或学习次数大于设定的最大次数,结束算法,否则选取下一个学习样本及对应的期望输出,进入下一轮学习[11]。

选取1978-2018年我国的卫生总费用中前32年作为训练样本,后9年作为检验样本。借助SPSS软件构建三层网络。设置各学习参数(最大训练步数为1000,训练的精度为0.05,学习速率为500),多次训练和检验后得到网络结构,经过多次迭代,可以发现预测值与样本值非常吻合,检验样本的MAE=11.74%,符合预测精度的要求(长期预测相对误差在30~40%)[7]。因此,可认为该预测模型的拟合效果较好。

结 果

1.我国1978-2018年期间卫生总费用的构成变化

1978-2018年我国卫生总费用从110.21亿元增加到57998.3亿元,增长约526倍,同期的GDP增长约250倍。卫生总费用的增加速度远超GDP的增加速度,卫生总费用于GDP的占比也从3%增加到6.3%。41年间,政府卫生支出增长462倍,社会卫生支出增长477倍,个人现金卫生支出增长740倍。结合图1来看,个人现金卫生支出于2001年占比达到59.97%,之后逐年下降,2018年占比28.7%。

图1 1978-2018年我国卫生总费用的构成比

政府近年来为降低居民医疗压力做出了很多调整,总体趋势为社会卫生支出逐步上升为三者之首;政府卫生支出占比高速增长后平稳,成为卫生总费用的第二支柱;个人现金卫生支出占比逐年下降为末位,且在“十三五”期间有望继续下降。

2.单预测模型的比较

运用2010-2018年这9年的全国卫生总费用进行模型检验,比较三种模型的预测值和绝对误差。由表1得,ARIMA模型的误差最大值为15.76%,最小值为2.16%,MAE=7.37%;GM(1,1)模型的误差最大值为8.96%,最小值为0.78%,MAE=4.46%;BP神经网络的误差最大值为16.45%,最小值为9.05%,MAE=11.74%。由此可得GM(1,1)模型的拟合度最好,ARIMA模型次之。

表1 ARIMA模型、GM(1,1)模型和BP神经网络模型的预测结果比较

3.组合模型的建立

鉴于前面描述的,无论是GM(1,1)、ARIMA还是BP都有其局限性,为了得到更优的预测结果,采用组合模型的方法构建预测函数。组合预测模型的思想最早在1969年由Bates等提出,将单项预测模型进行有效组合可以显著地提高预测效果[12]。本文将优势模型的GM(1,1)与ARIMA进行组合,来获得更加精确的预测结果。

目前的组合预测模型在时间序列为:y1=w1yt1+w2y2,其中yt为组合模型预测值,yt1和yt2分别为ARIMA模型和GM(1,1)模型的预测值,w1和w2分别为ARIMA模型和GM(1,1)模型所占的权重[13]。

E=∑[w1(et1-et2)+et2]2

(3)

当E最小时的w1和w2为最优权重[10]。计算求得GM(1,1)模型最优权重为0.81,ARIMA模型最优权重为0.19。

对GM(1,1)模型和组合模型进行比较,GM(1,1)模型的误差最大值为8.96%,最小值为0.78%,MAE=4.46%。组合模型误差最大值为7.32%,最小值为0.12%,MAE=3.3%。ARIMA模型和GM(1,1)模型的组合模型比单个的GM(1,1)模型精准度更高,拟合度更好,所以本研究将以采用ARIMA模型和GM(1,1)模型的组合模型进行预测。

表2 GM(1,1)模型和组合模型的预测结果比较

4.优势模型预测结果

运用组合模型对“十三五”期间2019-2020年的卫生总费用进行预测,得出我国卫生总费用为69259.02亿元和79285.36亿元。由图2模型预测值与实际数值比较可见组合模型精确度较好。

图2 组合模型样本值与预测值的比较

讨 论

1.预测模型的合理选择

在进行卫生总费用的时间序列预测时,可进行多种模型的检验以及组合模型的探究,进一步精准预测结果和减少预测误差[14]。本研究选取ARIMA模型、GM(1,1)模型和BP神经网络中具有良好拟合度的两种模型进行组合,形成优势组合模型,进一步减小预测误差,来获得更为精确的预测数据。

2.政府卫生支出占比增加,个人现金卫生支出占比有望继续下降

根据已有的数据分析,个人现金卫生支出占比逐年下降,政府卫生支出占比上升后趋于稳定,符合《“健康中国2030”规划纲要》提出的健全政府健康领域相关投入机制,科学合理地调整政府卫生支出[13]。

在卫生总费用不断增长的情况下,需继续优化布局,调整卫生支出的结构,加强监管增长速度,通过增加政府卫生支出,拓宽社会卫生支出,增加筹资来源,降低居民的就医负担。

3.“十三五”期间卫生总费用占比将达到预期目标,但需进行积极调控避免过度增长

根据优势模型的预测结果可以看出,“十三五”结束时,卫生总费用占GDP的比重将继续增长,能够完成《“健康中国”2020战略研究报告》的预期目标。由于目前医疗服务水平的提高以及老龄化等复杂原因,卫生总费用的快速增长是必然的结果,合理可控的卫生费用增长和科学的构成才能促进卫生事业的健康发展[15]。

“十三五”期间,还需不断深化卫生改革,控制卫生总费用的合理增长,与GDP增长水平相协调;完善卫生医疗体系和分级诊疗制度,避免资源浪费;进行科学宣教,使国民意识向预防为主转变,实现真正的“健康中国”;对医药检查等项目进行监管,避免“以药养医”等不良情况的发生,达到卫生费用的合理增长等。

猜你喜欢

总费用十三五卫生
“健康中国2030”背景下京、津、沪、渝四直辖市卫生总费用的比较研究
卫生与健康
卫生歌
办好卫生 让人民满意
21世纪我国卫生总费用占GDP比例首次低于4%