R语言时间序列和自回归积分滑动平均模型预测麻醉耗材领用的研究
2021-10-11杨旅军
徐 雯, 方 铮, 杨旅军
(复旦大学附属华东医院 麻醉科, 上海, 200040)
本院外科手术患者以老年人居多,麻醉科为应对老年手术患者麻醉的特色需求,相应的医用耗材用量更多[1-2]。合理地领用耗材可以在保证使用、提高工作效率的同时减轻库存压力、减少浪费[3]。自回归积分滑动平均模型(ARIMA)是时间序列预测中常用的模型,在医学领域中得到了很好的应用[4]。该模型的原理是滤除数据中的高频噪声,基于线性相关检测局部趋势,预测发展趋势[5]。与经典的最小二乘回归一样,自变量和因变量之间的关系很容易通过模型的假设来理解。该模型可以在一个时间序列中以自动化的方式进行模型选择,从而最大限度地提高预测精度[6]。本研究根据复旦大学附属华东医院麻醉科每月领用耗材支出历史数据建立ARIMA模型,预测当前的发展趋势,以判断过去的耗材领用方式是否合理,预测未来需求的发展趋势,为今后科室医用耗材的领用支出提供理论依据。
1 材料与方法
1.1 一般资料
收集2013年1月—2019年12月复旦大学附属华东医院麻醉科统计数据库中每月耗材支出数据用于构建ARIMA模型,利用2020年1—12月的数据对模型的预测性能进行评价。
1.2 ARIMA模型
ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括自回归过程(AR)、移动平均过程(MA)、自回归移动平均过程(ARMA)以及ARIMA过程。该模型表示为ARIMA(p,d,q)(P,D,Q)[S],p指自回归的顺序,d指趋势程度的差异,q指移动平均数的顺序,P指周期性自回归滞后,D指周期性差异的程度,Q指周期性移动平均数,S指周期模式的长度[7], 包括时间序列平稳性分析、参数估计、模型检验和模型的预测[8-9]。
1.2.1 时间序列平稳性分析: 当拿到一组时间序列,需要对其进行平稳性检验,观测不同时期序列各项的相关关系。对数变换和差分是稳定时间序列的首选方法[10], 根据观测序列的自相关图和偏自相关图判断序列平稳性。另外,可根据增广迪基-福勒检验(ADF)估计时间序列是否平稳[11]。
1.2.2 参数估计: 采用自相关函数(ACF)和偏自相关(PACF)图表估计ARIMA模型的参数。本研究采用自动识别和人工估计相结合的方法。首先采用R软件中的“auto. arima()”命令自动识别模型参数,然后用ACF和PACF来确认p、q和P、Q。
1.2.3 模型评估: 采用Box-JenkibsQ检验对p、q及P、Q变阶模型进行检验[12]。所有的模型行残差检验(显示为白噪声序列),使用Akaike信息标准(AIC)比较,以找到最好的模型。本研究评价了ARIMA模型的拟合能力和预测能力。
1.3 数据处理与分析
使用Excel 2016构建麻醉科耗材领用支出数据库,使用R3.5.1软件开发ARIMA模型,显著性水平为0.05。
2 结 果
2.1 麻醉科耗材领用支出的趋势
根据观测的时序序列图显示, 2013—2014年支出呈下降趋势,此后呈逐年上升趋势; 在每年2月呈现最低的支出,随后迅速上升,说明该序列不平稳(图1A)。本研究通过1次Log平滑和1次差分使序列图比较平稳(图1B)。
A: 支出序列不平稳; B: Log平滑和差分处理后序列平稳。
2.2 平稳性检测
经过趋势差分(d=1)和周期性差分(D=1)消除数值不稳定性。根据自相关图和偏相关图可以直观地感受自相关系数始终在0周围波动,应判定该序列为平稳时间序列(图2)。采用ADF检验对差分后的序列进行平稳性检验,结果显示P=0.02, 说明序列为平稳序列。
左: 自相关图; 右: 偏相关图。
在1个周期内, lag1后ACF下降到0, 偏自相关函数(PACF)则在lag0降到0, 因此p=0,q=1。在4个周期中, ACF在第1个周期结束时下降(lag12), 但接近于0, 因此Q=1或2。lag12时PACF为0, 故P=0。为了使结果更加可靠,对P=1进行了检验。D=1,d=0。此外,利用R3.5.1软件中的“auto. arima()”自动识别参数,残差检验结果和赤池信息量准则(AIC)值见表1。这些模型均满足残差时间序列的白噪声要求,故对AIC值进行比较。自动识别的模型ARIMA(0, 1, 1)(0, 0, 1)[12]的AIC最低,被选为本研究的最佳ARIMA模型。
表1 ARIMA模型极大似然方法检验和AIC
2.3 预测效果
模型建立后,以2020年1—12月本院麻醉科耗材领用实际支出数据作为验证集,将预测值与实际值进行比较分析, ARIMA模型较好地拟合和预测了周期性波动,见图3、4。ARIMA(0, 1, 1)(0, 0, 1)[12]模型预测的耗材支出在2020年1—12月会有小幅波动。
蓝色曲线: 2018年7月—2019年7月麻醉科耗材领用支出; 阴影部分: 95%可信区间。图3 ARIMA(0, 1, 1)(0, 0, 1)[12]模型预测价值
图4 观测序列的预测值(蓝色)与实际值(红色)对比图
3 讨 论
本院2018—2020年外科手术患者中,年龄≥65岁者约占50%, 择期手术多为恶性肿瘤等较大创伤手术,老年患者常伴有复杂的合并症,为了确保开展高风险手术的安全性,作者发现单价较高的麻醉耗材消耗较大。虽然昂贵的耗材、进阶的技术和监护增加了麻醉的费用,但可以减少围术期严重并发症的发生,进而降低了最终整体的医疗消耗,使老年择期手术患者获得更好的预后。研究[13]表明,老年髋部骨折患者早期实施髂筋膜间隙阻滞可减少阿片类药物的使用,减轻疼痛和缩短住院时间。
结构化建模基础和可接受的预测性能使得ARIMA模型在时间序列预测中得到了广泛的应用[14]。从2013—2019年数据来看,本院麻醉科耗材领用支出逐年上升,这一方面源于手术麻醉数量的增多,另一方面源于以老年患者为主的麻醉对质控安全及新技术的需求增强。目前,在预测中常见的应用有线性回归、人工神经网络和灰色模型等多种数学方法[15]。线性回归采用了最小二乘法计算,结果易于理解,计算不复杂,但是对非线性数据拟合不好[16]。神经网络通常需要更多的数据,至少需要数千数百万个标记样本,相比传统算法的计算代价更高[17]。灰色模型在数据少时也能大致预测出结果,但不适用于数据之间波动性和随机性较大的预测,不能满足一个简单的函数关系[18]。本研究运用R语言时间序列和ARIMA预测模型,验证ARIMA(0, 1, 1)(0, 0, 1)[12]模型对本院麻醉科耗材领用支出的预测性能最佳。这个模型一旦被识别后,就可以从时间序列的过去值及现在值来预测未来值[19]。本院麻醉科耗材领用支出数据显示, 2018年7月—2018年10月复旦大学附属华东医院麻醉科耗材领用支出将略有下降,随后将大幅上升,这与通常情况类似。2018年11月(cost=1 140 446.00)的耗材领用支出低于2017年11月(cost=1 711 022.10), 但高于2016年11月(cost=665 145.38)和2015年11月(cost=280 804.6)。这一结果表明,在2018年11月之前应增加耗材领用储备,防止缺货而影响麻醉工作开展。事实上,在2019年2月的耗材领用过多,造成成本核算收支不平衡,而2019年11月因耗材不足而临时加领了数次耗材。值得注意的是, 2020年的实际耗材领用支出与预测值出现了较大的偏差,这可能是突发事件新型冠状病毒肺炎疫情对预测模型的扰动,随着疫情的控制,预测能力逐渐恢复。
通过验证表明, ARIMA模型在本院麻醉科耗材领用支出方面取得了较好的预测效果。医院根据预测值合理制订采购计划,有效调控耗材的储备与采购计划。经过一段时间的试用,本院将逐步推广该模型至其他科室甚至其他医院。该模型的应用对于医院管理者而言,可以根据预测值进行耗材成本核算,为科室预算审批提供可靠依据[20]; 对于生产商和供应商而言,可以根据预测值制订更加合理的生产和备货计划,不仅可以降低库存积压成本,还可以减少紧急备货造成的额外生产成本,从而有效提高医用耗材供应链的管理水平[21]。