APP下载

自回归移动平均模型在南宁市输血依赖性地中海贫血患者用血需求预测中的应用

2022-10-14闫锡鹏黄林宾何保仁梁义安

中国医药科学 2022年18期
关键词:差分月度供血

闫锡鹏 李 贤 黄林宾 何保仁 梁义安 李 彬

南宁中心血站,广西南宁 530007

输血依赖性地中海贫血(transfusiondependent thalassemia,TDT)是重型β地中海贫血(thalassemia major,TM)的一种[1]。定期输注红细胞制剂是TDT患者维持血红蛋白水平和抑制无效红细胞生成最经济有效的方法。广西是地中海贫血高发区,而南宁市集中全区优质的医疗资源,对于输血依赖性地中海贫血患者的“虹吸效应”导致地中海贫血单病种用血量的急剧增长。为了给TDT患者提供更合理的供血服务,本研究回顾性统计南宁地区2016年1月至2021年6月(每月)TDT患者单病种供血量,建立了基于自回归移动平均模型(autoregressive integrated moving average,ARIMA)的地中海贫血患者供血预测最优模型,并以此模型预测2021年7—12月的地中海贫血供血量,得到的预测值与实际值相对误差在10%以内,证实了基于ARIMA模型的时间序列分析方法可用于南宁市(区)月度地中海贫血供血量的短期预测,为更好地开展“以供(血)定采(血)”的策略提供科学参考依据,现报道如下。

1 资料与方法

1.1 数据来源

从南宁中心血站血液信息管理系统(SHINOW 9.0唐山启奥科技有限公司)收集南宁市区医疗机构地中海贫血用血数据,按月度统计2016年1月至2021年6月的地中海贫血单病种月度用血量数据(包括洗涤红细胞、去白细胞悬浮红细胞,200 ml为1个血量单位U)。

1.2 ARIMA模型建模步骤[2]

①依据数据的时序图、自相关函数(ACF)图和偏自相关函数(PACF)图判断序列的平稳性,若为不平稳序列,则对其进行差分(通常只进行一阶差分),有明显季节性或周期性数据需要进行季节性差分,实现序列平稳。②选取合适模型,确定ARIMA模型的自回归阶数p与移动平均项数q。平稳处理后,若差分后的平稳序列ACF是拖尾、PACF是截尾的,建立AR模型;若ACF是截尾而PACF是拖尾的,建立MA模型;若ACF与PACF均是拖尾的,建立ARIMA模型。③根据残差ACF图与PACF图判断残差序列是否为白噪声序列,若是则用所得模型进行预测。若不是则需重新选取参数,训练模型。④选取最优ARIMA模型来进行预测,计算95%CI以及相对误差,并同实际值进行比较,验证模型的预测效果。

1.3 统计学分析

用Excel软件按月统计2016年1月至2021年6月南宁市区医院TDT用血总量数据库,用于模型建立。统计2021年7—12月用血量用于预测模型的验证;采用SPSS 26.0统计学软件进行数据分析及模型建立,采用白噪声检验,P< 0.05为差异有统计学意义。

2 结果

2.1 绘制地中海贫血月度用血量时序图

南宁市区医院地中海贫血用血量自2016年1月以来总体呈上升趋势,见图1。绘制地中海贫血月度用血量时序的ACF和PACF图,ACF图显示自相关系数长期大于0,PACF图显示1阶截尾。

图1 南宁市区医院月度地中海贫血用血量时间序列

2.2 数据的平稳化

由于此时间序列不平稳,且为单调趋势。对时序做一阶差分见图2,处理后序列在0上下波动;一阶差分后进行ADF检验。显示P< 0.01,此时序列平稳。

图2 月度地中海贫血用血量一阶差分后的时间序列

2.3 模型识别[2-4]

对平稳序列分别绘制一阶差分ACF、PACF图(图3~4)和一阶季节性差分ACF、PACF图(图5~6)。显示ACF与PACF均为拖尾,且结合南宁市区医院地中海贫血用血量受季节性采血量波动影响的实际情况,适合建立ARIMA(p,d,q)(P,D,Q)S模型对南宁市区医院地中海贫血用血月度数据进行拟合。通过观察序列及实际情况,地中海贫血用血数据显示年度周期性,确定季节性周期s为12;对原始序列进行了一阶差分,故取d=1;一阶差分ACF图显示一阶截尾或拖尾,自回归阶数p=1或0;1阶差分PACF图显示拖尾,取q=1;一阶季节性差分ACF图显示拖尾且有单调趋势,故P=0,D=0或1;一阶季节性差分PACF图显示一阶截尾,季节性移动平均阶数Q=1。模型参数的取值从低阶到高阶不断尝试,通过比较各个模型的标准化BIC值,选取备选模型。以此识别的两个备选模型为模型1:ARIMA(0,1,1)(0,0,1)12、模型2:ARIMA(1,1,1)(0,0,1)12。比较两个备选模型的正态化BIC值:模型1的BIC值为10.038,模型2的BIC值为11.009。根据贝叶斯最小信息准则,BIC值越小拟合效果越好。确定南宁市区医院地中海贫血月度用血量的预测模型为模型1:ARIMA(0,1,1)(0,0,1)12。

图3 月度地中海贫血用血量一阶差分后的ACF图

图5 月度地中海贫血用血量一阶季节性差分ACF图

图4 月度地中海贫血用血量一阶差分后的PACF图

图6 月度地中海贫血用血量一阶季节性差分PACF图

2.4 模型检验

对确定的最优模型的残差序列做自相关函数ACF和偏自相关函数PACF图(图7),残差序列 的ACF和PACF值 均 在95%CI内,杨-博 克斯(Ljung-Box test)Q统计量为22.8,差异无统计学意义(P> 0.05),即残差序列无自相关性。判定ARIMA(0,1,1)(0,0,1)12适用于南宁市区医院地中海贫血月度用血量的预测。

图7 模型1残差序列的ACF、PACF图

2.5 最优模型的运用及预测[4-5]

绘制最优模型ARIMA(0,1,1)(0,0,1)12包含实测值、拟合值和预测值的模型拟合图(图8)。由图可见地中海贫血月度用血量拟合值和实测值的曲线趋势变化基本一致。除2020年1月地中海贫血月度用血量的预测值外,其他实测值均在95%CI内,拟合效果较好。利用最优模型对2021年7—12月的地中海贫血月度用血量进行预测并与实际用血量比较,预测平均误差为8.42%,见表1。

表1 模型1对2021年7—12月预测及误差情况

图8 模型1预测效果图

3 讨论

TDT是两广地区高发的单基因遗传性贫血病[6],由于供体的稀缺性、移植相关风险以及患者家庭经济条件等因素限制,异基因造血干细胞移植在TDT患者的治疗中并未得到广泛应用。定期定量输血虽然不可避免地承担包括输血传播疾病、输血不良反应及铁过载引起的多器官功能损伤等风险[7-11],但仍是目前最常用的方法。为了保障TDT患者供血充足,南宁市从2013年起就做了大量工作[12-14],建立了TDT患者“定点供血-定期输血”的模式。南宁TDT患者仍然迫切需要加强规范输血和祛铁治疗[15]。

血站作为公益性事业单位,保障临床用血的安全、充足和有效是必须承担的社会责任,自2016年南宁市在全国率先全面取消互助献血[16]以来,满足TDT患者科学合理用血需求一直是血站重点工作之一。根据最新统计,2021年地中海贫血患者专项供血(仅以红细胞计算,下同)总量为23 159.5 U,占2021年全部供血总量的10.42%,是2016年地中海贫血患者专项供血总量(5485.5 U)的4.2倍。TDT患者实际用血量主要受以下因素影响:①无偿献血采集量(全血)。无偿献血易受天气季节、国家政策、突发事件、疫情、人群舆情等各类不确定因素的影响,临床供血紧张时,TDT患者供血将会受到限制;②TDT患者年龄及输血频率。定期、足量的规范输血治疗常能使TDT患者良好生存至40岁以上,但是实际用血量还会受到医疗条件和患者经济条件的影响。

2016—2021年,南宁市区地中海贫血用血占总红细胞供血量的比例从3%升至10.42%。同时由于受血液采集量季节性的影响,地中海贫血供血量也呈现一定的季节性周期变化,一般每年二三月份和七八月份献血淡季(寒暑假),地中海贫血用血量也相应缩减,而年末则表现出地中海贫血供血量增高的趋势。南宁市区的献血人群主要是本地区常住人口和驻邕各大高校以及机关企事业单位的人群,而用血人群则包含区内各个县市来邕求医的人群。因此,即使南宁在十三五期间千人口献血率达到16.85‰,并显著高于全国平均水平,但临床血液供应量一直以来在苦苦追赶市区内各医院规模扩大的步伐,供血压力巨大。献血活动的季节性和血液血型结构性的不稳定也增加了血液供需平衡的不确定性[17]。因此,对南宁市区医院地中海贫血用血量进行科学预测,从而指导血液的调配与发放,实现供需平衡,具有较大的应用价值。

既往国外类似研究的预测对象多为红细胞或血小板总体供血量[18],本研究将ARIMA模型预测应用于地方性单病种血液供应,旨在解决南宁市区医院地中海贫血单病种用血供需矛盾。南宁市区医院TDT患者月度供(用)血量是一组以固定间隔,时间顺序记录的时间序列数据,呈现一定的周期性和趋势性,符合ARIMA模型建模对时序的特征要求。经过统计分析,利用ARIMA模型的建模原理,结合实际情况,确定参数,经过反复检验和识别,得出最优模型为ARIMA(0,1,1)(0,0,1)12。运用最优模型对2021年7—12月用血量进行预测,得到的预测值和用血实际值的变化趋势基本一致。其中对7—11月预测误差较小,对9、11月预测误差甚至小于2%,预测效果良好。6个月预测值的平均相对误差为8.42%,小于10%(多数学者认为,平均误差小于10%说明模型的预测效果良好[2-4]),此模型可用于南宁市输血依赖性地中海贫血单病种月度用血量的短期预测。

TDT患者月度用血需求预测模型的构建,可以为采供血机构制订采供血计划提供科学依据,提前调整供血结构和储备及预留地中海贫血用血,缓解地中海贫血用血供需矛盾。使供血计划既能满足临床需求又能避免浪费。

虽然本研究所采用模型的拟合度和预测精度均达到预期,但是建立的ARIMA模型也具有一定的局限性,因为模型是依靠历史数据建立的,模型准确预测的条件是原始数据存在的客观规律,根据模型做出的预测一般为理想状态下的预测,尚未能考虑突发公共卫生事件及各种原因导致的血液库存量剧烈变化,以及国家政策等外部不确定因素的影响。对个别月份用血数据峰值(如2021年12月)的预测还不够理想。因此依据历史数据建立的模型,还需要继续长期收集建立大数据,及时更新参数。此外,2018年出台了《广西严重类型地中海贫血胎儿零出生计划实施方案》(桂政办发〔2018〕76号),新增TDT患者将逐步减少,在后续工作中需要找到TDT患者用血量变化趋势拐点,及时对模型有效性验证并调整。

猜你喜欢

差分月度供血
一类分数阶q-差分方程正解的存在性与不存在性(英文)
月度荐书单
心肌供血不足是怎么回事?
一个求非线性差分方程所有多项式解的算法(英)
辣语
一类caputo分数阶差分方程依赖于参数的正解存在和不存在性
月度游记
月度游记
月度游记
基于差分隐私的数据匿名化隐私保护方法