APP下载

ARIMA 模型在儿科红细胞用量预测中的应用

2023-11-30杨媛淇何柏霖温普生彭雪松胡娟郭玉霞

中国输血杂志 2023年9期
关键词:差分红细胞用量

杨媛淇 何柏霖 温普生 彭雪松 胡娟 郭玉霞

(重庆医科大学附属儿童医院输血科国家儿童健康与疾病临床医学研究中心儿童发病疾病研究教育部重点实验室儿科学重庆市重点实验室,重庆 400014)

儿童患者是一类异质性群体,在生长发育不同阶段,其造血系统、免疫系统及循环系统等均存在很大差异,但总体而言,儿童患者具有血容量低,病情变化快,对输血需求高,容易发生输血不良反应等特点,因此儿科的输血实践比成人更错综复杂[1]。 新生儿、早产儿造血系统发育不完全,机体对血红蛋白下降生理性代偿不足,尤其需要及时输注红细胞维持机体生命体征。 而较高库存的血液储备会使血液储存时间过长、红细胞破坏增加、游离血红蛋白升高,潜在病原体释放,可能导致患者发生免疫抑制、输血相关肺损伤、肾功能衰竭等,增加短期感染、甚至死亡风险[2]。 过量的血液储备还可能导致宝贵的血液资源浪费。 适当的血液储备是保证儿科输血质量的前提,而既往研究发现儿童疾病发病率具有一定的季节趋势性[3-5],血液需求量也受此影响。 因此,儿科输血更迫切需要可靠的预测模型和强大的信息化支持,以便输血科能精准预测临床悬浮红细胞用量,科学制定血液储备计划。

自回归移动平均模型(autoregressive integrated moving average model,ARIMA)是1 种短期预测精度较高的模型,在预测临床红细胞需求量方面优于其他时间序列模型[6]。 它能科学提取、分析序列的季节效应,长期趋势效应和随机影响因素之间的复杂交互关系,通过不断识别和调整参数确定最佳拟合模型,从而有效、精准预测季节周期性变化的目标对象未来发展情况。 ARIMA 模型正被各级中心血站广泛运用于临床血液需求量预测[7-9],但其在儿童临床用血情况预测方面仅Guo 等[10]做过初步报道,其普遍适用性有待进一步探究。 本研究旨在探究ARIMA 模型预测儿童医院临床红细胞需求量的可行性,为输血科合理规划血液储备提供依据,实现从经验备血向科学备血的转变。

1 资料与方法

1.1 数据来源 统计本院2016 年3 月至2022 年10 月临床每月悬浮红细胞用量,以单位(U)计算。 纳入标准:统计不同规格、不同品种的所有红细胞成分用量。 排除标准:洗涤红细胞、浓缩红细胞、阴性悬浮红细胞等特殊红细胞成分的用血量不纳入统计,以消除其他无关因素影响。

1.2 时间序列预测模型(ARIMA)构建 步骤:1)时间序列平稳化:通过原始序列图观察数据趋势走向及平稳程度,判断时间序列是否需进行差分处理;2)模型识别及参数估计:用上述处理后的数据绘制自相关性函数图,根据时间序列识别规则,判断自相关函数图(autocorrelation function, ACF)和偏自相关函数图(partial autocorrelation function, PACF)拖尾及截尾情况,初步判定ARIMA 模型的备选参数,且P,D,Q值一般不大于2[11];3)模型检验:以2016 年3 月至2022 年5月每月临床悬浮红细胞用量作数据源,代入上述备选参数建模,参考模型Q检验结果与贝叶斯信息准则(BIC)值,调整参数选取BIC 值最小的那一组作最佳模型。

1.3 模型预测及评估 为排除新冠疫情影响,用最佳模型预测本医院2022 年6 至10 月每月临床红细胞用血总量。 输出预测模型残差序列自相关性函数图,结合预测拟合曲线判断预测结果是否在95%置信区间内,评估预测模型的准确性。 根据2022 年6 至10 月临床实际用血量,进行模型预测效果检验。 比较预测值与实际值差异,计算平均相对误差,<10%则说明模型预测精确度高[12-13]。 在此基础上,尝试用ARIMA 模型“专家建模器”预测临床每月不同血型红细胞用血情况。

1.4 统计学方法 制定Excel 数据库,按月统计本院2 个院区悬浮红细胞用血量,将数据导入SPSS 26.0 统计分析软件,进行模型构建、分析及预测,以P<0.05 为差异具有统计学意义。

2 结果

2.1 数据平稳化处理 采用SPSS26.0 软件绘制本院2016年3 月至2022 年5 月悬浮红细胞总用量的原始时间序列图(图1),每月悬浮红细胞用量呈明显季节周期性波动,且整体呈逐步上升趋势。 每年春节期间出现临床用血最低值,而3、8、11 月前后临床红细胞用量会逐步回升。 针对数据的不平稳性,对数据进行一阶差分及一阶季节性差分,处理后得到新的时间序列图(图2),观测值在0 处上下随机波动。 根据序列图处理结果,初步选定ARIMA(p,d,q)(P,D,Q)s 模型,它是ARIMA 的季节性乘积模型,其中s 代表1 个季节性周期长度,p,d,q 分别为非季节性自回归阶数、差分阶数和移动平均阶数,而P,D,Q 值分别为模型相应季节性参数。综上,本研究模型参数分别为d=1,D=1,s=12。

表1 临床红细胞总用量模型统计

图1 原始序列图

图2 经过一阶差分和一阶季节差分后的序列图

2.2 模型识别及参数估计 对差分及季节差分处理后的平稳序列进行自相关性分析,分别得到其自相关函数图(图3)和偏自相关函数图(图4)。 图形显示PACF 在滞后12 阶趋于0,而ACF 图延迟数目在12 阶时显著不为0,结合既往研究提示P,Q 参数不大于2 的原则,考虑P=0,Q =1;由图4 显示,PACF 无明显收缩性,在2,5,8 阶时均有突出,截尾特征不明显,但基本处在95%置信区间范围内,尝试p 取0,1,2 或5,ACF 图在12 阶时有明显突出,无明显截尾现象,考虑q=1。

图3 经过一阶差分和一阶季节差分后的自相关函数图

图4 经过一阶差分和一阶季节差分后的偏自相关函数图

选取上述初步参数带入模型进行调试,结果如表1 所示,ARIMA(0,1,1)(0,1,1)12、ARIMA(1,1,1)(0,1,1)12、ARIMA(2,1,1)(0,1,1)12和ARIMA(5,1,1)(0,1,1)12备选模型的正态化BIC值分别为8.706、8.906、8.978 和10.186。最终确定ARIMA(0,1,1)(0,1,1)12模型BIC值最小,拟合效果最好,且该模型与SPSS26.0 中“专家建模器”所推荐的模型参数一致。

2.3 模型检验 对确定的最佳模型ARIMA(0,1,1)(0,1,1)12残差序列作自相关函数图和偏自相关函数图,如图5 所示,该模型残差序列基本落在95%置信区间内;经Ljung-Box Q统计分析,Q统计量为16.282,P值>0.05,表明ARIMA(0,1,1)(0,1,1)12残差序列不存在相关性,属于白噪声序列,满足随机性假设。 因此,该模型拟合效果较好,可用于本院临床悬浮红细胞总用量预测。

图5 临床红细胞总用量ARIMA(0,1,1)(0,1,1)12模型残差序列自相关函数和偏自相关函数图

2.4 模型预测及评估 运用上述最佳模型ARIMA(0,1,1)(0,1,1)12预测2022 年6 至10 月临床红细胞总用量,得到预测值与实际值的时序拟合图,如图6 所示,预测值与实际值趋势基本一致,且均在95%CI范围内,模型预测准确度较高。 为排除疫情客观因素影响,选取建模结束后重庆新冠疫情稳定的连续5 个月临床红细胞用量预测值及实际值做对比分析,结果见表2 所示,平均相对误差为5%,模型精确度高,预测拟合效果好。 用“专家建模器”预测临床每月不同血型红细胞用血情况,如表3 所示,并非所有血型都适用于ARIMA 模型,仅O 型红细胞用量适用于ARIMA(1,0,0)模型,P值>0.05。

表2 2022 年6—10 月临床每月红细胞总用量预测值与实际值比较

表3 临床红细胞不同血型用量模型统计

图6 临床红细胞总用量ARIMA(0,1,1)(0,1,1)12模型拟合效果图

3 讨论

输血是儿童疾病治疗的有效手段之一,具有一定的不可替代性。 儿童输血病种结构异于成人,有其独特的周期规律,儿童的输血策略不能遵循与成人相似的原则,临床需科学、全面地评估儿童患者的病情、输血需求、获益及风险,审慎选用适宜、适量的血液成分,规避或减少输血及其不良反应的发生,并及时评估患者输血疗效[14]。 早产、肺炎、出血、高胆红素血症、溶血性疾病等是新生儿输血的重要原因[15],其中早产儿、肺炎等发病具有明显的季节周期规律性[5,16]。结果显示,本院临床用血主要集中在3、8、11 月前后,具有明显的季节效应。 因此,儿童医院迫切需要依据既往用血数据,结合可靠的预测模型科学制定血液储备计划,最大程度保障临床输血安全和疗效。

现有临床血液需求量预测模型以预测期限为标准可分为短期、中、长期及突发事件下的预测模型,这些模型均存在一定缺陷。 回归分析模型、时间序列模型和随机模型等在短期预测方面更具优势,而人口统计学模型、微分方程模型通常用于中、长期预测[8]。 ARIMA 模型是自回归模型和移动平均模型的结合,不受样本容量和概率分布限制,不考虑过多相关因素影响,能准确预测临床用血变化趋势。 因此,越来越多的学者将ARIMA 模型用于临床血液需求量预测,以保障临床用血安全、血液资源有效利用[17-18]。 Pereira 等[6]对比了ARIMA、Holt-Winters 指数平滑模型、神经网络这3 种时间序列方法对临床红细胞需求量的预测拟合效果,结果表明ARIMA 模型对红细胞系列短期预测效果最好,但其对儿童医院的普遍适用性有待进一步探究。

本研究采用ARIMA 模型对本院2016 年3 月至2022 年5 月的临床红细胞用量时间序列数据逐月进行统计分析和建模,此期间临床用血基本满足,血液报废率<1%。 经过参数调整、模型检验,确定ARIMA(0,1,1)(0,1,1)12为临床红细胞用血总量预测最优模型,将其用于预测,2022 年6 至10 月的临床红细胞用量预测值与实际值的拟合曲线,趋势走向整体一致,基本处在95%置信区间范围内,预测平均相对误差为5%,预测拟合效果好。 本研究显示,利用ARIMA 模型分析和预测临床每月血液需求总量对于本院是有效、可行的,但并非每个血型都适用。 未来有必要持续关注临床用血情况,排除外界干扰因素的影响,结合实际用量及需求动态调整模型参数。

综上所述,ARIMA 季节性乘积模型适用于儿童医院临床悬浮红细胞总用量预测,有助于科学制定血液储备计划,从而有效缓解季节性、周期规律性缺血带来的影响。 儿童具有多个年龄分段期,其疾病特点及输血率与年龄、性别、地区等密切相关[19-20],低龄儿童患者用血量增长迅速[21]。 本研究中儿童医院所用血液成分有效期较短,未来有必要进一步探究不同时间周期、不同血型、不同年龄段的预测可行性及准确性,实现输血科每月甚至每周的精准库存调控管理,在减少血液资源浪费的同时,尽可能缩短血液在库储存时间,提高患者输血疗效。 在医疗卫生领域,ARIMA 模型还用于预测医院早产儿病例增长情况、儿童四肢骨折发生率、传染病流行特征及趋势等其他方面,结果表明儿童诸多疾病发病具有明显季节变动性[22-23]。 因此,移动自回归模型有希望应用于单病种用血量预测分析。 有研究表明,临床医生术前评估准确性低于人工智能[24],未来有望在进一步明确该模型在儿童更多疾病领域的预测作用的基础上,结合人工神经网络(artificial neural network,ANN)[25-26]等其他机器学习方法,进行危险因素分析,构建可靠实用的单病种输血量预测模型,进一步科学指导临床合理用血,提高疗效。

利益冲突:所有作者均声明不存在利益冲突。

猜你喜欢

差分红细胞用量
2021年日本钛加工材在各个领域用量统计
红细胞的奇妙旅行
数列与差分
大豆种植意向增加16.4%化肥用量或将减少
Side force controlon slender body by self-excited oscillation flag
猪附红细胞体病的发生及防治
农户如何称取和配制小用量固体农药
基于差分隐私的大数据隐私保护
相对差分单项测距△DOR
差分放大器在生理学中的应用