自回归移动平均模型在骨科Ⅰ类切口感染预测中的应用
2023-11-26陈丽杨玉妹方朕
陈丽,杨玉妹,方朕
(上海交通大学医学院附属第六人民医院 感染控制办公室,上海 200233)
切口感染是骨科Ⅰ类切口手术患者中最为常见的术后并发症之一,约占全部医院感染的25%[1]。骨科手术通常具有手术时间长、范围大、涉及重要器官等特点,一旦发生切口感染极易造成切口愈合缓慢、开裂,甚至引发败血症及全身炎性反应[2],并导致患者住院时间延长,加重患者经济负担,同时也在某种程度上增加发生医患纠纷的风险[3]。鉴于骨科Ⅰ类切口感染的高风险及强危害,迫切需要加强对切口感染的前瞻性监测,虽然我国已于1986年建立了医院感染监测体系[4],但监测方式多停留于横断面调查,未充分利用纵向时间序列数据预测未来感染率的趋势。时间序列分析可利用序列数据之间随时间发展产生的相关性对未来序列的发展趋势做出推断[5],自回归移动平均(autoregressive integrated moving average,ARIMA)模型作为一种应用非常广泛的时间序列模型,可较好捕捉时间序列数据的周期性和趋势性,预测效果较好。本研究通过对我院骨科Ⅰ类切口感染逐月发病率构建ARIMA模型并进行短期预测,旨在为护理人员开发、选择合适的骨科Ⅰ类切口感染预测模型提供参考,帮助护理人员掌握感染发病趋势、早期识别感染高发时段并建立预警系统,从而制订针对性临床干预措施。
1 资料与方法
1.1 资料来源 通过我院医院感染管理系统,回顾性收集、整理2013年1月至2021年12月骨科每月可疑医院感染患者清单,并从我院病案管理信息系统导出骨科同期每月接受I类切口手术患者清单并统计总数,数据连续无缺失,共计108个月。Ⅰ类切口感染发病率=发生Ⅰ类切口手术部位感染患者数/同期接受Ⅰ类切口手术患者总数×100%,其中,通过医院感染管理系统收集的可疑医院感染患者如同时出现在由病案管理信息系统导出的接受I类切口手术患者清单中,则由专人通过查阅电子病历系统最终确定该患者是否发生I类切口手术部位感染。Ⅰ类切口手术部位感染判定严格按照2001版《医院感染诊断标准(试行)》实施[6],如符合判定标准则计为1例发生Ⅰ类切口手术部位感染患者。
1.2 方法
1.2.1 模型介绍 ARIMA模型最早由美国统计学家Box和Jenkins于1970年提出,基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,这组随机序列所具有的自相关性表明了预测对象发展的延续性,而通过相应的数学模型描述出来,就可以从该时间序列的历史资料来预测其未来值[7]。ARIMA模型包括不具有季节性的ARIMA(p,d,q)和具有季节性的ARIMA(p,d,q)(P,D,Q)s,其中参数p、d、q分别是自回归阶数、差分阶数、移动平均阶数;参数p表示时间序列数据中本身的滞后数,d表示差分项,q表示预测误差的滞后数,P、D、Q则是季节性的参数;s表示季节周期,月度序列情形s取值12[8]。
1.2.2 模型构建 (1)平稳性检验:时间序列的平稳性是模型建立的前提,可采用扩展的迪克富勒(augmented dickey-fuller,ADF)检验进行判定,若数据不平稳需采用差分处理使数据平稳化。(2)模型识别:经预处理实现平稳的序列,可根据自相关函数图(autocorrelation function,ACF)和偏自相关函数图(partial autocorrelation function,PACF)进行判断;同时,也可以通过R语言中auto.arima函数来确定多个备选模型,并以赤迟信息量准则(akaike information criterion,AIC)为模型的选择标准,AIC相对较小的模型拟合度较高。(3)模型检验:选定模型的残差序列经Box-Ljung检验判定为白噪声序列(P>0.05),即原始序列中的有效部分均已提取充分,拟合的模型有效,反之需调整。
1.2.3 模型预测 选取2013年1月至2021年6月骨科Ⅰ类切口月感染发病率作为训练集,用于拟合模型;模型拟合效果可根据平均绝对百分比误差(mean absolute percentage error,MAPE)进行评价,MAPE为0.00%时为完美模型,MAPE大于100.00%为劣质模型[9]。以2021年7-12月的感染发病率作为验证集,采用拟合的最优ARIMA模型预测2021年7-12月的感染发病率,与实际数据进行比较,评价模型的预测效果。若选择的模型经判定具有较好的预测效果,即可使用全部观测数据建模,并对未来6个月的感染发病率进行预测。
1.2.4 统计学处理 采用R 4.1.1软件进行数据分析、构建ARIMA模型并预测,使用χ2检验分析不同年份骨科Ⅰ类切口感染率差异,以P<0.05为差异具有统计学意义。
2 结果
2.1 一般情况 2013年1月至2021年12月,骨科Ⅰ类切口手术患者共计228 647例,发生Ⅰ类切口感染628例,手术切口感染发病率为0.275%。不同年份骨科Ⅰ类切口感染发病率差异无统计学意义(χ2=11.071,P=0.198),冬季的月感染发病率较高,见表1、图1。
图1 骨科Ⅰ类切口感染发病率按月分布图
表1 骨科Ⅰ类切口感染发病率情况
2.2 模型建立与评价 对原始发病率序列作平稳性检验,ADF检验结果显示,2013年1月至2021年6月骨科Ⅰ类切口月感染发病率时间序列满足平稳性要求(Dickey-Fuller=-4.203,P=0.010),无需差分可直接建模。模型识别阶段,对原始发病率数据绘制ACF图和PACF图,图2显示偏自相关函数在一阶后截尾,而自相关函数拖尾,确定参数p=1,q=0;而对于季节性参数P、Q而言,则不会超过2[8];在上述判断基础上,同时使用R软件包中auto.arima函数,根据AIC最小化原则自动确定最优拟合模型为ARIMA(1,0,0)(1,0,0)12,该模型的AIC值为-169.401,为相对最小值。对该模型的残差序列进行Box-Ljung检验,结果显示残差为白噪声序列(Q=10.320,P=0.962),模型较好地捕捉了原始时间序列的有用信息,可用于预测分析。
图2 骨科Ⅰ类切口月感染发病率序列的ACF和PACF图
2.3 模型预测 采用构建的ARIMA(1,0,0)(1,0,0)12模型对2013年1月至2021年6月的数据进行拟合,比较2021年7-12月的预测值和实际值,见图3。模型拟合值与实际值整体变化趋势一致,模型拟合的MAPE为31.82%,处于可接受的范围;骨科Ⅰ类切口月感染发病率实际值均在预测值的95%可信区间(confidence interval,CI)内,说明此模型的预测效果良好。基于全部观测数据,采用ARIMA(1,0,0)(1,0,0)12模型对未来6个月感染发病率的预测结果依次分别为0.276%、0.283%、0.288%、0.285%、0.297%和0.291%,其95%CI分别为(0.083,0.470)、(0.062,0.504)、(0.059,0.516)、(0.055,0.516)、(0.066,0.529)和(0.059,0.523),未出现突增或突降的情况,总体呈现低水平流行的态势。
图3 骨科Ⅰ类切口月感染发病率的拟合及预测
3 讨论
3.1 骨科Ⅰ类切口医院感染发病现状
3.1.1 发病特征 手术是治疗骨科疾病的主要手段,治疗过程中完整皮肤屏障的破坏、无菌组织与外界环境的直接暴露以及手术器械对于局部组织的损伤,均可增加患者手术切口的感染风险[10],特别是骨科手术经常存在植入物的使用,具有手术过程复杂、手术时间长、出血量大等特点,使得手术切口感染的风险显著增加[11]。骨科手术切口一旦发生感染,可导致创面无法通过正常程序完成愈合修复,进而形成慢性难愈性创面,严重者可进一步引发感染性骨不连、慢性骨髓炎等并发症,导致患者预后不良[12]。因此,提前开展针对骨科Ⅰ类切口感染的前瞻性预测,采取针对性的预防干预措施,对于保护患者生命安全具有重要意义。
3.1.2 发病水平 本研究结果显示,我院骨科Ⅰ类切口感染总体发病率为0.275%,发病率水平低于《医院感染管理规范(试行)》中对500张病床以上医院Ⅰ类切口手术部位感染发病率的要求(<0.5%)[13],同时低于罗丽等[11]研究所报道的骨科Ⅰ类切口感染发病率(1.11%),这可能与我院强化围术期抗菌药物合理使用、落实消毒隔离措施、规范护理操作等有关,表明采取针对性的预防控制措施可有效减少骨科Ⅰ类切口感染的发生。
3.2 骨科Ⅰ类切口感染预测模型的应用价值
3.2.1 选择科学合理的预测方法 ARIMA模型可利用历史序列数据之间随时间发展产生的相关性对未来序列的发展趋势做出推断,已在医疗卫生领域得到了广泛应用[14-15]。目前,对骨科Ⅰ类切口感染预测分析主要有决策树模型、Logistic回归模型和组合预测模型等,但在应用过程中常存在预测对象数据资料无法获得、影响因素难以掌握等难点,而ARIMA模型解决了上述难题,在分析过程中不纳入其他影响因素而仅考虑时间因素,所需资料相对简单、易于获得,并可高效提取出时间序列中的确定性信息,对于短期预测具备较高的准确度[15]。骨科Ⅰ类切口感染相较于传染病与慢性病,其发病影响因素十分复杂,受患者自身健康状况、手术复杂程度、手术过程无菌技术操作执行情况、围手术期医疗护理等多种因素影响。目前,骨科Ⅰ类切口感染数据仍主要以查阅电子病历的方式获得,数据质量难以保证、影响因素监测不全。而ARIMA模型在分析预测过程中,仅需收集感染发病率资料并只考虑时间因素,对数据要求不高,符合目前医疗机构内骨科Ⅰ类切口感染的防治实际,拥有广阔的应用前景[16]。
3.2.2 科学预测未来发展趋势 本研究纳入的历史数据达108个月,其中验证预测效果的数据有6个月,预测效果的评价可靠真实。利用2013年1月至2021年6月的数据建立了优质模型ARIMA(1,0,0)(1,0,0)12,该模型较好拟合了骨科Ⅰ类切口感染发病率。采用构建的模型预测2021年7—12月的发病率,其预测结果与实际值基本相符,实际值都在预测值的95%CI内,模型预测效果良好[16],表明模型在长时间、大样本的数据应用中准确度较高。本研究纳入全部观测数据,采用ARIMA(1,0,0)(1,0,0)12模型预测未来6个月的骨科Ⅰ类切口感染发病率,提示未来6个月的发病趋势为低水平流行的态势,这也反映出我院当前的骨科Ⅰ类切口感染防控情况较好。
3.2.3 掌握趋势并启迪护理工作 鉴于构建ARIMA模型所需的资料相对简单,便于临床实际应用,护理人员可开展感染发病率动态预测,及时识别感染高发时段,并针对性做到:(1)提高警惕,严格执行各项无菌技术操作;(2)遵照医嘱,规范使用抗菌药物,观察用药疗效及不良反应,最大限度提高抗菌药物预防、治疗效果;(3)限制人员探视及流动,做好病区环境物品清洁消毒工作,避免出现交叉感染。同时,构建ARIMA预测模型有助于设置骨科Ⅰ类切口感染发病率警戒线并建立预警系统[17-18],如果实际值在预测值的95%CI范围内波动,说明骨科Ⅰ类切口感染发病率水平处于正常水平,如超出预测值95%CI上限时,提示感染水平已不同于以往散发规律,可能发生感染的暴发,护理人员应提高警惕,排查感染暴发的风险点,采取针对性措施控制感染的发生。
3.3 骨科Ⅰ类切口感染预测模型使用注意点 本研究使用的ARIMA模型虽可在获取相对简单资料的基础上即可较好拟合、预测骨科Ⅰ类切口感染发病率,但其一般仅对6-12个月以内的短期预测具有较高准确度[8,15,19]。模型参数并非一成不变,若需达到长期持续预测的效果,需要不断纳入新的实际观测值,及时调整模型,从而更好反映真实情况[20]。另外,ARIMA模型的未来应用中,如果出现缺失值,可通过线性内插值或其他内插值进行补充[14],从而提高模型精度。
4 小结
本研究基于骨科Ⅰ类切口感染发病率历史观测数据构建ARIMA模型,短期预测效果较好,预测结果可靠。预测结果可提示未来6个月内的发病率呈现低水平流行的态势,前瞻性预测骨科Ⅰ类切口感染发病率有助于掌握感染发病趋势、及时识别感染高发时段、完善医院感染预警系统,从而科学实施临床干预措施、降低感染发病水平。