APP下载

基于乘积季节性ARIMA模型对神经内科医院感染发病率的预测研究

2019-03-18王清青范馨月查筑红程永素罗光英

中国感染控制杂志 2019年1期
关键词:神经内科预测值差分

王清青,范馨月,查筑红,黄 冰,程永素,罗光英,曾 妮,姚 尧

(1. 贵州医科大学附属医院医院感染管理科,贵州 贵阳 550004; 2. 贵州大学数学与统计学院计算机科学系,贵州 贵阳 550025)

医院感染(healthcare-associated infection,HAI)不仅增加住院患者死亡风险,同时延长患者住院时间和增加患者经济负担,已成为医学界亟待解决的重大问题[1-2]。神经内科患者具有年龄大、发病急、基础疾病多、病情严重等特点,并常伴有不同程度的意识、运动障碍,免疫功能低下,卧床时间长等特点,是医院感染的高危人群[3-5]。因此,了解神经内科患者医院感染发生、发展规律,并在此基础上采取可能的预防和控制措施具有重要的现实意义[6]。医院感染发病率的预测是将被动预防向主动预防转化的重要环节。准确预测医院感染发病率未来变化情况,对于医院感染的预防与控制有着极为重要的作用[7]。自回归滑动平均混合模型(autoregressive integrated moving average model, ARIMA)是Box-Jenkins方法中的重要时间序列预测模型,目前用于短期预测效果较为理想,被广泛应用于医疗卫生、环境、金融等领域的预测[8]。本研究基于贵州省某三级甲等医院2014—2018年神经内科医院感染发病率数据,采用乘积季节性模型对该院神经内科医院感染的发病情况进行预测,以期发现医院感染的潜在规律,发出早期预警,从而为神经内科患者医院感染预防关口前移提供科学依据。

1 资料与方法

1.1 资料来源 收集贵州省某三级甲等医院2014年1月—2018年5月入住神经内科>48 h患者月度医院感染发病率资料。

1.2 医院感染诊断标准 参照中华人民共和国卫生部2001年发布施行的《医院感染诊断标准(试行)》[9]。

1.3 模型构建方法 由于医院感染具有季节性感染的特殊性,因此,采用乘积季节性模型拟合时间序列具有较好的预测效果。模型中分别代表非季节性和季节性自回归项、差分和移动平均项系数,为季节周期。以2014—2017年神经内科月度医院感染发病率数据作为训练样本,2018年1—5月数据作为模型预测验证样本。建模主要过程分为四步,(1)时间序列平稳化检验和处理:ARIMA模型要求数据符合时间序列平稳性,因此需对已有时间序列数据进行数据平稳化处理。采用差分方法使该序列满足零均值且方差不随时间变化,根据差分次数确定差分阶数。(2)模型识别:通过绘制平稳后时间序列的自相关函数(autocorrelation function, ACF)和偏自相关函数(partial autocorrelation function, PACF)图对目标序列进行定阶。(3)参数估计与诊断检验:从估计的多个模型中,选择其中最优模型进行预测。模型的筛选依据采用拟合优度统计量比较模型的优劣,采用赤池信息准则(Akaike information criterion,AIC)和贝叶斯信息准则(Bayesian information criterion,BIC)优先选择值最小参数进行拟合优化模型,对模型的参数进行显著性检验和残差进行白噪声检验。(4)模型预测:确定出最优模型,对模型进行预测,得到原序列将来感染发病率趋势。

1.4 统计分析 应用SPSS 18.0软件对每年及各月医院感染发病率进行卡方检验,应用Matlab2017a软件构建ARIMA(p,d,q)×(P,D,Q)s模型。

2 结果

2.1 医院感染情况 2014—2018年该院神经内科每年医院感染发病率分别为0.67%、2.01%、1.35%、0.59%和0.34%,差异有统计学意义(χ2=82.26,P<0.001),趋势性χ2检验发现医院感染发病率存在下降趋势(χ2=22.43,P<0.001)。见图1、表1。

图1 2014—2018年某院神经内科医院感染发病率变化趋势

Figure1Change trend in HAI incidence in department of neurology in a hospital from 2014 to 2018

2.2 时间序列平稳化 通过原始时序图(图1)发现,该三甲医院2014—2018年神经内科各月医院感染发病率呈现出一定季节性和周期性,为非平稳时间序列,需要对其进行平稳化处理。对原数据作一阶差分后消除了序列的长期趋势,发病率时序图基本趋于平稳。见图2。

2.3 模型识别与定阶 对原序列进行一阶差分后的ACF和PACF图,见图3。差分后通过ADF检验,确定ARIMA(p,d,q)×(P,D,Q)s中的d和D均为1。此时残差序列自相关函数和偏相关函数在可信区间内,模型的计算值和实际值拟合度较高。对其进行残差相关性检验,检验值基本落在95%的置信区间内。

表1 2014—2018年神经内科各月医院感染发病率[%(n/N)]

注:医院感染发病率=新发生医院感染的患者例数/同期住院患者例数×100%;表中n表示神经内科新发生医院感染的患者例数;N表示同期神经内科住院患者例数

图2 2014—2018年某院神经内科医院感染发病率数据一阶差分后时序图

Figure2Temporal graph after first order difference of data of HAI incidence in neurology department of a hospital from 2014 to 2018

图3 一阶差分后ACF和PACF图

AIC数值越小,模型精度越好。通过实验数据分析,自回归部分阶数和移动平均阶数可以选取p=2,q=2。综上得出的最优预测模型为ARIMA(2,1,2)×(1,1,1)4。通过计算AIC=125.68;BIC=133.16。ARIMA(2,1,2)×(1,1,1)4预测感染发病率的残差、QQ图检验、ACF和PACF见图4。模型估计结果的残差序列满足随机性检验。

2.4 模型诊断 对2018年1—5月神经内科各月医院感染发病率进行预测,结果显示,模型预测值的动态趋势与实际情况基本一致,实际发病率均是在预测值的95%置信区间内,说明了该模型拟合效果较好,可用以对未来进行较好的跟踪和预测。见表2,图5。

图4 预测模型残差、QQ图检验、ACF和PACF图

Figure4Prediction model residuals,QQ plot,ACF and PACF

表22018年1—5月神经内科医院感染发生率实际值与预测值比较

Table2Comparison of actual and predicted incidence of HAI in department of neurology from January to May 2018

注:差率=(|实际值-预测值|)/实际值

2.5 模型预测 用此模型对2018年6—12月神经内科医院感染发病率进行预测,预测结果见图5,结果显示预测值均位于95%的置信区间内。

图5 ARIMA模型对神经内科医院感染发病率预测图

3 讨论

医院感染给患者和家庭,以及医院均带来不同程度的疾病负担。预防和控制医院感染,降低医院感染发病率,是医院感染管理的核心工作。目前,我国对医院感染控制的监测模式多采用回顾性调查,前瞻性研究尚不多[10-11]。利用统计预测分析技术对医院感染进行预测性数据挖掘,建立医院感染预警模式是医院感染管理工作今后发展的重要方向。

ARIMA 模型是时间序列分析中重要而基本的模型之一,是针对有季节性变动的时间序列提出的建模方法,综合考虑了序列的趋势变化、周期变化及随机干扰,并借助模型参数进行了量化表达,具有实用性强、预测精准度高等特点[12-13],已被广泛应用于各个学科,尤其在卫生领域前瞻性预测方面具有广阔的应用前景[14-15]。本研究采用时间序列ARIMA(2,1,2)×(1,1,1)4模型对某三级甲等医院神经内科2014—2018年各月医院感染发病率数据进行分析,结果显示,该模型的预测精度较高,能很好地拟合原始序列的趋势性和周期性,可以用于神经内科医院感染发病趋势的分析和预测。使用该预测模型对2018年1—5月数据进行验证,结果显示,实际值与预测值重合较好,波动形势基本一致,实际值均在预测值95%可信区间内,预测拟合效果较可靠。在此基础上,对2018年6—12月神经内科医院感染发病率进行预测,结果显示2018年7月份和12月份是两个高发月份,因此在此期间应该加强落实医院感染控制措施,有效减少医院感染的发生。

此外,本研究所构建的ARIMA模型与李红等[16]构建的模型不同,说明了不同时间段、不同地域构建医院感染发病率预测模型的必要性。另外,单次分析建立的ARIMA模型,不能作为永久不变的预测工具,只能用于短期预测。在实际工作中,应收集足够多的时间序列数据,用新的实际值对已建立的模型进行验证,并不断加入新的实际值,以修正或重新拟合医院感染发病率预测模型,更能反映实际情况。

综上所述,医院感染的发生受社会因素、环境因素的影响,既有趋势变动,又有季节变动。选用相对最优的ARIMA模型对下一年的不同时间段内的医院感染人数进行初步预测,有利于我们提前做好防范工作,从而使医院感染的防线前移,从根本上减少医院感染的发生,降低总体医院感染发病率。

猜你喜欢

神经内科预测值差分
IMF上调今年全球经济增长预期
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
数列与差分
系统护理干预在神经内科对脑卒中护理中的应用探讨
法电再次修订2020年核发电量预测值
QCC在预防神经内科住院患者跌倒与坠床的应用
基于差分隐私的大数据隐私保护
相对差分单项测距△DOR
差分放大器在生理学中的应用