基于粒子群优化长短记忆网络算法的有创呼吸机使用量预测模型研究
2024-04-10符增夏景涛王凌申芳瑜钟晨温燕清通信作者
符增,夏景涛,王凌,申芳瑜,钟晨,温燕清(通信作者)
1 赣州市人民医院 (江西赣州 341000);2 南方医科大学南方医院(广东广州 510515)
随着医疗改革的不断深入,运营成本控制逐渐成为医院管理的重要研究方向[1]。与此同时,医疗设备管理成为医院成本管理的重要核心[2]。在实际工作中,除各重症监护病房(intensive care unit,ICU)对有创呼吸机的使用需求相对确定外,其他很多科室对于呼吸机的使用需求存在不确定性和即时性。因此,准确预测全院各科室有创呼吸机的使用量,对提高设备使用率,降低运营成本具有重要意义。
目前,用于医疗器械使用量预测的方法主要有卡尔曼滤波模型[3]、自回归积分滑动平均模型[4]、基于二次指数平滑和灰色马尔科夫模型[5]等传统的统计学方法和支持向量机[6]、循环神经网络(recurrent neural network,RNN)[7-8]等新兴的机器学习方法。采用传统统计学方法建立的模型一般有明确的数学形式,预测结果的好坏取决于数据分布的假定及构建模型的合理性。对于复杂的非线性数据,该方法较难挑选出合理的分布假定和创建明确的数学模型。而机器学习方法能够较好的处理非线性问题,提高预测准确率,但因其缺乏自学能力、破坏数据的时序特征、无法处理大规模数据而需手动选取等缺点影响预测的准确性。
长短期记忆网络(long short term memory,LSTM)是一种特殊的循环神经网络,有较强的自学能力、能较好学习数据中的时序特征,具有较高的预测精度,但网络层数、迭代次数、隐含节点数等参数的确定会直接影响LSTM 网络的预测精度[9]。
本研究采用粒子群优化(particle swarm optimization,PSO)与LSTM 相结合的方法,通过PSO方法优化LSTM 的隐含层神经元数、学习率,从而得到合适的网络参数,提高LSTM的预测精度。同时,结合医院有创呼吸机的使用情况,以天为颗粒度进行数据挖掘,应用本研究创建的PSO-LSTM 算法模型,以期准确预测有创呼吸机的每天使用量,为医疗设备采购决策及配置提供有效的合理建议,从而提高医疗设备的使用效率。
1 PSO-LSTM 模型创建
1.1 PSO 算法
PSO算法的思想源于对鸟群觅食行为的研究,鸟群通过共享集体的信息使群体找到最优的目的地[10]。假设搜索空间为D 维,粒子的个数为m 个,则可表示为:
式中,X 为包含m 个粒子的种群;Xi为1 个D维向量,指示搜索空间中的1 个可能的位置,称为候选解;v为粒子下一步的飞行速度;Pbest为个体极值;Gbest为全局极值。粒子根据2 个极值更新自己的速度和位置,有:
式中,w为惯性权重,c1和c2为2 个正的常数;r1和r2为[0,1]间的2 个随机数;n为当前的迭代次数。
惯性权重值越大,探索新区域的能力越强,全局寻优能力越强,但局部寻优能力越弱。反之,全局寻优能力越弱,局部寻优能力强。为了在搜索速度和搜索精度之间达到平衡,本研究采用线性变化策略调整w值来提高算法性能,具体如公式(8)所示:
式中,wmax为最大惯性权重,wmin为最小惯性权重,iter 为当前迭代次数,itermax为最大迭代次数。
1.2 LSTM 神经网络模型
LSTM 于1997 年由Hochreiter[11]首次提出,经Sussillo、Jozefowicz 等[12-13]不断优化,形成了较系统且完整的LSTM 框架,解决了梯度爆炸及长期依赖等问题,在语音识别、文字翻译、机械故障诊断和预测等领域得到广泛应用。LSTM 可以预测时间间隔较大的信息,具有记忆长短期信息能力。LSTM 是由一系列LSTM 单元(LSTM Unit)组成,其链式结构见图1 所示。LSTM 包含输入层、隐含层、输出层。隐含层结构是由一系列线性组合构成的存储单元组成,包括细胞状态、遗忘门、输入门及输出门。
图1 LSTM 神经网络模块
当信息输入时,先由遗忘门决定是否丢弃信息,LSTM 模型可以以一定概率控制遗忘上一层的信息。将t-1 节点的隐藏状态ht-1和t 节点的序列数据xt输入1 个sigmoid 激活函数,从而得出遗忘门的输出ft,遗忘门(ft)计算公式为:
其中σ为sigmoid 激活函数,Wf为遗忘门的权重矩阵,[ht-1,xt] 表示将2 个向量连接形成1 个新向量,bf为遗忘门的偏置项。
输入门由两部分,一部分通过sigmoid 激活函数形成,另一部分通过tanh 激活函数形成,输入门(it)计算公式为:
其中Wi、Wc分别为输入门、单元状态的权重矩阵,bi、bc分别为输入门、单元状态的偏置项。
信息经过遗忘门和输入门的处理后,作用于细胞状态,t 节点的细胞状态Ct由两部分组成,一部分为Ct和遗忘门输出ft的乘积,另一部分为2 个输入门输出it和Ct的乘积,计算公式如下:
获得细胞状态Ct,作为输出门的输入信息,隐藏状态ht由两部分祖成,第一部分是上一节点的隐藏状态ht-1和节点序列Ot通过sigmoid 激活函数的输出。
式(13)中Ot为t 时刻输出门的值,Wo为输出门的权重矩阵,bo为输出门的偏置项。式(14)中ht为t 时LSTM 的输出值。
1.3 PSO-LSTM 模型的有创呼吸机使用量预测方法
医院有创呼吸机使用量作为一种医疗时间序列数据,其使用情况受多因素影响,数据具有非周期性和非线性的特征。LSTM 模型的网络层数、迭代次数、隐含节点数等参数会显著影响神经网络的学习效果[14]。PSO 算法相较于其他自适应算法具有原理简单、搜索能力强的优势,其具有的自适应特性使得LSTM 能够根据有创呼吸机使用量的数据特征,快速、准确地确定最优参数,实现LSTM 模型结构与有创呼吸机使用数据特征的有效结合。基于PSO-LSTM 算法的有创呼吸机使用量预测建模步骤(图2)如下。
图2 ICU 有创呼吸机使用量预测值
图2 PSO-LSTM 神经网络算法的有创呼吸机使用量预测流程图
图3 全院有创呼吸机使用量预测值
第1 步,对样本数据进行预处理,将有创呼吸机使用量数据标准化,初始化PSO 算法参数。
第2 步,定义适应度,采用LSTM 预测值的均方根误差作为粒子适应度值Fit。Fit 公式如下:
式中y*为真实值,y 为预测值。
第3 步,以粒子的位置信息作为LSTM 的参数,构建多个LSTM。
第4 步,训练所有网络,得到每个粒子的自适应度值,更新个体极值和群体极值。
第5 步,根据个体极值和群体极值使用惯性权重迭代更新粒子速度和位置信息。
第6 步,满足条件或达到最大迭代次数后进入下1 步,否则返回执行第3 步。
第7 步,得到优化后的参数,重新训练LSTM。
第8 步,通过训练好的PSO-LSTM 进行有创呼吸机使用量预测。
2 有创呼吸机使用量预测
2.1 数据预处理
选取某三甲医院有创呼吸机使用数据进行分析。其中,有创呼吸机的使用收费包含呼吸机辅助呼吸(HIS 系统中的项目编号F00000002175)和持续呼吸功能检测(HIS 系统中的项目编号F00000002177)项目,通过检测呼吸机辅助呼吸统计数量能准确判断有创呼吸机的使用情况。从医院信 息系统(hospital information system,HIS)提取规定时间内有创呼吸机的收费明细,包括住院号、执行科室、项目编码、项目名称、执行数量(按小时收费)、执行日期等信息[15],根据收费明细可以统计每天各科室使用的有创呼吸机数量。
2.2 有创呼吸机使用量预测分析
根据某三甲医院2019 年4 月至2023 年4 月有创呼吸机使用量,重点分析ICU、全院有创呼吸机使用量。神经网络超参数范围设置如下:学习率(learning rate)范围为[0.01,0.15],训练次数(epoch)范围[10,500],隐含层神经元个数(hidden node)范围为[10,500]。同时根据文献[16]设置PSO 参数为:粒子数量为5,迭代次数为40, c1和c2均为2.5,wmax为0.8,wmin为0.2。通过预处理后的数据如表1 所示。
表1 数据划分
选用2023 年1 月27 日至4 月26 日有创呼吸机使用量作为测试数据,通过PSO-LSTM 模型与LSTM 模型分别预测ICU 及全院有创呼吸机使用量,结果显示,基于PSO-LSTM 模型的有创呼吸机使用量预测结果均与实际使用量更接近,相较于LSTM 模型预测精度更高,见图2~3。
3 PSO-LSTM 模型误差分析
3.1 误差分析方法
为验证模型的定量效果,采用平均绝对误差(mean absolute error,MAE)、平均绝对百分比误差(mean absolute percentage error,MAPE)及均方根 误 差(root mean squared error,RMSE)对PSOLSTM 模型预测数据与实际数据的误差程度进行评价[16-17]。
3.2 PSO-LSTM 模型与LSTM 模型预测结果
3.2.1 ICU 有创呼吸机使用量预测分析
PSO-LSTM 模型与LSTM 预测ICU 有创呼吸机使用量,MAE 值、MAPE 值及RMSE 值均降低,见表2。
表2 LSTM 模型与PSO-LSTM 预测ICU 呼吸机使用量误差比较
3.2.2 全院有创呼吸机使用量预测分析
PSO-LSTM 模型与LSTM 预测全院有创呼吸机使用量,MAE 值、MAPE 值及RMSE 值均有降低,见表3。
表3 LSTM 模型与PSO-LSTM 预测全院有创呼吸机使用量误差比较
4 讨论
4.1 PSO-LSTM 模型应用评价
ICU 有创呼吸机使用量受影响因素较小,数据相对规律,故PSO-LSTM 预测模型与LSTM 预测模型结果相差较小。目前全院27 个科室使用呼吸机,由于影响因素较多,导致全院有创呼吸机使用量的数据呈非周期性和非线性特征。LSTM 模型的预测结果欠佳,但PSO-LSTM 模型预测结果较接近实际使用情况。通过平均绝对误差、平均绝对百分比误差及均方根误差评价结果可知,使用基于PSOLSTM 模型的有创呼吸机使用量预测较准确。
4.2 有创呼吸机精细化管理
基于PSO-LSTM 算法的有创呼吸机使用量预测模型能够较准确的预测有创呼吸机的使用量提供采购建议,提高医疗设备使用效率。利用此模型,改进现有的有创呼吸机管理模式,创建全院呼吸机管理共享中心,通过预测各科室使用量,提前规划各科室有创呼吸机数量,降低管理成本,有效缩短调配时间,对提高临床急救成功率、减少急救风险具有重要意义。
5 结论
基于粒子群优化长短记忆网络算法的有创呼吸机使用量预测模型,可以推广至医院其他公用类设备的使用量预测,为公用类医疗设备的采购决策及配置调整提供科学依据,进一步改进现有的公用类医疗设备管理模式,提高其使用率,降低管理成本。下一步将根据各科室公用类医疗设备的使用情况,充分利用HIS、PACS 系统中的数据及改进相关算法模型,进一步提高设备使用情况的预测准确率,并将算法模型嵌入医疗设备管理软件中,实时监控并预测公用类医疗设备的使用情况,从而提高医疗设备的精细化管理水平。