APP下载

基于LSTM的医疗设备故障预警模型研究

2022-09-28张云华

智能计算机与应用 2022年9期
关键词:梯度神经网络预警

马 超,张云华

(浙江理工大学 信息学院,杭州 310018)

0 引 言

国内医疗行业迅猛发展,越来越多的先进医疗设备被研发出来,投入到医院的临床应用中,为患者的治疗做出了积极的贡献。但与此同时,医疗设备故障也屡见不鲜。现代医疗设备大都利用计算机技术、放射技术、自动化技术和影像处理技术等,系统庞大,设计复杂,通常都需要配有单独的设备机房,并配有相关维护管理人员。设备管理人员如果能提前发现设备存在的隐患并及时处理,能够避免一系列事故。

近年来,国内外学者针对医疗设备的故障预警做了很多研究。熊刚等人利用单片机整合了设备监控的各个传感器的检测数据,通过各传感点的数值是否处于正常阈值内来决定是否上报警告。徐立坤等人利用基于改进的BP神经网络进行设备的故障预警研究,基于历史故障数据和粗糙集理论对神经结构和算法进行优化。陈艳等人利用粗糙神经网络和数据挖掘技术研究医疗设备故障预警。

故障的预警并不是在故障发生时才发出警报,而是借助于先前一系列的变化数据来推断后续的数据曲线,从而提早发现问题数据,做出相应的警报。循环神经网络(Recurrent Neural Network,RNN)是一种用于处理序列数据的神经网络,但在长序列训练中会出现梯度消失和梯度爆炸问题。长短期记忆神经网络(Long short-term memory,LSTM)在RNN模型的基础上进行的改进,增加了门控机制的设计,使得其在较长的序列中有更好的表现,有更久的记忆特征,在数据预测方面优势明显。

本研究采用LSTM-RNN的神经网络模型对医疗设备的故障预警进行研究,在分析了医用红外热像仪的相关故障数据后,列出了8项故障特征点,采集其数据并进行预处理,作为实验的数据集,同时与BP神经网络、RNN神经网络预测模型进行实验对比,验证本模型的高效性。

1 相关知识

1.1 循环神经网络

循环神经网络(RNN)是一种具有循环结构的神经网络,能够很好地处理序列变化的数据,其网络结构如图1所示。模块在时刻同时读取了输入X和上一个时刻的输出数据h,输出h并进入下一个循环,通过对数据的循环处理来提取序列中随时间变化的特征。

图1 RNN网络结构Fig.1 RNN network structure

1.2 长短期记忆神经网络

长短期记忆神经网络(Long short-term memory,LSTM)是一种特殊的RNN。RNN在长序列训练中,梯度随着距离增加逐渐减弱,整个模型的梯度被近距离的梯度主导,难以学到远距离的依赖关系。LSTM通过门控设计,有选择地传递记忆信息,避免了长序列训练中发生上述问题,在数据预测领域有广泛的应用。

传统的LSTM在时刻的细胞单元结构如图2所示。设计了3个门来保护或丢弃细胞的信息,分别是输入门(i)、遗忘门(f)和输出门(o)。图2中,x表示一个输入节点,用来对应一个特征参数,在本文中代表影响红外热像仪运作的重要特征点,h表示时刻单元的信息输出向量,C表示时刻记忆细胞的计算状态。

图2 LSTM单元结构Fig.2 The unit structure of LSTM

LSTM通过3个阶段来传递信息。对此拟做阐释分述如下。

(1)第一阶段。利用遗忘门丢弃细胞状态中不需要的信息,对此可表示为:

其中,为函数;W为遗忘门系数权重矩阵;h为前一时刻的输出;x为此刻的输入;b为遗忘门偏置矩阵。

(2)第二阶段。选择记忆阶段,通过输入门来选择将要更新的值,对此可表示为:

其中,i为输入门信息,为函数;W为输入门系数权重矩阵;h为前一时刻输出;x为此刻的输入;b为输入门偏置矩阵。

创建一个新候选值向量~C,加入到状态中,推得的数学公式可写为:

其中,为数学函数;W为权重矩阵;h为前一时刻输出;x为此刻的输入;b为偏置矩阵。

更新细胞状态C,将旧状态与遗忘门相乘,确定需要丢弃的信息,并加上输入门的新候选值,得到最新的状态,推得的数学公式见如下:

(3)第三阶段。是输出阶段。首先对输入进行函数运算,然后对细胞状态进行函数运算,并将两者输出相乘,得到最终输出信息h,数学公式分别如下:

其中,o为输出门信息;为函数;W为输出门权重矩阵;h为前一时刻输出;x为此刻输入;b为输出门偏置矩阵。

LSTM通过3个阶段门状态的控制来传输状态,选择记忆有用信息,遗忘无用信息,减少特征丢失,有效避免了长期依赖以及梯度消失的问题,更有利于依据长期的数据进行预测分析。

2 模型构建

2.1 输入层设计

本文研究的医疗设备是医用红外热像仪,需要确定会导致此类设备出现故障的主要影响因子作为预测模型的输入。结合此类设备的运行特征以及历史故障的原因,确定的输入参数见表1。

表1 模型输入参数表Tab.1 Model input parameters table

2.2 数据预处理

由于各项数据范围差别很大,随着训练的迭代,模型难以收敛,梯度下降得比较慢,精度也不高,所以需要对输入数据进行预处理。本文使用数据归一化处理,使得每个特征数据的分布都在0~1之间,基本趋于一致,有利于梯度下降,加快模型的收敛速度,方法计算公式为:

其中,为实际值;表示该项数据中的峰值;表示该项数据中的最低值。

2.3 模型设计

本文的预测模型采用LSTM加全连接层的结构设计,由一层LSTM输入层、层LSTM隐藏层和2层全连接网络以及一个输出层组成,模型结构如图3所示。利用LSTM控制各项特征的长时记忆,并结合全连接层将LSTM训练得到的输出向量进行维度转换、特征深度融合。采用Adam优化器进行优化,利用梯度的一阶矩估计和二阶矩估计来改变各个参数的学习率,各个参数在学习率的动态调整下逐渐调到最优。

图3 LSTM模型Fig.3 LSTM model

3 实验与分析

3.1 数据集

本实验的数据集选用某医院医用红外热像仪相关数据,采用传感器采集以及调用仪器SDK开发包程序进行采集的方式收集了该设备8项特征点最近一年的数据作为本实验的训练集和验证集。

3.2 评价指标

为了准确地计算出模型预测数据与实际数据之间的偏差,本实验选用均方根误差()和平均绝对百分比误差()来衡量实验的预测效果,数学定义公式具体如下:

其中,(x)是模型的预测值,y是实际值。

3.3 参数设置

经过多次调整模型参数并根据和的结果,选择了最优的模型参数配置,见表2。

表2 参数设置表Tab.2 Parameters setting

3.4 实验结果

利用训练集数据训练后统计的训练集损失结果如图4所示。从图4结果可知,该模型对数据的拟合效果较好,模型的均方根误差在前几次迭代中快速降低,然后逐渐缓慢降低。

图4 模型的训练集损失Fig.4 Training loss of the model

为了验证本实验模型的有效性,基于同一数据集对BP神经网络、RNN神经网络等预测模型进行对比实验,利用和指标进行评估,具体评价结果见表3。

表3 预测模型的评价结果Tab.3 Evaluation results of prediction model

实验结果表明,通过提取医用红外热像仪的8项特征数据,并利用LSTM的模型进行训练的拟合效果最佳,值为0.023 5,值为1.69%。相比于BP、RNN等其他的神经网络预测模型,LSTM预测模型的预测误差更小,性能更好。

4 结束语

本文针对现有医疗设备故障预警研究存在的漏报、误报、不及时报警等问题,提出了基于LSTM的预警模型。利用LSTM在长时记忆特征的优势对可能影响医疗设备正常运行的特征数据进行深度学习,给出特征的未来序列预测,分析设备可能发生的故障,达到故障预警的目的。通过对采集到的设备特征数据进行实验,验证了本模型的高效预测性能,对数据的拟合效果较好,预测准确度明显高于BP、RNN等预测模型。该模型可为实现医疗设备的故障预警提供了参考。

猜你喜欢

梯度神经网络预警
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
烽火台:军事预警体系的关键
MIV-PSO-BP神经网络用户热负荷预测
超级秀场 大风预警
一个具梯度项的p-Laplace 方程弱解的存在性
内容、形式与表达——有梯度的语言教学策略研究
航磁梯度数据实测与计算对比研究
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
组合常见模型梯度设置问题