APP下载

基于深度学习LSTM的空调故障诊断

2019-08-13陆慧娟叶敏超

中国计量大学学报 2019年2期
关键词:冷水机组故障诊断空调

花 君,严 珂,陆慧娟,叶敏超

(中国计量大学 信息工程学院,浙江 杭州 310018)

目前空调故障频繁发生,空调设备复杂,故障原因种类繁多,并且空调故障是伴随着设备电子元器件的老化逐渐显露出来,当人们察觉出来时,往往故障程度已经很严重,因此对空调故障进行及时的检测诊断,以避免在故障状态下运行产生巨大能耗和安全隐患,具有可行性和现实意义[1-3]。近年来,空调设备越来越复杂同时也更加智能,传统的诊断技术远远不能满足现代空调设备诊断的需求[4-7],在这样的局面下,深度学习技术慢慢崛起,很多学习模型中都很好结合了时序数据的特点[8],训练性能不断提高。循环神经网络(Recurrent neural networks, RNN)[9]是运用内部的记忆来处理任意输入的时序数据,通过自循环的结构能长久的让数据在网络层上传输。在工业故障诊断方面,RNN使现有的神经网络故障诊断的方法不断提高,更加适应现代较复杂的设备并且在实时故障诊断中扩展性大大的提高。但由于存在梯度消失和梯度爆炸、长期记忆能力不足等问题,为解决该问题,1997年,Hochreiter和Schmidhuber等人[10]提出长短期记忆网络(Long short-term memory, LSTM)[11]即在RNN中添加了三个门控机制,即输入门、遗忘门和输出门,使梯度消失和梯度爆炸的这样的难题可以很好的处理[12-14]。

集中式空调中冷水机组(Chiller)系统消耗能量很大,频繁出故障,是很重要的一个子系统[15-16]。本文针对冷水机组数据,提出了一种基于LSTM的空调故障诊断模型并且通过多次实验调节、优化得到较优的LSTM模型,实验表明,所搭建的模型能对空调故障进行准确的诊断。

1 LSTM记忆循环神经网络

LSTM记忆循环神经网络是对RNN结构进行改进,LSTM在算法中加入了一个带有依此通过三个门并进行判断和更新的cell结构Ct。根据信息传入到cell中判断当前是否是符合算法认证,LSTM会只记住需要记住的信息,会直接遗忘无用信息,在这样的判断下不断调控,使误差保持恒定。

如图1,时间的连接是被LSTM记忆单元状态——细胞状态Ct进行调控,通过三个门结构对细胞状态更新,cell中每个时刻不同gate的计算公式如下:

ft=σ(Wf×[ht-1,xt]+bf),

(1)

it=σ(Wi·[ht-1,xt]+bi),

(2)

(3)

(4)

ot=σ(Wo·[ht-1,xt]+bo),

(5)

ht=ot·tanh(Ct)。

(6)

图1 LSTM神经元cell结构图Figure 1 A long short-term memory cell

2 基于LSTM的故障诊断模型

2.1 网络模型整体框架

冷水机组故障数据,模拟了空调冷却器系统正常样本各类故障数据并进行整理,根据故障严重程度不同进行划分,利用空调故障数据的时序性,搭建包含输入层、隐藏层、输出层、网络训练模块的LSTM的空调系统故障诊断模型,网络模型整体框架图如图2。

本文搭建了两层网络,如图2,逐层训练LSTM,将上一层LSTM网络的隐藏层的神经元的输出与下一层相对应,进行计算,并输出序列的最后数据数入Softmax分类器作为输出层,把预测标签y′为再传入网络优化模块进行不断优化模型,通过实验对比选出最优参数并进行交叉验证,搭建相对最优的LSTM模型。在网络训练及优化模块中,选择合适的损失函数很重要,使用Softmax输出时,选择交叉熵Cross entropy。

通过不过优化器进行对比,相同参数下取不同优化器(Adadelta、AdaGrad、RMSProp、Adam、Nadam、Adamax)对模型进行训练进行对比发现Nadam对学习率约束和梯度的更新影响较优,因此选择Nadam算法作为模型的超参数优化算法。

图2 基于LSTM冷水机组故障模型框架Figure 2 A fault model framework based on LSTM water chiller

3 实 验

3.1 实验数据

本数据来自于美国供暖、制冷与空调工程师学会(ASHRAE)的第一个工程包ASHRAE project 1043-RP,是一架90 t的离心式冷却器。实验选取了由4种不同严重程度的数据组成的5种故障种类的数据包,如表1。

表1 故障严重性级别

数据集首先进行预处理,数据集分为两部分,前2/3用作历史数据或培训输入,其余1/3的数据作为测试样本处理,训练数据样本根据其故障类型(正常、F1、F2、F3、F4和F5)。测试集数据不仅选取了故障程度等级分别为一级、二级、三级、四级的数据组成的4组数据集进行测试,还从4种故障严重程度数据集中进行随机组合成一组混合数据集,以这5组数据作为测试集验证网络训练的模型。

3.2 评价指标

本文选用冷水机组故障数据测试所得的分类准确准确率(Accuracy)作为评价标准,衡量的是故障样本分类正确的比例。Accuracy的计算公式为

(7)

模型诊断的故障标签和实际故障标签相同率较高,分类越准确,Accuracy也越高。

3.3 实验结果及评估

模型使用美国冷水机组数据进行性能评估,选取合适的超参数可以提高模型的整体训练性能。

测试集选用故障严重程度为一级的数据集。为避免实验测试的偶然性,其中每次实验进行30次取实验结果的平均值。通过固定其它参数不变而变化一种参数进行实验。初始参数如表2。

表2 初始参数

3.3.1 不同迭代次数的网络诊断结果

观察不同的迭代次数下训练准确率和损失函数变化,如图3,迭代次数慢慢增加,训练准确率呈上升趋势,并且在迭代次数为80之后,趋于平稳;损失函数随着迭代次数增大经历了先下降又递增波动的过程。这说明迭代次数过大将导致模型产生了严重的过拟合。因此,将迭代次数定为50。

图3 不同迭代次数下,LSTM模型训练误差和验证误差变化以及损失函数的变化Figure 3 LSTM model training error and verification error with various epochs

3.3.2 不同参数下的网络诊断结果

如图4(a),在相同参数下取不同LSTM层数的选择(Layer=1,2,3,4)对模型进行训练,实验表明,LSTM层数并不是越多越好,基于本数据集,数据量不是非常庞大,过多的隐藏层层数会导致过拟合,因此,模型选用2层LSTM层。

小批量梯度下降算法(Mini-batch gradient descent)被用在本模型的训练模块,针对训练的样本数量大,相对于随机和批量梯度相机算法,该算法更能使模型收敛波动平稳,合适的小批处理量能大大提高网络收敛速度。网络的损失函数定义为

(8)

其中B表示一个批次中样本的数量。相同参数下取不同批处理量进行试验。通过实验对比,小批处理量为32时模型性能最好。

为了研究隐藏层神经元个数对网络训练的影响,实验中多次调整神经元个数,通过对比确定神经元个数为32效果较优,收敛速度也最快。

如图4(b)在相同参数下取不同丢弃率(Dropout_rate=0.1,0.2,0.3,0.4,0.5)模型的训练会出现过拟合,因此在每层LSTM后加Dropout层。Dropout可在模型的训练过程当中,一定概率的丢弃网络单元,使网络的结构发生了变化,减少冗余。实验结果得出丢弃率为0.1时效果较好。

学习率的选取常常是模型中最难调试的一个参数。在相同参数下取不同学习率(Lr=0.001,0.002,0.003,0.004,0.005)进行实验,效果如图4(c),可清楚的看出,学习率为0.002时分类准确率最高,因此,将模型学习率定为0.002。

序列长度的选取对整个模型效果的影响也非常重要,通过实验对比,由实验结果图4(d),模型的序列长度定为16时,模型的分类准确率最高。

通过固定其它参数不变而变化一种参数和交叉验证的方式选出最优的LSTM模型参数,如表3。

图4 固定其它参数不变而变化一种参数下分类准确率的变化图Figure 4 Classification accuracy with one parameter changed

表3 最优模型参数

3.3.3 对比传统RNN和GRU

将将本模型在4个不同故障程度等级分别为一级,二级,三级,四级以及混合选取不同故障程度的数据集上进行测试,评价指标使用准确率(Accuracy)。并和RNN和GRU进行了对比实验,实验结果如表4。从图5可以清楚的看出,除了RNN方法只在故障程度为三级的数据集中表现最优,其他四组实验中,LSTM模型中分类表现都比RNN和GRU和好,这说明搭建的LSTM模型泛化能力比RNN和GRU好。

表4 三种方法在5组数据集中诊断性能对比

Table 4 Diagnostic performance comparison of three methods in five data sets

故障严重程度RNNGRULSTM10%0.707 90.827 30.828 620%0.846 90.871 30.869 330%0.938 50.933 20.931 340%0.901 00.906 40.911 6混合0.855 10.874 00.886 5

图5 三种方法在5组数据集中诊断性能对比Figure 5 Diagnostic performance comparison of three methods in five data sets

4 结 论

本文提出的搭建的LSTM的空调故障诊断模型,包括模型的框架、网络结构、超参数优化等内容。并使用冷水机组故障数据进行训练,对5组不同故障严重程度数据进行训练。本模型很好地利用了故障数据中时序的关联性,利用了前后故障样本对当前故障样本的影响,从而为空调故障的及时准确地诊断提供了保障,减少了维护人力成本,尽早地发现了故障种类并针对性地进行维修,进而提高了能源利用率,使设备使用年限大大延长。但是,该模型对于故障严重程度较低的情况其诊断准确率还不够高,故,我们的后续的工作准备通过加入T-SNE对数据进行降维等寻求更有效的参数优化方法和在保证故障诊断率的同时提高故障诊断的快速性,使之能做到诊断更及时并减少能源消耗。

猜你喜欢

冷水机组故障诊断空调
基于物联网的冷水机组节能与安全分析
中央空调系统冷水机组优化控制策略研究
基于包络解调原理的低转速滚动轴承故障诊断
多台冷水机组联合运行优化控制策略
水冷磁悬浮变频离心式冷水机组
数控机床电气系统的故障诊断与维修
空调病是怎么回事
基于量子万有引力搜索的SVM自驾故障诊断
奔驰E260车空调不正常
迈腾车空调不制冷