面向不等长时间序列的电梯故障早期预测
2020-04-10吉训生王大智
吉训生,王大智,李 晓
(江南大学 物联网工程学院,江苏 无锡 214122)
1 引 言
电梯是日常生活中频繁使用的楼层交通工具,我国目前电梯拥有量已达到500多万台,电梯拥有量呈持续增长态势[1],伴随而来的电梯故障问题也日益突出[2].目前,对电梯故障的识别大都依赖人工进行现场识别或者通过部件振动信号进行诊断[3],诊断效果较差.电梯是一种依靠电机运动的起重运输装置,用电机电信号的变化来描述电梯状态变化,通过电信号的分析来识别电梯已有或潜在故障,可以提高电梯的安全性和可靠性[4].
稳定持续的数据采集设备和大量可用的时间序列为电梯长期运行状态监测提供了巨大的机遇.但是,采集的大部分数据仍没有被标记,主要是由于无法控制实时采集的设置和人工专家离线标记的繁琐,因此,严重依赖标签的传统监督数据分析模型变得十分不利.近年来,针对正常数据的稀疏标记和异常数据的实时检测问题,无监督学习方法受到研究者们的广泛关注[5].然而,对于即将发生故障的早期预测并没有得到很好的解决[6].故障事件可能在它发生之前就已对正常的事件产生微妙和渐近的变化,对正常数据进行无监督分析并发现这些变化可以对故障进行有效预防.
自动编码器是一种无监督深度表示学习模型,近年来在学习图像[7]和文本[8]等数据信息方面受到了广泛的关注.当涉及到时间序列分析时,该模型由于无法准确重建异常数据点,并增加了正常数据重构误差的缺陷,研究者们多采用通过改进自动编码网络算法进行故障诊断[9].邵宝珠等人[10]将非负约束自动编码器(Non-negative Constrain Auto-Encoder,NCAE)堆叠,并将堆叠的网络应用于电缆电流的故障诊断,通过仿真实验,证明了该方法的可行性.王奉涛等人[11]对混沌萤火虫优化算法与核去噪自动编码器(Kernel Denosing Auto-Encoder,KDAE)进行了研究,并将该算法与中介轴承时域数据故障诊断相结合,解决了传统自动编码器泛化性较差的问题,并提高了故障诊断的准确率.Luay等人[12]组合自动编码器与软网输出层(Softnet Output Layer,SOL),提高了自动编码网络的性能,使脑电图信号特征提取的效果得到改善.在众多改进的自动编码网络中,长短时记忆自动编码器(Long Short-Term Memory networks Auto-Encoder,LSTM-AE)以其长时间记忆特性、重构误差在捕捉信号可见急剧变化的优异表现被提出应用于序列到序列的学习任务中,比如机器翻译[13].虽然重构误差在无监督检测突变方面取得了优异的性能,但由于重构任务的复杂性,重构误差在预测即将发生事件的性能较差[14].
目前,基于时间序列深度异常检测的研究还没有扩展到运行过程是间歇性、非周期、非高斯的特种设备中,尤其是电梯曳引机电流信号的分析.对LSTM-AE的重构误差改进的算法很多,但很少有人针对重构误差预测即将发生的事件性能差这一缺点进行改进.为此,本文提出了将相关特征选择(Correlation Feature Selection,CFS)、LSTM-AE和多层感知机(Multi-Layer Perception,MLP)3种算法相融合改进网络结构,并对时间序列固定长度截取和网络固定长度输入的不足进行划分和填充,并应用于电梯故障诊断中,有效提高了电梯故障诊断精度.在改进的算法中,首先对长时间序列按照电梯运行过程进行截取划分,减少了不同运行过程固定长度截取而导致的诊断性能差的问题.在此基础上,将不等长时间序列片段经过补零填充,有效满足了LSTM-AE固定长度输入的要求.在电梯故障诊断中引入非时间序列模型多层感知机网络,结合考虑深层编码特征和低相关性主要特征,大大提高LSTM-AE重构误差在早期预测方面的性能,诊断结果更加可靠.
2 LSTM自动编码
循环神经网络(Recurrent Neural Network,RNN)因为其具有保护时间信息的强大功能,被广泛应用于序列数据建模和特征提取[15],但由于梯度消失或梯度爆炸问题,标准RNN几乎不能长时间存储信息.改进的RNN体系结构LSTM缓解了这一问题[16].LSTM相比RNN多了一个门机制和用来存储的细胞记忆单元.一个LSTM神经元包含一个记忆细胞,ct有一个权值为1的循环自连接的边,可以拷贝自身状态的真实值和累积的外部信号.在每一个时间步长t,神经元可以选择写入、复位或读取由输入门it、遗忘门ft和输出门ot控制的记忆细胞.
LSTM的三个门控单元it、ft、ot三者计算方式都相同,区别只是使用了不同权重矩阵以便反向传播时对三个门独立更新.三个门控单元经过sigmoid归一化到[0,1]区间,可看成是二值输出[0,1],即门控单元是控制信息流通的开关.it、ft、ot的表达式如式(1)~式(3)所示.
it=sigm(Wxixt+Whiht-1+bi)
(1)
ft=sigm(Wxfxt+Whfht-1+bf)
(2)
ot=sigm(Wxoxt+Whoht-1+bo)
(3)
LSTM对各维度特征的门控单元也是独立更新的,为了简化表示,可以只考虑一维情况,从一维推广到多维很直观[17].化简到一维后,ct,ht最初公式中向量的内积可以转化成数与向量的乘积,如式(4)~式(6).
gt=tanh(Wxgxt+Whght-1+bg)
(4)
ct=ft*ct-1+it*gt
(5)
ht=ot*tanh(ct)
(6)
其中,bi、bf、bo和bg是m维偏置矢量,Wxi、Wxf、Wxo和Wxg是Rm中的权重参数,Whi、Whf、Who和Whg是Rm×m中的权重矩阵,ht是迭代t处的LSTM的输出矢量.
输出门ot-1用于保存ct-1中对ht-1有用的信息;输入门it用于判断当前输入xt是否对上文信息有用,当it=1时,使用xt作为输入.遗忘门ft用于判断当前细胞状态ct对上一个细胞状态ct-1的依赖程度,当前输入xt如果依赖上文信息,关闭遗忘门.细胞状态ct包含了当前输入xt和上一时刻细胞状态ct-1的信息,并且由于ct和ct-1之间的短路连接,在反向传播时,ct的梯度可以直接传播给ct-1,这也是LSTM能够有效缓解RNN中梯度消失和梯度爆炸的关键[18].
图1 LSTM自动编码器Fig.1 Long short-term memory networks auto-encoder
使用LSTM神经元来构建LSTM-AE,LSTM-AE包括编码器和解码器两部分.编码器学习输入时间序列的向量表示,解码器再使用这种向量表示来重构时间序列.编码器和解码器共享类似结构,即堆叠若干LSTM层.与传统的数据变换不同,网络能够保留序列的有效时间信息.如图1所示,输入的时间序列片段,yi(k),13 改进的LSTM-AE方法
3.1 时间序列的划分
由于电梯运行是一个间歇性、非周期和非高斯的过程,曳引机的电流时间序列片段长度与运行过程长短有关.因此,得到的电梯曳引机电流数据也是由不等长时间序列组成.传统时间序列划分是通过固定长度矩形窗截取,以满足LSTM-AE固定长度输入的要求,不适合电梯这类不等长、非周期的时间序列.如图2所示,根据电梯静态与动态数据交错的特性,将电流时间序列划分为不等长的时间序列片段.
3.2 不等长时间序列的填充
为满足网络固定长度输入的要求,对电梯曳引机不等长时间序列进行补零填充.针对不同层高的楼宇,时间序列填充通常以最长时间序列为标准进行补零填充.当楼宇为超高层建筑时,电梯的最长时间序列会远远超过中低层建筑.若再以原本的填充方式不仅耗时也浪费运算空间.因此,本文提出三种不等长时间序列的填充方式,如图3所示.第一种填充方式直接填充,缺点是需要知道最长序列长度;第二种填充方式,将不等长时间序列加入到特殊填充队列里,队列读取少量数据时找出最长的时间序列,其他序列都填充到最长序列中.不需要知道整体最长尺寸,运算的时间和空间要求降低,可以不断变更批训练的数量,但很可能退化回到填充方式1;第三种填充方式,同时运行的不同队列对不等长时间序列进行填充,很大程度上压缩了运算时间与空间的需求.
图2 不等长时间序列的提取Fig.2 Extraction of unequal length time sequences
图3 不等长时间序列的填充Fig.3 Filling of unequal length time sequences
3.3 改进的网络结构
LSTM-AE被训练来重建“正常”的时间序列,目标时间序列本身就是输入时间序列,然后利用任意未来事件点的重构误差判断出该时刻异常的可能性.LSTM-AE重构误差在捕捉信号急剧变化表现很好.但由于重构任务的复杂性,对于预测即将发生的事件,重构误差的性能较差.因此,LSTM-AE能很好地检测实时故障,但对于故障的早期预测问题并没有得到很好解决.
LSTM神经元会认为越往后的输入越重要,这是因为序列从前往后输入,最后一个输入的信息会更多的留下来,而且LSTM很容易过拟合[19].这样我们使用LSTM-AE对时间序列片段进行压缩,并不能最大程度的提取全部有用信息,以至于最后预测结果并不会很好.通过相关性特征选择,可以发现电梯的启动最大电流是相关性最小的特征,同时也是初始输入网络的特征.因此,选择电梯的最大启动电流作为深层特征编码值的附加信息.
论文设计了一个多层感知机网络,如图4所示,该网络包含输入层、两个隐含层和一个输出层.隐含层节点个数设置为最长时间序列的长度.学习速率设置为0.01,批处理样本数量设置为64,迭代200次,优化器选择Adam.通过堆叠三个称为深度LSTM网络的LSTM层来构建LSTM-AE网络,在训练好的LSTM-AE的基础上,只保留编码器部分以简化网络结构.具有LSTM-AE编码部分的改进网络能够间隔长期时间动态并自动学习特征表示,而且表现优秀的LSTM编解码器一定也是很好的编码器.时间序列片段经过编码器得到信号的深层特征,将信号的深层特征编码值与相关性最小特征启动电流值输入多层感知机网络来重构预测启动电流值.引入附加输入作为一种辅助信息来弥补LSTM神经元对初始输入重要性的忽略.通过比较预测值和真实值,设定阈值揭示故障发生前的隐藏变化,实现故障的早期预测.
图4 LSTM-AE+MLP网络结构Fig.4 LSTM-AE+MLP network structure
4 实验结果与分析
实验选择某小区同批次生产并同时投入使用的74台层高为23层的电梯数据,实验数据的采集来自实验室开发出的基于电梯物联网的数据采集系统,采集的数据包括电梯的运行速度、瞬时电压、瞬时电流、频率、当前楼层、系统状态、控制器状态、电梯故障、电梯状态和轿厢状态.数据采样周期为5s,当电梯静止时的采样周期是3~4min.
在数据采集过程中已进行了数据清理,如图5所示.可以发现,同台电梯相同运行过程表现出的时间序列形状十分相近,但仍有因为控制器编码受干扰导致的明显错误.首先找到13层到3层所有样本的基线标准值,然后将每个样本与基线样本值进行一元线性回归运算,最后删除线性平移量与倾斜平移量大的样本,实现同种运行状态数据的筛选.如图6 所示,该台电梯13层到3层电梯电机电流的时间序列经过筛选后滤除了明显的不可用数据.
图5 未经筛选的某一下行过程数据Fig.5 Unfiltered downlink process data
图6 筛选后的采集数据Fig.6 Filtered downlink process data
图7给出了电梯某一上行运行情况,电梯上行过程也具有相近的时间序列形状.如图8所示,它展示了同一台电梯的不同运行状态电机电流时间序列的均值,对于每一种运行状态,它以一条线相连不同采样时刻电流的均值.无论是时间序列的长度还是最大启动电流或者是最大制动电流,电梯的不同运行过程表现出明显的差异性.
图7 经筛选后的采集数据Fig.7 Filtered uplink process data
图8 不同电梯运行情况的差线图Fig.8 Deviation chart of different elevator operation
通过测量可知,每台电梯平均每天有150次运行过程.根据物联网电梯维保平台系统的某一电梯安全开关断开故障的时间信息,选择故障发生之前一个月的电梯电机运行电流时间序列数据作为训练样本,故障当天的数据作为测试样本.针对不等长时间序列,采用填充方式1对事件序列进行补零.由表1可知,不等长时间序列片段的最大长度为10.通过LSTM自动编码器对时间序列片段进行编码,编码值很大程度上保留了时间序列的长度和内在结构信息,实现了不等长时间序列信息的压缩与提取.
表1 不同电梯运行测试集的编码情况
Table.1 Code for different elevator running test sets
编号0123456789编码值启动电流9350.0021.5611.1301.0561.0070.7080.0020.0000.0000.00030.3461.56114530.0020.5980.8310.7950.6900.0810.0020.0000.0000.00022.6130.59813730.0021.4291.0650.6360.0020.0000.0000.0000.0000.00023.9121.42910020.0021.1671.1661.1281.0360.0190.0020.0000.0000.00028.2161.16718650.0021.2721.0200.9660.9450.9150.6690.0020.0000.00031.0361.2722480.0020.3740.0910.0020.0000.0000.0000.0000.0000.0005.6420.3743330.0021.7630.8940.1600.0020.0000.0000.0000.0000.00021.8721.76315010.0020.1740.3551.2330.0020.0000.0000.0000.0000.00012.4480.1749440.0020.0840.7320.0020.0000.0000.0000.0000.0000.0007.4880.0845360.0020.2520.1000.0020.0000.0000.0000.0000.0000.0004.8310.252
某台电梯的各种运行状态的电机电流时间序列片段经过方式1进行填充,将每一个采样点时刻的电流数据作为该时间序列的特征变量.不同时刻采样特征的相关矩阵热力图如图9所示,如果变量之间的相关性是‘1’,则意味着它们高度相关且受直接正比例的约束;如果变量之间的相关性是‘-1’,则意味着它们高度相关且受直接反向比例的约束.我们发现采样时刻'1'对应的相关性最低,即启动最大电流在整个时间序列片段中变化最大.结合实际,电梯故障也一般发生启动或制动时刻.因此,选择最大启动电流与编码值一同输入改进的网络结构中预测每个时间序列片段的最大启动电流.
如图10所示,LSTM自动编码器与多层感知机结合的网络是收敛的.将待测试的不等长时间序列填充为最大时间序列长度10,输入已经训练好的LSTM自动编码器进行编码,将编码值与最大启动电流值输入多层感知机网络进行预测每个运行过程的最大启动电流.
图9 不同时刻采样特征的相关系数矩阵Fig.9 Correlation coefficient matrix of samplingfeatures at different times
如图11所示,通过比较预测值和真实值,计算它们的误差,通过设定误差阈值±0.5,成功检测出故障和故障发生前6层,安全开关断开,电梯故障产生.因此,通过设置阈值可以实现电梯故障早期预警,根据电梯运行楼层信息13层确定需要的维保部件.
图10 改进网络的loss曲线图Fig.10 Loss curve of the improved network
的早期异常.此处异常情况以电梯安全开关开合为标志.电梯运行过程在早期预测故障点处13层到3层产生了异常,影响了该电梯电机电流时间序列的值与结构,当电梯运行13层到
图11 长时特征的电梯故障早期预测Fig.11 Early prediction of elevator failure withlong-length characteristics
上述时间序列是针对长时间的运行过程而言,对于短时间序列由于采样点过少,时间序列的信息相比于长时间序列较少,可以通过减少LSTM自动编码器+多层感知机网络的层数来重构预测启动最大电流,同样实现电梯故障的早期预测.如图12所示,电梯发生运行中门锁断开故障,检测到的电梯故障早期预测为相邻的两个运行过程,4层到3层,3层到4层,在3层停留还产生突变电流.因此,推测电梯在3层的门机系统出现故障需要维保.
图12 短时特征的电梯故障的早期预测Fig.12 Early prediction of elevator failure withshort-length characteristics
表2列出了不等长时间序列填充方式的效果比较.可以看出,传统LSTM-AE通过固定长度划分时间序列的方法并不适用于电梯这类间歇性过程,且可以明确划分时间序列片段的情况.LSTM-AE+MLP网络可以成功识别电梯早期故障,平均准确率达到85.3%.通过比较不同时间序列的填充方式,填充方式1虽然训练时间较长但是均方根误差最小.对于社区、百货、医院等中低层建筑,填充方式1即可满足需求.对于超高层建筑电梯数据使用的填充方式3,可以很大程度压缩训练与测试的时间.
表2 不等长时间序列的填充方式的比较
Table 2 Comparison of the filling methods of unequal length time sequences
不同填充方式报警阈值训练时间测试集RSME平均准确率平均提前预测时间LSTM-AE/±0.8201s49.3463//LSTM-AE填充方式1±0.4214s0.253085.3%41分钟+填充方式2±0.5209s0.269181.7%37分钟MLP填充方式3±0.4207s0.285480.1%34分钟
5 结 论
本文采用LSTM-AE的编码部分与MLP相结合的方式简化LSTM自动编码器的网络结构,解决了LSTM-AE重构误差在预测即将发生的事件的性能较差的问题.为了适应电梯这类间歇性、非周期和非高斯运行过程,改变时间序列片段截取方式.针对运算时间和空间的优化,提出三种不等长时间序列的填充方式.通过相关特征选择确定附加特征信息弥补了递归网络对初始输入重要性忽略的缺点.仿真实验表明,LSTM-AE+MLP结合的改进模型相比传统的固定长度时间序列划分方法具有更高的故障早期预测准确率,平均准确率达到85.3%.为电梯故障早期预测和不等长时间序列异常检测提供了一种切实可行的办法.