基于自编码孪生神经网络的采煤机异常检测
2022-08-24冯银辉李务晋吴雨欣秦泽宇
冯银辉,宋 阳,李务晋,吴雨欣,秦泽宇
(1.北京天玛智控科技股份有限公司,北京 101399;2.中国矿业大学(北京) 机电与信息工程学院,北京 100083;3.中国矿业大学(北京) 化学与环境工程学院,北京 100083)
采煤机作为综采工作面的关键设备,其在煤矿开采中起着举足轻重的作用。考虑到采煤机应用场景的复杂性,其设备的退化评估是一个具有挑战性的问题。采煤机的工作状态决定了生产效益,缺乏早期的异常检测会导致系统产生灾难性问题。因此采煤机的异常检测方法对设备高效稳定运行具有重要意义[1-5]。
近年来随着深度学习技术与硬件的发展,深度学习的模式识别能力推动了机械设备异常检测方面的发展,基于设备历史工况数据的数据驱动方式成为了机械设备异常检测的可能方法。此外由于振动监测在表示故障信息方面具有良好的性能,是目前监测机械设备退化的主要监测方法[6]。目前通过采集带标签数据基于深度学习对设备振动信号建模在机械设备异常检测领域有一定研究[7-10]。
上述数据驱动的方法属于监督学习,依赖于大量标签数据。但在实际煤矿开采过程中,采集到的原始数据存在信息缺失问题,带标签的数据量贫乏甚至难以采集到标签数据,且现实世界存在未收集到的故障类型数据,因此目前的机械设备早期异常检测多在实验台仿真搭建物理模型采集数据再进行建模分析,其难以在现场真实环境得以应用。此外由于异常数据与正常数据存在极度不平衡问题,常规的机器学习模型难以达到理想效果[11-16]。
针对这些问题,本文提出了基于孪生神经网络的采煤机异常检测,该方法主要贡献如下:提出了一种采煤机运行异常状态的弱标签提取模式克服了数据标注的难题,以孪生网络结合LSTM-CNN自编码搭建了采煤机故障状态的检测模型,实现采煤机在工作状态中的异常检测。
1 采煤机主要故障分析
采煤机故障可分为截割部故障,牵引部故障,采煤机电控箱故障以及其他类故障,其中采煤机截割部故障主要指采煤机摇臂齿轮箱、截割电机及螺旋滚筒故障3大类。牵引部故障主要是由牵引电机、牵引齿轮箱、牵引块引起的故障。截割部故障及牵引部故障占总故障约50%左右[17]。
摇臂齿轮箱故障特征通常表现为高速区高温、低速区噪声异常及漏油。故障发生的主要原因通常是润滑不良;摇臂齿轮箱行星系统疲劳磨损;摇臂齿轮箱过负荷运行,工作面地质条件差,受冲击载荷大; 浮动密封损坏漏油; 齿轮润滑油乳化,润滑失效等。
截割电机电气类故障远高于机械轴承类故障,其中电气故障主要表现为电机绕阻绝缘失效,机械故障主要表现为电机轴承疲劳磨损失效,振动大。故障发生的主要原因是电机绕阻老化,高温跳闸,绝缘失效; 电机进水绝缘失效; 电机轴承疲劳磨损失效; 检修时异物进入电机内部,导致定转子摩擦等。
截割螺旋滚筒故障主要特征表现在滚筒连接螺栓松动断裂、截齿齿座脱落及滚筒疲劳磨损开裂等故障。故障发生的主要原因是滚筒安装方面滚筒连接内方头与摇臂外方头配合间隙大,引起螺旋滚筒振动大; 工作面地质条件差,滚筒负荷、冲击大,引发连接螺栓松动且维护不及时;滚筒疲劳磨损,引发齿座、滚筒体磨损开焊等失效。
牵引块故障特征主要表现采煤机停机不牵引、振动大、温度高、牵引电流不平衡、链轮、驱动及惰轮齿轮断裂、轴承故障等。主要原因为牵引块部件疲劳磨损; 牵引块润滑油不良,各轴承高温引发故障。
牵引齿轮箱故障特征主要表现采煤机牵引异常、牵引转矩轴断裂、温度高、牵引电流不平衡及密封失效漏油。主要原因为疲劳损坏,引发齿轮箱轴承齿轮疲劳磨损失效; 工作面工程质量差或地质条件差,牵引齿轮箱过负荷运行或受到冲击;转矩轴质量故障,没有起到应有的机械保护作用;密封失效故障等。
牵引电机故障主要由电机绕阻绝缘失效,或因疲劳老化、或因电机长期过载运行,冷却流量低温度高等原因所致,其次因电机轴承质量问题,引发机械故障或导致电机转子与定子摩擦故障。
本文采集截割部、牵引部电流温度共八维数据构建弱标签数据集,以LSTM-CNN自编码器结合孪生神经网络搭建神经网络实现采煤机的异常检测。
2 LCAS模型架构
本文构建了时空融合的LSTM-CNN Auto-Encoder Siamese(LCAS)神经网络,解决异常信息过少导致的数据类别不平衡问题问题,孪生神经网络减弱了类别不平衡对训练的影响,结合LSTM与CNN的自编码神经网络可以实现特征的有效提取。
2.1 LSTM-CNN Auto-Encoder
循环神经网络(RNN)在处理时序数据领域应用广泛,机械设备的工况数据具有天然的时序性。但是,原始的循环神经网络存在梯度消失或梯度爆炸问题,长短时记忆网络(LSTM)将长期依赖引入RNN,结构如图1所示。
图1 LSTM‘门’结构
LSTM通过门的结构改变cell状态,门是一种可选地让信息通过的方式。它由Sigmoid神经网络层和点乘法运算组成,Sigmoid神经网络层输出0和1之间的数字代表每个组件可以通过的信息量,LSTM有三个门,用于保护和控制cell的状态。在输入、输出、忘记过去信息上分别加入了输入门、输出门、遗忘门来控制信息通过,缓解了梯度消失或爆炸问题。公式如下:
ft=σ(Wf·[ht-1,Xt]+bf)
(1)
it=σ(Wi·[ht-1,Xt]+bi)
(2)
ot=σ(Wo·[ht-1,Xt]+bo)
(3)
式中,Xt为t时刻的输入信号;ht-1为上一时刻的输出信号;Wf、Wi、Wo分别为对应的权重参数;σ为对结果进行Sigmoid运算。
LSTM的cell包括两种不同的状态信息:一种是长期状态,另一种是短期记忆。时序数据的两个相邻的时间步之间,通过在长期状态中遗忘不太重要的信息,同时增加过滤的短期记忆的信息,结合两者输入到后续步骤。LSTM的cell的长期状态类似于“高速公路”,cell的状态类似车流在高速公路上运行,小的线性操作作用其上如同车辆离开或并入车流,信息很容易保持不变的流过整个高速公路,即使较早时间步长的信息也能携带到较后时间步长的细胞中,克服了短时记忆的影响。Cell公式为:
it作为输入门决定将哪些信息将加入到当前时刻细胞状态Ct中。ot作为输出门与Ct相乘得到输出信号ht,同时ht也作为下一时间步的输入信号传递到下一阶段,其公式为:
ht=ot×tanh(Ct)
(6)
卷积神经网络(CNN)利用卷积运算操作在诸多领域应用特别是图像相关任务上表现优异,诸如,图像分类,图像语义分割,图像检索,物体检测等计算机视觉问题,适合处理空间数据。本文采用一维卷积神经网络处理一维数据。通过卷积层能够保持数据的空间连续性,提取数据的局部特征,池化层采用最大池化降低中间隐含层的维度,减少后续计算的运算量,并提供了旋转不变性。CNN提供了数据的分层表示,将原始信号经过逐层的处理,依次识别出部分到整体。
自编码神经网络,其中编码器encoder部分将大数量级的源信息X压缩,解码器decoder部分将压缩后的信息解压成X,通过对比两者的误差,反向传递,逐步提升自编码网络的准确性,这一过程无需标签数据。其中encoder部分提取了源数据的精髓,解码器将精髓信息解压,当解压的结果与源数据一致性很高时,自编码神经网络就提取到了源数据的最具代表性的特征。相比源数据,encoder部分提取的特征维度大大降低,减少了后续神经网络训练的负担的同时能达到很好的训练效果。此时将encoder部分输出结果输送到下一环节进行处理。
2.2 Siamese孪生神经网络
孪生神经网络(Siamese Network)在处理类别不平衡数据上有良好的表现。网络一次接受两个样本组成一个样本对作为输入,分别输入到特征提取网络,将输入在新的空间映射成两个特征向量Gw(X1)、Gw(X2),其中两个特征网络Network1、Network2共享权值。计算两个特征向量的相似程度,在训练过程中通过不断优化损失函数,使两个相同分类样本对的相似性尽可能大,两个异类样本对的相似性尽可能小,从而达到区分异常数据的目的。损失函数的定义如下:
(1-Y)max(m-DW,0)2
(7)
式中,DW为某种度量距离;m为设置的相似度阈值,本文选用欧氏距离来计算两个向量之间的相似性,公式为:
其中,P为样本特征维数。
当Y=1即样本相似时,损失函数为式(9);当样本相似时,特征空间欧式距离越小,损失函数越小,当Y=0,即样本不相识时,损失函数为式(10):
当样本不相似时,其特征空间的欧式距离越大,损失函数越小。上述损失函数可以很好的表达成对样本的匹配程度,有助于模型训练时提取有效特征。网络结构如图2所示。
图2 孪生神经网络
2.3 LCAS网络构建
3 采煤机异常检测
3.1 数据集构建
方法的第一阶段涉及从采煤机原始数据提取出弱标签数据集。采煤机在综采工作面具有固定的作业时间,由于采煤机的往复工作机制,结合工况信息可以绘制采煤机随时间变化的运动轨迹,如图3所示。
图3 采煤机运动轨迹
图像的横轴代表非等长间隔的时间顺序,左纵轴代表从采煤机位置架从标号0—150,右纵轴代表在其工作位置停留时间,在作业状态下过高的滞留时间意味着采煤机发生了异常情况。根据需求,截取20—120位置架之间的数据如图4所示。
图4 采煤机局部运动轨迹
根据时间戳截取采煤机设备的截割部与牵引部的电流温度数据。为采煤机某异常状态的8维数据,如图5所示。设置滑动时间窗口(500,50),以大小为500(约10min),步幅为50(约1min),滑动截取距离采煤机异常间隔小于10min的长度为500的工况数据。以同样方式滑动截取正常数据。
图5 异常多维数据
3.2 模型训练与测试
第二阶段的基于LCAS模型的采煤机异常检测方法具体步骤如下:①对数据集进行平稳性检验与处理;②将数据成对输入到搭建好的LCES模型进行训练;③选取某月数据进行模拟部署,验证模型检测效果。
工况数据为天然时序数据,用样本时序数据的均值、方差、协方差来刻画时间序列的本质特征,这些统计量须保持在未来阶段的一个时期内维持不变,可被人为样本时序数据 具有平稳性。本文通过单位根检验(ADF)对时序数据平稳性进行判定,序列平稳就不存在单位根,ADF检验的H0假设存在单位根,通过对显著性检验统计量小于三个置信度(10%、5%、1%)则对应有(90%、95%、99%)的把握拒绝原假设,通过对数据进行差分以满足ADF检验,作为模型输入。
样本对分别输入并联的LSTM、CNN编码器,提取样本数据特征,对提取到的特征进行相似性度量,通过优化损失函数,不断增大相异类别数据提取的特征之间的差异,并使相同类别数据对的特征之间的差异更小,实现异常检测。同时通过解码器将压缩的特征还原,通过提升解码结果对于原始数据的还原度,从而增强编码器提取的特征的有效性。
实验中所选取的测试数据为某综采面采煤机一月、二月的工况数据,包含采煤机截割部、牵引部的电流温度共八维数据,通过选取与上文数据集制作时相同的滑动窗口,在测试数据上按时序滑动截取数据,模拟采煤机工作产生工况数据,将截取的数据输入训练好的模型,输出采煤机异常与否的判别情况,将结果与记录的采煤机急停数据对比,完成模型检验。
4 实验结果
本文通过对历史工况数据构建训练集与验证集完成对LCAS模型的训练,原始数据存储在influxdb时序数据库中,通过对原始数据清洗重构生成csv格式的数据,选取综采面采煤机一、二月份工况数据作为测试集对模型性能进行检测,数据包含采煤机的截割部、牵引部四个部位的电流、温度共八维工况数据。一月份数据共选取约230000个数据点,其中包含了18个异常数据节点,通过构建大小为500的滑动窗口对一月份数据滑窗截取作为一条样本数据进行测试集构建,距离异常节点小于2h的数据归为异常数据。测试数据统计见表1。
表1 测试数据统计量
一、二月份的工况数据对LCAS模型检测结果见表2、3(将异常情况视为正例),其中TP为被模型预测为正类的正样本,TN为被模型预测为负类的负样本,FP为被模型预测为正类的负样本,FN为被模型预测为负类的正样本。
表2 一月份工况数据模拟部署结果
表3 二月份工况数据模拟部署结果
一、二月份的工况数据对LCAS模型评价指标见表4。
表4 测试结果评价指标
从上述实验结果可以看出,在两个不同月份测试集上进行部署模拟,整体准确率均在97%以上,对于异常检测的精准率均在96%以上。漏警率大于10%的原因在于,部署策略通过滑动截取异常数据,在相对较远离异常点,即正常与异常数据的交界处的数据易被误检,这也是漏检易发生的区域,随着越来越接近异常点,检测的准确率也会随之提高。从诊断结果可以看出,基于自编码孪生神经网络的采煤机异常检测,通过LCAS模型对构建的弱标签数据集学习,可以有效识别出采煤机在工作过程的异常状况,且模型对数据标注需求较低,极大程度的降低了标注成本。
5 结 论
1)结合采煤机工况信息对采煤机截割部、牵引部工况数据进行标定,通过ADF单位根检验实现对时序工况数据进行平稳性检验,利用差分实现时序数据平稳化,完成数据集构建。
2)基于自编码孪生神经网络架构,并联LSTM、CNN在时间域、空间域提取不同尺度的特征,通过Concatenate层将特征合并,保证特征的泛化性、鲁棒性。通过自编码结构约束特征能最大程度代表原始数据,保证所提取的特征的有效性。利用Siamese孪生网络结构对输入的数据对进行相似性度量,在不平衡数据集上检测出异常数据。
3)以某综采面采煤机工况数据搭建模型并进行模拟部署测试,测试结果表明本文提出的数据集构建模式及模型,能对采煤机的异常情况作出有效检测,并且模型具有不错的泛化能力。