基于时序数据的工作面设备故障预测研究
2021-09-02郑磊
郑磊
(国能信息技术有限公司,北京 100011)
0 引言
煤矿工作面设备(采煤机、液压支架、刮板输送机等)突发故障造成的非计划性停机会影响煤矿正常生产,同时会缩短设备使用寿命,增加生产成本[1]。实现工作面设备故障预测及预防性检修,提高设备的可靠性已成为热点研究课题[2-3]。
时间序列(时序)分析是一种根据时序数据预测未来发展趋势的方法。时序数据是同一指标按时间顺序记录的数据列,与设备运行相关的时序数据是在设备运行阶段随时间获取的一系列观测数据[4-5]。时序分析通常通过数据预处理、建模、预测3个步骤实现趋势预测,在多个领域得到研究和应用。如E.Erdem等[6]基于时序数据,采用自回归移动平均值预测风速和风向;蔺茜等[7]采用长短期记忆(Long Short-Term Memory,LSTM)网络,根据电力变压器监测时序数据,实现了电力变压器运行状态预测;王超等[8]通过分析与齿轮箱轴承温度相关的特征时序数据,采用LSTM网络对齿轮箱轴承温度进行预测,并通过滑动窗口对预测残差进行合理分析,实现了对齿轮箱轴承故障的有效预测。但鲜有时序分析在煤矿工作面设备故障预测中应用的报道。
本文提出基于时序数据对工作面设备进行故障预测。煤矿工作面设备通常由多个复杂系统模块组成,各模块间具有强耦合性,且设备故障机理复杂,因此在进行故障预测时需对设备的运行状态、环境参数、操作数据等进行实时监测,获取电气、机械、热工类多参数时序数据。本文以国家能源集团神东煤炭集团公司上湾煤矿8.8 m大采高综采工作面设备为研究对象,采集设备的多状态时序数据,采用时序数据处理中常用的LSTM网络建立故障预测模型,实现了设备故障的有效预测。
1 工作面设备时序数据预处理
上湾煤矿工作面设备各监测点数据均为单序列变化时序数据,根据数据变化记录时间戳,采样时间无规则。以某采煤机4个监测点数据为例,部分时序数据见表1。可看出各组数据对应的时间戳均不相同,形成独特的时序。为便于采用LSTM网络处理数据,需对原始数据进行预处理。
表1 采煤机部分时序数据
根据表1数据,基于时序对齐算法将时序数据对齐并进行前值填充,具体方法:对监测数据的时间列重新排序,以时间列为关键值,各监测数据作为标签值填入,对某一时刻空缺值以前值进行填充。对齐后的时序数据见表2。
表2 对齐后的采煤机部分时序数据
2 故障预测因素集选取
煤矿工作面设备故障种类多,各故障发生机理不同;单一设备监测点多(可达120个),监测数据量大[9-12]。针对某一故障选取最合理有效的相关因素是实现故障预测的关键环节。本文以采煤机过热跳闸故障为例进行说明。
通过分析采煤机过热跳闸故障表征现象和发生机理,得出引发过热跳闸故障的相关因素集为{滚筒温度,滚筒电流,滚筒启停,变频器跳闸状态,牵引温度,变频器设定速度,变压器温度,摇臂温度}。采用Pearson相关系数分析法[13]对相关因素集进行相关性分析。相关系数为
(1)
r取值范围为[-1,1],r>0表示存在正相关关系,r<0表示存在负相关关系,|r|≤0.3表示不存在线性相关关系,0.3<|r|≤0.5表示存在低度线性相关关系,0.5<|r|≤0.8表示存在显著线性相关关系,0.8<|r|<1表示存在高度线性相关关系,|r|=1表示存在完全线性相关关系。
1.2.4 处置及改进阶段:在培训过程中,运用PDCA循环管理,定期总结,在对新入科的CSSD护士进行培训过程中及时发现问题,提出改进措施,总结经验并进行效果评价。消毒供应专业操作项目杂、设备设施多、工作量大,因此对消毒供应中心新入科护士的培训是持续性的。对定期考核的成绩应及时分析原因并进行改进。
根据监测数据,采煤机过热跳闸故障相关因素间相关系数如图1所示。可看出变频器跳闸状态和变频器设定速度与其他因素间相关系数较小,因此将这2个因素舍弃,将{滚筒温度,滚筒电流,滚筒启停,牵引温度,变压器温度,摇臂温度}作为过热跳闸故障预测因素集。
1-滚筒温度;2-滚筒电流;3-滚筒启停;4-变频器跳闸状态;5-牵引温度;6-变频器设定速度;7-变压器温度;8-摇臂温度;9-过热跳闸。
3 基于LSTM网络的多状态时序数据预测方法
采用LSTM网络对采煤机过热跳闸故障进行预测。以故障预测因素集作为LSTM网络输入,过热跳闸故障作为LSTM网络输出。LSTM网络由递归神经网络发展而来,其细胞结构如图2所示。
图2 LSTM网络细胞结构
细胞状态为LSTM网络的关键要素,是整个LSTM网络的记忆空间。信息是否记忆由控制门控制,包括遗忘门、输入门和输出门。
遗忘门控制信息是否遗忘,即以一定的概率控制是否遗忘上一层的隐藏细胞状态。图2中LSTM网络细胞单元输入为上一层隐藏细胞状态Ht-1(t为当前细胞层数)和本层时序数据Xt,通过sigmoid激活函数(σ)得到遗忘门输出ft。ft在[0,1]之间,其代表遗忘上一层隐藏细胞状态的概率。
输入门负责处理本层细胞的输入,包括2个部分:第1部分使用sigmoid激活函数,输出it;第2部分使用tanh激活函数,输出at。
本层细胞状态Ct由2个部分组成:第1部分为上一层细胞状态Ct-1和本层细胞遗忘门输出ft的乘积;第2部分为本层细胞输入门的it和at乘积。
本层隐藏细胞状态Ht的更新由2个部分组成:第1部分为由上一层隐藏细胞状态Ht-1和本层时序数据Xt通过sigmoid激活函数得到的Ot;第2部分由本层细胞状态Ct通过tanh激活函数得到的nt。二者相乘得到Ht。
(2)
在实际生产中,迟滞性故障与其相关因素间存在时间累积效应,即相关因素经过一段迟滞时间后才引发故障。因此故障数据与故障发生前一段时间的相关因素相关。在LSTM网络训练阶段引入迟滞时间h,将输入的故障预测因素集通过h与输出故障数据建立联系,即
(3)
式(3)表明,预测阶段的输出具有时间段h的滞后性,因此确定迟滞时间段h成为研究重点。
4 试验及结果分析
根据采煤机过热跳闸故障预测因素集,选取实际生产中的9 000组数据为训练集,3 000组数据为测试集,正常数据与故障数据比为10∶1。
对数据进行归一化处理,把数据转换至[-1,1]区间,将各数据绝对值变成相对值,其实质是一种线性变换,不会导致数据失效,反而能提高数据表现。归一化公式如下。
(4)
式中:x*为归一化时序数据;x为原始时序数据;xmax,xmin分别为原始时序数据最大值、最小值。
部分归一化时序数据见表3。滚筒启停以1表示启动,0表示停止;过热跳闸故障以0表示正常,1表示故障。
表3 部分归一化时序数据
设置LSTM网络细胞层数为10,隐藏细胞数为10,学习率为0.001,一次读取样本个数为120。以均方根误差为指标,确定迟滞时间为60 min。则不同迭代次数下LSTM网络迭代损失如图3所示。从图3可看出,随着迭代次数增加,LSTM网络迭代损失表现出持续性递减,1 500次迭代后损失减小速度较小,验证了LSTM网络在时序数据下表现出良好的计算性能。确定迭代次数为1 500,以迟滞时间为变量对LSTM网络迭代损失进行计算,结果如图4所示。可看出迭代损失最小时迟滞时间为30 min。
(a)迭代次数为1 000
图4 不同迟滞时间下LSTM网络迭代损失
根据上述结果确定LSTM网络训练的迭代次数为1 500,迟滞时间为30 min,采用测试集进行故障预测,结果如图5所示。预测值为[0,1],当预测值有明显上升趋势或达0.5以上时,表明实现了故障预测。从图5可看出,实际值在72 min左右达到1(发生故障),预测值从46 min开始持续上升至0.5,实现了故障超前26 min预测,与设定的故障迟滞时间相差4 min,验证了模型具有良好的预测效果。
图5 故障预测结果
5 结论
(1)提出采用时序对齐算法对采集的煤矿工作面设备原始时序数据进行对齐及前值填充,形成了完备的基础数据集。
(2)采用相关性分析验证了故障与其影响因素间的相关性,选取了故障预测因素集。
(3)建立了工作面设备故障的LSTM网络预测模型,根据工作面迟滞性故障与其相关因素间存在时间累积效应的特点,将迟滞时间段引入预测模型,通过试验确定了迟滞时间段,并验证了采用时序数据进行工作面设备故障预测的有效性。