基于最大Lyapunov指数Elman-决策树的故障预警方法
2022-02-23黄海兵王卫玉李崇仕陈启卷
黄海兵,王卫玉,2,李崇仕,2,侯 凯,2,郑 阳,陈启卷
(1.五凌电力有限公司,长沙410004;2.国家电力投资集团水电产业创新中心,长沙410004;3.武汉大学动力与机械学院,武汉430072)
0 引言
随着机械设备故障诊断理论的不断发展,传统事后维修已无法满足日益增长的工业状态检修需求。故障预警技术可通过历史状态数据建立相应的预测模型,对未来一段时间内的状态趋势进行分析。常用的预测方法有基于统计模型的预测方法、基于物理模型的预测方法和基于数据驱动的预测方法,且主要包含三方面任务:①根据设备当前监测信息建立时间序列模型,提取特征并预测该特征变化趋势;②研究劣化评价方法,给出机组随时间推移下的状态劣化趋势;③研究机组健康评价准则,根据机组不同部件的劣化水平对机组当前及未来的运行状态进行评价,并给出维修决策及建议[1]。通常,故障预警面临着以下三方面困境:①故障类型多且成因复杂,多类模式识别往往需要分别建立模型,预测准确性随时间逐步降低;②研究对象往往为复杂耦合非线性系统,需考虑结构、摩擦、环境、外载荷等因素,其运行状态往往表现出明显的非线性动力特性,传统特征提取方法在处理非线性信号时具有局限性;③精确物理模型搭建难度较大[2]。
针对上述问题,中外学者提出可利用最大Lyapunov 指数反映系统在初始条件下微小变化导致的相空间轨道变化程度的特性进行机械故障诊断。Soleimani 通过分析齿轮箱信号[3]正常、各故障类型的最大Lyapunov 指数值,验证了其区分故障类型的能力。赵赏鑫对滚动轴承信号[4]进行包络降解及降噪处理,证明最大Lyapunov 指数可对故障劣化程度进行有效判断。由此可见,最大Lyapunov 指数在度量短序列信号的复杂度时有较高的准确性,并能对故障类型进行准确的分类,可避免建立多类模型。但针对最大Lyapunov 指数在长序列信号计算效率较低、对噪声敏感及该方法应用于故障预警的具体方法方面相关研究仍较少。
由此,本文提出基于最大Lyapunov指数的Elman-决策树的故障预警方法。首先将长序列信号依据经验及实时性的要求分为较短序列信号,建立时间序列模型,以满足后期预测的需求;并将文献[5]中提出的抗中度随机或异方差噪声的最大李雅普诺夫指数计算方法应用于故障预警领域,通过测得包含噪声的时序信号训练前馈神经网络,重构系统数学表达式,其次计算该表达式的雅克比矩阵,进而得到最大李雅普诺夫函数作为故障预测提取的特征;利用Elman 神经网络能够实现动态系统的映射并直接反应系统的动态特性,建立能够内部反馈、存储和利用过去时刻输出信息的模型,预测未来时刻的最大李雅普诺夫指数,最后训练决策树模型进行分类。本文采用正常轴承、外环人工电火花加工出裂纹(滚压方向0.25 mm、深度1~2 mm)、外环钻孔(直径0.9 mm)轴承的壳体振动信号时序数据[6]对上述方法进行了验证,结果证明在故障类型较为简单时该方法具有计算简单、预测效果较好的优势,且证明了最大李雅普诺夫指数可作为故障预警时的劣化评价方法,其值的大小可对机组运行状态进行有效评价,对故障种类进行较为精确的判断。
1 抗噪声的最大Lyapunov指数计算方法
最大Lyapunov 指数代表相空间相邻轨迹的平均指数发散率的数值特征,是衡量动力学特性的一个重要定量指标[6]。当最大Lyapunov指数小于0时,系统的状态随着指数而趋近混沌,当大于0 时系统为混沌状态。在故障诊断领域,已有学者提出该指数可用于故障分类[7],且随着劣化程度而增加[8]。为克服其对噪声敏感的特点,本文采用了Ahmed BenSaïd 提出的抗噪声的最大Lyapunov指数计算方法,流程如下:
(1)由于测量误差、噪声和混沌映射难以确立,由测量时序数据建立混沌系统的精确物理模型难度极大。所以文献[4]提出,可将一个标量时间序列{x}t拟合为xt=f(xt-L,xt-2L,...,xt-mL)形式,具体如式(1)所示。当参数选取得当时,该式即可通过前馈神经网络来拟合所有非线性函数。
式中:α0,α1,…,αj和β0,β1,…,βm,q代表需要训练的两组参数。[m,q,L]决定了拟合过程的复杂性和结果的准确性,参照文献[9]设为[5,6,5]。
(2)根据式(1)得出的拟合结果计算雅可比矩阵,如式(2)所示。
(3)最大Lyapunov系数可由式(3)得到。
式中:M=(length(X)-m*L)2/3,。
2 Elman神经网络
Elman 神经网络的结构由图1所示,由输入层、隐含层、承接层和输出层构成,输入层单元器信号传输作用,隐含层单元的激励函数分为线性与非线性两类,本文中选取Signmoid 非线性函数承接层可记忆前一时刻隐含层的输出,可看作单步延时算子,输出层单元起加权作用。Elman 神经网络本质上是一种递归神经网络,较BP 等前馈神经网络而言,Elman 神经网络增加了承接层,能自联到隐含层的输入。该自联作用增强了Elman 神经网络对历史数据的敏感性,增加了网络对动态信息的出力能力,更能直接反应动态过程的时序特性,因此更适用于对具有时变特性的故障预警问题[10]。同时,它具有更强的计算能力和网络全局稳定性。
图1中,y(t)、x(t)、xc(t)可表达为:
图1 Elman神经网络结构示意图Fig.1 Schematic diagram of Elman neural network structure
式中:y(t)为t时刻时m维输出节点向量;x(t)为t时刻时n维隐含层节点单元向量;u(t-1)为t-1 时刻时r维输入向量;xc(t)为n维反馈状态向量;ω1为承接层到隐含层连接权值;ω2为输入层到隐含层连接权值;ω3为输入层到输出层连接权值;g(x)为输出层传递函数,时常选为线性函数以叠加中间层输出;f(x)为中间层传递函数,选为Sigmoid函数。
Elman 网络的预测流程如图2所示。初始化载入并划分数据,构造样本集和测试集合,同时进行归一化以便于后续训练网络。构建Elman神经网络并初始化,随机给定权值与阈值,载入训练数据,通过式(4)、(5)计算隐含层、输出层的输出值。隐含层输出信号进入承接层,经过延时与加权后重新反馈至隐含层。计算误差函数,利用方法传播算法更新权值及阈值直至理想误差范围。
图2 Elman神经网络预测流程图Fig.2 Elman neural network prediction flow chart
3 决策树模型
决策树是根据已知的各种情况发生的概率,计算净现值期望值大于等于零的概率,评估项目风险,判断其可行性的一种决策分析方法,是一种直观地应用概率分析的图解方法。决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。
以训练集为数据基础,依据ID3算法完成特征选择、决策树生成和决策树剪枝,形成最终的决策树模型。对训练集判断矩阵进行预处理,划分训练集、测试集输入输出数据,完成特征选择、决策树生成和决策树剪枝。具体步骤如图3所示:
图3 决策树分类流程图Fig.3 The flow chart of the classification process of Decision tree
(1)计算训练集的经验熵H(S)。
式中:|S|代表总样本容量,k为分类个数,|Ck|代表属于类Ck的样本个数,K=1,2,3,…。
(2)计算条件熵H(S|K)及信息增益g(S|K),以信息增益最高的特征为根节点。
式中:pi为极大似然估计得到的概率。
(3)根节点分裂出子节点,进一步计算所有可能特征的信息增益。选取信息增益最大的特征作为节点的特征。递归地将上述方法调用到子节点以构造决策树,直到所有特征的信息增益小于给定的阈值或没有特征可供选择为止,得到最终决策树。
(4)对最终决策树进行剪枝,建立决策树学习损失函数Cα(T)以避免过拟合情况。计算每个节点决策树学习损失系数,递归回推,当损失系数最小时完成剪枝,得到最终的决策树模型。
式中:T代表决策树叶子节点;Nt代表第t个叶子所含训练样例个数;Ht(T)代表第t个叶子的熵;α代表惩罚系数。
(5)训练好的决策树模型中,以振动区判断值为输出,将预测结果与测试集判断矩阵中数据进行对比,得到预测正确率百分比。
4 实测数据分析验证
4.1 研究对象
本文选取由帕德博恩大学发布的KAT 滚动轴承状态监测的基准数据集轴承故障试验数据[5]进行预警方法验证,采样频率为64 kHz。本文选取正常轴承、外环人工电火花加工出裂纹(滚压方向0.25 mm、深度1~2 mm)、外环钻孔(直径0.9 mm)轴承各62 500 个壳体振动信号采样点用于分析,图4 例举了前3 000个采样点幅值信息,并对3组信号基本时域特征进行了简要对比。
图4 3种状态下壳体的振动波形图Fig.4 The time domain diagram of the vibration signal of the shell in 3 different fault states.
图4(a)表征了正常轴承壳体振动,图4(b)表征了外环人工电火花加工出裂纹(滚压方向0.25 mm、深度1~2 mm)后轴承壳体振动,图4(c)表征了外环钻孔(直径0.9 mm)后轴承壳体振动。当轴承无损坏时振动幅值较小,电火花加工、钻孔后,幅值有较为明显的增大,且钻孔后轴承壳体出现了周期性冲击现象。并且可从图中可提取出均值、方差、峰值等信息,总体而言正常轴承数据均值绝对值即静态分量稍小,为3.94 μm,而电火花加工、钻孔后振动值均值依次增大,分别为5.58 μm、7.45 μm。但从信号离散度及最大波动程度而言,正常轴承数据也略微优于故障数据,三组数据的方差依次为:55.31、85.86、159.31 μm2,峰值依次为:162.47、161.70、171.46 μm。但正常与电火花加工后的轴承壳体振动数据峰值与均值均十分接近,所以需进一步提取特征以用于后续故障预警。
基于最大Lyapunov 指数的Elman-决策树的故障预警方法具体步骤如下:
Step 1:为解决长序列最大Lyapunov 指数计算效率低的问题,本文将3组数据分别按每500个点分为125个短序列。
Step 2:将每组短数据带入公式(1)~(3)计算最大Lyapunov指数,按照时间顺序形成波形,用于后续故障分析及预测。
Step 3:对3组数据计算得出的最大李雅普诺夫指数分别进行归一化,并按照7:3的比例划分训练样本与测试样本,每组数据约88个训练样本及37个测试样本。
Step 4:划分训练样本与测试样本的输入、输出数据集,划分规则如下:将前6 个短序列的最大Lyapunov 指数作为Elman神经网络的输入向量,第7 个短序列的最大Lyapunov 指数作为输出向量,依次递推。
Step 5:重复章节3 中的步骤对Elman 神经网络进行训练,并预测后37个测试样本的最大Lyapunov指数,与测试集的真实输出进行对比,得到准确率。
Step 6:决策树训练样本选取方法与Elman 神经网络相同,同样需要划分训练样本与测试样本的输入、输出数据集,划分规则如下:每标签相同的8 个最大李雅普诺夫指数作为一个输入向量,输出为对应的正常或故障编号,重复4中的步骤进行决策树训练
Step 7:以预测得出的最大Lyapunov 指数作为测试集输入,真实故障作为输出,检验决策树准确率。
4.2 最大Lyapunov指数计算结果分析
图5 为3 种状态下短序列最大Lyapunov 指数对比图,可分别通过分析振动信号时域波形图能量大小与最大Lyapunov 指数的关系,分析将其作为故障预警特征的可行性。
图5 3种状态下短序列最大Lyapunov指数对比图Fig.5 The comparison of the maximum Lyapunov exponent in 3 different fault states
如图所示,正常轴承最大Lyapunov 指数处于[-0.130,-0.398]区间,为三组数据中最小、最稳定的一组,与时域波形静态信息分析、动态信息分析及实际物理意义相符。外环电火花加工出裂纹轴承最大Lyapunov 指数值所处区间稍有增大,为[-0.110,-0.199]。外环钻孔轴承最大Lyapunov 指数值所处区间最大,为[0.114,-0.130],且存在指数大于0的混沌现象,轴承运行状态较前两组更恶劣。总体而言,三组数据最大Lyapunov指数在工作状态相同时特征具有一致性,且不同工作状态下具有明显差异,验证了将其作为故障预警特征的可行性。
4.3 Elman-决策树预测结果分析
首先,通过Elman 神经网络分别对3 种状态下的最大Lyapunov指数进行预测,图6~8依次为正常轴承、外环电火花加工出裂纹轴承及外环钻孔轴承的预测结果图。
图6 正常轴承数据预测结果图Fig.6 The prediction result diagram of the normal functioning bearing
图6(a)、图7(a)、图8(a)依次为正常轴承、电火花加工后轴承、钻孔后轴承数据预测结果与真实值对比图,图6(b)、图7(b)、图8(b)依次为上述三组数据的预测结果残差图。由图可见,3 组预测数据的最大残差绝对值依次为:0.065 7,0.001 5,0.056 8,总体预测效果较好,且收敛速度远高于传统BP 神经网络。对比图6~8可看出,三组预测数据所处区间与真实值相近,且彼此间有明显区别。将预测数据分组后带入决策树训练,分别对三组数据预警准确率进行分析,结果如图9 及表1所示。外环电火花加工后的轴承数据与正常轴承数最大Lyapunov 指数范围部分重叠,所以该类型分类效果精度略微下降,但总体分类效果较好。
图9 决策树预测结果图Fig.9 The prediction result diagram of the decision tree
图7 电火花加工轴承数据预测结果图Fig.7 The prediction result diagram of theelectrical discharge machined bearing
图8 钻孔轴承数据预测结果图Fig.8 The prediction result diagram of the drilled bearing
同时设立BP-决策树为对照组,对比BP 神经网络与Elman神经网络预测的最大残差绝对值,可讨论预测精度对最后分类的影响,图10~12依次为正常轴承、外环电火花加工出裂纹轴承及外环钻孔轴承的预测结果图。
图10(a)、图11(a)、图12(a)依次为正常轴承、电火花加工后轴承、钻孔后轴承数据预测结果与真实值对比图,图10(b)、图11(b)、图12(b)依次为上述3 组数据的预测结果残差图。由图可见,3 组预测数据的最大残差绝对值依次为:0.071 7,0.034 5,0.058 43,可验证Elman 神经网络因具有承接层作为一步延时的算子在反应动态过程中具有的优势。
图10 正常轴承数据预测结果图Fig.10 The prediction result diagram of the normal functioning bearing
图11 电火花加工轴承数据预测结果图Fig.11 The prediction result diagram of theelectrical discharge machined bearing
图12 钻孔轴承数据预测结果图Fig.12 The prediction result diagram of the drilled bearing
为验证Elman-决策树方法组合的优越性,表2例举Elman-决策树、BP-决策树、Elman-SVM、BP-SVM、Elman-KNN、Elman-随机森林对3 种状态的预测分类结果,对比Elman-决策树、BP-决策树及Elman-SVM、BP-SVM两组数据可见,Elman由于具有更高的预测精度,在状态识别中分类精度也更高。对比Elman-决策树、Elman-SVM、Elman-KNN、Elman-随机森林分类精度可见,本文选取的Elman-决策树分类精度最高,在本类案例中最为合适。
表2 各方法故障预警准确性结果 %Tab.2 Results of fault early warning accuracy for comparison
5 结论
本文提出了基于最大Lyapunov 指数的Elman-决策树的故障预警方法,并用轴承数据对该方法进行了简单验证,分析结果表明:①最大Lyapunov 指数能体现不同故障的非线性动力特征,本文验证了该预测方法对简单的故障进行预测、分类的可行性;②若需处理更复杂的故障预警问题,需进一步提高数据量,并可将最大Lyapunov 指数作为故障特征的一种有效补充,本文可为故障预警提供一种新途径。□