APP下载

基于振动能量趋势预测和K均值聚类的水电机组故障预警方法研究

2019-08-24曲力涛潘罗平曹登峰郑云峰

水力发电 2019年5期
关键词:均值聚类预警

曲力涛,潘罗平,曹登峰,郑云峰

(1.中国水利水电科学研究院,北京100044;2.北京中水科水电科技开发有限公司,北京100038)

0 引 言

水轮发电机组在运行过程中常伴有剧烈的非线性振动,该现象影响机组运行的稳定性,进而导致故障。根据故障特征参数的变化特征可将转子系统故障分成缓变和突变故障,其中前者特征为在从正常状态到故障发生的过程中参数发生连续的变化,而后者存在参数的非线性“跃迁”,同时后者的发生将造成更大的破坏性[1,2]。采取实时预警策略可防止预防此类故障的发生及扩大,具有重要的安全和经济意义。

机组运行过程中的振动数据中蕴含丰富信息[3],但考虑到振动信号幅值对机组运行状态的描述能力有限,于是本文以振动幅值为基础计算信号能量值来表示机组状态。现有的机组预警方法大多采取固定阈值的策略,例如设定状态参数变化百分比[4]及以参数标准差的3σ法[5]。若故障参数跃迁出现在阈值以下,固定阈值方法则会出现故障预警不及时问题。本文采用以Teager算子提取的振动能量值非线性时间序列预测为基础,以欧式距离为测度的k均值聚类方法实现机组突变故障的实时预警策略。

1 振动信号Teager能量

1.1 振动能量提取

Teager能量算子是通过将信号瞬时幅值与信号微分进行非线性组合来计算产生该信号所需能量,该方法对信号的瞬时变化有自适应能力,且计算复杂性低[6]。Teager能量算子Ψ表达式为

(1)

(2)

Ψx(t)=ΨAcos(ωt+φ)=A2ω2∝E

(3)

对比式(2)、(3)可知,能量算子与简谐振动所需机械能成正比,表明该算子能在固定常数意义下实现对简谐振动机械能的追踪[7]。由于在实际对机组监测的过程中所采集的信号均为离散信号,设离散样本为xn=Acos(nΩ+φ),Ω为数字频率,相邻3个离散样本经变换可得

(4)

(5)

利用上式可以计算出单分量振动信号的能量表示,而实际通过传感器采集到的机组振动信号包含着多种频率成分,无法直接计算振动信号能量算子,因此采用对原始信号进行分解计算再重构的策略完成信号能量计算。

1.2 振动信号EMD分解

经验模态分解(EMD)能够将时间序列信号中不同尺度的波动或趋势逐层分解,进而生成一系列不同尺度的数据序列,即本征模式函数(IMF)[9]。分解过程为先通过特征时间尺度获取IMF,再由IMF来分解时间序列数据。设EMD算法将所输入的振动时间序列信号分解成k层。分别对每层的数据序列计算能量算子{Ej(n)}

(6)

再对各层计算结果求和得到振动能量非线性时间序列数据{E(n)},并输入至预测模型。

2 振动能量序列预测

2.1 神经网络时间序列预测

由振动序列为基础得到能量序列继承了其随机特性,无法对其进行长期预测,但其内部存在复杂而具有确定性的规律,因此对其进行短期预测。对任意非线性时间序列都可将其当成是由非线性映射关系确定的输入-输出系统,同时神经网络可逼近任意非线性函数,因此其能够预测机组振动能量时间序列数据[10]。

图1 神经网络结构示意

神经网络基本结构如图1所示,其能够描述复杂的非线性映射关系,可通过训练使其学习样本的内在规律,建立输入和输出间映射关系,同时该映射可适用于样本外的同分布数据。训练网络模型常采用误差逆传播(BP)算法,其基于梯度下降策略进行参数更新[11]。

时间序列预测是根据历史观测数据来获取数据变化的规律信息,并计算出下一时刻的数据值。记非线性时间序列为{xn},预测步数为k,输入维度为m,数据延时为τ。通常神经网络数据延时间隔τ=1较为合理[12],故预测模型可表达为

xn+k=f(xn,xn-1,…,xn-m+1)

(7)

2.2 欠完备自编码器

自编码器(AE)属于神经网络,其经过训练后能够实现将输入复制到输出功能。如图2所示,自编码器包括输入层x、隐藏层h和输出层r,其中隐层h可以产生编码来表示输入,同时网络可以拆分成函数h=f(x)表示的编码器和生成重构的解码器r=g(h)[13]。

图2 自编码器示意

对自编码器施加限制条件使隐藏层维度小于输入层,即为欠完备自编码器(UAE),其能强制编码器学习到训练样本的显著特征。UAE的学习过程可近似为根据输入与输出间的差异实现惩罚的最小化损失函数过程。

2.3 综合趋势预测模型

预测模型整体结构如图3所示,其内部由输出-输入连接的ANN(神经网络)和UAE组成,输入数据为根据机组振动信号计算的能量值,输出作为预警模型的输入完成故障预警任务。在将数据输入网络之前需按式(9)进行归一化处理。

(8)

综合预测过程为先ANN做初步预测,在由学习到历史序列内部特征的UAE对结果进行校正,其目的是减弱标签值对预测结果的影响。

图3 综合预测模型示意

3 k-均值聚类突变故障预警

设输入样本集为D={x1,x2,…,xn},k均值聚类目标是将样本集根据相似度分成k个簇,即C={C1,C2,…,Ck},其中k的取值应在聚类前给定。簇内相似度通过式(9)来描述,E为平方误差,μi为簇Ci的均值,其中E取值越小则簇内相似度越高。

(9)

最小化E需考察样本集D中所有簇划分情况,因此采用贪婪策略,通过迭代优化近似计算最小化平方误差E[11]。聚类过程为先从样本集中随机选取k个样本作为各簇初始均值,再计算各样本与各均值μi的距离,并将其划至与相距最近的簇,然后根据划分结果计算新的均值代替上一步均值,重复该过程直至聚类结果不再变化[14]。将训练集和预测值作为输入样本集进行k均值聚类,若聚类将训练集和预测值分成两个不同的簇则表明下一时刻的状态与历史状态有显著差异,发出预警信号;反之,则状态正常,不发出预警信号。

4 实例验证

以某电厂机组顶盖水平X、Y方向振动为对象,分别对其在稳定工况下采集的数据和在其基础上插入故障的数据来验证本文提出的预警方法。在稳定运行工况采集到50 s顶盖水平X方向振动信号如图4(a)所示。首先对原始信号进行EMD分解成多个不同尺度的IMF,再对各IMF分别计算Teager能量并求和得出振动信号能量值,最后按500∶1对能量信号降频得到振动信号能量序列如图4(b)所示。

采样频率fs=1 kHz,低频振动频率f

图4 原始信号和Teager能量

对神经网络超参设置为输入、输出和隐层神经元个数分别为5、3、8;学习率为0.05;学习迭代次数为150。以输出层神经元结果的均值作为单步预测结果。由图5预测结果可见,神经网络可预测到能量的细节变化,若以该结果进行聚类预警易因信号自身的波动而导致误预警。

图5 神经网络预测结果

将初步预测结果输入至欠完备编码器中进行校正。如图6所示ANN-UAE趋势预测结果一方面能够反映信号的变化趋势,另一方面降低了信号的波动幅度,可避免由于信号的随机性导致误报警问题。

图6 综合模型趋势预测结果

图7 X、Y方向振动能量时间序列

图8 稳定运行状态样本聚类

将顶盖水平X、Y方向振动能量序列表示在同一平面内可得振动序列三维图(图7)。在序列中任意选择两个时刻切片,分别对应9 s和36.5 s时刻。对切片时刻数据和其之前的几个时间点的数据进行聚类来判断是否发生了状态突变。考虑到k均值聚类的结果在分类成2个簇的情况下可能受到初始随机种子的影响,因此采取多次聚类并取出现次数最多的情况作为最终聚类结果。如图所示8,聚类结果未将预测值从历史数据中聚类为单独的簇,因此未发生状态突变。

为验证该方法对突变故障的预警能力,从序列中随机截取一段数据并在其中某点开始对后续数据数值上加上2σ来模拟突变故障。截取结果如图9,可见在插入故障后,能量序列和预测序列整体均向右上平移,同时在插入故障点位置均出现“跃迁”。

对插入故障位置(22.5 s)的预测值和历史数据进行聚类,结果如图10,模型将预测值和历史数据分成了两个单独的簇,发出报警信号。至此验证了该方法对机组突变故障的预警能力。

图9 插入故障后截取数据序列

图10 突变故障聚类结果

5 结 论

本文基于振动信号计算Teager能量算子获取振动能量值,通过ANN-UAE综合模型预测出振动能量趋势信息,并以预测值和历史序列为输入进行k均值聚类判断是否出现状态异常,从而实现对机组突变故障的预警。通过真实机组稳态工况运行和插入故障的数据分别对该方法进行验证,从预警结果可见本文提出的预警方法能够有效对振动能量“跃迁”进行判断,即能够有效对突变故障进行预警。

猜你喜欢

均值聚类预警
基于K-means聚类的车-地无线通信场强研究
法国发布高温预警 严阵以待备战“史上最热周”
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
园林有害生物预警与可持续控制
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
机载预警雷达对IFF 的干扰分析
基于改进的遗传算法的模糊聚类算法
关于均值有界变差函数的重要不等式