基于重采样降噪与主成分分析的宽卷积深度神经网络风机故障诊断方法
2024-01-06刘展包琰洋李大字
刘展,包琰洋,李大字*
(1.北京能高普康测控技术有限公司,北京市 丰台区 100070;2.北京化工大学自动化研究所,北京市 朝阳区 100029)
0 引言
近年来,为应对气候变化与能源危机,清洁能源在全球能源组成中的比重不断加大[1]。风电作为一种重要的清洁能源,具有获取难度低、技术成熟等优点,得到了广泛重视与大力发展。据预计,到2030年,风力发电量将占全球总发电量的22%。在我国提出了“双碳”目标后,风电在国家能源战略发展中将具有越来越重要的地位[2-3]。
随着风力发电在我国的大规模发展,风电机组的数量快速增长[4],风电机组故障率高的问题应引起重视。因此,如何快速而准确地进行故障诊断,特别是对难以排查的机械故障[5-8]进行诊断,以降低风电机组运行的维护成本[9],成为风力发电领域面临的问题之一。
由于风电机组运行所处的环境与其主要机械结构的特点,风机振动信号中包含了大量的运行状态信息,这些信息可用来分析并判断风电机组运行状态与故障[10]。目前,风电机组的故障诊断[11]主要依赖于对风机振动信号的特征分析。
当前用于风机故障诊断的信号分析方法主要有时域分析、频域分析与时频域分析,其中时域分析[12]是最常用的方法。因为风机状态的改变所带来的振动信号的变化在时域中有明显的体现,方便对其进行特征的提取与分析。目前在故障诊断领域主要应用的时域分析方法有时域波形分析法、概率密度分析法、相关分析法、滤波处理法以及与人工智能相结合的方法[13]等。
国内外目前对基于时域分析的故障诊断方法已有一定的研究。文献[14]为适应原始数据中不同尺度的噪声强度,提出了一种基于Morlet 小波变换的噪声控制二阶增强随机共振方法,对风机振动信号进行故障提取。针对时域上的重噪声引起经验小波变换中的模态混叠现象,文献[15]首先用原始数据来驱动阈值小波空间邻近系数法,在此基础上再进行经验小波分解,可以自适应性地将信号分解成单组分来提取原有的调制信息。
随着人工智能技术在深度学习领域的发展[16],其具有越来越强的特征学习、提取与分析能力,在故障诊断问题上有着良好的应用前景。文献[17]提出了一种在时域分析中应用多传感器数据融合技术的风机故障诊断方法,将原始时域数据通过融合得到由峰值指数、脉冲指数等组成的故障特征时域集,并结合云蝙蝠算法和核极限学习机构成CBAKELM 模型实现故障诊断。文献[18]针对齿轮箱振动信号故障诊断,提出了一种结合小波包变换滤波器和交叉验证粒子群优化核极端学习机的诊断方法。
针对风电机组的故障诊断问题,本文基于时域分析方法,通过对原始风机现场数据进行多种信号预处理,并采用宽卷积深度神经网络(wide deep convolutional neural network,WDCNN)进行信号特征提取。此方法受风机的机械转速差异等因素影响较小,在真实诊断场景中具有很好的泛化性与实用性。
1 宽卷积深度神经网络
宽卷积深度神经网络 是卷积神经网络(convolutional neural network,CNN)的一种[19],其最显著的特点在于首层卷积层所使用的卷积核为宽卷积核。卷积神经网络中卷积核的大小决定了感受野的大小,即所提取信息的全局性。宽卷积深度神经网络所使用的宽卷积核在基于时域分析的故障诊断问题中可有效捕获周期性或波动性故障信号,避免了普通的卷积神经网络所使用的窄卷积核容易出现的无法将此类故障信号完全纳入感受野的问题。在使用宽卷积的首层卷积层将故障信息完全截取之后,再经过多层使用窄卷积核的卷积层对信息进行深层语义剖析,进一步提取其特征。
WDCNN 共有4 层组成,其基本结构如图1所示。
图1 WDCNN结构图Fig.1 Diagram of WDCNN structure
第1 层为卷积层,该层用于提取输入信息的特征,而其中的卷积核可看作滤波器,其提取特征的全局性与其感受野有关,也即与卷积核的大小有关。一般来说,经过的卷积层越多,提取的特征越深层。卷积后将输出进一步通过一个激活函数即非线性映射,以满足网络非线性的要求。卷积层的输出表示为
式中:σ为激活函数;xi为输入信号;wi为卷积核;bi为偏差。
第2层为池化层,该层一般位于卷积层之后,对卷积层的输出降维。一方面使经过卷积层得到的特征图进一步变小,降低计算复杂度;另一方面对特征进一步压缩,提取主要特征,去除冗余信息,加快网络收敛,防止过拟合现象的发生。
第3 层为全连接层,该层的作用是将网络学习所得到的分布式特征进行连接,将其映射到样本标记空间,用于接下来的分类任务。
第4层为归一化层,该层中使用的Softmax函数可将网络全连接层的输出结果归一化为故障的概率分布,该层的输出结果可直接用于故障诊断。
神经网络中用损失函数来表示真实值与预测值之间的差距,并在网络中进行反向传播,指导网络参数的训练,使网络在训练后预测值尽可能接近真实值,从而提高预测精度,在故障诊断问题中也即提高诊断结果的可靠性。
本文提出的方法中所用的WDCNN 共有5 层卷积层,其中第1层卷积核的尺寸为16×16,其余4层卷积核的尺寸为3×3,所使用的非线性激活函数为Relu函数。
2 基于WDCNN的故障诊断方法框架
2.1 基于信号频率的重采样方法
对采集得到的风机原始振动信号数据进行分析时,由于原始数据中包含了多台风机的数据,不同风机的机械转速等都有所差别,常常导致通过信号分析所得到的不是故障状态的特征,而是有关特征转速、频率等的差异所导致的特征,背离了故障诊断的要求。
为了减小转速差异对特征提取的影响,本文在数据预处理中采用了基于信号频率与机械转速的重采样方法。信号重采样间隔表示为
式中:fs为原始数据采样频率;ft为重采样频率;n为旋转机械的转速;q为重采样倍数常量。
重采样倍数常量q决定了最后的重采样频率,需要通过实验进行调试,最后选取合适的q值。实验所用的q值依照振动信号来源的不同而有所不同。以某风力发电机组高速轴断齿时的振动信号数据为例,其高速轴转速约1 700 r/min,采用16 384 Hz的原始采样频率,经过调试发现q=144,即采样间隔为4,实际重采样频率在4 096 Hz时所得到的故障检测结果最好。重采样过程如图2 所示,图中L表示所截取数据中采样点个数。
图2 某机组高速轴断齿振动信号重采样示意图Fig.2 Diagram of resampling vibration signal of highspeed shaft tooth breakage in a certain unit
该重采样方法一方面减少了数据中关于转速等因素的冗余信息,增大了数据中关于故障状态特征的信息密度,有利于后续的特征提取与网络训练;另一方面增大了数据量,起到了对训练集与测试集进行数据增强的效果。
2.2 小波阈值去噪
原始风机振动信号数据除了受到转速、频率的影响,还混合了环境中的自然噪声,仅仅依靠重采样无法消除噪声的影响。WDCNN的输入为时域上的信号数据,需要避免对噪声的特征进行无效提取,消除噪声是保证其有效性的重要步骤。
由于风机振动信号本身具有时变性,因此本文在信号重采样之后采用了小波阈值去噪的方法,以得到特征性更强的信号,其原理如下。
将包含噪声的原始数据在各尺度上与式(3)所示的小波基函数进行小波正交变换:
保留在大尺度(低分辨率)下的所有分解值,即保留信号主体的时频域特征;对小尺度(高分辨率)下的分解值设定一个阈值,保留小波系数高于该阈值的分解值,舍弃小波系数低于该阈值的分解值,即去除幅值相较于原始信号较小的突变噪声信号。最后对处理过后的信号进行逆小波变换,重构出去除噪声后的振动信号数据。
图3 为某风机机组高速轴断齿时的振动信号数据在降噪前后的对比图。从图3 可看出,小波阈值降噪消除了伪分量,明显地将其中一些由噪声引起的较高峰值数据进行了削弱,避免之后提取到错误的故障特征。
图3 小波阈值降噪前后对比图Fig.3 Comparison before and after wavelet threshold denoising
2.3 主成分分析降维
现场风机机组的一个部件上往往会包含多个传感器测点,因此得到的振动信号数据包含了多个通道的数据。这些不同通道数据彼此具有强相关性而又包含了不同的特征。目前在工程领域会凭借人工经验选择某个或某几个通道的数据进行使用,这种依赖先验知识的做法会降低方法的泛化性与可迁移性,同时也具有不可靠性。而将所有通道数据都参与网络模型训练的做法一方面引入了不必要的特征,另一方面计算量过大,拖慢训练时间。
本文采用了主成分分析法(principal component analysis,PCA)对预处理后的振动信号数据进行处理,降低数据通道数,提取合适的特征数据。PCA 的原理为利用降维的方法,通过正交线性组合方式,最大化保留样本间方差,把多指标转化为几个综合指标。图4为具有5个测点的某风机机组数据PCA 降维前后的频域图。图4 显示PCA 将原本的5 个数据通道降维成3 个数据通道,在大大减少参加训练的数据量的同时自动提取并保留了原本5 个数据通道的主要频域特征。本文实验中所采用的降维通道数以主元贡献度之和大于85%为标准来选取,并非一个固定的数。
图4 某机组高速轴振动信号PCA降维前后频域图Fig.4 Frequency domain diagram of high-speed shaft vibration signal of a certain unit before and after PCA dimensionality reduction
2.4 特征参数选择
风机机组的振动信号数据不仅具有鲜明的时域特征,而且在频域上故障信号与正常信号也会有所区别。图5 为某风电机组高速轴在正常与故障时的振动信号数据在频域上的对比。
图5 某风机机组高速轴振动信号频域数据Fig.5 Frequency domain data of high-speed shaft vibration signal for a certain unit
本文所提出的方法不仅选取了时域上常用的15 个特征参数(如平均值、方差、峰峰值、峭度等),还选取了频域上的5个特征参数(如基频等),以全面描述振动信号的特征。
2.5 用于风机故障诊断的卷积神经网络设计
本文所提出的方法利用了卷积神经网络通过自身的训练能自适应地从信号中提取有关故障特征的优点,减少了采样频率、转速等因素对特征提取的影响,降低了信号预处理的复杂度与参数的敏感性,且网络训练所需的数据量较少,实现了故障诊断的自动化与泛用化。
基于宽卷积神经网络的方法结构如图6所示,其主要步骤如下:
图6 基于WDCNN方法结构图Fig.6 Structure diagram based on WDCNN method
1)利用风机上的传感器采集振动信号数据。
2)将采集得到的原始振动信号数据按照设置的步长间隔进行重采样处理,即对随后的网络训练中作为训练集与验证集的数据进行数据增强;并进行小波阈值去噪。将预处理后的数据进行PCA降维。
3)对预处理后的数据按照设置的切片数目与长度进行切片,作为接下来WDCNN 的输入,并提取时频域特征作为标签。
4)按照初始化的参数,先后经过一层宽卷积核的卷积层与多层窄卷积核的卷积层,每次通过卷积层后都通过一个池化层进行压缩,以此对数据的深度特征信息进行提取。
5)经过全连接层与归一化层将网络输出转化为故障的概率分布。
6)按照根据真实值与预测值之间的差距所设计的损失函数进行反向传播,更新网络参数。网络收敛同时在验证集上达到预计的准确率后,保存训练所得到的模型。
7)将在线数据经过重采样与切片后输入到训练好的WDCNN 中,对数据的深度特征信息进行提取。
8)在经过卷积神经网络模型之后,经过全连接层与归一化层输出故障的概率分布即对故障的分类结果,完成在线故障诊断。
3 实验结果与分析
3.1 发电机故障诊断实验
风力发电机是风电机组中最重要的部件,但也常出现机械故障。本节通过分析风力发电机的数据进行诊断实验,所采用的数据为实际采集的某风电机组数据。
实验数据分为2 组,分别是发电机驱动端数据与发电机非驱动端数据。其中,发电机驱动端数据包含发电机驱动端正常与发电机驱动端磨损2种状态,某个通道2种状态的振动信号数据分别如图7(a)、(b)所示。发电机非驱动端数据包含发电机非驱动端正常与发电机非驱动端磨损2 种状态,某个通道2种状态的振动信号数据分别如图8(a)、(b)所示。分别从编号为39的风机机组的发电机驱动端数据与非驱动端数据中取出20组具有相同转速的数据用于网络训练,每组包含6 个数据通道,每个通道有65 536 个振动信号数据,故障数据与正常数据各占一半,其中70%的数据用作训练集,剩余30%的数据用作预测集。网络训练完成后分别用其他机组的50组具有相同转速的数据进行测试。实验结果如表1所示。
表1 相同转速下风机发电机故障诊断结果Tab.1 Fault diagnosis results of wind turbine generator at the same speed
图7 发电机驱动端原始数据Fig.7 Raw data of drive end of generator
图8 发电机非驱动端原始数据Fig.8 Raw data of non drive end of generator
从表1 可以看到,当机械转速相同时,用较少数据训练得到的网络有相当高的诊断准确率,其中风机发电机驱动端的故障分类准确率达到100%,发电机非驱动端的故障分类准确率达到98%。
为检验转速因素对本文提出方法的影响,分别从编号为46的风机机组的发电机驱动端数据与非驱动端数据中取出30组包含不同转速的数据用于网络训练,每组包含6 个数据通道,每个通道有65 536 个振动信号数据,故障数据与正常数据各占一半,其中70%的数据作为训练集,30%的数据作为预测集。网络训练完成后分别用其他机组的50组包含不同转速的数据进行测试。实验结果如表2所示。
表2 不同转速下风机发电机故障诊断结果Tab.2 Fault diagnosis results of fan generators at different rotational speeds
从表2中可以看出,转速的差异对网络的特征提取与诊断能力影响较小,风机发电机驱动端与非驱动端的故障分类准确率分别达到了98%与96%。
3.2 齿轮箱故障诊断实验
齿轮箱是风电机组中另一个较为重要的部件,该部件信号受齿轮数差异的影响较大,信号中干扰特征较多。本节通过分析齿轮箱的数据进行诊断实验。
所采用的数据为实际采集的某风电机组数据,共包含齿轮箱正常与齿轮箱断齿2 种状态,其中某个通道2种状态的振动信号数据如图9所示。
图9 齿轮箱驱动端原始数据Fig.9 Raw data of drive end of gearbox
实验中共从编号为4 的风机机组中取出20 组数据用于网络训练,每组包含6 个数据通道,每个通道有131 072个振动信号数据,故障数据与正常数据各占一半,其中70%的数据作为训练集,30%的数据作为预测集。用训练好的网络对编号为30的风机机组的50组数据进行测试,分类准确率为98%,说明对于信号差异较大的齿轮箱数据,本文提出的方法仍有较好的诊断效果。实验结果表明,本文提出的方法对转速差异等因素具有良好的抗干扰能力,对状态特征具有优秀的特征提取能力。
3.3 消融实验
针对本文所采用的预处理方法进行了消融实验,设置了4组实验来验证所采用方法的有效性。4 组实验所采用的数据均为某风机机组驱动端振动信号数据。
第1 组实验设置为进行重采样,未进行小波阈值降噪。第2组实验设置为进行小波阈值降噪,未进行重采样。第3 组实验设置为进行重采样与小波阈值降噪。前3 组实验均未进行PCA 降维,均按人工经验选取数据通道。第4 组实验设置为同时进行了重采样、小波阈值降噪与PCA降维。
表3 为消融实验结果,可以看出,未进行重采样或小波阈值降噪的网络性能均会有所下降,证明了本文所采用预处理方法的有效性。另外,采用PCA降维后的实验结果基本能接近人工经验选择的网络训练结果,考虑到该方法具有更好的灵活性与泛化性,综合评估下与PCA结合的方法具有一定的可行性。
表3 消融实验结果Tab.3 Results of ablation experiment
4 结论
针对风电机组的故障诊断问题,基于时域分析给出了一种使用WDCNN 来进行特征提取并完成自动诊断的方法。此方法在风机轴承转速不同的情况下,采用重采样处理数据,并使用小波阈值降噪的方法去除伪分量。另外,针对现场风机数据所含通道数较多的情况,结合PCA 进行降维,选取合适的数据通道。最后,训练好的神经网络可有效提取出风电振动信号所包含的故障特征。在风电场中的风机数据表明,此方法通过较少的风机数据即可训练出具有较强特征提取与故障诊断能力的网络,同时不受风机轴承转速改变的影响。所提出的方法在保证较高诊断准确率的同时具有数据需求量少、训练时间短与限制条件少等优点,在实际工程中有着较大的应用价值。