APP下载

基于可迁移注意力和动态卷积的滚动轴承跨工况故障诊断方法

2024-02-20王煜伟朱静史曜炜邓艾东

轴承 2024年2期
关键词:源域特征提取尺度

王煜伟,朱静,史曜炜,邓艾东

(1.国家能源集团 谏壁发电厂,江苏 镇江 212006;2.河南科技大学 车辆与交通工程学院,河南 洛阳 471000;3.东南大学 能源与环境学院,南京 210000)

旋转机械在现代工业中扮演着重要的角色,其健康状态对设备的稳定运行具有十分重要的影响[1]。建立可靠的故障诊断方法对于早期预警和预测维修,保障机组安全运行,提高机组运行效率,避免事故发生具有重要的现实意义[2]。近些年涌现出的智能故障诊断方法中,以深度学习为代表的基于数据驱动的方法由于具有优化简单,对专家经验依赖少等优点被广泛关注。常见的有卷积神经网络(CNN)[3]、长短期记忆网络[4]和自编码网络[5]等。基于传统深度学习的诊断方法总是依赖于训练数据和测试数据服从相同分布的假设,即使数据是相似的,在一个领域数据(源域)上训练的模型也无法很好地应用在其他领域数据(目标域),如滚动轴承不同运行工况(转速、载荷)下的振动数据。

领域自适应(Domain Adaptation,DA)是迁移学习的分支,其利用有监督的源域数据和无监督的目标域数据学习具有领域不变性的特征,使得在源域建立的诊断模型可以有效应用于目标域的故障识别[6−9]。文献[7]利用Wasserstein 距离构造了深度对抗DA 网络,将源域学习到的故障知识迁移到目标域进行诊断;文献[8]提出了多源域分解网络,从多个源域中学习更丰富的诊断知识,同时考虑了每个领域的私有特征对知识迁移的影响。

为降低领域之间的分布差异,现有方法开发了多种特征对齐策略,但其对特征学习过程的关注不够,尤其是忽略了不同领域特征的尺度特性差异,学到的特征虽然具有较好的可迁移性,但携带的故障信息却不全面,从而限制了模型性能的提升及其适用性。滚动轴承的振动信号通常表现出多尺度特性且在多个时间尺度上包含复杂的模式[10],为此一些研究者提出了多尺度学习框架[11−12],利用多个尺度并行提取特征并加以融合以获取丰富的故障信息,如文献[11]通过设置不同尺度的卷积核建立了并行的多尺度特征提取分支,试图学习振动信号中故障特征多样的表征模式。此外,还有一些研究从动态特征提取的层面展开[13−14],通过构造动态卷积网络并根据不同的输入数据自适应地改变网络参数以实现差异化的特征学习方式。然而,由于轴承的运行工况多变,跨工况下的故障特征尺度的特性差异不仅存在于每个领域内,领域之间的差异同样存在且更为复杂。

综上,本文提出基于可迁移注意力的领域自适应网络(Transferable Attention Based Domain Adap⁃tation Network,TADAN),用于滚动轴承的跨工况故障诊断,通过学习包含丰富故障信息的领域不变特征,在无监督目标域实现高性能的故障诊断。

1 理论分析

1.1 领域自适应

本文的研究目的是从有监督的源域和无监督的目标域中学习具有领域不变性和故障类别判别性的特征表示,从而识别目标数据的故障类型。

设DS=为有nS个样本−标签对的有监督源域,DT={DT,train,DT,test}为目标域。分别为用于训练的无监督目标数据和用于测试的有监督目标数据。YS,PS分别为源域的标签空间和数据分布;YT,PT分别为目标域的标签空间和数据分布;它们具有相同的标签空间但数据分布不同,即YS=YT,PS≠PT。则本文的目的是从DS和DT,train中学习一个共享的函数映射,使其能够在DT,test上实现高性能的诊断。

1.2 领域对抗训练

领域对抗训练被广泛地应用在迁移学习中,用于消除不同领域数据间的分布差异[15],其核心思想是在训练分类器C 识别来自源域特征对应故障类别的同时,构造一个领域判别器D 和特征提取器G 进行最小化−最大化对抗训练[16],使G 可以从源域和目标域中提取领域不变的特征表示f。

令θG,θC和θD分别为子网络G,C,D 的参数,则对抗训练的优化目标为

式中:Lc,Ld分别为分类损失和领域判别损失;λ为折中系数,用于平衡2 个损失,λ>0;yi,di分别为样本xi的类别标签和领域标签。

基于(1)式,网络的参数可优化为

1.3 动态卷积

传统的静态网络对所有输入数据采用相同的网络结构和参数,面对多样化的输入时,其特征学习能力会受到削弱。动态卷积[17]在每次执行卷积的过程中,随机生成的卷积核不再单一,而是M个子卷积核的加权累加,因此可以根据不同的输入数据自适应地调整卷积核,针对性地提取有效特征,从而强化网络学习能力。动态卷积的结构如图1所示,子卷积核(convm)享有相同的尺寸和输入输出维度,其权重系数(πm)由输入数据动态决定,权重系数的生成采用squeeze−and−excitation方法。

图1 动态卷积结构示意图Fig.1 Structure diagram of dynamic convolution

2 TADAN故障诊断方法

2.1 网络架构

基于可迁移注意力的领域自适应网络的架构如图2 所示,由包含K个尺度分支的特征提取器G ={Gk}K k=1,可迁移性计算模块,领域判别器D 和分类器C 构成。每个特征提取分支由多个卷积层构成,可通过设置不同的卷积核感受野实现不同尺度特征的提取。为降低模型复杂度并减少训练参数,只在最后一个卷积层采用动态卷积。具体的数据流动为:来自源域和目标域的原始振动信号被送入网络,经多个尺度特征提取分支获得不同尺度的特征表示;可迁移计算模块对这些特征的可迁移性进行评估并分配权重,加权后的多尺度特征被进一步融合去冗,从而获得高等级的抽象特征表示fh;一方面,来自源域和目标域的fh被送入D进行对抗训练,促使其领域不变;另一方面,来自源域的fh被送入C 并映射到故障类别,学习判别性的诊断信息。当网络训练完备后,特征提取器最终获取的特征表示fh应当是携带大量故障识别信息且对分布差异不敏感,可以应用于无监督目标域的诊断任务。

图2 TADAN网络架构Fig.2 Architecture of TADAN

2.2 可迁移计算模块

可迁移计算模块的作用是计算不同尺度特征在2个领域之间的可迁移性,从而给予可迁移性高的尺度特征以更高的关注度,促进知识的有效迁移。可迁移计算模块中包含K个尺度领域判别器,分别对应K个特征提取分支。判别器的输出为该尺度特征属于源域或目标域的概率,应用熵函数H(p) =−∑pilogpi即可量化特征的可迁移性。特征越不容易被判别来源,越容易被混淆,则表示该特征越适合迁移。可迁移计算模块最终输出不同尺度特征的权重集合,可表示为

2.3 网络训练

式中:ε为学习率。

2.4 故障诊断流程

具体的模型训练与诊断流程如下:

1)获取数据。以工况A 下的有监督数据作为源域,其他工况(如工况B)下的无监督数据作为目标域。

2)将源域与目标域数据同时输入TADAN 网络中,经过特征提取器G 得到分别属于源域和目标域的多个尺度特征。

3)将源域和目标域的同尺度特征分别送入可迁移计算模块,计算不同尺度特征的可迁移性以获取尺度权重= 1。

4)利用尺度权重对多尺度特征进行加权融合,获取高等级的抽象特征表示fh。

5)将特征表示fh送入领域判别器和分类器计算领域判别损失和分类损失。

6)将得到损失之和进行反向传播,并更新模型参数。

7)重复上述步骤,直至损失值趋于稳定,训练收敛,模型训练结束。

8)将工况B 下的数据输入训练完成的诊断模型,输出变工况下的故障类型识别结果。

3 试验分析

3.1 数据集介绍

本文使用2 个公开的轴承数据集构造试验以验证所提方法的有效性。

3.1.1 帕德伯恩大学滚动轴承数据集

帕德伯恩大学(Paderborn University,PB)滚动轴承公开数据集[18]的试验轴承为6203型深沟球轴承,内、外径分别为24.0 ,33.1 mm,钢球数量为8,球径为6.75 mm。试验数据包含6 种轴承状态,分别是正常状态N,3 种不同损伤程度的内圈故障(IR1,IR2,IR3)以及2种不同损伤程度的外圈故障(OR1,OR2),其类别标签依次被标记为0~5。轴承故障的具体描述见表1,损伤程度根据损伤表面在滚动方向上的长度进行分类,损伤等级1,2,3代表的损伤长度分别为0~2,2.0~4.5,4.5~13.5 mm。故障轴承振动信号的时域波形如图3所示,除幅值略有区别外,很难通过肉眼分辨不同故障。

表1 PB数据集轴承故障描述Tab.1 Description of bearing faults in PB dataset

图3 PB数据集中故障轴承振动信号时域波形Fig.3 Time domain waveform of faulty bearing vibration signals in PB dataset

振动数据收集自4 种运行工况,采样频率为64 kHz。根据工况将数据分割为4 个独立域A,B,C,D,每个域的细节信息见表2。在原始振动信号上执行滑动窗分割以获取数据样本,每个样本包含2400个数据点。以某一个领域为源域,剩余3个领域为目标域,共建立了12 个跨域诊断任务(表3)。对于每个诊断任务,所有源域样本(有监督)和70%的目标域样本(无监督)用于训练,剩下的30%目标域样本(有监督)用于测试。

表2 PB数据集领域信息Tab.2 Domain information in PB dataset

表3 PB数据集诊断任务Tab.3 Diagnostic tasks in PB dataset

3.1.2 江南大学轴承数据集

江南大学轴承数据集[19]的轴承状态包括正常(N)、外圈损伤(OR)、内圈损伤(IR)和滚子损伤(RE)。损伤轴承通过线切割得到,内、外圈损伤尺寸(宽×深)均为0.30 mm×0.25 mm,滚子损伤尺寸为0.50 mm×0.15 mm。内圈损伤轴承型号为NU205,其他状态轴承的型号为N205,N205 和NU205 型轴承的内径均为25 mm,外径均为52 mm,滚子直径均为7 mm,滚子数分别为10,11。

振动数据收集自600,800,1000 r/min 工况,采样频率为50 kHz。领域分割和数据集划分方式与PB数据集相同,分为E,F,G三个域,共建立6个跨域诊断任务,见表4。

表4 江南大学数据集诊断任务Tab.4 Diagnostic tasks in Jiangnan University dataset

3.2 试验设置

TADAN 的网络结构见表5,尺度分支K设置为3,卷积−池化的参数为(卷积核数量,卷积核尺寸)−(池化尺寸,池化步长),动态卷积均应用在特征提取分支的最后一个卷积层,其子卷积核数M设置为4。此外,可迁移计算模块中的K个尺度领域判别器与网络最后的领域判别器结构相同。

表5 TADAN的网络拓扑与参数Tab.5 Topology and parameters of TADAN

网络训练过程中,使用Kaiming 初始化方法初始化网络参数,折中参数λ设置为0.1;采用随机梯度下降优化器,动量为0.9,学习率衰减为5×10−4;初始学习率为0.01;总训练次数为120次。每次试验重复5次后记录其平均值。

3.3 对比方法

为验证所提方法的有效性和优越性,构建多个不同的模型用于对比分析:

1) SCNN。标准的单尺度卷积神经网络模型,其特征提取器采用TADAN 中的特征提取分支3。SCNN 不涉及领域自适应(移除了领域判别器和可迁移计算模块),仅采用传统的有监督学习方式,即训练样本中不包含无监督的目标域数据。此外,SCNN特征提取器不采用动态卷积。

2) MCNN。多尺度卷积神经网络模型,与TADAN 具有相同的网络结构(未使用动态卷积),训练方式与SCNN相同,为传统的有监督训练。

3) DAN。与MCNN 相比,DAN 方法增加了领域判别器,遵循标准的对抗训练方式。

4) TA−DC。TADAN不采用动态卷积的版本。

3.4 结果分析

2个试验案例的测试结果见表6,以PB数据集为例进行说明:

表6 各模型对不同轴承数据集的测试准确率Tab.6 Test accuracy of each model for different bearing datasets%

1)SCNN 的诊断性能在所有对比方法中最差,平均准确率只有63.43%;MSCNN的诊断准确率在SCNN 的基础上提高了4.61%,证明了多尺度学习策略能够通过学习更丰富的故障特征提高模型诊断性能,但SCNN 和MSCNN 的准确率均低于70%,远不能满足高性能的诊断需求,这也是训练数据与测试数据之间的分布差异所导致的结果,在源域上训练的模型很难泛化到目标域的诊断任务中。

2)DAN方法对12个诊断任务的平均准确率达到了83.31%,比MCNN 高15.27%,而且在多个跨域诊断任务上的准确率超过95%,表明领域自适应策略对于处理存在分布差异的诊断问题十分有效。

3)在DAN 的基础上,TA−DC 和TADAN 又将平均准确率分别提高了2.48%和3.26%,在任务T2 和T7 上的测试准确率甚至超过99.5%,说明可迁移注意力策略和动态卷积的应用对促进模型迁移,提高跨域诊断性能积极且有益。

4)TADAN 几乎在所有诊断任务上均获得了最好的诊断性能,在PB 数据集和江南大学数据集中的平均诊断准确率分别为86.57%和91.91%,具有较好的稳定性。

为深入探究样本误分类和所提方法有效的原因,将所有模型在任务T9 上的一次测试结果以混淆矩阵的形式展现,结果如图4 所示:SCNN 和MCNN 诊断准确率低的原因主要是无法准确识别IR2(标签2)和OR2(标签5),总将OR2 误分类为OR1;相比之下,TADAN 对各类别样本的识别准确率有大幅提升,除将少数OR2误分类为OR1之外,在其他类型故障的分类上几乎达到了100%的准确率,再一次证明了TADAN 优秀的故障特征学习能力和知识迁移能力。

图4 不同方法在任务T9上测试结果的混淆矩阵Fig.4 Confusion matrices of results tested by different methods on task T9

4 结论

为强化跨工况故障诊断模型的特征学习能力和领域适应能力,本文提出了一种基于可迁移注意力和动态卷积的旋转机械故障诊断方法TADAN,通过试验对比可得出以下结论:

1)基于动态卷积的多尺度特征提取器可以提取更丰富的特征并提高模型的自适应能力,使模型在面对不同数据集任务时更具鲁棒性。

2)可迁移计算模块可进一步量化多尺度特征的可迁移性并在特征制度层面强化其整体差异化,促进领域不变特征的学习,降低负迁移风险。

3)TADAN 在2个跨域诊断任务案例上的平均测试准确率分别达到了86.57%和91.91%,高出传统有监督学习方法23.14%和9.28%,高出标准领域自适应方法3.26%和2.94%,具有较好的稳定性,适用于滚动轴承跨域诊断任务并具有较好的应用前景。

猜你喜欢

源域特征提取尺度
基于参数字典的多源域自适应学习算法
财产的五大尺度和五重应对
基于Daubechies(dbN)的飞行器音频特征提取
Bagging RCSP脑电特征提取算法
宇宙的尺度
可迁移测度准则下的协变量偏移修正多源集成方法
基于MED和循环域解调的多故障特征提取
9
Walsh变换在滚动轴承早期故障特征提取中的应用
室外雕塑的尺度