APP下载

基于深度学习的工业装备PHM研究综述*

2022-11-04李彦夫韩特

振动、测试与诊断 2022年5期
关键词:故障诊断装备工况

李彦夫,韩特

(清华大学工业工程系 北京,100084)

引言

随着现代工业装备复杂性、精密性、自动化以及智能化程度的不断提高,为了有效保障工业装备的安全可靠运行和经济性维护,PHM技术应运而生[1]。PHM旨在综合利用装备传感信息、专家知识和维修保障资源信息,借助人工智能方法和推理模型实现装备运行状态监测、故障识别诊断、健康状态评估及预测,并最终提供维修保障等健康管理措施。在此之前,工业装备维护策略已先后经历了事后维护、周期预防性维护、状态维护以及预测性维护4个阶段。PHM技术融合状态维护与预测性维护的思想,成功实现了装备故障的有效诊断与早期预防。

现在装备PHM方法的性能很大程度上取决于所提取的特征质量,即反映设备特性变化、趋势变化以及故障模型演化的能力,即如何有效学习并表征装备健康状态特征是PHM技术的核心。目前,传统特征提取方法受到以下问题的约束:

1)特征提取过程严重依赖先验知识和专家经验,特征设计过程需要深厚的数学基础和丰富的诊断对象专业知识;

2)无法从大工业大数据中获得统计意义上的健康特征表示,人工设计的特征难免以偏概全,无法准确表征装备健康;

3)所提取的特征通常为对信息的浅层次表达,在处理复杂装备信号时,其泛化能力有限;

4)所设计的特征普适性较差,往往需要根据装备系统特性、运行工况条件进行量身定制,当对象的系统物理特性发生改变时,所设计的特征需要相应调整更换。

随着计算能力的提高和出现高效的深层结构神经网络的训练方法,深度学习逐渐兴起。Hinton等[2-3]推动深度学习取得突破性进展,使得神经网络模型逐渐由浅入深,深度学习也成为机器学习方向的一个重要分支。深度学习理论旨在叠加多层次、多结构的信息表示层,以期在数据建模处理过程中获得层次化信息表征能力,最终取得更优的分类及预测能力。经典的深度学习模型,如受限玻尔兹曼机(restricted Boltzmann machine,简称RBM)、深层置信网络(deep belief network,简称DBN)、自编码器(autoencoder,简称AE)、卷积神经网络(convolutional neural network,简称CNN)、循环神经网络(recurrent neural network,简称RNN)以及生成对抗网络(generative adversarial network,简称GAN)等,已经在计算机视觉、图像处理、自然语言处理、医疗诊断及推荐系统等领域得到广泛研究与应用[4-8]。鉴于深度学习模型所具备的从原始数据中获取多层次非线性特征学习的能力,深度学习为工业装备PHM提供了一套完整的理论方法和有效便捷的工具。

笔者系统梳理了工业装备PHM中常见的深度学习模型,综述了国内外基于深度学习的PHM研究现状及研究热点,探讨了现存的主要问题,并展望了深度学习在PHM领域的未来研究方向及可能的解决方案。

1 PHM框架

PHM技术是用于改善并提高设备安全性和可靠性、保障执行任务成功率的重要手段,也是提高维修效率和节约维修成本的重要工具。PHM内涵极为丰富,主要包括传感器网络的数据采集和传输、装备状态监测、故障诊断、故障预测、健康管理和决策等。国际上众多标准组织,如IEEE和ISO等,已经围绕PHM发布一系列标准[9]。图1所示为PHM基本框架。

图1 工业装备PHM框架示意图Fig.1 Illustration of PHM framework of industrial equipment

首先,PHM技术通过部署在装备上的传感器网络收集反映装备健康状态的相关数据,如振动、转速、温度、电流及声发射等。由于复杂运行环境以及传感器故障等因素,获取的数据往往质量较差,因此需要有效的信号预处理方法来保障数据质量。常见的数据质量保障方法包括数据规整、数据清洗及数据恢复。其次,对于获取的数据,需要进一步从中提取故障敏感特征信息,其中常见的方法包括基于信号处理技术的人工特征提取、特征选择、降维以及深度学习方法。机器学习算法通过提取到的特征进行异常检测、故障诊断及预测。最后,PHM技术根据故障诊断及预测状态制定维修决策,形成维修建议。总之,PHM技术通盘考虑了装备的状态监测、故障诊断、预测及维修决策等装备运维的关键过程,对于装备安全可靠运行意义重大[10]。

PHM技术能否实现可靠的故障诊断、预测以及合理的维修策略制定,取决于其核心的数据分析方法。传统的基于人工特征提取的数据分析方法需要依赖专家经验,且难以避免繁琐的人工参数设计,无法充分契合工业大数据的特性。浅层机器学习模型对装备非线性监测数据的学习表征能力有限。为了克服PHM的局限,研究人员需要开发新的解决方案,深度学习为此提供了一套深具潜力的理论方法体系。

2 工业装备PHM中的深度学习模型

近年来,深度学习(deep learning,简称DL)或深度神经网络(deep neural networks,简称DNN)越来越受到各个领域研究人员的关注。通过利用多层神经网络的层次结构,以逐层处理的方式从数据中提取有效信息。深层结构保证了DNN对原始数据的多层次抽象表达,可以自动捕获海量数据中的复杂结构特征。鉴于其在特征学习方面的显著优势,DNN有效弥补了人工特征提取方法无法自适应特征学习的劣势,在处理工业装备监测大数据中显现出巨大潜力和迫切需求。基于深度学习的装备PHM已经成为领域的研究热点[11-13]。

PHM研究领域中主流的深度学习基本模型包括DBN,AE,CNN,RNN和GAN。图2为上述典型深度学习模型的基本单元示意图。本节将重点介绍这些模型的原理及其在PHM领域中的典型应用,以阐明深度学习在工业装备PHM的研究现状。

图2 典型深度学习模型基本单元示意图Fig.2 Illustration of the units in typical deep neural networks

2.1 深度置信网络

DBN是第1个成功应用于PHM领域的深度学习模型,它由多个RBM堆叠形成。DBN的顶层是无方向性的,其他层自上而下连接。DBN的训练分为2个步骤:预训练和微调。预训练通过贪婪学习算法以自下而上的方式进行无监督学习。当网络通过预训练完成初始化,就可以通过有监督的方法利用标记数据对参数进行微调。DBN中无监督逐层预训练可以构造一系列高度非线性的映射关系,这是从装备监测信号中提取健康状态信息的关键。

Tamilselvan等[14]将DBN成功应用于航空发动机和电力变压器的健康状态分类任务中。Tran等[15]利用Teager-Kaiser能量算子与小波变换对往复式压缩机阀门监测信号进行预处理,利用DBN对提取的统计特征进行机械状态诊断。Shao等[16]利用粒子群算法(particle swarm optimization,简称PSO)对DBN模型结构进行参数优化,并成功应用到滚动轴承故障诊断中。Guan等[17]通过经验模态分解和样本熵提取原始信号中的故障特征分量,构建DBN模型准确识别了旋转机械转子系统中的不同健康状态。

2.2 自编码器

AE是一种包含两阶段训练过程的无监督网络,在输出层实现对输入信号的重构。编码通过特征提取函数获得数据的隐状态,解码将隐状态映射回输入空间,获得数据的重建。与RBM类似,自动编码器可以通过堆叠形成深度模型,称之为堆叠自动编码器(stacked autoencoder,简称SAE),其通过将上一层的隐状态作为下一层的输入,并以一种贪婪学习的方式逐层训练。在隐藏层维度大于输入层的超完备情况下,标准的AE常常面临无法从原始数据中学习到有用信息的困扰。因此,需要通过引入正则化或其他生成式建模方法对标准AE进行改进。常见的变种AE包括稀疏自编码器、降噪自编码器和变分自编码器等。

Verma等[18]在空气压缩机故障诊断问题中提出了基于稀疏AE的特征学习方法,有效解决了传统SVM无法选择最优故障特征的难题。Lu等[19]研究了堆叠降噪AE模型在滚动轴承故障诊断中的表现,认为该方法具有良好的抗噪声干扰能力。Oliaee等[20]构建深度AE用于自适应的特征提取,成功诊断了燃气轮机故障。雷亚国等[21]构建深度降噪AE,完成了多级齿轮传动系统中不同故障类型的识别。

2.3 卷积神经网络

作为在PHM领域应用最为广泛的深度学习模型,CNN在处理具有网格状拓扑结构的数据方面显示出良好的效果。CNN与标准DNN的关键区别在于参数共享,这使得模型可以在信号中不同的位置捕捉特定的特征。

CNN模型起源于计算机视觉领域,用于处理2维图像数据。工业装备监测数据通常为1维时序数据。早期研究多数利用时频分析等技术将1维时序数据,如振动、温度、噪声等信号,转化为2维格式数据。Hoang等[22]将1维轴承振动信号转化为2维格式,随后构建2维CNN模型进行故障诊断。Verstraete等[23]利用时频分析方法获取轴承振动信号的2维时频图像,进而利用2维CNN模型进行分类。Yoo等[24]采用连续小波变换提取原始信号中的时频图像,通过CNN模型学习图像中的健康指标,有效预测了轴承的剩余使用寿命。Aghazadeh等[25]构建CNN模型,从小波时频图谱中学习故障特征,完成了刀具磨损状态评估。

尽管从1维时序数据到2维格式数据的转换可以有效利用CNN模型,但信号处理环节增加了算法的复杂度,且信号处理参数设置也需要依靠专家经验。因此,更多的研究采用包含1维卷积核的CNN模型,建立端对端的PHM方法。Mo等[26]提出了一种基于1维变分卷积核的CNN模型,以增强更加重要的故障特征学习能力,在有限的机械故障数据下表现出更佳的性能。Wu等[27]提出了一种基于1维CNN的转子碰摩故障诊断方法,从转子系统的原始振动信号中主动学习有用的特征。Zhang等[28]基于1维CNN提出了一种Dense-Squeeze Network,用于列车转向架故障诊断。Kao等[29]提出一种小波包分解和1维CNN的永磁同步电机故障诊断方法,有效提取电流信号中的故障特征。

2.4 循环神经网络

RNN是一类包含反馈回路的深度学习模型,该类模型的优势在于可以保持之前单元的信息,因此能够从时间序列中捕捉长期的时间依赖关系,非常适用于时序数据,如自然语言和时间序列的处理。在训练过程中,隐藏单元根据当前输入在该时刻的激活和之前的隐藏状态依次更新。RNN仍然存在梯度消失或爆炸的问题,即在梯度传播回初始层的过程中,梯度会逐渐缩小并最终消失。另一方面,如果梯度大于1,它们会通过无数次的矩阵乘法累积起来,导致模型崩溃。长短时记忆(long short term memory,简称LSTM)网络和门控递归单元(gated recurrent unit,简称GRU)是RNN的变体,有助于缓解上述问题。

目前,RNN及其变体在工业装备故障诊断,尤其是故障预测方面已经存在诸多研究。Lei等[30]提出了一种基于LSTM的风力机多源时序数据特征学习方法,取得了理想的故障诊断精度。Zhao等[31]设计了一种增强双向GRU网络,并将其应用于机械装备健康状态监测。Zhao等[32]提出了基于胶囊神经网络和LSTM的双通道混合故障预测模型,有效避免了局部特征的空间关系丢失,提高了LSTM的预 测 精 度。Huang等[33]利 用 双 向LSTM网 络 同 时处理发动机多传感器与多工况数据,取得了较为先进的预测精度。针对LSTM算法复杂度高、无法部署到边缘计算设备上的问题,Xu等[34]提出了一种基于知识蒸馏和LSTM的机械装备故障预测方法。

2.5 生成对抗神经网络

GAN通常由判别器和生成器组成。作为模型的生成部分,生成器主要学习输入的分布并创建假数据。判别器的作用在于同时接受真实数据与生成器创建的假数据,并识别数据的真实性。GAN中的对抗部分主要由生成器与判别器以博弈的方式开展,训练过程类似于博弈论中判别器与生成器之间的最小最大双人博弈。原始GAN模型在生成器与判别器中完全使用全连接层,最近的研究开发了诸多基于AE,CNN以及RNN架构的变种GAN模型。工业装备PHM领域也涌现出大量基于GAN的研究[35-40]。

2.6 其他深度学习模型

除了上述代表性深度学习模型之外,工业装备PHM领域也用到了其他类型的深度学习模型,这类研究通常基于典型深度学习单元进行改进,使之适用于特定的PHM任务。

Zhu等[41]受动态路由胶囊网的启发,提出了一个具有Inception block和回归分支的新型胶囊网络,在轴承故障诊断案例中,所提模型相较于传统方法和最先进的CNN模型具有更强的泛化能力。Zhao等[42]开发一个变体深度残差网络(deep residual networks,简称DRN)模型,在DRN前融合动态加权小波系数层,提高对行星齿轮箱故障本质信息的挖掘。Liu等[43]针对电机故障信号的非平稳特性,设计了一种基于多尺度核的残差CNN模型,以获取电机轴承故障深层及分层的多模式故障特征,在5种典型电机故障中取得了优越的诊断结果。He等[44]为了捕捉风力发电机SCADA数据中每个传感器变量内部复杂的时间相关性和不同传感器变量之间的空间相关性,提出了一种时空多尺度深度学习模型,首先基于回声状态网络(echo state network,简称ESN)提取多尺度时间信息,再利用多尺度残差模型提取多尺度空间特征,所提模型有效性在实际风电场SCADA数据中得到验证。Li等[45]研究了基于拓扑结构数据的图卷积神经网络(graph convolutional networks,简称GCN)的机械装备故障诊断方法,借助于GCN在非欧几里得空间的图数据处理中的特征表示能力,验证了所提方法在机械故障诊断中的有效性。Zhao等[46]开发了一种基于新型半监督图卷积深度信念网络模型的机电系统智能故障诊断方法,采用标记和无标记的样本来设计自适应局部图学习方法,在电机轴承系统诊断案例中,仅用10%的标记训练数据达到98.66%的诊断精度。

3 深度学习在工业装备PHM的应用

3.1 深度学习在异常检测方面的应用

工业装备异常检测重点关注如何利用在线监测数据,准确、稳定地检测异常及早期故障。在线异常检测有助于避免停机检修而造成的损失。不同于故障诊断的故障归类与原因分析,异常监测侧重于健康状态之外的装备异常状态报警。因此,异常检测模型训练无需大量典型标定的各类故障模式数据,可以仅通过正常数据进行无监督训练,异常监测在工业装备PHM中具有较强的工程环境适用性和明确的应用需求。

戴俊等[47]针对机械装备故障样本获取困难的问题,提出了一种基于GAN和SAE的异常检测方法,仅利用正常数据进行模型训练,有效监测装备未知异常状态。毛文涛等[48]从时域数据异常检测的角度,利用深度迁移自编码器提取轴承早期故障特征,基于正常数据排列熵确定报警阈值,有效识别轴承异常状态。向玲等[49]提出一种融合CNN和LSTM的级联深度学习模型,分析华北某风电场SCADA系统数据,监测了风力机齿轮箱的温度异常。许勇等[50]综合了DBN,CNN和RNN等深度学习模型在核电设备状态监测与异常监测中的应用,检测了给水管道、泵以及稳压器安全阀等设备的异常状态。Miele等[51]提出 一 种新型风力 发电机SCADA数据的无监督异常检测框架,利用图卷积SAE处理多源时域序列,有效捕获多变量信号之间的非线性关系,提升了SAE无监督特征学习能力和对异常状态的敏 感 程 度。Xiang等[52]提 出 了 一 种 基 于CNN和 双向门控循环单元的深度学习模型,用于风力机时空特征提取和早期异常状态检测。Wang等[53]提出了一种基于变分模态分解和SAE的异常检测方法,通过观测深度SAE重构误差,有效检测了水轮发电机组异常状态。Yang等[54]将深度学习用于航天器遥测数据异常检测中,将LSTM非线性模型与多尺度异常检测策略相结合,在NASA基准航天器数据和北斗导航卫星时钟数据中验证了方法的有效性。

3.2 深度学习在故障诊断方面的应用

故障诊断是保障工业装备安全可靠运行的关键环节。基于深度学习的故障诊断方法通过引入更深、更复杂的网络结构捕捉监测数据中的高阶、抽象特征信息,从而准确识别装备的健康状态,实现装备故障监测数据的在线诊断。

考虑工业装备现场运行环境特点及装备故障诊断本身的复杂特性,以数据为核心的深度学习方法需要考虑以下问题:①装备监测数据通常来自于多源传感器,不同测点、不同类型的监测数据可以从不同维度反映装备健康状态;②由于高可靠性要求,工业装备通常在健康状态条件下运行,监测数据表现出非平衡特点,典型故障数据往往极其有限;③深度学习模型通常假设训练数据和部署场景中的测试数据遵从独立同分布,然而工业装备运行工况,如转速和载荷等复杂多变,往往造成训练数据与测试数据间的分布漂移,制约了深度学习模型的诊断精度;④以旋转机械为代表的装备机械结构复杂,故障部件距离传感器安装位置具有较长的传递路径,故障信号往往表现出故障模式复杂、低信噪比及非平稳等特点,单一深度学习模型面临结构单一、特征提取能力不足的问题。

目前,相关研究充分考虑上述实际应用问题,主要聚焦信息融合下的深度学习故障诊断、考虑数据非平衡的深度学习故障诊断、基于小样本学习的深度学习故障诊断、复杂变工况下的深度学习故障诊断、基于领域自适应的深度学习故障诊断以及基于深度集成学习故障诊断等方面。

3.2.1 信息融合下的深度学习故障诊断

信息融合下的故障诊断旨在融合并利用多源传感器数据,在数据层、特征层以及决策层不同层级上对数据和信息进行关联、相关和综合,从而提高了模型算法的故障诊断能力。Zhang等[55]提出了一种考虑数据层融合和特征层融合的多层次深度信息融合诊断框架,成功应用于实际离心式鼓风机故障诊断中。Zhang等[56]提出了一种基于信息融合和深度学习的质子交换膜燃料电池故障诊断方法,通过反向传播神经网络将原始测量信号转换为特征映射,进行特征层信息融合,然后输入基于InceptionNet的CNN实现故障分类。Gültekin等[57]利用自动转运车电机上的多源声音和振动监测信号,构建了一种基于LeNet5的多源信息融合深度模型,用于车辆故障的识别诊断。Shao等[58]基 于Morlet小 波函数的SAE模型,提出了一种灵活加权融合策略的多源传感数据信息融合方法,在行星齿轮箱故障诊断案例中进行了验证。

3.2.2 考虑数据非平衡的深度学习故障诊断

在模型层面,考虑数据非平衡的深度学习故障诊断研究通过设计新的损失函数和模型结构来关注数据中的少数类别。Jia等[59]通过改进损失函数,设计了一种深度归一化CNN模型,解决了不平衡数据的机械故障诊断问题。Geng等[60]在深度残差学习模型中,提出一种不平衡加权交叉熵的损失函数,通过增加少数群体的权重来解决列车转向架故障数据不平衡的问题。Zhao等[61]构建了一种基于拉普拉斯正则化的SAE模型,可从非平衡数据中少量故障样本获取故障特征信息,增强模型对旋转机械故障诊断的能力。Zhao等[62]提出了一种基于批量归一化和指数移动平均的归一化CNN模型,可以有效地改善数据不平衡情况下的故障分类精度。在数据层面,数据增强是解决非平衡故障诊断的一类主要方法。Zhang等[63]构 建了 一 种 融合DBN模 型 和 合成少数类过采样技术(synthetic minority oversampling technique,简称SMOTE)的故障诊断框架,对混合动力电车燃料电池系统4种健康状态识别准确率达到100%。Jiang等[64]通过融合GAN、马氏距离和欧几里得距离,提出了一种数据增强策略以生成高质量 故障样本。Zhang等[65]利 用Wasserstein GAN扩充少数类样本,提升机械故障诊断模型性能。

3.2.3 基于小样本学习的深度学习故障诊断

在实际工业故障诊断任务中,装备故障数据极其有限,基于小样本学习的深度故障诊断方法在此情况下显现出优势。深度学习框架下的小样本学习方法通常基于原型网络[66]、匹配网络[67]、孪生网络[68]以及关系网络[69]开展。Zhang等[70]基于孪生网络模型,讨论了小样本学习下的轴承故障诊断方法,通过度量输入样本对之间的距离来确定它们的相似性,进而识别样本故障类型。Wu等[71]利用关系网络开发了一种小样本迁移学习方法,以解决设备在不同工况下的故障样本匮乏的问题。Ding等[72]设计了一种元学习模型,通过元CNN和元门控循环单元来解决小样本的机械装备故障诊断问题。

3.2.4 复杂变工况下的深度学习故障诊断

由于工业装备在实际运行环境中工况多变,外部环境,如温度、压力和背景噪声等难以预测,从而引入不确定性因素。数据驱动下的深度学习故障诊断模型通常假设训练数据与测试数据独立同分布,因此在特定工况数据下的训练得到的模型难以准确诊断不同工况下的监测数据。复杂变工况致使的数据分布漂移是制约深度学习故障诊断模型的一个关键因素。国内外学者对此展开了深入研究,主要方法概括如下:①通过信号预处理降低工况变化致使的数据分布漂移;②利用迁移学习方法,主要包括领域自适应与预训练-微调策略,将已知工况下的诊断知识迁移到目标工况,降低工况变化对模型的干扰;③研究对工况变化鲁棒且泛化的深度学习故障诊断模型。Ji等[73]提出了一种融合阶次跟踪和1维CNN模型,处理变转速工况下故障诊断问题,通过阶次跟踪预处理,可以将不同转速下的监测数据进行重采样,避免了转速变化引起的数据分布漂移。Wen等[74]设计了一种基于SAE的深度迁移学习模型,通过最小化最大均值差异(maximum mean discrepancy,简称MMD)降低深度学习模型对不同工况下监测数据的表示差异,提高了不同工况下的滚动轴承诊断精度。Chen等[75]提出了一种对抗迁移网络模型,利用对抗训练最小化不同转速条件下的数据分布差异,用于旋转机械不同转速下的迁移诊断。Shao等[76]采用从预训练到模型微调的迁移学习方法,提出一种融合改进CNN模型和热力图的转子轴承系统跨工况故障诊断方法。Han等[77]基于对抗训练与度量学习,在深度学习框架下提出了一种泛化网络,处理未知工况下的旋转机械故障诊断问题,所提模型对未知工况表现出良好的泛化性能。

3.2.5 基于领域自适应的深度学习故障诊断

作为迁移学习理论方法的一个重要分支,领域自适应方法不仅可以解决深度学习模型在不同工况下的故障诊断问题,在处理其他故障诊断难题时也表现出潜在优势,例如不同传感器测点间的迁移诊断问题和不同装备间的迁移诊断问题。深度学习下的领域自适应故障诊断方法核心思想为不同域下的数据、特征等层面的分布适配,减小领域差异。目前,主流的领域自适应深度学习故障诊断方法可以划 分 为MMD最 小 化 和 对 抗 训 练。Lu等[78]在深度学习模型中考虑样本特征分布的MMD优化问题,并在轴承与齿轮箱不同工况下的诊断试验中进行了方法验证。Li等[79]在深度CNN模型基础上提出了一种多层领域自适应方法,通过在模型多层结构上最小化不同域特征分布MMD,进一步提高了轴承振动信号在不同工况下的分布适配准确性。Li等[80]通过对抗训练的方式对旋转机械不同传感器的数据进行领域自适应,解决了不同数据采集部位条件下的迁移故障诊断。Wang等[81]在不同工况下轴承故障诊断案例中对比研究了3种典型的领域自适应方法,即MMD最小化、对抗训练和自适应批处理归一化,验证了领域自适应方法在故障诊断中的应用价值。

3.2.6 基于深度集成学习的故障诊断

集成学习通过构建并以一定策略集成多个学习单元来完成学习任务,达到“博采众长”的目的。集成学习有望改善模型故障诊断能力,提高模型泛化性能。Shao等[82]提出了一种集成深度AE的智能故障诊断方法,相比于单体深度AE具有更高的诊断精度。Xu等[83]提出了一种基于CNN和随机森林集成学习的轴承故障诊断方法。Liang等[84]提出了一种基于DBN的改进深度集成方法用于滚动轴承故障诊断,通过使用权重矩阵对每个DBN进行投票,得到最终的诊断结果。Chen等[85]融合SAE与DBN得到集成学习模型,并将其应用到多源传感数据特征学习与故障诊断中。Ma等[86]提出了一种融合CNN,DBN和SAE的深度集成学习故障诊断方法,将多目标优化作为集成策略,实现了转子和轴承故障的有效诊断。

3.3 深度学习在故障预测方面的应用

故障诊断强调故障报警和故障类型及其原因的归类分析,而故障预测更加关注对工业装备潜在故障的早期预警,对装备未来状态退化趋势以及剩余使用寿命(remaining useful life,简称RUL)做出预测。装备当前运行健康状态数据和历史数据是故障预测的基础。故障预测的核心内容通常包括:①评估装备当前的健康状态,构建健康指标(health indicator,简称HI),分析装备可能出现的退化趋势;②估计未来故障发生的时间以及预测装备RUL。

深度学习是一类最先进的数据驱动故障预测方法。在HI构建方面,赵光权等[87]针对传统轴承RUL预测中健康指标构建依赖专家经验的问题,设计了一种基于降噪SAE的无监督自适应HI构建方法。Fan等[88]利 用 门 递归单元CNN分析 锂 离 子电池恒流-恒压充电数据,实现了电池健康状态的准确评估。Gong等[89]提出一种融合深度神经网络,包含2维卷积模块、轻量子空间注意机制模块和循环单元模块,提取锂离子电池循环充电数据中的退化特征,有效评估电池健康状态。Peng等[90]基于DBN建立系统故障特征表示,将退化状态与故障状态之间的距离作为HI,利用粒子滤波算法进行RUL预测,该方法在发动机故障预测中表现出卓越性能。Pan等[91]提 出 一 种 基 于DBN和自组织映射的性能退化评估方法,能有效实现多源振动信号的自适应降噪与融合,并将最小量化误差作为HI来预测风力机变速箱早期故障。She等[92]设计了一种指数衰减学习率的多通道CNN模型,提取滚动轴承的磨损特征作为HI。Chen等[93]提出了一种深度卷积自编码器模型自适应构建滚动轴承HI。Huang等[94]利用双向LSTM网络自适应提取、旋转、融合原始监测信号中的磨损特征,构建计算机数控铣床HI。

工业装备HI构建是RUL预测的基础,合适的HI构建方法可以有效保障后续故障预测精度。研究表明,深度学习在工业装备HI构建方面的优越性能,既能有效避免HI构建过分依赖专家经验和人工特征提取的弊端,也能保证提取的HI可以有效反映装备退化趋势。

准确地进行RUL预测为确定装备最佳维护时间提供依据,以实现经济性运维的目的。传统的基于物理退化模型的RUL预测方法需要考虑装备内部失效机理,在实际复杂工业装备中的应用局限性较大。数据驱动方法可以直接从状态监测数据中挖掘健康状态特征变化规律,从而实现RUL预测。深度学习框架下的数据驱动RUL预测方法具有良好的应用前景。

Listou-Ellefsen等[95]综合考虑监督学习和无监督学习的优势,提出了一种半监督的深度学习RUL预测方法,其有效性在C-MAPSS推进系统退化数据中得到验证。Chen等[96]提出了一种基于门控循环单元的RNN模型,能够有效预测发动机推进系统RUL。Li等[97]设计了一种多尺度特征CNN模型,用于C-MAPSS推进系统退化数据RUL预测。Al-Dulaimi等[98]设计了一种混合深度神经网络RUL预测模型,通过并行计算的方式集成CNN和LSTM,以获取不同预测场景下更优的泛化性能。Wang等[99]提出一种多尺度卷积注意力网络(multiscale convolutional attention network,简 称MSCAN)来预测机械装备RUL,其中注意力模块可以有效融合多源传感器数据,多尺度学习策略可以捕获信号中不同尺度的退化特征,所提方法有效性在刀具退化数据中得到验证。针对现有深度学习模型在RUL预测中只能提供点估计的问题,Lin等[100]研究了贝叶斯深度学习(Bayesian deep learning,简称BDL)框架下的RUL预测方法,有效量化不确定性并进行校准,成功应用于C-MAPSS推进系统和锂离子电池退化数据RUL预测。

除了上述研究广泛采用的开源数据集,如商用模块化航空推进系统仿真数据(C-MAPSS-Data)[101]、美国国家航空航天局锂离子电池循环老化数据(NASA Ames Prognostics Data)[102]等,西 安 交通大学现代设计及转子轴承系统教育部重点实验室开源了轴承加速退化试验数据,该数据集包含15个滚动轴承从健康到失效的全生命周期监测数据,已经被国内外学者广泛用于算法测试[103]。

4 深度学习在工业装备PHM的挑战与展望

随着工业装备PHM领域步入大数据时代,对模型算法的智能化程度与自适应性的要求日益提高,基于数据驱动的PHM理论方法研究也在不断发展完善。然而,鉴于工业装备PHM应用环境的复杂性与特殊性,将深度学习理论方法灵活应用于工程实际问题仍然面临许多新的挑战。

1)深度学习通常立足数据为王,工业装备监测数据质量普遍较差,具体表现为数据噪声、缺失、异常以及延迟等特点,深度学习方法难以从低质量数据中有效挖掘装备健康状态特征信息。此外,工业装备监测数据具有多源异构的特点,信号测点采样形式多样,一致性差,随机因素干扰严重,这些均大大增加了深度学习PHM方法的应用难度。

2)现有基于深度学习的工业装备PHM决策模型通常以纯数据驱动的方式执行,其训练学习方式无法考虑目标对象的物理知识,因此训练所得模型非常脆弱,其普适性与鲁棒性能难以保证。

3)深度学习的工业装备PHM方法通常基于闭环假设,即仅能保证模型在已知可见数据中的效果。对 于 已 知 分 布 外(out-of-distribution,简 称OOD)数据,模型通常表现出较差的泛化性能。尽管迁移学习可以有效解决领域分布漂移的问题,但其仍然需要获取特定的目标域数据,在工程实际应用中存在一定局限性。

4)深度学习的工业装备PHM方法目前仍处于“黑箱模型”阶段,模型的可解释性一直是制约深度学习方法安全可靠性应用的关键问题。“收集数据-模型调参”的训练模式无法清晰解释模型参数物理含义,无法由模型输出诊断结果准确溯源到故障原始特征及故障原因。

5)在工程实际中,无论是故障诊断还是故障预测,不确定性问题始终存在。利用深度学习的工业装备PHM方法大多为确定性表达。在确定性表达的深度学习模型中,模型输出的准确性与可靠性难以评价,高维数据、噪声、不确定的输入数据以及有限的模型知识往往造成误诊断,模型智能诊断及预测结果的不确定性难以评估。

针对上述深度学习的工业装备PHM研究难点与挑战,未来的研究方向总结如下。

1)工业装备监测数据质量保障方法研究与数据标准化。建立监测数据质量保障方法体系可以有效提高以深度学习为代表的PHM方法在工程实际问题中的适应性,成为本领域的首要问题。监测数据质量保障需要综合考虑数据规整、数据清洗以及数据恢复方法。针对特定装备和特定监测物理量,制定数据监测、传输及存储相关标准,为工业装备PHM技术高效可靠应用夯实数据基础。

2)知识驱动与数据驱动融合的深度学习PHM理论方法研究。将领域知识以及物理模型形成约束融入深度学习之中,有助于提高模型的普适性与鲁棒性。近年来,内嵌物理知识的神经网络(physics-informed neural networks,简称PINN)将物理偏微分方程嵌入神经网络中进行学习求解,有效提高了模型的泛化能力,保证了模型所学特征符合物理规律,弥补了纯数据驱动方法的劣势。以PINN为代表的知识驱动与数据驱动的融合方法给工业装备PHM带来了新的思路。

3)高可信深度学习PHM框架构建。高可信PHM框架旨在通过结合统计学、不确定性量化和概率建模等方法,缓解深度学习不可解释的弊端,提高PHM模型的安全性和可靠性,最终实现高可信智能决策。图3给出了高可信深度学习PHM框架示意图。开展深度学习模型不确定性评估,通过不确定性度量模型智能决策结果的可信程度;开展OOD数据检测,及时预警并剔除OOD数据,避免深度学习PHM模型做出错误的决策;基于统计和概率建模,评估深度学习模型的可靠性,避免在特定PHM任务中过分信任深度学习模型带来的风险。

图3 高可信深度学习PHM框架示意图Fig.3 Illustration of the deep learning-based trustworthy PHM framework

5 结束语

围绕深度学习开展了工业装备PHM研究综述,对工业装备PHM中的典型深度学习模型进行介绍和总结。围绕工业装备PHM中的3个核心问题,即异常检测、故障诊断与故障预测,总结了深度学习相关的国内外研究现状和代表性工作。探讨了现有深度学习PHM研究中存在的问题与挑战,并从夯实数据基础、知识驱动与数据驱动融合和高可信PHM框架构建等方面进行展望,推动深度学习的工业装备PHM理论方法研究进一步向工程实际应用转化。

猜你喜欢

故障诊断装备工况
这些精锐与装备驰援泸定
港警新装备
热网异常工况的辨识
基于包络解调原理的低转速滚动轴承故障诊断
变工况下离心泵性能研究
不同工况下喷水推进泵内流性能研究
基于非负矩阵分解的高速列车走行部工况识别
防晒装备折起来
数控机床电气系统的故障诊断与维修
因果图定性分析法及其在故障诊断中的应用