基于深度学习的永磁同步电机故障诊断方法

2019-10-21张周磊李垣江李梦含魏海峰

计算机应用与软件 2019年10期

张周磊李垣江,2 李梦含魏海峰,2

1(江苏科技大学电子信息学院江苏镇江 212003)2(常熟瑞特电气股份有限公司江苏常熟 215500)

0 引言

匝间短路及永磁体的失磁是典型的、破坏性极强的永磁同步电机(PMSM)故障。若轻微的匝间短路故障未加以关注，则短路环流持续上升产生高温引起退磁现象，最终导致电机无法运行，甚至烧毁电机。因此，匝间短路和失磁故障特征的研究以及特征数据集的优化对于高效、准确、低耗、省时地进行故障检测具有重要的意义。

现阶段，永磁同步电机匝间短路及永磁体失磁故障的研究大多通过信号变换方法，将电机信号(输出电流、反向电动势等)精确分解成重要信息块，并作为诊断故障的标准。常用的方法包括：小波变换(WT)[1]、傅里叶变换(FFT)[2]、经验模态分解(EMD)[3]等。定子电流谐波频谱分析[4]对于电机故障具有强相关联性，因此对谐波的FFT频域分析是目前研究较多的方法。该方法能够有效诊断电机状态，但是受环境因素的影响(转速、温度)，谐波次数会不尽相同，所需表达的电机模型也会相对复杂。而电机参数辨识方法[5]通过识别各状态参数(负序特征、振动、转矩等)判断其运行状态，确认故障类型及劣化程度。该方法可以简化操作过程，但由于各参数之间是相互独立的，在分析多故障状态时，已有的参数未能完整表示电机故障，因此诊断效率并不高。

深度神经网络在图像识别、数据挖掘领域取得了显著成就。基于深度学习参数特征的数据挖掘可以大大提高电机故障诊断的准确性。文献[6]基于定轴变速齿轮特征，在100组有限样本数量条件下，利用粒子支持向量机实现齿轮智能故障诊断，效率能够达到95%以上。文献[7]基于振动信号特征，在400个有限样本数量条件下，采用去噪稀疏自编码网络实现异步电机6类故障诊断，结果达到97%以上。然而多故障电机模型组件内部存在强相关联，导致电机故障具有一定的随机性、并发性。因此小样本深度学习网络特征提取对于结果意义较小，海量且有效的参数样本数据是提升深度学习故障诊断准确率的关键。

本文结合信号处理(定子谐波电流)与参数识别(电磁转矩、磁感应强度)方法，分析特征与故障的关联性，建立特征组合样本，从而改善效率低下的问题。通过变分自编码网络[8](Vriational Auto-Encoder Net，VAE)对数据样本进行特征提取并将其作用于生成模块进行伪样本扩展，最终生成的样本能够高拟合原样本数据，解决故障诊断深度网络训练数据集稀缺的问题，大大节约资源和时间。最后利用稀疏自编码网络(Sparse Auto-Encoder Net，SAE)学习优化后的数据集特征，将训练好的网络作为永磁同步电机故障诊断的标准。

1 深度学习故障诊断网络模型

1.1 变分自编码网络

神经网络故障诊断主要以监督学习为主，因此海量的标签数据是高效网络诊断的关键。而人工生成标注样本数据存在工作量大、消耗资源多、周期长等缺点，为了解决此类问题，本文利用深度生成变分自编码网络无监督学习已知样本，并基于学到的数据概率分布生成伪样本。

标准自编码网络目标仅仅是数据降维、特征提取，而变分自编码网络的区别之处在于能够训练出潜变量Z的概率分布，通过Z分布采样生成新样本。如图1所示。

已知故障样本数据X通过p(Z|X)推断出Z:

(1)

(2)

由于X为高维的连续变量，p(X)处于复杂的分布，所以通过概率论方法很难计算Z。因此应用变分推断(Varitational inference)方法利用分布q(Z)近似p(Z|X)，通过KL散度[9]衡量两者近似程度。

(3)

将式(3)进行贝叶斯公式变换得到：

logp(X)-KL(q(Z)‖p(Z|X))=

(4)

故障样本X已知情况下p(X)为固定值，因此为了缩短q(Z)与p(Z|X)之间的距离，需要对式(4)等号右侧进行处理：

(1) Decoder：等号右侧第一项的log似然期望最大化；

(2) Encoder：等号右侧第二项q(Z)与p(Z)KL散度最小化。

另一方面可以将随机变量Z分为两个部分：确定部分X；随机部分ε。条件概率z=gφ(X,ε)，gφ为组合函数。ε决定了z条件概率值的变化趋势，则q(Z)=p(ε)，处理式(4)得：

logp(X)-KL(q(X)‖p(Z|X))=

(5)

变分自编码网络可以划分为编码器和解码器。为了简化网络求解过程，假设q(Z)服从多维高斯分布[10]，p(Z)服从标准正态分布，则编码阶段q(Z)与p(Z)的KL散度即可表示为：

KL(p(ε)‖N(0,1))=

(6)

式中：d为隐变量的维度;Σε为方差矩阵。

将高斯分布分解为均值与方差形式：

KL(N(μ,σ2)‖N(0,1))=

(7)

从式(7)可以很清晰地看出KL散度与(μ,σ)的关系，通过不断优化均值及方差参数使散度距离最小化实现p(Z|X)目标的近似。Encoder网络模型如图2所示。

图2 VAE网络Encoder模型

将上述由均值及方差组成的潜变量Z作为解码阶段(Decoder)的采样输入，这样的采样过程会遇到困难：Z～N(μ,σ2)参加采样操作时均值和方差不可导从而导致网络梯度下降训练不可实行。为解决难题，引用重参数方法[11]来实现误差反向传播,原理如图3所示。

图3 重参数技巧

首先从标准正态分布中随机采样参量φ，再经过参数变换得到服从所需高斯分布的采样变量Z，此时对线性变换后的结果进行求取偏导即可完成网络梯度下降训练过程。

(8)

变分自编码网络总的优化目标函数即为Encoder和Decoder阶段损失函数的综合：

Loss=min(J+KL)

(9)

网络经过误差反向传播优化网络参数使目标函数最小化，最终达到数据样本扩展的目标。整体VAE网络模型如图4所示。

图4 VAE数据扩张网络流程

图4中，真实故障集X的概率分布通过KL散度学习分布q(Z)(近似条件分布p(Z|X))编码计算获取输入样本的潜在表达μ、σ，并通过重参数技巧(引入标准正态分布)构成潜变量Z完成反向传播算法。然后通过交叉熵函数最大化似然条件分布p(X|Z)，使生成样本与真实故障样本相似达到最终故障集构建的目的。

1.2 稀疏自编码网络

本文采用稀疏自编码网络进行电机故障诊断，SAE与普通自编码器(AE)相似，具有特征提取、数据降维功能，而它们的区别是实现泛化的方式不同。不同于AE直接惩罚模型参数实现泛化，SAE引入稀疏正则项以及稀疏连接提升网络的表征能力，加强训练，并且解决由于深程度泛化引起的过拟合问题[12]。

如图5所示，稀疏自编码网络编码阶段分析多特征数据集提取重要特征，将复杂的数据分布简单拟合，利用KL散度引入稀疏正则项惩罚网络激活单元，实现局部连接，权值共享。

(10)

图5 稀疏自编码

解码阶段将特征进行数据恢复输出预测结果，通过目标函数比较诊断结果与真实结果的可靠性，在不断地迭代中经过随机梯度下降算法按梯度方向修改权值，最终实现最小化目标函数，并记录相应的网络参数。

(11)

另一方面隐层引入稀疏连接的关键是为了避免各层神经元提取到重复的特征或额外的噪声特征。此时虽然训练阶段的误差较小但测试结果并不满足要求，这样的现象即为过拟合。Dropout能够有效解决这种问题，通过伯努利离散分布随机激活或停止输入节点的状态，并以整体概率为p作为响应，p也可以理解为Dropout率，其直接影响权值参数的个数。Dropout作用于SAE的编码网络和解码网络能够提升隐层处理效率，增强特征提取以及故障诊断能力。

此时训练好的深度神经网络即可用于永磁同步电机故障诊断。最终深度神经网络诊断流程如图6所示。

图6 深度神经网络诊断流程

2 真实故障数据集的构建

本文利用MAXWELL有限元仿真软件构建三相永磁同步电机模型，电机参数设置如表1所示。

表1 三相永磁同步电机参数

通过设置电机并联绕组工作匝数模拟匝间短路故障与失磁现象，从而获取5 000组特征样本数据集。特征样本部分数据如表2所示。

表2 部分特征样本数据集

表2中：A、B、C分别为A相、B相、C相3次谐波电流幅值；E为最低磁密值；F为磁密波动幅值；T为电磁转矩。标签值表示电机状态，分配情况见表3。

表3 电机状态

本文采用组合特征的方式，将不相关的特征项组成7维故障样本集，这样的优势在于：(1) 避免由于某项特征的误差导致诊断错误；(2) 数据集的丰富性以及多样性能够提升深度神经网络学习能力，避免过拟合现象。

3 实验分析

3.1 网络结构优化

在VAE数据扩张实验中，将5 000组电机故障真实样本以3∶1的比例建立训练集与测试集，每一批次采样100组，连续训练20 000次。为寻找最优的网络模型，实验中不断修改网络结构(学习率、学习算法)，将测试的准确率作为衡量标准，结果如表4所示。

表4 VAE参数优化

相同网络条件下，对比不同学习率所对应的准确率可知，学习率的高低对于结果有很大程度的影响，而学习率在0.01情况下训练结果最优。同理，选取Adam(Adaptive Moment Estimation)学习算法作为网络的最优算法。

3.2 样本扩展有效性分析

为展示VAE网络样本扩展的有效性，实验将VAE编码器数据降维后映射到二维潜在空间上均值的分布可视化，判别隐变量是否具有良好的样本重构特性。图7(a)展示了真实样本潜在分布变化情况，最终将电机样本划分为4个区域状态。

图7 数据扩展后潜在空间分布

图7(a)中不同的颜色深度代表不同的状态，很显然训练之后各状态区域均匀分布，彼此之间有明显的界限，则说明潜在空间可以重现输入即存在最小化重构损失(KL散度)实现潜在分布与先验分布近似。

图7(b)采样真实故障样本，经过变分自编码Encoder特征提取，Decoder合成作用，利用误差函数反向传播学习、优化生成结果，实现伪数据样本的合成。与图7(a)相比较，显然扩展后的样本潜在空间分布近似于真实数据分布趋势，证实VAE生成模型的衍生能力。且扩展后的数据集丰富了原样本，促进样本的多样性，另外由于误差产生的噪声样本，能够增强数据集，提升SAE网络故障诊断的鲁棒性。

同时，实验为了实现合成结果的高效性，结合三种误差函数对比分析采取最优方案，结果如表5所示。

表5 VAE损失函数结果对比

实验基于相同的电机样本数量，经过3层隐层网络(全连接层)迭代500次对比不同误差算法最终生成数据的准确性。从表5可知，均方误差与绝对误差算法整体的误差偏差差距较小，而交叉熵函数对于处理真伪偏差问题具有较大的优势，误差值明显低于另外两种算法，因此本文采用交叉熵函数作为判别生成模型的准则。

3.3 故障诊断分析

为了展示SAE引入Dropout稀疏连接对最终结果泛化能力的影响，实验在SAE的基础上引入Dropout率为0.5的稀疏连接，以相同的真实样本为数据源，分别将正常SAE以及处理后的SAE作为诊断模型，实验结果如表6所示。

显然稀疏连接的引入能够更好地发挥深度网络的表征能力以及强泛化能力。因此本文SAE诊断模型即为处理后的SAE网络。

为了进一步展示特征分析的合理性以及数据扩展的高效性，实验将真实样本以及扩展样本分别作为训练网络输入，稀疏化节点提取样本重要特征并进行反复学习，将训练完成的网络用作判断故障诊断的标准，并用测试数据检验诊断效率。实验基于相同SAE网络对比不同数据集下的故障诊断结果如图8所示。

图8 不同训练集条件下诊断偏差对比

两组实验分别经过相同参数(隐藏层：3；隐层节点：10；批处理量：100；步数20 000)的SAE网络，比较不同特征样本集故障诊断的优劣程度。

(1) 实验1将合成的5 000组本文特征分析故障数据集(A，B，C，E，F，T)作为网络输入，显然样本的数量直接影响诊断效率的高低，且随着样本数量的升高准确率趋于缓和，达到最优结果，最终诊断效率达到96.6%。

(2) 在实验2的基础上增加本文提出的VAE数据扩张，增加2 500组额外样本集。由于扩张的数据是从无到有的过程，生成的伪数据通常会携带非相关噪声元素，而这样的样本作为训练数据反而能够提高网络的泛化能力，防止过拟合现象。因此从图8中可以看出，5 000组相同样本数下扩展后特征集准确率会略微高于组合特征集情况。另外样本数过少网络训练无法达到最终状态且诊断效率无法处于最优目标，从额外的样本集诊断结果能够观察到，随着样本数的增多准确率也渐渐趋向于稳定达到99.3%，证明VAE扩展组合特征对于永磁同步电机匝间短路及永磁体失磁故障诊断的高效性。

3.4 与传统方法的对比

不同诊断方法对比结果如表7所示。

表7 不同诊断方法结果对比分析

(1) 小波变换以及经验模态分解作为传统信号处理方法，与SVM分类器相结合用作电机故障诊断。诊断结果展示了这两种方法的实用性，且相对深度神经网络其结构简单，计算方便，但效率不及另外几种方法。

(2) BP神经网络作为回归、分类问题的常客，其良好的监督学习以及泛化能力在电机故障诊断领域也有较好的深入，且结果也比较让人满意。从表7中看出，BP诊断效率为88.7%足以证明BP的可行性，但整体效率还需大幅提升。

(3) 模糊逻辑与BP神经网络的结合，既继承了知识的模糊性，又兼顾了网络学习能力强的特点，其核心是利用阈值向量判别方法。这样的诊断策略从最终的诊断效率可以看出它的可靠性以及灵活性。

(4) 最后两种方法的共同点在于它们都是基于深度学习网络来实现电机故障诊断。DSAE是在稀疏自编码网络的基础上增加噪声的方法来提高训练的鲁棒性，其诊断效率达到98.6%，证实深度学习在故障诊断的高效性。而本文提出VAE+SAE的方法，通过深度学习数据扩张模型一方面增加样本数量提升数据集多样性，另一方面由于误差产生的噪声数据可以达到增强数据集的作用，其优势在于减少人工工作量，减少计算机资源消耗，并能够获得精确的诊断结果。