改进残差网络的逆变器开路电路故障诊断
2024-03-06谢泽文陈裕成柴琴琴林琼斌王武
谢泽文, 陈裕成, 柴琴琴, 林琼斌, 王武
(1. 福州大学电气工程与自动化学院, 福建 福州 350108; 2. 漳州职业技术学院 电子信息学院, 福建 漳州 363000)
0 引言
三相电压源逆变电路作为控制设备的核心电源, 广泛应用于电机驱动和各种电力系统[1-2]. 统计数据表明, 三相电压源逆变电路的开关管器件故障高发, 主要有开路故障和短路故障. 其中开路故障来源于电路工作温度过高引起的导线断裂或栅极信号丢失, 值得注意的是三相电压源逆变器电路的短路故障发生时, 配置的短路保护装置会自动切换开关管, 也会将短路故障转换为开路故障[3]. 逆变器发生开路故障时, 由于功率转换器中的功率电子元件数量较多, 逐个诊断功率电子元件耗费大量时间. 因此, 实现智能故障诊断是提升诊断速度、 容错性和可靠性迫切需要解决的问题, 以减少停机时间、 实现预测性维护、 节省人力和资源.
三相电压源逆变电路故障诊断技术是电路测试领域的研究热点. 传统的故障诊断方法一般步骤是信号获取→特征提取→故障识别[4], 其中特征提取在一定程度上决定了故障诊断的准确率[5]. 传统方法的诊断特征处理步骤较为复杂、 依赖人工经验知识、 可迁移性差, 不利于早期电气故障的快速诊断[6-7].
鉴于故障诊断的数据多为一维时序信号、 卷积神经网络的强大特征自提取能力, 一维卷积神经网络(1-D convolutional neural network, 1-D CNN)逐渐成为故障诊断的一种主流方法. 文献[8]采用1-D CNN 来实现模块化多电平转换器的故障诊断, 省去特征提取等预处理环节. 文献[9]验证1-D_CNN用于传输故障诊断任务的有效性. 文献[10]提出紧凑式结构的卷积神经网络直接对一维信号数据进行诊断. 文献[11]提出一种优化改进堆叠降噪自编码器的故障诊断模型, 并利用学生心理优化算法对模型参数进行求解. 上述方法有针对性地解决了一些电力电子器件的故障诊断问题, 但一维卷积层进行特征提取时容易丢失时序特征, 导致模型在训练过程中容易出现过拟合. 此外, 目前最前沿的卷积神经网络结构并不能直接适用于一维时间序列信号, 需要输入二维图像才能充分发挥网络的性能.
鉴于此, 本研究提出一种基于改进ResNet18网络的三相电压源开路故障诊断方法. 该方法选取包含故障信息的相电压为检测量, 引入一种新的数据预处理方法, 把原始时间序列信号经过马尔可夫变换转换为二维图像, 尽可能地保留更多的数据时空信息. 然后将ResNet网络与改进注意力机制相结合, 实现诊断结果和误分类信息自动输出. 该方法无需任何人工特征提取操作, 为三相电压源逆变器开路故障诊断提供了一种具有更高的诊断准确率和鲁棒性的故障诊断模型.
1 三相逆变器故障样本采集
1.1 三相逆变电路故障分析
三相电压源逆变电路的拓扑结构如图1所示. 图1中L为滤波电感, R为负载, C1为滤波电容, S1~S6为功率管,Udc为直流侧电压. 在直流电源输出端并联大电容以稳定直流侧电压, 所有开关器件采用带反并联二极管的全控型开关器件. 驱动模块提供驱动信号控制功率管开通和关断, 当门极信号为1时, 功率管开通; 当门极信号为0时, 功率管关闭. 正常情况下任意时段内各桥臂仅存在一个开关管导通. 然而逆变器由于实际工作环境恶劣、 工作时间久等原因出现单管或两管同时发生故障的情况.
图1 三相电压源逆变电路Fig.1 Three-phase voltage source inverter circuits
逆变器的故障可分为开路和短路故障. 由于短路故障时间一般在10 μs以内, 现有条件难以检测, 且通常开关器件是与熔断器串联的, 在故障发生时, 熔断器断开将短路故障转化成开路故障, 因此本研究以开路故障类型作为研究对象. 在实际运行过程中, 最常见的三相电压型逆变器开路故障可分为 5类 22种类型, 如表 1 所示, 包含单管开路、 两管开路故障等.
1.2 故障数据采集
三相逆变器功率管发生开路故障时将影响输出相电压, 导致相电压Ua、Ub、Uc发生畸变或波形缺失, 不同故障类型所产生的故障波形也不相同. 经分析和统计, 若只取其中某一相相电压作为故障信号时, 会出现故障电压波形重复的情况, 进而导致误诊. 比如, 当S5开路故障时, 正常和故障情况下Ua电压波形相同. 为了准确区分不同故障类型, 本研究采集三相相电压作为故障特征, 实现故障诊断.
本研究搭建如图2所示的故障数据采集平台, 主要由直流电源、 三相逆变器、 反激辅助电源、 驱动电路、 数据采集卡(PCI-6229)、 采样电路和PC机组成. 驱动电路采用MS320F28069芯片产生控制信号组成. 其中, PC制信号用于控制三相功率管模拟开路故障, 采样频率为50 Hz. 采集得到的不同故障类型电压波形如图3、 4所示. 受篇幅所限, 表1中各大类故障仅列两小类作为对比.
表1 三相逆变器开路故障类型
图2 实验平台Fig.2 Experimental platform
图3 单管和同桥臂两管故障时电压波形Fig.3 Voltage waveform when single tube and two tubes of the same bridge arm fail
模式1. 发生单管开路故障时, 以S1和S5功率管单管开路故障为例, 由于上桥臂断开, 只有下桥臂正常开通关断, 相电压缺失一半波形, 如图3(a)所示.
模式2. 发生同桥臂两只功率管故障时, 以S1S2或S3S4故障为例, A相或B相对应的桥臂上下两管都是断开状态, 没有电流流过, 导致A相或B相相电压为0的情况, 如图3(b)所示.
模式3. 发生不同桥臂异侧两管故障时, 以S1S5或S3S5故障为例, 在任意时刻各桥臂均只有1个功率管导通, 而同侧的桥臂开路导致电流不能经过正常相对侧的功率管. 在这样的情况下, 每一相的相电压波形都出现半波丢失和电压波形畸变, 如图4(a)所示.
图4 不同桥臂两管故障时电压波形Fig.4 Voltage waveforms when two tubes of different bridge arms fail
模式4. 发生不同桥臂同侧两管故障时, 以S1S6或S4S5为例,发生功率管故障的桥臂都处于断开状态, 正半周没有电流流过, 导致功率管输出出现半波缺失, 剩余半波波形产生畸变. 另一相电压同时发生电压畸变, 如图4(b)所示.
由以上故障波形图可看出, 不同故障类型波形十分相似. 如, S1S5与S3S5故障、 S1S2与S3S4故障, 使用常规的机器学习方法难以准确地判断三相电压型逆变器的故障类型. 因此, 本研究提出一种改进的深度学习算法实现故障高精度诊断.
2 改进的P_CBAM_ ResNet18故障诊断模型
2.1 改进的故障诊断模型结构
ResNet18[12]通过深层的特征提取网络将数据映射到更加离散的高维空间, 保障种类数量较多的分类任务的分类精度, 在所有ResNet网络中具有参数量最少、 训练速度快的特点. 考虑到实际应用环境下模型部署的条件限制, 本研究选择ResNet18作为模型基本架构. 然而ResNet18是针对二维数据设计的, 且由于残差块对冗余信息采用非线性激活进行信息提取, 模型易受噪声影响, 很难直接用于逆变器实际故障数据的学习. 为此, 本研究提出一种基于马尔可夫转移场(Markov transition fields, MTF)转换和带并行注意力机制的ResNet18网络模型(parallel-convolutional block-attention module-ResNet18, P-CBAM-ResNet18)的故障诊断模型. 该模型的自动特征提取层可以充分挖掘图像中时间和空间关系, 这在一维的信号中是无法实现的, 因为一维 CNN 在检测信号局部相关性存在不足[13], 其结构框图如图5所示.
图5 改进的P-CBAM-ResNet18网络结构图Fig.5 Improved P-CBAM-ResNet18 network structure
本研究利用MTF可以保留原始信号在不同时间间隔内的时间相关性的特点, 把原始电压信号转换成二维的图像. 然后, 依次经过ResNet18的1个普通卷积层、 4个带残差块的卷积层将特征图像映射到高维特征空间, 再利用改进的并行注意力机制实现高维特征的双通道筛选和融合. 接着, 用ResNet18的全连接层来整合融合后的特征中具有故障类型区分性的局部信息. 最后, 在ResNet18的输出层采用Softmax分类器进行故障分类. 该方法以文献[12]中ResNet18为基本框架, 这里只对MTF转换原理和改进的注意力机制进行详细介绍, 详见下面小节.
2.2 基于MTF的数据转换
直接将一维信号或者将其平铺成二维信号作为故障诊断模型的输入时, 只能学习到不同特征维度上特征之间的空间关系, 忽略了状态的时间转移特性. 而马尔可夫转移场变换可呈现时域之间的信息关系[14], 采用MTF变换更能表征逆变器故障信息, 保留更多有效信息.
马尔可夫转移场通过表示马尔可夫转移概率来对一段信号进行求和, 把局域不明显的特征提取出来. 首先, 将电压序列数据X=[x1,x2, …,xn]平均划分为Q个区域, 序列中每个数据点xi可以映射到qi(i∈ {1, 2, …,Q}).然后, 通过跟随矩阵得到马尔可夫变迁场概率矩阵M.即
(1)
得到矩阵M后, 将矩阵中的元素作为像素, 从而完成MTF转换的全程. 为了验证MTF算法的唯一性, 使用MTF转换原理对原始电压信号进行二维映射, 结果如图6所示.
图6 MTF映射说明Fig.6 MTF mapping instructions
从图中可以看出, 完整波形的一维信号对应的是完整的十字形图像(图中方框标注). 波形缺失的部分(图中圆圈标注)对应的MTF是模糊不清. 以上结果表明, 电压信号通过在MTF图中能够进行完整映射.
2.3 改进的并行注意力机制
ResNet18网络中残差块可以解决由于网络层数较多而出现的退化问题, 但是对冗余信息采用非线性激活信息提取时, 易受噪声影响. 而注意力机制(convolutional block attention module, CBAM)[15]可以有效提升残差块对关键特征的提取, 抑制冗余信息对模型训练的影响.
传统CBAM模块采用串行连接方式. 首先是将特征图(F)经过通道注意力机制(channel attention module, CAM)加权得到特征图(F1), 再经过空间注意力机制(spatial attention module, SAM)加权得到输出特征图(F2), 使网络先关注图像中对分类结果起决定作用的特征通道, 再考虑图像特征中重要的位置. 然而由于CAM和SAM先后顺序关系导致接在通道注意力机制所学习到的是筛选过的特征图, 影响空间注意力模块所学习到的特征, 甚至由于“串行连接”产生的干扰, 会使注意力模块的效果变得不稳定.
为此, 本研究提出采用“并行连接”的方式构造注意力机制, 使两个注意力模块都直接从原始的特征输入进行学习, 再将通道和空间输出特征的双线性池化结果作为输出. 与原始串行连接相比, 空间注意力机制输入特征更全面, 并行连接的空间注意力部分得到增强, 更加关注不同特征之间的图像空间位置关系, 即关注图像中对故障分类起决定作用的故障特征区域, 忽略无关区域. 其次, 传统双线性池化[16]特征的高维会导致整个模型参数大小和训练时间增加, 本研究提出采用紧凑双线性池化(compact bilinear pooling, CBP)[17]对并行通道结果进行融合, CBP使用 Count-Sketch 映射函数将2个向量投影到较低维空间, 然后通过快速傅里叶变换来计算2个向量的外积, 实现对图像局部判别性特征进行交互与融合, 提取图像成对的特征关系. 因此, 并行注意力机制的输出为
f=F-1(F(C1(f1))•F(C2(f2)))
(2)
其中:C1和C2是2个Count-Sketch映射函数; •是两个向量的点积;F为快速傅里叶变换;f1表示特征图经过通道注意力模块的输出;f2表示特征图经过空间注意力模块的输出. 其计算式分别为
f1=Mc(F)⊗F
(3)
f2=Ms(F)⊗F
(4)
其中:Ms(F)、Mc(F)分别为基本通道和空间注意力模块操作; ⊗特征图加权乘法运算符号.
操作过程详见文献[16], 具体计算式为
Ms(F)=σ(γ7×7([AvgPool(F), MaxPool(F)]))
(5)
Mc(F)=σ(MLP(AvgPool(F)))+σ(MLP(MaxPool(F)))
(6)
其中:σ表示Sigmoid函数; MLP表示二层的共享全连接层; AvgPool、 MaxPool分别表示平均池化和最大池化定;γ表示卷积操作.
3 故障诊断试验与分析
3.1 实验数据采集
利用图2所示的实验平台, 每个相电压采样400个数据点, 采样频率50 Hz. 对于每个故障状态采集800样本, 共有22种故障运行状态, 共17 600个样本. 数据按训练集∶验证集∶ 测试集=7∶2∶1的比例划分, 并对训练集样本进行随机顺序打乱. 所有实验独立运行10次, 实验结果取10次平均值.
3.2 实验结果与分析
3.2.1消融实验
为了评估不同连接方式的注意力机制对ResNet18网络性能的影响, 本研究选取ResNet18、 未加入CBAM的双特征融合模型CBP_ResNet18、 单独加入通道注意力的CAM_ResNet18、 单独加入空间注意力的SAM_ ResNet18、 加入正向串联连接的注意力的CBAM_ResNet18、 反向串联连接的注意力R_CBAM_ResNet18和本研究所提出的P_CBAM_ResNet18网络模型进行对比, 采用诊断精确率来评估模型的有效性. 实验选用 Adam 优化器, 初始学习率为0.001, 最终平均诊断精度和时间如表2所示. 验证集的准确率如图7所示.
表2 ResNet18嵌入各注意力模块的实验结果
图7 验证集准确率Fig.7 Verification set accuracy
由图7和表2可知, 相比于ResNet18模型诊断结果, 只对ResNet18使用紧凑双线性池组合时, 准确率并无提升, 但嵌入注意力机制后准确率均得到明显提升. 其次, 不同连接方式的注意力机制精度不同, 说明通道注意力机制和空间注意力机制的连接顺序对模型精度有影响, 本研究提出的并行注意力模块P_CBAM的表现最优, 其诊断准确率达到99.80%, 比ResNet18提高2.88%, 比串行注意力模块提高1.15%. 因此, 采用并行连接的CBAM能够有效提高故障的诊断准确率.
从表2中诊断时间可以看出, 单次诊断时间为0.017 3 s, 可为逆变器发生开路故障后的故障类型和器件进行快速定位.
3.2.2鲁棒性实验结果对比分析
在实际工况中, 三相电压逆变器的电压会受到外部噪声的影响. 为了进一步验证本研究所提出的网络模型的泛化性和鲁棒性, 在原始的数据中加入不同比例的噪声作为实验数据. 将本研究模型与以下4种模型进行对比, 分别是: 以原始三相电压数据作为输入的贝叶斯网络(1D_BYS)、 基于时域分析的一维卷积神经网络(1D_ CNN)、 以MTF转换的数据作为输入的MTF_ResNet18和直接将原始数据进行平铺成方阵的2D_P_CBAM_ResNet18. 诊断准确率如图8所示.
图8 各算法在不同噪声的识别准确率Fig.8 Recognition accuracy of each algorithm in different noises
从图8可见, 虽然随着信噪比的降低, 5个模型的平均精度均呈下降趋势, 但当信噪比降至-4~-8 dB时, 其他算法都有较大的波动, 而本研究提出的方法准确率都在90%以上, 诊断效果稳定. 在不同信噪比下, MTF转换图像的平均诊断精度相比于直接平铺成2D数据, 提高1.375%; ResNet18加入并行注意力的平均诊断精度相比ResNet18, 提高2.88%. 这两组数据对比分析可知, MTF转换和并行注意力机制均可有效提高模型的诊断精度和鲁棒性. 这主要归功于MTF可以有效保留原始数据的故障、 注意力机制可以通过计算位置信息和通道特征权重来挖掘关键故障特征, 并且抑制无用的噪声干扰特征.
4 结语
本研究以三相电压源逆变器电压信号作为故障诊断信号, 采集22种不同故障状态下的电压数据, 对原始数据进行马尔可夫变换, 然后将转变后的二维图像数据输入到P_CBAM_ResNet18进行故障识别. 消融实验和鲁棒性实验结果验证数据转换和改进注意力模块对提升模型精度和鲁棒性的有效性. 与其他方法相比, 基于MTF变换和P_CBAM_ResNet18三相电压源逆变器故障诊断方法优势在于以下几点.
1) MTF图像转换的预处理方法可以保留原信号内的时间特征, 减少信息损失.
2) 所提出的P_CBAM_ResNet18故障诊断方法, 可实现故障特征自动提取, 避免特征提取对经验的依赖. 同时, 解决基本注意力串行连接时两种注意力产生干扰的问题, 减少外部噪声对诊断结果的干扰, 提高模型的诊断精度, 具有良好的鲁棒性.