面向电力变压器的声纹智能诊断装置设计与应用∗

2021-12-15林春清周颖杨超李希元方嘉丽

传感技术学报 2021年10期

林春清周颖杨超李希元方嘉丽

(1.国网大连供电公司，辽宁大连116000；2.国网辽宁省电力有限公司，辽宁沈阳110000)

电网稳定运行和电能高效供应关系着国民经济发展和人民生活质量，电力变压器是电网各环节至关重要的设备之一，一旦发生故障将严重影响电网系统运行，造成重大经济损失。电力变压器体积庞大、构造复杂、成本高昂，其重大故障和严重事故大多是由于内部局部放电、局部过热、绕组变形、机械部件松动、以及设备绝缘老化等潜伏性故障随时间积累引起的，因此，对电力变压器的运行状态进行在线监测，检测发现潜伏性故障，并基于监测数据分析潜伏性故障的发展趋势，准确预测事故的发生，及时对电力变压器进行检修维护，是电力运维人员的重要工作[1]。

电力变压器的在线运行带电检测技术是业内研究的热点及难点，目前主要手段包括电压电流等电气量监测、光谱诊断、油色谱诊断、超声检测、红外热成像诊断等，变电站内也相应地部署了一些监测传感设备，一定程度上提高了变压器在线监测和故障分析的能力，但是设备运行声音的检测仍然需要凭借巡检人员的经验进行异常判断，对变压器声音状态属性的智能感知研究较少，声纹在线监测的成熟应用尚属于空白[2－3]。变压器运行时发出的声音包含了大量的状态信息，正常状态和异常故障时发出的声音信号存在较大差异，不同的故障类型能够产生固有声学特征的声纹信息，通过声纹特征提取与分析能够有效检测变压器内部故障，如直流偏磁、过负荷、机械松动、变压器绕组变形等，能够有效补充常规监测技术的有效性。经验丰富的运维人员可以通过变压器发出的声音定性地判断变压器是否存在故障，但是人耳监听的方式易受主观影响，误差较大，且不能长时间监听，不能达到定量的科学分析，因此，采用声纹传感监测与智能诊断技术，对变压器声信号进行采集、处理、分析，可定量实时监测变压器运行声纹数据，解决人工监听的不足，有效诊断评估变压器健康状态和分析预测异常故障。

基于变压器声音信号的故障诊断已经有了一定的理论技术研究和初步应用尝试，文献[2]从信号采集处理、特征提取、故障诊断等方面综述了变压器可听声诊断技术的研究现状与进展，并阐述了未来研究重点。文献[4]针对变压器可听声故障诊断方法中声音数据采集过程进行了具体分析研究，对常用的动圈式、电容式、驻极体电容式传声器进行分析比较，并推荐驻极体电容式传声器应用在变压器可听声诊断检测中。文献[3]研发的声纹成像测试系统将声场分布云图与可见光图像叠加形成声纹图像，直观定位电力设备噪声源位置，并应用于变电站设备噪声巡检，发现管母和隔离开关缺陷异响，但未报道变压器声纹监测。文献[5]结合人耳听觉感知和变压器声信号，提出了一种变压器故障诊断方法，并通过样本测试验证了该方法的有效性。文献[6]提出了一种基于50Hz倍频倒谱系数和门控循环单元的变压器直流偏磁声纹识别模型，并通过样本数据测试和不同模型结果的对比分析，相较于传统声信号识别算法，所提方法能更好地对直流偏磁状态进行识别。文献[7]提出了一种基于Mel时频谱－卷积神经网络的变压器铁芯松动声纹识别方法和算法模型，通过变压器噪声数据测试，可实现铁芯松动故障的准确识别，为变压器铁芯夹件松动故障诊断提供参考。

深度学习是电气设备缺陷识别与智能巡视的重要方法，目前已广泛应用在基于图像或视频的设备类型识别与缺陷分析中，以及基于声音信号的自然语言模式识别中[8]，并对高压电缆、GIS等设备的放电声纹识别方面有了较成熟的研究与应用[9－10]，针对电力变压器的声纹智能识别与故障诊断算法模型也有了一定的理论研究和样本测试验证，但面向电力变压器的声纹智能诊断装置和系统成熟应用未见报道。本文针对电力变压器的声音数据，开展变压器声纹智能诊断装置的设计研发，采集处理声纹信号，提高复杂噪声背景下设备声音感知水平，结合变压器结构形式、电气温度、负荷状态等数据建立声纹样本库，开展声纹特征提取和故障识别深度学习算法模型研究，建立不同工况下变压器噪声的声纹模型，研发变压器声纹在线监测系统，实现基于声纹识别的变压器异常工况诊断。

1 系统总体设计

电力变压器声纹智能诊断系统是基于电力变压器声纹特征的在线监测与分析诊断系统，主要包括高灵敏度声纹采集装置、数据交换机、管理服务器、算法服务器、以及智能诊断平台，如图1所示。在声纹采集、声纹特征数据库、声纹特征提取与识别、故障识别模型等基础上，实现变压器在线监测、状态分析、故障识别、主动预警等应用。

图1 声纹智能诊断系统总体设计

①声纹采集装置:采用MEMS声学传感器和嵌入式高速处理器，研制声纹采集装置，实现声音信号的采集、预处理、以及传输等功能。

②数据交换机:接入多路声纹采集装置，实现声纹数据的高速传输。

③管理服务器:存储前端采集的声纹数据，运行声纹智能诊断平台，并负责声纹算法模型的调用与交互。

④算法服务器:管理声纹特征数据库，运行变压器故障声纹识别模型，通过变压器声纹识别，提取噪声信号特征，建立不同故障噪声的声纹模型，实现变压器异常分析的故障声纹识别功能。

⑤智能诊断平台:提供人机交互可视化功能，实现变压器属性参数管理、音频信息管理、变压器分析结果、故障主动告警、诊断报告与检修工单自动生成与管理等功能。

2 声纹采集装置设计

针对变压器实际运行环境和需求，研究适用于变压器在线采集的声学传感器技术及传感器选型策略，基于传感器空间布局对采集效果的影响，设计传感器布局方案，并采用声音增强提取等信号处理技术优化声学信号，开发前端精密声纹采集装置，保证数据源质量和高效传输，声纹采集装置总体设计方案如图2所示，主要包括声传感阵列、信号调理模块、信号处理模块、以及电源模块。

图2 声纹采集装置总体架构图

①声传感阵列:声音传感器采用MEMS传声器，设计可更换传声器模组，内部集成温度传感器，配合声音信号的同步采集，可在后端软件中实现基于环境温度的数据修正，并进行半封闭式硅橡胶定位，并配合低压泡模材质实现双层定向降噪。

②信号调理模块:由阻抗匹配、带通滤波器、增益放大等部分组成，对传感器的输出信号进行调理，完成小信号的匹配、滤波和放大。

③信号处理模块:采用嵌入式ARM平台，通过ADC转换模块实现声音信号数字化采样，内置主控程序将采样数据作自然波束形成后，将处理结果通过网口发送给声纹智能诊断平台和算法服务器(图1)进行识别诊断。同时信号处理模块运行嵌入式操作系统，实现多任务处理机制，并提供RS232串口和JTAG调试等对外接口。

④电源模块:采用12V直流供电，通过正负极防接反设计和电磁兼容(EMC)防护设计，提高采集装置安全可靠性，具备EMC4级电磁防护，同时电源转换单元可将12 V转换为各模块所需的5 V、3.3 V等直流电压。

声纹采集装置如图3所示，外壳采用轻量化铝合金材质，集成防水透声膜、抗老化橡胶垫片等防水防尘环境适应性措施，可实现IP67级防护。

图3 声纹采集装置实物图

3 变压器声纹特征提取

变压器的噪声信号较为冗长杂乱，且不同工况下变压器噪声在时域和频域的相似度都很高，很难直接对其进行分析识别，因此，设计多声纹特征提取方法，通过提取噪声信号中的特征，便于后续噪声分析与识别。

整个特征提取方法主要包括预处理、特征提取、以及特征连结三部分，如图4所示。声音信号预处理主要包括分帧、预加重等，目的是去除冗余噪声的干扰，为下一步短时特征提取做准备；特征提取部分，分成短时时域特征和短时频域特征，选用短时能量、短时平均过零率、短时能量熵、Mel倒谱系数来描述分帧特征；最后，对提取到的特征，连结成为特征向量，作为后续多特征融合数据。

图4 变压器声纹特征提取流程图

3.1 变压器噪声信号预处理

变压器噪声信号通常采集较长时间，直接对其进行时域和频域分析难度较大，因此，首先需要对其进行预处理，将一个时间段内采集的变压器声音信号分为若干段短时信号后再进行处理。信号预处理包含分帧和加窗两个步骤，为保证相邻两帧信号的连续性，两帧间一般有重叠，分帧过程中，若帧长太短，则特征向量尺度较小，代表性差；若帧长过长，则声音信号变化过大，影响特征向量的准确性。与语音信号相比，变压器噪声信号较为平稳，在不严重影响识别效率的前提下，可适当增加帧长以获得更高的准确性，经实验测试分析，500 ms左右的帧长最适应变压器噪声。此外，考虑到变压器相同工况下的噪声信号较为稳定，分帧后相邻两帧的连续性较好，可以适当降低相邻帧的重叠率，以减少计算量，经实验测试分析，相邻帧重叠率取40%即可，如图5所示。

图5 噪声信号预处理流程图

为了提取分帧特征，需要对其进行离散傅里叶变换，若直接对分帧信号进行离散傅里叶变换会产生较大失真。因此，对每个分帧信号首先加窗，再进行傅里叶变换，以增加信号两端的连续性，从而减少傅里叶变换造成的失真。常用的加窗函数有矩形窗、汉明窗和汉宁窗等，经实验测试分析，采用汉明窗对分帧信号进行处理，汉明窗具有较好的低通能力，能够更好地反映短时信号的频率特性[11]。

3.2 变压器噪声特征提取

对变压器噪声信号进行分帧预处理后，每一个分帧信号看作为短时平稳信号，分别提取短时时域特征和短时频域特征。短时时域特征主要包括短时能量、短时平均过零率、短时能量熵，短时频率特征选用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients-MFCC)。此外，根据变压器运行工况，设计了能量相似度、振动相关性、振动平稳性以及频率复杂度等特征[12]。

图6 噪声信号短时时域特征图

④梅尔频率倒谱系数:MFCC的求取过程主要包括快速傅立叶变换(Fast Fourier Transform-FFT)、取模值、Mel滤波、对数变换、以及离散余弦变换(Discrete Cosine Transform-DCT)五个过程，如图7所示。对一个分帧信号首先进行FFT变换，并取其模值，然后通过n个Mel滤波器组变换到Mel频率域，再进行对数变换，最终通过DCT运算得到的一组n个系数c(i)即组成了该分帧信号的MFCC特征向量。对预处理后的每一个分帧信号分别求取一个MFCC特征向量，共同组成一个MFCC特征向量组。图8为变压器噪声信号提取的声纹特征图，横轴表示时间，纵轴表示噪声Mel频率，颜色越亮，声音能量越大。

图7 MFCC特征提取流程图

图8 声纹特征图

3.3 变压器声纹特征连结

通过已有研究和实验测试验证得知上述短时时域与频域特征所表征的含义不同，维度不同，对声纹识别的贡献率不同，若直接将上述特征向量用于后续分析，则计算量大，且有时甚至会降低识别率。因此，本文针对变压器噪声信号特点，设计了MFCC特征向量的优化改进处理算法，首先，对MFCC特征向量组引入基于F-score的加权优化方法，通过调优特征向量的F-score来提高变压器噪声信号识别率。其次，对短时时域和频域特征连结成的特征向量，通过PCA(Principal Component Analysis)进行降维，在保证信息不丢失的前提下，尽可能降低特征向量的维度，从而减小计算复杂度。

①基于F-score的MFCC特征向量加权优化:F-score是计量统计领域中常用的指标，用来考察多维数据中各个维度分量的有效性。F-score高的分量表明该分量在同类数据中方差较小，在不同类数据中方差较大，用来做数据分类时效率较高。特征向量第k维的分量F-score值F(k)的计算公式如式(1)所示。

式中:N为识别对象个数，uk(i)为第i个对象特征向量的第k维分量，uk为均值；xk(i)为第i个识别对象所有样本的第k维分量，ni为第i个识别对象的样本数。

一般而言，若F-score大于1，则该分量能够起到区分不同类噪声信号的作用，F-score越大，区分能力越强。以F-score为权重，对上述特征向量进行加权处理，可以增强对识别贡献较多的分量，抑制贡献较低的分量，从而提高噪声识别的准确率。

②基于PCA的多特征降维:将原特征向量的各维分量进行线性组合以生成新的特征向量，使新特征向量各维分量互不相关，且方差尽可能大。设声纹时域与频域特征向量组成的联合特征向量维数为m，根据预处理可知共有n个特征向量，据此构建一个m×n的矩阵X，求取矩阵X的相关矩阵R，同时求出矩阵R的特征值和特征向量，如式(2)和式(3)所示。

计算出矩阵R的特征值λ1，λ2，…λm，以及各特征值对应的特征向量u1，u2，…um，再求出方差贡献率ηi和累计方差贡献率η(p)，如式(4)和式(5)所示。

选取能够使累计方差贡献率大于75%的p值作为主成分个数，即PCA降维之后的特征向量维数，最终实现从m维声纹特征向量到p维特征向量的降维。

奴隶社以汗血换来的几文钱，想为这本书出版，却又在我们的上司“以身作则”的半年之后了，还要我写几句序。然而这几天，却又谣言蜂起，闸北的熙熙攘攘的居民，又在抱头鼠窜了，路上是络绎不绝的行李车和人，路旁是黄白两色的外人，含笑在赏鉴这礼让之邦的盛况。自以为居于安全地带的报馆的报纸，则称这些逃命者为“庸人”或“愚民”。我却以为他们也许是聪明的，至少，是已经凭着经验，知道了煌煌的官样文章之不可信。他们还有些记性。

4 变压器声纹智能识别

变压器声纹特征提取之后，需要对目标工况建模，对待测噪声信号进行比较判定，识别故障工况类型。本文针对变压器直流偏磁、过负荷、过励磁、局部放电、机械松动、变压器绕组变形、有载分接开关故障、断路器操作机构异常共8种故障工况类型进行智能识别，以深度神经网络(Deep Neural Networks-DNN)为基线，针对变压器噪声特征改进DNN模型，在DNN模型训练完成后，移除最后一层分类层，将最后一层隐藏层的输出结果作为声纹模版进行对比，如图9所示。

图9 声纹特征分析网络结构图

4.1 网络结构

基于DNN的变压器声纹特征分析网络结构如图9所示，该网络由四层全连接(Fully Connected-FC)的隐藏层组成，输入为变压器噪声信号提取分帧特征向量经过连结后的结果，输出为与不同工况类型对应的One-hot向量，使用ReLu(Rectified Linear Units)函数作为激活函数，分类使用SoftMax函数，目标函数则使用交叉熵函数。

4.2 基于迁移学习的模型训练

变压器在实际运行过程中，极少发生异常故障现象，很难收集大量不同异常工况下的样本数据，因此，在网络模型实际训练中，由于负样本(异常工况)较少，直接训练容易出现过拟合。此外，如果将已经训练好某型号变压器的不同工况声纹模型用于监测其他型号变压器，需要针对新的监测变压器进行再次训练。基于声学特征具有很大程度的共性假设，本文根据参数迁移的思想，采用迁移学习方式，对不同型号的变压器噪声特征进行训练和学习，首先使用ESC－50数据集进行模型预训练，固定FC1层和FC2层，输出作为特征提取器，然后使用变压器声纹数据集对模型进行Fine-tuning。

具体地，使用ESC－50通用声音数据预训练网络模型后，得到基本的声纹网络框架参数，将预训练完成的模型保留FC1层和FC2层的参数，如图10所示，在此基础上，使用变压器专有声纹数据对FC3层和FC4层的参数继续进行训练，在二次训练后，固定所有参数，将隐藏层的最后一层输出作为监测目标的模板进行比对。

图10 参数迁移模型训练示意图

4.3 声纹识别模板选择与度量指标

对已训练好的、固定参数的网络模型，去掉最后一层带有标签的输出分类层，将最后一层隐藏层的输出作为该工况对应的声纹模板。对于不同工况，随机取出训练数据集中的5~15条数据，经过网络模型得到目标模板，由于模板选择具有一定的随机性，为确保目标模板能够准确反应该类工况下的噪声情况，使用k均值聚类算法(k-means clustering algorithm)对得到的目标模板进行聚类。

具体地，首先，将上述5~15条数据对应的目标模板输出进行k为2的聚类，完成聚类后，选择多数样本所在的聚类作为代表该类工况的目标模板p，然后，将待检测噪声信号进行特征提取，输入训练好的网络模型，得到最后一层隐藏层的输出o，最后，使用余弦相似度度量比较o与目标模板输出p的相似性，如式(6)所示。

5 声纹特征数据库

在大量模拟试验及现场测试的基础上，建立变压器工作状态声学特征数据库，其中包含变压器正常状态和不同故障状态下的声学特征，是人工智能算法模型和声纹智能诊断的重要样本数据。

如图11所示，首先利用含标签的声学数据训练神经网络模型，并将变压器的电压、电流、负荷、油温、绕温等状态参量作为神经网络模型的输入，神经网络模型会对变压器是否异常给出输出预测。对于一些较为复杂的情况，通过电力专家的经验知识来做出判断，并将专家的经验知识传授给神经网络，对神经网络模型进行更新，经过反复迭代训练，神经网络对于未知的情况也能给出相应的预测。最终利用人工智能算法对变压器的工作状态(正常和异常)和变压器的状态参量(电压、电流、负荷、油温、绕温)等进行预测，且对于每一种异常状态，数据库包括其异常状态的区分性特征类型，同时，将所利用的电力经验知识入库，数据库还具有适应性和易于增添属性等特点，预留多种属性预测的数据库接口，以便于未来的研究工作。

图11 声纹数据库构建过程

声纹特征数据库包括以下内容:

①音频样本

包括变压器在正常、异常工作状态时的音频文件，对于每个异常的音频文件，数据库中标明其异常类型和其音频特征。

②变压器工作状态

包含变压器的正常工作状态和异常工作状态，以及相对应的异常状态类型。

③变压器状态参量

主要包含变压器的电压、电流、负荷、油温、绕温等参量，一方面来自人工标注的数据，另一方面由神经网络输出得到状态参量的预测。

④潜在属性

包含变压器在不同工作状态时易区分的音频特征，或者通过人工智能算法模型输出的潜在特征向量，这些特征向量和变压器工作状态紧密联系，能表征变压器的某些属性。

⑤电力经验知识

工智能算法模型，将这些专家经验知识入库。

6 声纹监测平台

在声纹采集装置的基础上，研发了用于人机交互的声纹监测平台，集成噪声信号存储、声纹特征提取、以及声纹识别算法等功能，实现变压器声音在线监测与智能诊断，主要包含声纹展示、设备与数据管理、实时监测、主动告警、人工诊断、声纹样本库等功能，如图12所示。

图12 声纹监测平台页面图

平台实时采集设备运行的声纹信息，展示每个采集装置的实时音频频谱图与声纹特征，并支持音频回放与人工诊断功能；利用声纹识别算法，可对在线监测的声纹数据进行全面的综合诊断，包括频谱分析、事件检测、负荷识别、时频域分析，最终形成设备运行状态的全面诊断报告。同时，具备变压器设备管理功能，可管理查看地市级各变压器整体运行工况信息，综合声纹智能诊断结果、生产厂家、电压等级、投运年限、绕组类型、冷却方式等维度生成检修工单等。

7 测试应用

7.1 数据集对比测试

传统分类识别算法主要包括SVM(支持向量机Support Vector Machine)、NN(神经网络Neural Networks)、CNN(卷积神经网络Convolutional Neural Networks)，使用传统分类识别算法与本文设计的迁移学习网络在ESC－50数据集上进行识别准确度对比测试。首先，将ESC－50数据集的2000条音频分成5叠，每叠400条，覆盖全部50个类，并确保同一场景不同时段的音频只在一个叠中出现，避免数据污染。其次，分别在5叠数据中使用训练和测试交叉验证方式，训练数据量和测试数据量作5折交叉，每叠中选取80%作为训练集，剩余20%作为测试集，最后，平均5叠的结果得到识别准确率均值，对比测试结果如表1所示。

表1 与传统算法的结果对比

通过分析已有声纹识别算法，结合变压器声纹数据特点，本文设计的迁移学习深度神经网络算法的识别准确率从通用CNN算法的42.63%提升到91.80%。

ESC－50数据集已被大量环境声音识别论文作为基准评估数据集，并得到了很好的分类器识别精度。表2统计对比了目前基于ESC数据集的先进识别方法与本文所设计算法的精度，相比于已有方法，本文设计的迁移学习深度神经网络算法的识别准确率有了一定提升。

表2 与现有识别算法的结果对比

7.2 变电站应用验证

变压器声纹采集装置及智能识别诊断算法已在安徽合肥锦绣220 kV变电站、辽宁大连220 kV港东变电站等21座变电站/换流站部署应用，如图13所示，通常在变压器的四面各布置一台声纹采集装置，通过大量测试验证得到了装置与变压器之间距离的经验值为1 m左右，该距离是传感器采集信号强度的最优范围，距离太近，易丢失该采集面边缘侧的信息，距离太远，易受到外界杂音的干扰。该系统于2019年1月准确捕获某超高压站主变直流偏磁异常工况，以及某110 kV变电站主变压器绕组变形缺陷，目前已积累形成了约70 000 h的声纹样本库数据，通过训练优化提升了识别算法模型。

图13 声纹变电站现场布置图

通过实际部署运行，本文研发的声纹采集装置和算法模型可满足变电站现场应用和数据分析的需求，可作为变压器局放、电压、电流等在线监测的有效补充，丰富了变压器状态监测技术手段，对于电力行业发展新一代智能不停电检测装备，提高电网设备智能管控水平具有重要的示范推广价值。

8 总结

本文设计了面向电力变压器的声纹采集装置，用于采集变压器噪声信号，并开发了相关的预处理和特征提取算法，基于变压器噪声信号特点，设计了迁移学习人工智能识别网络模型，实现了变压器直流偏磁、绕组变形、过负荷等工况的智能诊断识别，并开发了人机交互声纹监测平台，对软硬件和分析算法进行了集成。通过数据集测试和变电站部署应用，验证了该声纹采集装置和相关算法的有效性和可靠性，能够满足实际变电站运维需求。研究了变压器声纹特征数据库的建立方法，随着系统现场部署应用和推广，采集变压器运行异常工况声纹样本，不断优化提升算法模型，丰富数据库内容，逐步建立全面可靠的声纹特征数据库。

目前系统已在20余座变电站部署应用，变压器异常工况识别准确率可达76%，使用声纹识别方式，一方面可以独立识别特定类别的缺陷，有效解决通过图像或在线监测等手段无法识别的潜伏性缺陷隐患，另一方面可作为局部放电等其他监测方式的有效补充，提升综合检测能力。

后续，在变压器声纹样本库不断丰富的基础上，进一步利用迁移学习，获取有效的先验，并研究语谱图、色度特征等更多的语音特征，增加可训练参数，提高人工智能网络模型的拟合能力。同时可开展监听式和振动式声纹相融合的多模态声纹智能诊断装置，提高异常工况识别可靠性。