基于重复模式提取与高斯混合模型的变压器故障声纹识别

2023-02-21王广真付德慧杜非于浩蔡睿王谦弓艳朋

广东电力 2023年1期

王广真，付德慧，杜非，于浩，蔡睿，王谦，弓艳朋

(1.中国电力科学研究院有限公司，北京 100085；2.国网北京市电力公司电力科学研究院，北京 100036)

电力变压器是电力系统的重要设备，在其运行全寿命周期内需要定期开展检修工作，以维持正常运行状态[1-2]。变压器正常运行时会发出声音，随着运行状态的变化(如发生故障或过负荷运行时)，变压器发出的声音也会产生变化。变电站的工作人员可在现场巡检时通过听取变压器运行声判断其运行状态，但在变压器发出异常声音时靠近变压器可能威胁工作人员的人身安全。利用现代数字信号处理技术进行变压器声纹故障诊断，既可提高变压器声纹识别的准确度，也可确保工作人员的人身安全。

最初有关变压器声音的研究主要与变压器的噪声控制有关，近年也开始将声纹识别应用于变压器故障检测。外文文献中，A.Swedan等人提出基于模式识别的局部放电信号声学检测方法，模拟产生局部放电的不同情况，提取的声信号特征被输入人工神经网络用于训练和分类；结果表明，利用信号熵等特征可显著提高局部放电声信号的检测性能[3]。X.J.Dang等人提出基于Gammatone滤波器倒谱系数(Gammatone filter cepstral coefficient，GFCC)声纹谱和卷积神经网络的故障诊断方法，利用VGG-16深度学习算法计算出声信号GFCC的特征参数，由此识别变压器的典型故障；对额定电压10 kV的干式变压器进行不同工况下的负荷试验，模拟变压器过载运行和铁心松动，验证了所提方法的正确性[4]。B.Yan、G.Q.Qian等人利用梅尔频率倒谱系数(Mel frequency cepstrum coefficient，MFCC)特征提取和矢量量化算法进行变压器异常声纹识别；利用10 kV干式变压器模拟变压器铁心松动声，对模拟的异常声音信号预处理后，结合主成分分析和MFCC计算噪声信号的特征向量，然后建立矢量量化模型来识别噪声特性[5]。Julaiti Abulizi等人提出基于门控循环单元(gated recurrent unit，GRU)的变压器声纹识别方法，对实验获得的变压器在非正常励磁或铁心松动情况下的音频数据预处理后，利用MFCC进行特征提取，构建一个GRU结构，并将其与长短时记忆网络和递归神经网络进行比较；结果表明，基于MFCC和GRU的声纹识别方法能有效检测变压器异常声音[6]。

国内文献中，华北电力大学的赵书涛课题组首次将声纹识别应用于变压器故障诊断。华中科技大学的陈俊武课题组主要研究变压器放电故障声学诊断；在实验室模拟了不同类型的变压器内部放电和外部放电，分析不同放电类型的频谱特点；用小波包算法提取能量作为特征向量，小波变换用于故障类型辨识；并研制了变压器故障声学诊断仪，可识别变压器内部放电故障[7]。上海交通大学的王丰华课题组在10 kV干式变压器上模拟变压器铁心松动和绕组松动故障，分别尝试GFCC、压缩观测和耳蜗滤波倒谱系数等特征提取方法，声纹识别算法方面采用鲸鱼算法优化随机森林[8]、判别字典学习[9]、矢量量化算法[10]和概率神经网络[11]等，对于变压器机械故障都有较高的识别率。华北电力大学的刘云鹏课题组主要通过深度学习算法实现变压器机械故障的声纹识别，对变压器铁心夹件松动时的声纹[12]、有载分接开关传动机构卡涩及内部组件松动故障[13]、不同运行工况下的铁心振动时的声纹[14]及直流偏磁[15]都进行了相应的研究。

一些文献针对变电站干扰声音也提供了一些处理方法。周东旭采用集合经验模态分解算法去除部分杂散噪声和低频噪声，利用K-SVD字典和正交匹配追踪算法从含噪信号中分离出变压器真实声音和干扰分量[16]。田昊洋针对变压器冷却风机噪声，提出一种利用稀疏自动编码器从含冷却风机噪声的声音信号中分离出变压器本体声音信号的方法，但没有考虑瞬时性干扰声音的影响[17]。邹亮将改进的基于势函数的稀疏分量分析算法应用于变压器振声提取，现场实验发现该方法受声反射的影响较大，分离出的变压器振声信号幅值不稳定[18]。朱柯佳将小波阈值、谱减法、FastICA算法应用于变压器声音的去噪，分析得到各方法的去噪效果：基于小波阈值的去噪方法对不同类型的噪声去噪效果差别不大，但噪声信号的输入信噪比对其去噪效果影响较大；基于FastICA的去噪方法更适合去除瞬时干扰与混合噪声，对持续弱干扰的效果不佳；基于谱减法的去噪方法更适合处理持续弱干扰[19]。

综上所述，目前国内外关于变压器声纹识别的研究有了一些进展，但在实际应用方面还存在问题。变电站存在的大量干扰声音可能导致提取的变压器声纹特征模型产生变化，影响声纹识别效果。现有的声纹识别研究主要是针对变压器本体声音的去噪，当变压器出现放电故障或冷却风机故障时，故障声音会与变压器本体声音叠加在一起，现有的去噪方法对此没有针对性；而且干扰声音的出现有很大的随机性，无法提前预知干扰声音出现的时刻及类型，进而选择合适的去噪方法。因此，本文提出一种基于重复模式提取(repeating pattern extraction technique，REPET)和高斯混合模型(Gaussian mixture model，GMM)的变压器故障声纹识别方法。首先，在真实的变压器油箱中模拟不同类型放电和机械故障。其次，针对变电站内非平稳性干扰声音，采用基于REPET的盲源分离算法将非稳定干扰声音从混合声音中分离。然后，针对主要由变压器冷却风机造成的持续性干扰声音，通过选择鲁棒性较好的MFCC特征和基于GMM的声纹识别算法来降低风机噪声对声纹识别系统的影响。最后，采用实验数据验证该方法对含噪声音的识别率。

1 变压器故障模拟与声音特征分析

1.1 变压器放电故障模拟

运行中的变压器绝缘结构复杂，可能发生的内部放电类型很多，通常有如下几种：绕组端部油隙放电、绕组中部油-隔板绝缘中油隙放电、绝缘纸沿面滑闪放电、接触绝缘导线和绝缘纸的油隙放电[20]。变电站内一些导体的尖角处也可能发生电晕放电，属于变压器外部放电。本文设计了3种放电模型，如图1所示：图1(a)为平板放电模型，模拟变压器内部均匀电场中的放电(如绝缘纸间放电)，高压电极和接地极均为直径2 cm圆形电极，电极间夹着1 mm厚的绝缘纸板；图1(b)为柱板放电模型，用于模拟电极和绝缘纸板接触产生的变压器油中沿面放电，高压电极直径为0.5 cm，接地极直径为2 cm，绝缘纸板厚度为1 mm；图1(c)为针板放电模型，用于模拟变压器外部的电晕放电，空气间隙长度为1 cm。

图1 放电模型Fig.1 Discharge models

变压器内部放电故障的模拟如图2所示。在变压器油箱内放置平板放电模型和柱板放电模型，分别模拟变压器内部均匀电场的放电和沿面放电。

图2 故障模拟实验图片Fig.2 Fault simulation experiment picture

1.2 变压器冷却风机故障模拟

变压器风冷系统启动后，冷却风机在运行过程中可能发出异常声音。造成这种现象的原因有固定风机的螺丝松动、电动机扇叶变形或损坏、电动机轴承缺少润滑油、电动机扇叶触碰风罩或风道被堵等[21]。实验室模拟3种类型的变压器冷却风机故障声音：①冷却风机消音罩振动产生的声音；②固定风机的螺丝松动产生的声音；③电动机扇叶触碰风罩产生的声音。

1.3 变压器本体声音与故障声音特征分析

变压器故障声纹识别过程中，声音的采集是非常关键的，采集设备的性能直接影响声纹识别结果。本文选择电容式麦克风作为声信号传感器。采样频率48 kHz，频率响应范围为20 Hz～20 kHz，最大声压级为120 dB，灵敏度为4.5 mV/Pa(1 kHz)，信噪比为100 dB。对变电站采集的自冷变压器声音数据进行时域和频域特征分析，如图3所示。考虑到录制故障声音时周围环境的噪音也会被麦克风采集，在进行以上故障声音特征分析前，已经减去了实验环境的背景声音。

图3(a)为0.15 s长度的时域波形，可以看出正常运行的变压器声音时域波形有明显的周期性。由图3(b)可以看出，变压器本体声音的频率成分主要分布在1 000 Hz范围内，频率成分主要是100 Hz及其倍频分量，并含有一些50 Hz的奇次倍频分量。

图3 自冷变压器声音信号的时域图和频域图Fig.3 Time domain and frequency domain diagrams of self-cooled transformer sound signals

在相对安静的实验室进行变压器故障实验，采用电容式麦克风和Adobe Audition软件录制音频并进行特征分析。图4为实验模拟的放电故障和机械故障声音的频域图。可以看出：平板电极放电声的频率成分主要集中在10 kHz以下；沿面放电声的频率成分主要集中在8 kHz以下；电晕放电声的频率成分在整个可听声频段均有分布；3种机械故障的频率成分主要集中在4 kHz以下。

图4 故障声音频域图Fig.4 Frequency domain diagrams of fault sound

2 干扰声音处理算法

2.1 干扰声音特征分析

声纹识别尚未在变压器故障诊断中得到广泛应用的一个重要原因是：采集到的声音信号中可能存在许多干扰声音，影响声纹诊断的效率和准确性。因此，在进行变压器故障声纹识别前有必要对声音进行去噪处理。为进一步了解变电站内干扰声音的特点，采集了变电站常见的干扰声音，包括脚步声、说话声、鸟叫声、汽车鸣笛声、隔离开关声和断路器动作声。分析干扰声音的时域和频域特征，并对干扰信号进行分类，具体见表1。

脚步声、说话声、鸟叫声、汽车鸣笛声、隔离开关声和断路器都是随机出现的干扰声音，可归类为非稳定声音；冷却风机声归类为连续稳定声音。由表1可以看出许多干扰声音的频带较宽，且不同干扰声的频率成分有交集。

针对变电站内的非稳定干扰声音，采用基于REPET的盲源分离算法将非稳定声音从混合声音中分离。实验模拟的放电声音响度很小，当与风冷变压器声混合时，放电声音的频域特征被变压器本体声和冷却风机声完全淹没；因此，本文采用特征域和模型域方法处理变压器冷却风机声导致的连续稳定干扰，即通过选择鲁棒性较好的MFCC特征和GMM声纹识别算法降低风机声对声纹识别系统的影响。

2.2 REPET算法原理

盲源分离法是指从观测到的混合信号中恢复出无法直接观测到的源信号的过程[11]。REPET是一种单通道盲源分离算法，可用于分离非稳定信号和连续稳定信号。分析发现，非稳定干扰声音在变电站的干扰种类中占绝大部分，此类干扰的共同特性是持续时间短，且干扰信号的能量分布集中，而变压器本体声音则是连续稳定的信号。根据这一特点，选择REPET技术将非稳定干扰声音从混合声音中分离，提高后续识别算法的准确率和效率。REPET的作用机理可以概括为3个阶段：重复周期的识别、重复片段的建模和重复模式的提取。基于REPET的盲源分离步骤如图5所示。

图5 基于REPET的盲源分离步骤Fig.5 Steps of blind source separation based on REPET

a)重复周期识别。首先计算混合信号x的短时傅里叶变换X，取X元素的绝对值，得到幅度谱图V(其元素为V(i,j))。然后计算功率谱图V2的每个频率通道随时间的自相关，并获得自相关矩阵A(其元素为A(i,j))。取矩阵A每行的平均值，即可获得混合信号x的整体自相似性b。最后将b的每一项b(l)除以其第1项b(1)，得到b归一化后的值。计算公式为：

A(i,l)=

i=1，2，…，n，l=1,2,…,m；

(1)

式中：n为频率通道数；m为时间帧数；A(i,l)为A的元素，下同。为方便起见，将b称为拍频。如果混合信号x中存在周期性重复模式，b将形成以不同周期律重复的峰值，揭示混合信号的潜在周期性重复结构。

b)重复片段建模。估计出混合信号的重复周期p后，就可将幅度谱图V分割成长度为p的r段。通过取r段的元素中值获得重复段模型S。重复段模型S的计算公式为

i=1，2，…，n,j=1，2，…，p.

(2)

c)REPET。计算出重复段模型S后，就可通过取S和混合信号幅度谱图V的r段的元素最小值来推导重复谱图模型W。重复谱图W的计算公式为

W(i,j+(k-1)p)=

min{S(i,j),V(i,j+(k-1)p)}，

i=1，2，…，n,j=1，2，…，p,

k=1，2，…，r.

(3)

最后，通过用混合谱图V对W中对应的元素进行归一化处理来推导软时频掩模M，软时频掩模M的计算公式为

i=1，2，…，n,j=1，2，…，m.

(4)

设置阈值t∈[0,1]，将软时频掩模M中高于此阈值的时频单元设置为1，其余设置为0，进一步导出二进制时频掩码；然后将时频掩模M对称化，并按元素乘以混合信号x的短时傅里叶变换X；将得到的短时傅里叶变换X转换为时域即获得估计的背景信号；从混合信号中减去背景信号，即可获得估计的前景信号。

2.3 基于REPET算法的混合声音分离

为验证算法有效性，分别将汽车鸣笛声、说话声、脚步声、鸟鸣声、隔离开关声、断路器声与风冷变压器声信号混合用于REPET。本文选择汉明窗作为窗函数。由于可听声的频率范围是20 Hz～20 kHz，根据香农采样定理，选用的电容式麦克风的采样频率为48 kHz；设置混合信号的短时傅里叶变换的帧长为40 ms，即1 920个采样点；帧移为半个汉明窗的长度(即20 ms)，960个采样点。将盲源分离得到的前景信号、背景信号与混合信号的时频谱图进行对比。因篇幅有限，仅选取1种混合声音的分离结果进行展示，如图6所示。由于混合信号仅是变压器正常运行声和非稳定干扰声音的叠加，分离出的背景信号即为变压器本体运行声音。

图6 含隔离开关声干扰的分离结果Fig.6 Separation results containing acoustic interference of disconnector

通过比较可以看出，非稳定性干扰声音已经从混合声音中分离出来。该算法对于其他非平稳干扰也有很好的分离效果。

3 GMM

3.1 声音特征参数提取

MFCC在1980年由Davis和Mermelstein首次提出，是语音识别和说话人识别领域最常用到的语音特征。MFCC特征的提取流程如图7所示。

图7 MFCC特征提取流程Fig.7 Feature extraction flow chart of MFCC

预加重是对高频部分的声音信号进行加重，使声学模型的高频共振峰更加直观。预加重函数

y(h)=x(h)-α·x(h-1).

(5)

式中：x(h)为时刻h的声音采样值；α为预加重系数，一般取值0.9～1.0，本文取0.97。

分帧即将原始声音信号分成大小固定的N段语音。如果直接分帧，帧与帧之间的连贯性就会变差，因此引入帧移的概念，本文将帧长设置为20 ms，帧移设置为10 ms。加窗的目的是消除谱泄漏，本文选择汉明窗作为窗函数。对加窗后的每帧进行N点快速傅里叶变换，N通常取256或512。对每帧的N个数据点分别取模再取平方，然后除以N，便得到能量谱密度。梅尔频率是一个新的量度，它更接近于人耳的听觉机制，在低频范围内增长速度很快，在高频范围内增长速度很慢。每个频率值都对应1个梅尔频率，对应关系为

(6)

式中：m为梅尔频率；f为频率，单位为Hz。对能量的对数作离散余弦变换即可得到MFCC参数。

经REPET处理后7种声音数据的MFCC特征如图8所示。

图8 MFCC特征Fig.8 Features of MFCC

3.2 基于GMM的声纹识别

本文将GMM应用于变压器故障的声纹识别。首先对每类声音数据训练出一个GMM，每类声音训练出的GMM是由聚类后的每一类的均值、加权系数和协方差矩阵组成。然后提取待测试声音的声纹特征并代入各个GMM，通过极大似然估计，将最大似然值对应的GMM声音类型作为声纹识别结果。GMM基本框架如图9所示，其中L为混合成分数目。

图9 GMM基本框架Fig.9 Basic framework of GMM

GMM训练使用的数据库由7种类型的声音构成，分别为变压器正常运行声、平板放电声、沿面放电声、电晕放电声、冷却风机消音罩振动声、固定风机的螺丝松动声和电动机扇叶触碰风罩声。每种声音时长180 s，前60 s用于模型训练，后120 s与不同干扰声音混合后用于模型测试。每个声音样本的时长15 s。模型训练时，设置K-means最大迭代次数为5，最大期望算法最大迭代次数为30。不同混合成分数目的GMM的识别率见表2。从表2可以看出，识别率随混合成分数目的增加而提高，当混合成分数目为3时，识别率达到100%。

表2 不同混合成分数目GMM识别率Tab.1 Recognition rates of GMM model with different numbers of mixed components

4 结论

本文提出了一种基于REPET和GMM的变压器故障声纹识别方法，取得的主要成果及结论如下：

a)实验模拟了不同类型的放电故障和机械故障声。根据变电站内常见的放电类型，模拟了变压器油中均匀电场放电、沿面放电和变压器外部电晕放电；机械故障主要模拟了变压器冷却风机的故障声音，分别是冷却风机消音罩振动、固定风机的螺丝松动和电动机扇叶触碰风罩的声音。分析了各种故障声音和变电站内干扰声音的特征。

b)针对变电站内非平稳性干扰声音，采用基于REPET的盲源分离算法将非平稳干扰声从混合声音中分离，排除了非平稳干扰声音对声纹识别的影响。

c)针对变电站内的持续性干扰声音，选择鲁棒性较好的MFCC特征和基于GMM的声纹识别算法来降低风机噪声对声纹识别系统的影响。在实验室环境下用变压器正常运行声和实验模拟的6种故障声音构建数据库，每类声音时长均为180 s，前60 s用于GMM训练，后120 s与不同干扰声音混合后用于模型测试。K-means最大迭代次数为5，最大期望算法最大迭代次数为30。GMM混合成分数目为3时，模型识别率可达100%。