声纹识别在电厂设备状态监测中的运用
2022-10-19肖毓增付新华杨胜仪陈文清
肖毓增,付新华,杨胜仪,陈文清
(1.福建华电福瑞能源发展有限公司池潭水力发电厂,福建 三明 353000;2.西北大学,陕西 西安 710100)
0 引 言
在电力设备中,电力变压器作为改变电压的重要器件,是维持电力系统稳健运行的关键部件之一。变压器在生产、安装、维护、长时间运行等实际条件下,不可避免地受到热力等外部因素的影响。此外,如果不及早发现变压器故障,那么现有故障将逐步演变并恶化。最终,故障会导致火灾或其他电网设备大面积损坏,致使配电中断,对人们的生产生活产生巨大影响。因此,如何准确发现并识别故障类型,以便采取适当的措施减轻其负面影响,是亟待解决的问题。
目前,现有的故障诊断方法在很大程度上依赖于接触式传感器等特殊设备。这种方法增加了故障诊断的成本,更重要的是,可能会受到高压、强电磁场等复杂工作环境的影响,从而干扰系统的正常运行。变压器在运行时会产生内部振动,其中包括内部硅钢片伸缩效应导致的周期性振动等,将不同振幅和频率的振动信号辐射到周围。特别是在高压和强电磁环境中,可能会发生各种故障,产生不同的声音。通过声音信号进行故障诊断是一种较好的解决方案,具有多方面优点。首先,它支持非接触式安装,设备小且使用简便,便于信号采集;声信号不产生电磁场,不影响设备的正常运行。事实上,声纹识别已被广泛应用于声音验证、医疗保健、故障检测等领域。
基于声音信号的故障诊断通常包括声学特征提取和分类。对于声音特征提取,通常需要进行频域变换提取特征参数进行识别。考虑到电力变压器声音信号与人语音的相似性,常用的特征参数有梅尔频率倒谱系数(MFCC)、线性预测倒谱系数(LPCC)以及耳蜗滤波器倒谱系数(CFCC)。通常情况下,变压器是逐渐损坏的,而不是突然发生故障。上述系数仅反映变压器声信号的静态特征。但在人类听觉系统上对声音信号的动态特征更为敏感,这些静态特征不足以表示。
分类器是声音识别的重要组成部分,近年来,人工神经网络(ANN)、支持向量机(SVMs)和决策树等58种机器学习算法作为变压器故障检测的60种有前景的解决方案在文献中得到了研究。变压器故障检测本质上是一个多分类问题。本文提出了一种基于朴素贝叶斯分类器的变压器故障检测方法。首先,对于声音信号进行预处理,特别使用了汉明窗函数,接下来将经过预处理的声音信号转换为频域信号进行后续特征提取,最后使用朴素贝叶斯分类器对故障进行分类,采用声学特征向量训练的朴素贝叶斯分类器来判断变压器的故障类型。如果发生故障就及时通知检修人员维修电力设备。
1 系统结构
电厂设备中变压器故障监测系统结构如图1所示,包含信号预处理、故障特征提取以及分类器。
图1 系统结构
在电厂中利用声学传感器很容易采集到变压器工作时的声音信号,将其进行信号预处理,获得相对平滑的变压器声信号,之后将该信号预先强调以增强高频效果,并分成短时间稳定的帧段进行预加重。设计了汉明窗对每帧进行进一步处理以减少频谱泄漏。变压器运行过程中产生的声音信号含有丰富的信息,能在一定程度上反映变压器的工作状态和故障状况。针对声音特征提取阶段,提出了一种用于声音信号的梅尔频率倒频谱系数(MFCC)特征向量,特别是基于MFCC的动态特征。将提取出来的特征向量输入朴素贝叶斯分类器即可得到变压器工作时的状态。
2 MFCC特征
声音识别技术是提取语音信号来判断说话人的方法,它提取不同说话人声音信号的特征向量组成库,通过比较特征向量的相似度来确定说话人。由于正在运行中的变压器所产生的声音信号与人的声音信号相似度较高,我们使用这些揭露人声音信号的典型参数来提取变压器的故障声音。MFCC能有效揭示语音信号的时域和频域特征,因此本文将其应用于变压器声音信号的特征提取。通过计算滤波频谱的能量,得到的参数能够反映各频带的频谱能量分布。
2.1 MFCC算法原理
MFCC的提取观测单位为帧,它由个采样点组成。一般情况下,变压器故障音频数据是一种非平稳信号,通常在50~200 ms范围内保持稳定,即为值涵盖时间。为实现帧间平滑,通常相邻帧间有50%的重叠区域。预处理的最后一步将每帧乘以汉明窗函数。在故障音频特征提取阶段,对分帧加窗后的信号进行快速傅里叶变换得到各帧频域特征,并且对上一步得到的频域特征取模平方得到功率谱。接下来将功率谱通过Mel滤波并计算得到其对数能量,再将对数能量带入离散余弦变换得到MFCC特征参数。算法流程如图2所示,其中数据预处理包括预加重、分帧和加窗。
2.2 基于电力变压器故障特征的MFCC提取
鉴于工作中的变压器所产生的声音信号与人的声音相似,我们使用描述人的声音的典型参数来有效提取变压器噪声的特征是可行的。运行中的变压器声音信号包含着其工作状态信息,这些信息与变压器结构、运行状态等密切相关。对复杂的变压器音频故障进行有效分析并识别不同的工作状态,可为电力设备状态监测提供依据。MFCC能有效揭示语音信号的时域和频域特征,因此本文将其应用于变压器声音信号的特征提取方面。MFCC特征提取流程如图2所示。
图2 MFCC特征提取流程
2.2.1 数据预处理
首先,通过一阶高通滤波器实现故障音频预加重,用于放大输入声音信号的高频分量。事实上,语音、音乐等的功率谱是随着频率的增加而减小的,其大部分能量集中在低频范围内。因此,产生的信号幅值是由信号的低频分量引起的。预加重是一种对原始信号高频分量进行补偿的处理方法。经过预加重滤波,可以有效抑制随机噪声。
接下来对信号分帧,为减少每帧开始和结束时信号中断,两帧之间有一段50%的重叠区域。将每帧乘以汉明窗函数增加帧左右两端的连续性。窗函数主要为了减少频谱泄露,使得信号更好地满足特征提取的周期性要求。汉明窗的幅频特性为旁瓣衰减较大,主瓣峰值与第一个旁瓣峰值衰减可达40 dB,窗函数()形式如下:
式中:预加重分帧后的信号为();为帧的大小。
2.2.2 特征提取
对预处理后的各帧信号进行傅里叶变换,得到各帧的频谱,设信号的FFT为:
对信号的频谱取模平方得到信号的功率谱:
在Mel三角滤波器中每个三角形滤波器的跨度对应于梅尔尺度。Mel频率与线性频率的关系为:
将每个滤波器组乘以功率谱,然后将系数相加取对数得到滤波器组的对数能量。
最后将得到的对数能量带入离散余弦变换中,求出MFCC参数。
式中:=1, 2,...,,为 MFCC 堵塞阶数;为三角滤波器的个数。
MFCC系数仅反映变压器故障音频的静态特征。由于动态特征也包含大量的特征信息以及人耳对其较为敏感,因此声谱的动态信息中也包含丰富的声信息。一般来说,变压器在一段时间内会逐渐发生故障。因此,相关参数不断向故障状态变化。动态特征还包含丰富的变压器状态信息,可用于提高变压器故障诊断的准确性。为反映变压器故障音频的动态信息,需要提取MFCC的一阶差分ΔMFCC、二阶差分 ΔΔMFCC。
式中:(+)为第+帧MFCC的特征参数;值设置为2;()为MFCC一阶差分;()为MFCC二阶差分。
图3中最上边的每一条线表示提取的MFCC特征系数,中间和底部的曲线为线圈松动故障音频信号的一阶差分和二阶差分曲线图。利用上述提到的MFCC特征向量、MFCC的一阶差分向量和二阶差分向量构建一个新的特征向量(36维),通过提出的分类模型进行进一步的特征学习。图4为内部短路故障时的静态特征(MFCC),图5和图6为内部短路故障时的动态特征(ΔMFCC和ΔΔMFCC)。
图3 二维特征提取曲线
图4 内部短路故障时的MFCC特征
图5 内部短路故障时的ΔMFCC特征
图6 内部短路故障时的ΔΔ MFCC特征
3 故障识别与分析
本研究采用朴素贝叶斯分类器对4种变压器非正常工作时的故障音频信号进行识别,并且以识别准确率来评价识别效果。本研究共有4种变压器常见故障类别,属于多分类问题。在识别过程中,首先对声音信号进行静态和动态的特征提取,然后输入到朴素贝叶斯分类器。朴素贝叶斯分类器是一种监督机器学习方法,它是一个条件概率模型。朴素贝叶斯分类器是一个问题实例向量=(,,...,x),其中,是提取特征的值,使用特征向量元素之间朴素独立的假设,即概率分类方法,该方法在文本分类、实时预测、多类预测、推荐系统、传入邮件的垃圾分类、人脸识别、故障诊断、文章分类等方面都有应用。
朴素贝叶斯分类器与传统分类器的不同之处是它需要计算类的后验概率,从而降低计算的复杂度。贝叶斯定理利用先验概率,即不含任何附加信息的假设或事件的原始概率。先验概率用于寻找后验概率,后验概率是在获得事件的附加信息后对事件进行修正的概率。
式中,表示变压器故障种类。联合概率模型可以表示为:
自动识别是一种机器学习技术,需要经过训练的数据集,该数据集记录不同变压器故障的声音信号。数据集中记录的每个声音信号都标记了不同的变压器故障种类。将训练好的数据集组成分类器,并在此基础上形成算法。故障数据集被分类为4个不同的种类,分别为高电压、内部短路、硅钢片或线圈松动以及铁芯部件松动。
朴素贝叶斯分类器的优点是正确分类需要少量的训练特征向量,比较易于实现以及对高维数据点识别率高。
4 实验结果
本文训练样本数据集为4 800段故障音频(每段持续时间为4 s),包括1 200段高电压故障时的音频数据,1 200段内部短路的音频数据,1 200段硅钢片或线圈松动的音频数据,1 200段铁芯部件松动的音频数据。测试集数据集为2 400段音频,每种故障分别有600段故障音频。收集的数据来自110 kV三相干式变压器。另外,为了讨论在麦克风处于不同位置和不同数量对收集声音信号的质量影响,我们还在2个不同工作间收集了高电压故障和铁芯部件松动故障数据。
4.1 朴素贝叶斯分类器变压器故障分类
变压器故障检测朴素贝叶斯分类器的分类效果见表1所列。我们采用准确率、精确率以及召回率等常见描述性能的分类指标。表1中序号序列分别表示高电压、内部短路、硅钢片或线圈松动的音频数据以及铁芯部件松动的音频数据。实验结果表明,该方法在诊断分类故障中具有良好的性能。
表1 4种故障的分类效果
4.2 基于MFCC特征的特征向量的性能比较
动态特征还包含丰富的变压器状态信息,可用于提高变压器故障诊断的准确性。为验证动态特征提取的特征向量(ΔMFCC和ΔΔMFCC)的有效性,本研究分别提取了静态和动态特征组成新的特征向量,并且将这些特征向量输入到朴素贝叶斯分类器中。图7为上述方法的量化分类效果对比。通过实验结果可以得出,使用静态和动态特征结合的特征提取方法可以充分提取声音信号的特征。
图7 提取不同特征参数的分类效果
4.3 不同位置和数量的麦克风收集数据的性能影响
我们在2个不同工作间收集了高电压故障和铁芯部件松动故障,见表2所列。麦克风距离变压器0.5 m,麦克风距离变压器1.0 m,+代表在2个位置同时收集声音信号。实验结果表明,不同位置和数量的麦克风收集数据对实验结果几乎无影响。所以我们在麦克风所在的位置进行数据收集。
表2 不同位置和数量的麦克风对性能的影响
5 结 语
文中提出了基于朴素贝叶斯分类器的变压器故障监测方法。通过分析声音信号,提取声音信号的静态和动态特征。结果表明,该故障检测方法较好地满足了变压器故障监测的实际要求,识别精度高,对故障监测和报警具有较大的应用价值。