基于音频识别的无人值守变电站设备在线监测*
2013-08-15曹文明王耀南
曹文明,王耀南
(1.湖南大学 电气与信息工程学院,湖南 长沙 410082;2.温州大学 物理与电子信息学院,浙江 温州 325035)
随着电网建设的发展和安全要求的提高,变电站建设正朝无人值守或少人值守的方向发展.目前,无人值守变电站主要倾向于向“五遥”方向发展(遥测、遥信、遥控、遥调、遥视)[1-2],利用视频监控系统,变电站中已逐步实现了“遥视”功能,但对于运行设备内部声音的监测却没有得到重视,已开发的成套设备也非常少[3],针对电力设备运行状态的智能化音频识别系统就更少了.
电力设备在运行过程中会发出各种声音,从声音变化强弱可以判别设备的运行状态,甚至故障类别[4].例如,10kV配电变压器正常运行时,有较轻微均匀的“嗡嗡”声,这是铁心自振的正常现象.如果变压器突然出现异常的声音,原因是多方面的,可从以下几个方面考虑:1)若声音比平常听起来沉重,说明此时变压器过负荷;2)若声音比平常尖锐,说明电源电压过高;3)当变压器内部铁心结构松动时,便会出现乱而嘈杂的声音;4)当变压器出现爆裂声时,表明线圈或铁心绝缘有击穿现象;5)当跌落式熔断器触头接触不好、分接开关触头接触不良,以及其他外电路上有故障时,也会引起变压器声音的变化.为了判断变压器故障类型,变电站值班人员常用绝缘棒的一端放在变压器的油箱上,另一端放在耳边仔细听声音.该方法虽然操作简单,但无法实现远程的连续的在线检测,与无人值班变电站的发展趋势不相符;同时还要求检测人员具有丰富的实际经验,给判断的准确性带来了不稳定因素.
为了全面掌握变电站实时运行情况、及时发现故障设备[5],并做出科学的决策和处理,有必要研究一种无人值守的设备音频监控新方法,通过监测设备运行时的声音信号,对设备运行状态进行在线监测.并且注意与变电站现有监控系统相配合,从多方面掌握设备实际运行情况,优化变电站系统的管理,对提高设备的检修效率、可靠性,延长设备使用寿命都有重要的现实意义.
1 音频监测原理与系统结构
1.1 电气设备音频监测原理
无人值守变电站设备音频检测系统主要用于检测变压器、电容器、电抗器、GIS(气体绝缘开关)等主设备运行时的声音信号.如图1所示,多路音频信号经传感器采集、滤波、放大、AD转换,传送至单片机数据处理器,经数据处理后,由现场总线把音频数据传至变电站监控主机(IPC)上,经音频频谱分析、提取到音频特征参数,再用神经网络识别该音频特征,根据音频特征向量输出该设备所处的状态和故障类型,并且监控主机根据判断结果做出报警或采取其它措施进行故障处理.
1.2 电气设备音频监控系统结构
变电站无人值守设备音频监控系统结构如图2所示,系统硬件由声音信号采集模块(由声音传感器、现场总线、数据收集器构成)、故障类型判别模块(变电站主机)和人机交互模块(集控站主机)和电源模块组成.
图1 音频信号监测原理Fig.1 Audio signal monitoring principle
图2 电气设备音频监测系统结构Fig.2 Structure of audio monitoring system in Power Substation
首先,在变电站需要监测的电气设备上安装了多个声音传感器(如图1所示).每个数据采集器负责多路音频数据的采集;然后数据收集器负责收集某个站点多个数据采集器的音频数据,并上传至站点监控主机.变电站监控主机根据设备故障状况和设备优先顺序,分时处理多路音频数据.对音频数据进行变换和频谱分析、提取音频数据的特征向量,然后把特征向量输入训练好的神经网络进行识别,判断发出该音频数据的设备运行状况和故障类型,并根据判断结果采取警报或其它控制措施.
集控站主机位于变电站集控中心,通过以太网与各变电站主机进行远程通信,是工作人员与各变电站音频监控系统进行人机交互的平台,可方便地对多个无人值守变电站点进行远程的集中监管.集控站工作人员利用服务器保存的历史记录,不但可查询任一指定站点的设备当前和过去的音频数据,还可通过集控站的数据汇总分析,绘制出一段时间来某个电气设备的波形和频谱幅度变化曲线图,方便工作人员综合分析该设备的变化情况.另外,集控中心还可结合集控站其他非音频监控系统的信息,对某个变电站设备状态进行全面分析,更加准确地判断它的运行状态,确保设备安全稳定运行.集控主机主要功能如图3所示.
图3 集控站主机功能结构Fig.3 Functional structure of host machine in centralized control station
2 系统关键技术实现
2.1 音频数据采集器
数据采集器是实现变电站设备无人值守音频监控的重要部件,它负责电气设备音频数据的处理和初步判断,内部结构如图4所示.
图4 音频数据采集器硬件结构Fig.4 Hardware construction of audio data collection terminal
数据采集器对声音传感器采集声音信号的处理包括:信号放大、低通滤波、模数转换、声音压缩、信号初步判断、串行通信等处理过程.核心处理器为凌阳SPCE061A型音频处理机,该处理器集成了信号放大、模数转换、串行通信接口等部件,具有强大的声音处理能力,适合本项目音频信号的处理.SPCE061A型单片机IO端口的IOB7和IOB10可以从通用IO口设置为串行通信口(UART),为RS422通信提供了硬件条件.串行通信口的波特率从1 500bps到51 200bps(51.2Kbps)可调,通信速度能够满足状态监控的要求.为了实现多机通信,每个音频数据采集器均有自己的一个地址.通过单片机读取7个IO的二进制编码,实现采集器的地址编码,数据收集器根据这个地址编码轮询各数据采集器,实现与各监测点的多机通信.
为了减少上层服务器对音频数据的计算和处理,底层的数据采集器还需对采集的音频数据在本地进行简单的故障预判断,通过预判断提前发现所采集的音频是否属于故障音频.其基本原理是:首先对典型故障音频进行特征统计,并把统计结果保存在本地数据库中,然后把当前音频数据特征快速与故障音频特征进行比对.例如,当出现音频信号的幅度明显过高、过低、噪声信号过大等情况时,就能快速判断其属于故障音频.对于这些异常情况,数据采集器马上将判断结果通过RS485总线发送给数据收集器,再经数据收集器告知监控主机.
经数据采集器预判断不属于故障音频的数据,还需上传至监控主机作进一步分析.当数据采集器收到监控主机发出监听某个设备的要求时,立即将该设备的声音数据进行压缩和编码传输给数据收集器.数据收集器利用串口服务器,把RS485协议数据转换为TCP/IP协议的网络数据与监控主机进行通信,把音频数据传输到监控主机后完成进一步的判断处理.
2.2 设备运行状态判别模块
设备运行状态判别模块是变电站音频监控系统的核心模块,基本判断过程如图5所示.监控主机对上传的音频数据进行频域变换、频谱分析,提取音频信号的 MFCC(Mel Frequency Cepstrum Coefficient,即Mel频率倒谱系数)特征参数[6],然后把特征向量输入训练好的正弦基神经网络进行计算,判断出该音频数据表征的设备运行状态,同时监控主机根据判断结果做出相应控制和处理,保证设备安全运行.
图5 音频数据识别过程Fig.5 Recognition process of audio data
2.2.1 音频信号特征提取
有效提取语音特征是识别语音的关键.人的内耳基础膜对外来信号会产生调节作用,它实质上充当了一个滤波器组,具有在嘈杂的环境中以及各种变异情况下仍能正常地分辨出各种语音的功能,即使信噪比降低时它仍有较好的识别性能.Mel频率就是基于人耳听觉这一特性提出来的[7],它与Hz频率成非线性对应关系;而且MFCC算法还模拟人耳滤波器功能设计了听觉前端滤波器组模型,这样计算的结果能很好地体现音频信号的主要信息,所以MFCC提取的音频参数广泛地应用于语音识别[8]、音频分类和检索领域[9].本项目也是通过提取电气设备声音的Mel频率倒谱特征参数作为判断识别的特征参数,Mel频率倒谱系数的参数提取步骤如下.
Step 1:预加重.
将经采样后的数字音频信号s(n)通过一个高通滤波器:H(z)=1-a×z-1,0.9<a<1.0(一般取0.95左右).经过预加重后的信号为H(n)=s(n)-a×s(n-1).
Step 2:分帧.
一般取10~20ms为一帧,为了避免窗边界对信号的频谱泄漏,对帧做偏移时,要有帧迭(帧与帧之间重叠部分).一般取帧长的一半作为帧移,也就是每次位移一帧的二分之一后再取下一帧,这样可以避免帧与帧之间的特性变化太大.
Step 3:计算短时能量.
短时能量代表着音量的高低,亦即声音振幅的大小,可以根据此能量的值来过滤掉语音信号中的一些细微噪声.当一帧的能量值低于设定阈值时,则将此帧作为静音段.
Step 4:加窗.
语音在长范围内是不停变动的,没有固定的特性无法做处理,所以将每一帧代入窗函数,窗外的值设定为0,其目的是消除各个帧两端可能会造成的信号不连续性.常用的窗函数有方窗、汉明窗、汉宁窗等,根据窗函数的频域特性,常采用汉明窗.公式是在加窗范围内w(n)=0.54-0.46*cos(2*π*n/(n-1)).
Step 5:快速傅立叶变换.
由于语音信号在时域上的变化快速而不稳定,所以通常都将它转换到频域上观察,此时它的频谱会随着时间作缓慢的变化,所以通常将加窗后的帧经过FFT变换求出每帧的频谱参数.
Step 6:谱减法消除噪声.
由于受环境噪声的干扰,影响到实际音频质量,所以需要用到音频增强技术,从带噪语音中提取尽可能纯净的原始音频.近年来噪声音频增强技术中,谱减法(Spectral Subtraction)是最常用的.本文使用性能较好的基于最小统计的谱减法[10],它不需要进行语音活性检测、比传统谱减法引入的音频噪声小.
假设加性噪声与音频信号不相关,则带噪音频信号表示为:y(t)=s(t)+n(t),其中s与n分别为纯净音频信号与噪声信号.因其相互独立,故对于给定(带噪音频信号功率谱)与(噪声功率谱估计值),可以估计出纯净语音信号的功率谱为:
其中α是过减因子,β是频谱平滑参数.
Step 7:三角形带通滤波器.
使每帧的频谱参数通过一组N个三角形带通滤波器(N一般为20~30个)所组成的梅尔刻度滤波器,每个三角窗滤波器覆盖的范围都近似于人耳的一个临界带宽,以此来模拟人耳的掩蔽效应.将每个频带的输出取对数,求出每一个输出的对数能量,k=1,2,…,N.再将此N个参数进行余弦变换求出L阶的Mel频率倒谱系数.
2.2.2 音频数据识别方法
提取MFCC音频特征后,采用能够快速响应的正弦基神经网络对特征向量进行状态识别与分类[11-12].正弦基神经网络模型结构如图6所示.
图6 正弦基神经网络模型Fig.6 Neural networks model based on sine basis function
其中C1(ω1),C2(ω2),…,CN(ωN)为正弦基函数,即
神经元输入为 MFCC提取的N个参数 [ω1,ω2,…,ωN],即向量Ω= [ω1,ω2,…,ωN],ωi∈ [0,1],其中ωi为归一化的特征区间MFCC提取的N个参数.由于输入向量有16个元素,因此选择输入层和隐层神经元的个数N=16.
由于对变压器运行状态的评估结果为一个确定的数值,因此输出神经元的个数选为1.假设变压器运行状态等级粗略地分为10个等级,则神经元期望输出为D(Ω)= [1,0.9,0.8,…,0.1],神经网络输出为:
设:W=wn= [ω1,ω2,…,ωN],C(Ω)=[C1(ω1),C2(ω2),…,Cn(ωn)],则式(2)改写为:
设误差函数e(t)=D(Ωt)-Y(Ωt),其中t=1,2,…,m为训练样本数.D(Ω)为神经网络的期望输出,Y(Ω)为神经网络的实际输出.性能指标:
权值调整:由式(3)和(4)有:
其中:η为学习率,且0<η<1.实验表明[13]:当学习率取0≤η≤2/N时(N为隐层神经元个数),该正弦基神经网络算法是收敛的.
2.2.3 音频特征识别器的训练
利用神经网络对音频数据进行自动分类,首先需要收集各种电气设备良好和故障状态下的音频数据进行训练.在变电站设备中采集m个音频信号的样本,经MFCC算法分别提取m个样本的特征参数,作为该状态的训练样本.每个特征参数是含有N个元素的向量,根据神经网络的模型及权值修正方法,设计了如下训练方法.
Step 1:用随机数初始化神经网络权值ωi,确定学习率η的值以及任意小正实数ε.
Step 2:取变电站主设备运行状态的第1个状态的MFCC音频特征值作为神经网络的输入向量
Step 3:计算正弦基神经元的输出向量
C(Ω)= [C1(ω1),C2(ω2),…Cn(ωn)]T,再计算神经网络的输出Y(Ω1).
Step 4:将实际输出与期望输出D1(Ω1)相比较得到误差e(t)=D(Ω1)-Y(Ω1).
Step 5:根据e(t)计算ηe(t)C(ωi),调整输出神经元的权值W(t+1)=W(t)+ηe(t)C(ωi).
Step 6:取变电站主设备运行状态第2个状态的MFCC音频特征值Ω2= [ω1,ω2,…,ωn]T作为输入,计算Step 3,4和5.依次进行P个等级的m个样本数据计算和权值修正,完成m个训练样本的一次学习.
这样,采用m个样本作为特征对神经网络进行训练,在神经网络反复学习后收敛到P个期望输出,最终完成神经网络训练,使神经网络能辨识出变电站设备的多个运行状态.
3 实验与仿真
3.1 实验设备介绍
无人值守变电站的音频监控系统已在河南省信阳供电公司220kV沙港集控中心和110kV工业城变电站试运行,且沙港集控中心离工业城变电站相距50 km.系统设备包括:集控站主机1台、变电站主机2台、数据采集器8个,还有端子箱、配电箱、交换机、通讯电缆等.集控站主机设在信阳供电公司220kV沙港集控中心,其余主要设备安装在信阳供电公司110kV工业城变电站.到目前为止,音频监控系统性能稳定、运行良好,其安装现场如图7所示.
为保证信号采集的准确性,在工业城变电站工1号主变周围装有4个数据采集器,从不同位置监听变压器声音(如图8所示).在主要GIS开关处装有4个音频数据采集器,以监测GIS设备运行状态(如图9所示).
图7 变电站音频监控主机Fig.7 Audio monitoring host in power substation
图8 主变压器音频采集器Fig.8 Audio collector of main transformer
图9 GIS设备音频采集器Fig.9 Audio collector of GIS switchgear
变电站监控主机接收数据采集器采集的电气设备音频信号,并对其进行频谱分析,判断声音的异常情况(如图10所示),然后将波形图和频谱幅度图通过以太网传送至集控站主机供值班人员查看(如图11所示).
图10显示了主变压器音频信号的波形图和频谱幅度图.从图中可看出音频信号是周期性的正弦波,电压幅度120mV,频率300Hz.另外,监控主机还利用MFCC算法提取声音信号的音频特征,将特征参数输入神经网络识别,判断设备运行状态,若属于故障音频,便自动发出警报、通知技术人员及时处理.
图10 变压器音频信号的波形和频谱幅度分析Fig.10 Oscillogram and spectrum amplitude diagram of voice data for transformer
图11 集控站主机对音频信号的波形和频谱分析Fig.11 Oscillogram and spectrum amplitude diagram of voice data for transformers in centralized control station
如图11所示,在离变电站50km远的集控站主机管理界面上,监管人员可以选择监听1~8号数据采集器所采集的声音信号,查看波形图和频谱幅度图,分析所监测电气设备的运行状况,以便管理该设备.
3.2 计算与仿真
3.2.1 音频信号时域、频域特征
首先利用安装在信阳市工业城变电站的音频数据采集器进行录音,将变压器的声音保存为50_good.wav文件.利用Matlab读取音频文件计算时域特征,运行结果如图12所示.
从图12可知,在时域空间里,最重要的特征是信号在短时(20ms)内相对平稳,并具有周期性,其他音频信号特征不能明显表征出来,所以音频信号在时域中不能完全显示特征,需要将信号转换到频域分析,采用快速FFT进行频谱分析,运行结果如图13所示.
图12 变压器音频信号时域波形Fig.12 Oscillogram of voice signal for transformers in time domain
图13 变压器音频信号幅频图Fig.13 Spectrum amplitude diagram of voice signal for transformers in frequency domain
由图13可知,变压器音频信号的频率主要集中在50~500Hz,主要原因是变压器铁心振动产生的声音集中在5个频率范围.实验表明:不同运行状态下的音频信号,幅频图的频率峰值和幅度明显不同,所以有必要根据这个特点设置MFCC计算的初始条件,提取稳定可靠的音频信号特征作为识别的根据.
3.2.2 变压器音频信号特征提取
利用Matlab计算主变压器音频数据的MFCC特征参数,结果如图14所示.
当变压器处于同一工作状态时,其声音具有持续稳定的不变性,而且不同时期获得同一状态的MFCC特征曲线具有相似性,如图15所示.
3.2.3 正弦基神经网络识别分类
选取前面所述变压器5种状态下的音频数据各2 000组共10 000组(采样频率为8kHz).首先从每种状态中随机抽取1 500组共7 500组进行神经网络训练,将每种状态剩下的500组特征向量作为测试数据,进行正弦基神经网络识别测试,得到变压器各种状态的正确识别率如表1所示.
图14 变压器音频信号的MFCC特征曲线Fig.14 The MFCC characteristic curve of voice signal for transformer
图15 变压器同一状态不同时期声音信号的特征曲线Fig.15 The characteristic curve of transformer voice signal in different periods of the same state
表1 变压器不同状态的声音识别率Tab.1 The recognition rate of transformer voice signal in different states
4 结 论
监听电气设备运行时发出的声音信号能有效发现设备异常情况,及时采取措施隔离和消除故障,避免事态扩大.本文提出一种利用神经网络准确识别音频特征、判断设备故障类型的方法,从根本上改进了传统人工监听设备、判断故障的方法,提高了电气设备故障检测水平,丰富了无人值守变电站的设备在线监测和检修技术,在未来的智能电网建设中具有重要的应用价值.
[1] 丁正胜.无人值班变电站远程图像监控系统应用[J].大众用电,2009,3:24-25.DING Zheng-sheng.Remote video monitoring system for nonattended substation[J].Popular Utilization of Electricity,2009,3:24-25.(In Chinese)
[2] 孔英会.无人值守变电站监控视频异常模式识别方法[J].华北电力大学学报:自然科学版,2011,38(6):11-16.KONG Ying-hui.A recognition method of abnormal patterns for video surveillance in unmanned substation[J].Journal of North China Electric Power University:Natural Science Edition,2011,38(6):11-16.(In Chinese)
[3] 徐林.变电站音频实时监测系统初探[J].机电信息,2009(36):155-156.XU Lin.Preliminary discussion of audio real-time monitoring in transformer substation[J].Mechanical and Electrical Information,2009(36):155-156.(In Chinese)
[4] 杨新杰.配电变压器异常现象的分析与判断[J].北京电力高等专科学校学报,2011,12:2-3.YANG Xin-jie.Analysis and diagnosis of abnormal phenomenon occurring for distribution transformer[J].Journal of Beijing Electric Power College,2011,12:2-3.(In Chinese)
[5] 蔡声镇.高压变电站室内分布式SF6监测系统的研制[J].仪器仪表学报,2006,27(9):1033-1036.CAI Sheng-zheng.Distributed network of measuring SF6system for GIS[J].Chinese Journal of Scientific Instrument,2006,27(9):1033-1036.(In Chinese)
[6] 陈勇.语音特征参数MFCC的提取及其应用[J].湖南农业大学学报:自然科学版,2009,35(1):106-107.CHEN Yong.The extraction and application of phonetic characteristic parameter MFCC[J].Journal of Hunan Agricultural University:Natural Sciences,2009,35(1):106-107.(In Chinese)
[7] 张小玫.基于小波Mel倒谱系数的抗噪语音识别[J].中国电子科学研究院学报,2008,3(2):187-189.ZHANG Xiao-mei.A noise-robust speech recognition based on wavelet MFCC[J].Journal of CAEIT,2008,3(2):187-189.(In Chinese)
[8] 郭春霞.基于 MFCC的说话人识别系统[J].电子科技,2005(11):53-56.GUO Chun-xia.Study of MFCC speaker recognition[J].Electronic Science and Technology,2005(11):53-56.(In Chinese)
[9] 江星华.基于LPCMCC的音频数据检索方法[J].计算机工程,2009,35(11):246-248.JIANG Xin-hua.Audio data retrieval method based on LPCMCC[J].Computer Engineering,2009,35(11):246-248.(In Chinese)
[10] 薛峰.噪声环境下 MFCC特征提取[J].信号处理,2010,26(1):127-131.XUE Feng.Confidence analysis of cepstral feature and application to speaker recognition[J].Signal Processing,2010,26(1):127-131.(In Chinese)
[11] 邹阿金.正弦基函数神经网络滤波器设计[J].长沙电力学院学报:自然科学版,2001,16(2):16-18.ZOU A-jin.Design on the filter based on the sine basis function neural networks[J].Journal of Changsha University of E-lectric Power:Natural Science,2001,16(2):16-18.(In Chinese)
[12] 张林.噪声环境下基于MFCC的鲁棒语音识别研究[D].长沙:湖南大学电气与信息工程学院,2009.ZHANG Lin.The research of robust speech recognition in noise environment based on MFCC [D].Changsha:College of Electrical and Information Engineering,Hunan University,2009.(In Chinese)
[13] 王小华,何怡刚.神经网络在4型FIR滤波器的优化设计研究[J].电路与系统学报,2003,8(10):97-100.WANG Xiao-hua,HE Yi-gang.Optimized design of the typefour FIR filter based on neural networks with sine basis functions[J].Journal of Circuits And Systems,2003,8(10):97-100.(In Chinese)