电晕放电辐射信号的特征提取和模式 识别方法研究
2017-06-08胡小锋刘卫东周帅
胡小锋,刘卫东,周帅
电晕放电辐射信号的特征提取和模式 识别方法研究
胡小锋,刘卫东,周帅
(军械工程学院 静电与电磁防护研究所,石家庄 050003)
目的研究电晕放电辐射信号的特征提取和模式识别方法。方法在分析信号特征提取方法的基础上,对实测的电晕放电辐射信号特征提取,利用概率神经网络开展电晕放电辐射信号目标识别,检验特征提取的有效性。结果以奇异值作为输入特征量的PNN在整体上效果更优,稳定性好,对两类不同放电辐射信号的正确识别率均可达到80%以上,并且当输入特征量个数达到10个时,对实测样本的正确识别率均达到了最高值。电晕放电的正确识别率为96.7%,火花放电的正确识别率为93.3%。结论该方法能基本满足实际放电信号的识别应用。
电晕放电;特征提取;模式识别;概率神经网络
高压传输线及送变电设备由于绝缘性能下降和故障会发生电晕放电。目前,国内外很多研究单位利用电晕放电辐射场信号进行高压输变电系统的故障诊断和定位。电晕放电辐射信号是一种奇异性很强的非平稳信号,由于在野外现场测试,不可避免地受到周期性和随机性空间干扰的影响。比如通信信号、电视信号、广播信号等,随机性空间干扰主要有静电放电信号、行驶车辆的火花塞放电信号、电子开关开合辐射信号等。各种滤波方法适用于周期性空间干扰的消除,而随机性空间干扰信号与电晕放电时域信号特征相似,很难辨别,对电晕放电辐射信号的远距离探测和识别有较大的影响。因此信号去噪、特征提取和目标识别方法研究是实现放电辐射信号远距离测试的关键,对于放电信号的识别和定位具有重要意义。文中在信号特征提取方法研究的基础上,对实测的电晕放电辐射信号进行特征提取,最后利用概率神经网络对电晕放电辐射信号进行目标识别,从而检验特征提取的有效性。
1 特征提取与模式识别方法概述
特征提取是目标识别的基础,对目标识别的效果起着决定性作用。一般识别对象的原始数据量很大,首先要对原始数据进行选取和变化,获取能反映分类特征的物理量作为特征向量,进行特征提取[1—3]。针对提取的特征参数不同,常用的特征提取方法可以简单地分为以下几种:统计特征法、分形特征法、图像矩特征法、波形特征法和时频特征法等。
国内外在利用人工神经网络对放电模式进行识别方面取得了很好的效果[4—5],其中基于误差反向传播的BP神经网络具有结构简捷、状态稳定、分类能力强的特点,应用较广。国内学者采用BP神经网络作为目标识别分类器对电晕放电辐射信号进行目标识别,取得了较好的效果。当用BP网络进行函数逼近时,其权值调节使用负梯度下降的方法,存在收敛速度慢和局部极小等局限性。因此,文中将采用分类能力和学习速度等方面均优于BP网络的另一种网络——概率神经网络(Probabilistic Neural Networks,简称PNN)对放电模式进行分类和识别[6]。
概率神经网络是径向基网络的一种形式,由径向基神经元、竞争神经元组建而成,其网络结构见图1。它的优点是结构简单、训练快速、应用很广泛,尤其适合解决模式分类问题。它不仅可以利用线性的学习算法来解决以往非线性算法不能解决的问题,而且还可以满足算法高精度要求。
在图1中,是输入的向量元素数,是输入向量样本数,是输入向量类别数。其工作原理为[6—7]:PNN网络的第一层,也就是径向基层的输入权值IW1.1作为输入的转置矩阵。首先,||dist||表示径向基层计算输入向量与训练样本向量之间的距离,它代表输入向量和训练样本向量之间接近的程度,是一个距离向量。输入向量和何类输入样本最接近,则神经元输出1对应元素值等于1,如果输入向量同几类输入样本都接近,则1相对应的几个元素均为1。
第二层是竞争层接受距离向量为输入向量,其权值LW2.1代表期望值的向量矩阵,每个行向量只有一个元素等于1,表示对应的模式,其余元素都等于0,然后对每个模式的概率进行计算,竞争传递函数为概率最大的元素值对应为1,作为一种模式;否则输出为0,定为其他模式。至此,PNN网络就能够完成对输入向量的分类。
文中在时频分析和高阶谱分析的基础上,主要对矩阵的两个特征量(特征值和奇异值)进行提取,并结合概率神经网络进行对比分析,研究特征提取的适用性和有效性,从而寻找更适合对放电模式进行识别的特征量。放电信号特征提取及其模式识别的过程如图2所示。
图1 概率神经网络结构模型
图2 基于矩阵特征量和PNN的放电模式识别
2 放电辐射信号数据及预处理
为了能够有效识别目标,验证特征提取的有效性,在实验中分别采集了50组不同条件下长线缆电晕放电辐射信号数据和50组某辐射源的火花放电辐射信号数据。考虑到采集数据的波动性及分散性,对采集到的数据进行预处理。
首先,对信号的触发时间进行对齐处理。考虑到两类不同的放电信号是在不同时期和不同放电条件下获得的,信号的触发时间差异较大,对后期的特征提取有一定影响。因此,统一将采集的数据进行对齐截取处理,即取信号最大值点之前1000个点及其后3095个点(共4096个点)进行分析处理。
其次,归一化数据处理,分为全局数据归一化以及局部数据归一化。全局数据归一化将全部实测数据中的最大值作为基准,其他数据换算成它的相对值。这种处理的优点是在同一尺度下比较所有波形,有比较明显区别,适用于模式识别,但存在小数据将被淹没的缺点,甚至会出现同类信号被判定成不同模式类别信号的现象。局部数据归一化是以采集数据峰值作为基准进行归一化,它弥补了全局归一化的不足,但可能减弱了同类信号之间的区别性。经过比较与分析,文中采用局部归一化方法对采集到的数据值进行处理,将其归一化到[-1,1]区间上。
数据预处理后两类放电信号的典型时域波形及其对应的功率谱如图3所示。可以看出,两类信号的时域波形均含有大量的背景噪声干扰。为了更贴近真实情况,在对其进行特征提取时未对其进行消噪处理。
图3 两类放电辐射信号的典型时域波形及其功率谱
3 基于时频分析的特征提取
在通用的信号分析中,信号作为平稳来处理的,采用时域表达或者对信号进行傅立叶变换的频域表达。实际上,非平稳信号是最常见的,对这类信号一般采用的方法是时频分析技术。时频分析方法按照所设计时频联合函数的不同可以分为线性时频表示、双线性(二次)时频表示以及其他形式的时频表示方法,其中短时傅立叶变换(STFT)就是最常用的一种线性时频表示方法。在提取二维图像(矩阵)特征量方面,通常采用计算矩阵的特征值、奇异值,或者计算图像的矩特征等方法,这些方法在目标识别领域得到了广泛应用[8—11]。文中就在对图3所示两组信号进行STFT的基础上进行特征提取。
考虑到提取的矩阵特征值可能为复数,这里取矩阵特征值的模作为特征量进行提取,后面基于时频分析进行的特征值提取亦如此。另外,鉴于特征值的模及奇异值从大到小的排列规律,分别选择居于前面的15个值作为神经网络的输入特征量,舍去后面数值较小的项,达到降低特征维数的目的,从而提高神经网络的运算速度和识别能力。对图3中的电晕放电辐射信号和火花放电辐射信号分别进行短时傅立叶变换,结果如图4所示。可以看出,两者在频率分布和持续时间上具有较大差异,对其分别提取矩阵特征值的模和奇异值,对比结果如图5所示。可以看出,特征值的模及奇异值对两类不同的放电信号均具有一定的区分能力,反应了信号之间的差异。其中前面数值大的几个量差别比较明显,随着数值的减小,后面也逐渐趋于一致,区分能力也随之变弱。相比而言,奇异值比特征值的模具有更好的区分能力,这在后面进行的模式识别中可以得到验证。
图4 两类放电辐射信号的短时傅立叶变换
图5 基于短时傅立叶变换的特征提取
4 基于PNN的放电模式识别
在设计概率神经网络时,为进一步优化输入特征量,降低特征维数,将输入层节点数设置为可调,即从1依次增加至15,通过对比正确识别率确定最低输入维数。
在两类放电信号各50组数据中,分别随机选择20组数据进行特征提取,并将其作为训练样本对概率神经网络进行训练。对其余数据进行特征提取,并将其作为测试样本对训练好的神经网络进行检验。放电模式识别结果分别见表1、表2。
表1给出了基于特征值提取的模式识别结果。可以看出,在对训练样本的识别中,对电晕放电的正确识别率仅为55%,而且随着输入特征量个数的增加,其识别率并没有相应增加;对火花放电的正确识别率最高也仅为90%。同时,从测试样本的识别结果来看,电晕放电的正确识别率依然很低,最高仅为56.7%,而火花放电的正确识别率在输入特征量个数达到5个以后增加到了96.7%。整体来看,基于STFT特征值提取的模式识别效果并不理想。
表1 基于STFT特征值和PNN的模式识别结果
表2 基于STFT奇异值和PNN的模式识别结果
表2给出了基于奇异值提取的模式识别结果。可以看出,在输入特征量个数达到10个以后,训练样本的正确识别率均达到了100%。同时,测试样本的正确识别率也均达到了最高值,电晕放电正确识别率为96.7%,火花放电正确识别率为93.3%。
通过对基于两种不同特征量识别结果的对比分析可以看出,以奇异值作为输入特征量的PNN在整体上效果更优,对两类不同放电辐射信号的正确识别率均可达到80%以上。这主要是因为矩阵奇异值具有非常好的稳定性,当矩阵的元素发生小的变动时,奇异值的变化较小。
4 结语
文中首先讨论了在研究非平稳信号特征提取与模式识别方法的基础上,确定了本研究的特征提取和模式识别方法。最后在时频分析和高阶谱分析的基础上,通过提取矩阵的特征值和奇异值作为输入特征量,结合概率神经网络对两类不同的放电辐射信号进行了模式识别。识别结果表明,以奇异值作为输入特征量的PNN在整体上效果更优,稳定性好,对两类不同放电辐射信号的正确识别率均可达到80%以上。当输入特征量个数达到10个时,对实测样本的正确识别率均达到了最高值,电晕放电正确识别率为96.7%,火花放电正确识别率为93.3%,能基本满足实际放电信号的识别应用。
[1] CHO K B, OH J Y. An Overview of Application of Artificial Neural Network to Partial Discharge Pattern Classification[C]// Proceedings of the 5th International Conference on Properties and Applications of Dielectric Materials. Korea, 1997.
[2] CHANG C, CHANG C S, JIN J. Source Classification of Partial Discharge for Gas Insulated Substation using Waveshape Pattern Recognition[J]. IEEE Transactions on Dielectrics and Electrical Insulation, 2005, 12(2): 374—386.
[3] 郑海波. 非平稳非高斯信号特征提取与故障诊断技术研究[D]. 合肥: 合肥工业大学, 2002.
[4] 淡文刚, 陈祥训, 郑健超. 采用小波分析与神经网络技术的局部放电统计识别方法[J]. 中国电机工程学报, 2002, 22(9): 1—18.
[5] 阳国庆, 郑殿春, 孙学勇. 基于小波神经网络局部放电模式识别方法的实验研究[J]. 哈尔滨理工大学学报, 2005, 10(5): 98—101.
[6] 董长虹. Matlab神经网络与应用[M]. 北京: 国防工业出版社, 2005.
[7] 飞思科技产品研发中心. 神经网络理论与MATLAB7实现[M]. 北京: 电子工业出版社, 2005.
[8] 王蕴红, 刘国岁, 李玺, 等. 基于短时傅里叶变换及奇异值特征提取的目标识别方法[J]. 信号处理, 1998, 14(2): 123—127.
[9] 鲜明, 庄钊文, 郭桂蓉, 等. 基于时频分析的飞机目标识别[J].国防科技大学学报, 1997, 19(3): 7—11.
[10] CHEN V C, LING H. Joint Time-Frequency Analysis for Radar Signal and Image Processing[J]. IEEE Signal Processing Magazine, 1999, 16(2): 81—93.
[11] 范建, 李孝昌. 奇异值特征抽取目标识别方法[J]. 系统工程与电子技术, 1993, 15(11): 14—17.
Feature Extraction and Pattern Recognition of Corona Discharging Signals
HU Xiao-feng, LIU Wei-dong, ZHOU Shuai
(Institute of Electrostatic and Electromagnetic Protection, Machine Engineering College, Shijiazhuang 050003, China)
Objective To research methods for feature extraction and pattern recognition of corona discharge radiation signals. Methods Based on the analysis of signal feature extraction method, the signal feature of corona discharge radiation measured was extracted. The probabilistic neural network was adopted to identify corona discharge radiation signal target to test the effectiveness of the proposed feature extraction. Results The PNN with singular value as the input characteristics was overall better in effect and good in stability. Its correct rate of recognition of two kinds of different discharge radiation signals could be higher than 80%. When ten characteristics were input, the correct recognition rate reached the peak of the measured samples. The correct recognition rate of corona discharge was 96.7%. The correct recognition rate of spark discharge was 93.3%. Conclusion This method can basically meet the recognition and application of actual discharge signals.
corona discharging; feature extraction; pattern recognition; probabilistic neural network
10.7643/ issn.1672-9242.2017.04.012
TJ06;TN911.7
A
1672-9242(2017)04-0057-05
2017-01-18;
2017-03-24
胡小锋(1977—),男,博士,副教授,主要研究方向为静电与电磁防护。