基于ESMD与SVM的电能质量混合扰动识别
2019-12-12杨晓楠吕国强侯鹏飞
杨晓楠 吕国强 侯鹏飞
摘 要:针对实际电能质量扰动种类繁多、扰动信号差异不明显、存在多种混合扰动,导致识别电能质量非常困难的情况,提出一种基于极点对称经验模式分解方法(ESMD)和支持向量机(SVM)的电能质量混合扰动信号分类识别新方法。首先,对加入白噪声的混合扰动信号利用小波软阈值去噪处理;其次,利用ESMD将信号分解为不同信号分量,对每类扰动的不同信号分量分别提取样本熵和互样本熵特征值,所有分量特征值构成特征向量;最后利用SVM对扰动信号特征向量进行分类和混合扰动识别。研究表明,该方法对混合扰动识别正确率很高,是一个有效的方法。
关键词:样本熵;互样本熵;电能质量混合扰动;极点对称经验模式分解方法;支持向量机
0 引言
智能电网的发展带来电力电子设备的广泛应用,电力系统的电能质量[1]扰动问题受到重视。实际的电能质量扰动种类繁多,扰动信号差异不明显,还存在多种混合扰动现象,导致电能质量检测与识别问题非常复杂[2]。单一扰动问题研究较多,复合扰动问题研究逐渐成为热点。单一扰动分类时各种扰动类别信号特征之间是互斥和独立的,而混合扰动时各类复合扰动信号的特征量之间相互重叠和交叉,给检测和识别带来极大困难,如特征失效、分类评价错误等。混合扰动识别[3-6]典型研究有:S变换+分类器[7]、小波变换+分类器[8]、独立分量分析+分类器[9]和经验模式分解+分类器[10]等。文献[7]首先运用S变换对暂态多扰动信号进行时频分析,然后提取扰动信号的特征量,最后生成对暂态多扰动信号进行分类的决策树分类辨识方法,以此实现对暂态多扰动信号的分类辨识;文献[8]利用离散小波变换提取扰动信号的多种特征,采用主成分分析方法对信号最优特征进行选择,然后利用小波神经网络进行分类识别;文献[9]提出一种独立分量进行信号分解,并对每个分量提取特征,利用支持向量机对混合扰动信号进行分类;文献[10]将EEMD和多标签Rank-SVM相结合进行电能质量混合扰动识别。首先利用EEMD进行混合扰动信号分解并提取各分量的标准能量差特征值,然后利用多标签Rank-SVM进行电能质量的混合扰动分类。
研究表明,改进的经验模式分解方法作为电能质量混合扰动的信号分解方法,能将混合扰动信号进行高质量信号分解,有利于特征提取和信号分类。对信号分解后各分量选择合适的特征量提取方法对复杂的分类问题至关重要。基于此,本文提出一种极点对称经验模式分解方法(ESMD)与SVM结合,对混合扰动信号进行分类与识别。首先,对加了白噪声的混合扰动信号利用小波软阈值去噪处理;其次,利用ESMD将信号分解为不同的信号分量,对每类扰动的不同信号分量分别提取样本熵和互样本熵特征值,所有分量的特征值构成特征向量;最后利用SVM对扰动信号特征向量进行分类和混合扰动识别。
1 电能质量混合扰动信号分析
1.1 极点对称模态分解(ESMD)
极点对称模态分解(ESMD)是2013年由青岛理工大学王宗良、李宗军等[11]开发的一种新的数据处理方法,是著名的Hilbert-Huang变换新发展。与以往的经验模态分解(Empirical Mode Decomposition,EMD)和集合經验模态分解(Ensemble Empirical Mode Decomposition,EEMD)[12]一样,ESMD方法能将复杂的信号进行平稳化处理,得到若干个具有不同特征尺度或固有周期的本征模态函数(IMF)。但ESMD方法将EMD方法中用于确定原始信号外部包络线的三阶样条插值法改进为内部极点对称插值法,并借用“最小二乘法”思想优化最后剩余模态,使其成为整个信号分解过程中的“自适应全局均线”,以此确定分解过程中的最佳筛选次数,有效解决了EMD方法分解中的“模态混叠”问题,是目前信号分析的最新方法之一。
1.2 混合扰动信号仿真
理想情况下,电网以恒定的额定电压和恒定工频的交流电为用户供电。然而在实际生活中,电压和频率会发生变化,从而引起一系列电能质量问题。电能质量扰动有很多种,下面列出12种典型的电能质量单一扰动类型[13],如表1所示。与单一电能质量扰动信号相比,电能质量混合扰动具有独特之处,不同的混合扰动具有独特的信号内在特征。混合扰动指包含两种及以上单一扰动的电能质量扰动形式。较为常见的混合扰动信号包括谐波与各种暂态扰动的混合、两种暂态扰动的混合、各种稳态扰动的混合等,本文对两种单一扰动混合而成的7种混合扰动、3个典型信号进行观察和分析。为减少模态混叠现象,使仿真更贴近实际,3种混合扰动均加入40dB的高斯白噪声,然后采用小波去噪方法获得模拟信号,如图1-图3所示。
图1-图3是3种混合扰动信号的仿真波形图,图(a)是不进行任何处理的原始信号,图(b)是加了40dB白噪声后的信号,图(c)是对加了白噪声的信号进行小波去噪后的仿真信号。这里所有信号的采样频率都为6.4kHz。从以上几个混合扰动的仿真可以看出,在加入白噪声后,波形变得不光滑,但在小波去噪后,波形有一定改善。
1.3 扰动信号ESMD分解分析
对7种混合扰动信号进行ESMD分解,得到各个模态分量IMF,选取200~1 000之间的801个点,剩余模态极值点最少个数默认设置为4,迭代次数默认设置为40,分别得到7种混合扰动的经验模绘图,在此只图示上述3种混合扰动的经验模绘图,如图4-图6所示。
图4-图6为7种混合扰动信号分解之后的经验模绘图,每个图中的Data为原始数据,下面的几个为分解出来的分量,最后一个分量是余量。从图中可以看出,各个扰动的分量不同,有最少6个分量(除原始数据)最多7个分量的。ESMD根据极值点数确定模态分量的个数,当余量的极值点达到一定数量时,即得到余量的模绘图。所以,对于同一扰动,当改变扰动发生的起止时间或扰动幅值后,得到的经验模绘图也会不同。
2 电能质量混合扰动信号特征提取
在电能质量扰动识别中,提取和选择有效特征向量非常重要,它直接影响到扰动是否能识别。常见的电能质量信号提取特征类型有时间、频率、幅度、波形、能量、相关系数和熵等特征。本文研究基于熵类型的改进特征提取方法,即样本熵和互样本熵。
Pincus & Kalman[14]引入了一个基于信息理论的数学方法——近似熵,用来度量时间序列的复杂性或不规则性;Richman & Moorman[15]分析了近似熵存在两个不足:近似熵的值依赖于数据长度,缺少相对一致性,对此提出一种更有效的可用来度量时间序列不规则性的熵:样本熵。样本熵是一种有别于近似熵的不计数自身匹配的统计量,是对于近似熵算法的改进。样本熵可以理解为条件概率的自然对数的相反数,其中条件概率指两个序列在窗宽为m时,相似的向量在窗宽增加1个长度时仍然相似的概率。样本熵越小则序列规则性越强;样本熵越大则序列随机性越强。与近似熵相比,样本熵具有以下两个优点:①样本熵不包含自身数据段的比较,它是条件概率的负平均自然对数的精确值,因此样本熵的计算不依赖数据长度;②样本熵具有更好的一致性。即如一时间序列比另一时间序列有较高的值时,其对于其它m和r值也具有较高的值[16-17]。样本熵在很大程度上不依赖于数据长度,样本熵的一致性比近似熵高,在一定程度上弥补了近似熵的不足。为表达两个信号的异步程度,即不相似程度,Pincus & Singer[18]提出了可以计算两个时间序列异步程度的互近似熵。为克服计算互近似熵时与计算近似熵不一致和抗干扰能力弱问题,Richman & Moorman提出了针对两个序列的互样本熵(Cross-SampEn),对于给定的两个序列,互样本熵可以计算得到一个非负值。互样本熵越大,两个型号异步性越强。互样本熵在一定程度上克服了互近似熵的不足。互样本熵是根据样本熵的概念而提出的,是对样本熵算法的拓展。在实际应用中,互样本熵只需较少的数据量就可估计一个较为稳定的值,有较好的抗噪声能力和抗干扰能力,其分析效果优于样本熵。样本熵和互样本熵已经在复杂生理等非线性信号处理中得到成功应用,但在电能质量信号分类方面的研究不多见。下面给出互样本熵定义:
4 SVM識别结果与分析
根据电能质量混合扰动模型产生7种混合扰动波形,使用MATLAB软件进行研究,叠加信噪比为40dB的噪声信号以模拟实际情况,并利用小波软阈值去噪处理获得有用信号,共生成280个样本,每种扰动分别为40个;其次,利用ESMD将信号分解为不同信号分量,对每类扰动的不同信号分量分别提取样本熵和互样本熵特征值,所有分量的特征值构成特征向量,本文选取其中的几个分量求其样本熵和互样本熵。综合7种混合扰动的分解情况,大多分解出6个分量(除原始数据即第一个分量外),但为了避免求取过程中有0存在,本文选取最少的分量作为标准,即5个分量,将多余的分量与第5个分量求和作为第5个分量。然后利用SVM对扰动信号特征向量进行分类和混合扰动识别,选核函数类型为高斯径向基核函数,采用交叉验证选择最佳的惩罚系数c和最佳核函数半径g,用所获得的最佳c和g对整个训练集进行训练,获得支持向量机模型;最后利用所得到的支持向量机模型对测试集进行测试获得识别和预测结果。每类扰动取20个作为训练样本,其余20个作为测试样本。其中,类型1表示电压暂降+脉冲暂态的混合扰动,类型2表示电压暂降+振荡暂态的混合扰动,类型3表示电压暂升+振荡暂态的混合扰动,类型4表示谐波+电压暂升的混合扰动,类型5表示谐波+电压中断的混合扰动,类型6表示谐波+振荡暂态的混合扰动,类型7表示振荡暂态+电压中断的混合扰动。
提取样本熵的特征向量时,设置嵌入维度m=2,阈值r=0.2SD,对于互样本熵,设置嵌入维度m=2,阈值r=0.2。因两种特征值下的数据小而且维度小,所以将样本数据读入后,在SVM的人机交互界面上都选择不进行归一化和不进行PCA降维预处理。采用网格划分(grid search)寻找最佳的惩罚系数c和最佳核函数半径g,网格搜索能够找到在CV意义下的最高分类准确率,即全局最优解。样本熵的最佳惩罚系数c=0.003 906 3,最终CV意义下的最佳分类准确率CVAccuracy=98.571 4%,最佳核函数半径g=0.353 55,训练样本的准确率97.857 1%,测试样本的识别准确率为95%,即140个测试样本中有133个样本能正确识别。互样本熵的最佳惩罚系数c=5.656 9,最终CV意义下的最佳分类准确率CVAccuracy=99.285 7%,最佳核函数半径g=22.627 4,训练样本的准确率99.285 7%,测试样本的识别准确率为98.571 4%,即140个测试样本中有138个样本能正确识别。利用SVM对7种扰动的互样本熵和样本熵的特征值进行识别,以互样本熵为例进行分析,结果如图7所示。
图7包含7个类别标签、实际测试集和预测测试集,将实际测试集与预测集进行对比,从图中可以看出哪个样本被正确识别,哪个样本被错误识别。在此以互样本熵为例,样本熵的分析类似,互样本熵分析如下:
(1)第6类中20个样本有两个识别错误,其中,有一个识别成第2类,另外一个识别成第3类,识别正确率为90%。
(2)其它几类中20个样本被完全识别,其识别准确率为100%。
由于篇幅有限,近似熵的相关识别过程不再赘述,本文只给出识别结果,3种特征值的识别结果比较如表2所示。
从表中可以看出,相对于近似熵,提取样本熵和互样本熵的特征向量,然后利用SVM对混合扰动进行识别,正确率达到95%以上,互样本熵的识别正确率达到98.571 4%,表明利用样本熵和互样本熵的特征向量对电能质量混合扰动识别具有很好的效果。
5 结语
本文提出一种基于ESMD和SVM的电能质量混合扰动识别方法。按照信号分解、特征提取和扰动识别过程进行研究,仿真测试结果表明:
(1)通过ESMD对混合信号分解的方法有效解决了EMD方法分解中的“模态混叠”问题,操作简单,可以得到直观的模绘图,达到很好的分解效果。
(2)提取样本熵和互样本熵特征值,利用SVM具有结构简单和泛化能力较高的优点对混合扰动进行识别。大量仿真试验结果表明,该方法有效性高、实时性好、分类准确度高。
后续研究将尝试更多种类的混合扰动,同时将新方法拓展到实际电能质量扰动信号分类和识别工作中,进一步证明新方法的实用性。
参考文献:
[1] 张淑清,乔永静,姜安琦,等. 基于CEEMD和GG聚类的电能质量扰动识别[J]. 计量学报,2019,40(1):49-57.
[2] 瞿合祚,李晓明,陈陈,等. 基于卷积神经网络的电能质量扰动分类[J]. 武汉大学学报:工学版,2018(6):11-16.
[3] 王天伟,张厚江,路敦民,等. 基于小波去噪和经验模态分解算法的足尺人造板动态称重研究[J]. 计量学报,2017,38(3):300-303.
[4] 吴凯,施康明. 基于SVD和PNN的电能质量扰动分析方法[J]. 浙江电力,2018,37(4):63-67.
[5] 张会敏,唐贵基. 基于CEEMD和奇异值差分谱的滚动轴承故障特征提取[J]. 电力科学与工程,2016,32(1):37-42.
[6] 刘志刚,张巧革,张扬. 电能质量复合扰动分类的研究进展[J]. 电力系统保护与控制,2013,41(13):147-153.
[7] 岳明道. 基于S变换和分类树的电网暂态电能质量扰动分类辨识[J]. 电力系统保护与控制,2011,39(9):33-37.
[8] MASOUM M A S, JAMALI S, GHAFFARZADEH N. Detection and classification of power quality disturbances using discrete wavelet transform and wavelet networks[J]. IET Science,Measurement& Technology,2010, 4(4):193-205.
[9] MARTA RUIZ-LLATA,GUILLERMO GUARNIZO,CARLOS BOYA.Embedded power quality monitoring system based on independent component analysis and SVMs[C]. Proceedings of International Joint Conference on Neural Networks,2011:2229-2234.
[10] LIU Z G, CUI Y, LI W H. A classification method for complex power quality disturbances using EEMD and rank wavelet SVM[J]. IEEE Transactions on Smart Grid, 2015(23):97431-97442.
[11] 王金良,李宗军. 极点对称模态分解方法[M]. 北京:高等教育出版社,2015.
[12] 邓为权. 基于EEMD和SVM的电能质量扰动检测与分析研究[D]. 昆明:昆明理工大学,2015.
[13] 刘志刚. Hilbert-Huang变换及其在电力系统中的应用[M]. 北京:科学出版社,2016.
[14] PINCUS S,KALMAN R E. Irregularity,volatility,risk,and financial market time series[J]. Proceedings of the National Academy of Science of the United States of America,2004(101):13709-13714.
[15] RICHMAN J S, MOORMAN J R.Physiological time-series analysis using approximate entropy and sample entropy[J]. American Journal of Physiology-Heart and Circulatory Physiology,2000,278(6):2039-2049.
[16] GASPARETTO A,LANZUTTI A,VIDONI R,et al. Experimental validation and comparative analysis of optimal time-jerk algorithms for trajectory planning[J]. Robotics and Computer-Integrated Manufacturing,2012( 28) : 164-181.
[17] PINCUS S,SINGER B H. Randomness and degrees of irregularity[J]. Proceedings of the National Academy of Science of the United States of America,1996(93):2083-2088.
[18] 朱永利,吳立増,李雪玉,等. 贝叶斯分类器与粗綻集相结合的变压器综合故障诊断[J]. 中国电机工程学报,2005,25(10):159-165.
[19] 司 莉,毕贵红,魏永刚,等. 基于 RQA 与 SVM 的声发射信号检测识别方法[J]. 振动与冲击,2016,35(2):98-103.
[20] CHANG C C,LIN C J. LIBSVM: a library for support vector machines[D]. Taiwan:Department of Computer Science National Taiwan University,2011.
(责任编辑:杜能钢)