基于时频熵的放电脉冲取特征提取算法
2015-03-15陈志椿
陈志椿
(福建省闽南理工学院 实践教学中心,福建 石狮 362700)
基于时频熵的放电脉冲取特征提取算法
陈志椿
(福建省闽南理工学院 实践教学中心,福建 石狮 362700)
传统的放电脉冲取特征提取方法采用的是线性时间序列分析方法,提取放电脉冲的关联维特征进行分类识别,由于放电脉冲具有非线性特性,线性时间序列分析方法无法提取非线性特征,导致模式识别性能不好。提出基于时频熵的放电脉冲取特征提取算法,对108次/s的超宽带局部放电脉冲时间序列波形进行时频熵特征参数提出,采用混沌差分进化算法对模糊C均值聚类算法进行改进,用改进的模糊C均值聚类算法,在高维的特征参数空间中,进行超宽带局部放电脉冲的时频熵特征参数的聚类分析,实现对放电脉冲的特征分类检测和识别。仿真实验结果表明,采用该算法能有限实现对放电脉冲取特征提取,特征聚类的准确度提高,提高了脉冲检测识别性能。
放电脉冲;特征提取;模糊C均值;数据聚类
在复杂环境下的电力设备网络系统中,由于外加电压在电气设备中形成导体间的绝缘局部空间,造成绝缘部分区域发生绝缘劣化,断绝缘的化学键而发生裂解,导致电气设备产生局部放电,绝缘强度性能下降。在多局部放电源的超宽带检测技术以及模式识别系统设计中,需要通过放电脉冲特征提取,以此为数据基础进行特征分类,实现模式识别[1-3]。因此,研究多局部放电的脉冲提取算法具有基础性意义。
文献[4]提出一种基于广义的平稳随机过程分析的放电脉冲特征提取和信号处理算法,采用放电脉冲信号的统计量特征进行模式识别,提高了检测性能,但是算法的计算量较大,抗干扰性能不好;文献[5]提出一种基于非平稳放电脉冲信号频率调制的特征提取算法,通过提取放电脉冲的频率调制特征,实现对放电脉冲的双曲调频、多项式调频,对放电脉冲的参量具有较好的估计和分类性能,但是随着放电脉冲样本数目的增大,会在特征分类过程中出现非线性局部失真,导致特征提取性能不好。针对上述问题,提出基于时频熵的放电脉冲取特征提取算法,首先局部放电脉冲非线性时间序列分析及时频熵特征提取算法研究,形成一组高维特征参数空间,基于混沌差分进化算法对模糊C均值聚类算法进行改进,实现对放电脉冲的时频熵特征分类识别,最后通过仿真实验进行性能验证,展示本文算法在实现放电脉冲特征提取和分类识别中的优越性能,得出有效性结论。
1 局部放电脉冲非线性时间序列分析及特征提取
1.1 局部放电脉冲非线性时间序列分析
由于外加电压在电气设备中形成导体间的绝缘局部空间,造成绝缘部分区域发生绝缘劣化,产生局部放电,它可以采用非线性时间序列分析方法进行特征提取和研究,局部放电脉冲非线性时间序列分析可以看作是如图1所示的输入输出过程,输入的是具有强烈的电磁场干扰的高压复杂系统的时间序列,输出的是多局部放电源的超宽带检测技术以及模式识别系统的某些特征[6]。
图1 多局部放电源脉冲的非线性时间序列分析过程
一个局部放电脉冲非线性时间序列由一非线性多元特征线性方程表示,多元特征线性方程为:
xn=x(t0+nΔt)=h[z(t0+nΔt)]+ωn
(1)
式中h(.)——来自于随机系统的局部放电脉冲的多元数量值函数,ωn——测得的观标量时间序列误差,采用相空间重构方法构建一个高维的特征参数空间[7],在维相空间中形成一种规则的、有形的维矢量为:
X(n)={x(n),x(n+τ),…,x(n+(m-1)τ)}
n=1,2,…,N
(2)
局部放电脉冲时间序列的变量为{x(t0+iΔt)},i=0,1,…,N-1,其相空间重构的时间波动轨迹为:
X=[s1,s2,…sK]n=(xn,xn-τ,…,xn-(m-1)τ)
(3)
式中K=N-(m-1)τ表示相空间中的嵌入向量维数,N表示局部房地那时间序列的几何不变量,τ为时间延迟,m为多维状态空间,si=(xi,xi+τ,…,xi+(m-1)τ)T称为局部放电脉冲非线性时间序列的嵌入空间状态矢量,其表达式为:
(4)
选择适当的m和τ,创建一个嵌入式子空间,当外加电压在电气设备中产生场强时,在子空间中进行局部放电脉冲非线性时间序列的特征提取,局部放电脉冲非线性时间序列的特征提取过程如图2所示。
图2 局部放电脉冲非线性时间序列的特征提取过程
1.2 局部放电脉冲信号模型构建及时频熵特征提取
在上述进行了局部放电脉冲非线性时间序列分析的基础上,通过特征提取反应脉冲的细节特征,实现脉冲检测和识别,在此需要进行局部放电脉冲信号模型构建,在多局部放电源的超宽带检测技术以及模式识别系统中,假设局部放电脉冲的M是d维的紧流形,F是光滑的矢量场,对脉冲时间序列进行Hilbert变换[8],构建多局部放电源的Weibull分模型:
z(t)=x(t)+iy(t)=a(t)eiθ(t)
(5)
式中z(t)——信号离散数据解析特征;x(t)——局部放电脉冲信号解析模型的实部;y(t)——局部放电脉冲的固有模态函数;a(t)——为局部放电脉冲数据序列第一个最小值时对应的3次样条插值包络;θ(t)——高频分量。
对非平稳时变信号进行时频分析,通过经验模态分解将原始局部放电源脉冲信号分解为多个窄带分量,信号的离散解析形式与所给定的实信号s(t)=a(t)cosφ(t)相同,得到局部放电脉冲的包络特征为:
(6)
式中a(t),θ(t)——局部放电脉冲的解析形式的包络和相位。
a(t)和θ(t)作为时间的函数极坐标形式,显然有:
(7)
式中,φ(t)称为瞬时相位,对局部放电脉冲z(t)实行x(t)与1/t的经验模态特征分析是保留其正频部分(将其幅度加倍,以使原信号的总能量保持不变),有效保留了x(t)的局部时间特性,放电脉冲时间序列的正信号具有双向延拓特性,针对局部放电脉冲波形特征的低频域产生的干扰,通过滤波得到局部放电脉冲的阶跃式传输函数:
(8)
即Z(f)可由S(f)通过滤波得到,此时局部放电脉冲的频域时间均值为:
(9)
对上述进行分解卷积,从而有效保留了信号x(t)的单分量和多分量特性,实现信号模型构建,进行时频熵特征提取。时频熵代表局部放电系统的脉冲信息量或随机性的程度,计算过程如下:
xi=(xi,xi+τ,…,xi+(m-1)τ)
(10)
其中,i=1,2,…,N-(m-1)τ。
(2)计算局部放电脉冲时间序列进行相空间重构后的在子空间中的第i点xi和第j点矢量xj的欧式距离:
(11)
其中,i,j=1,2,…,N-(m-1)τ。表示局部放电脉冲在某些时刻具有各自的瞬时频率。
(3)对于给定的单分量信号xi,瞬时频率dij≤ε,计算满足上式的数目脉冲点数N(i),采用定量递归分析方法,得到原始局部放电时间序列标准差,放电脉冲的时频特征总点数的比值Rm(r,i):
(12)
(4) 利用Gabor的平均测度,计算时频熵,计算式为:
(13)
求出其平均值:
(14)
2 改进的模糊C均值聚类及时频熵特征参数分类识别实现
在上述进行局部放电脉冲时间序列的时频熵特征提取的基础上,构建高维特征参数空间,特征分类采用的是改进的模糊C均值聚类算法,传统的模糊C均值聚类对噪声和初始值敏感,不适应于局部放电脉冲的特征聚类和识别中,容易陷入局部最优,本文采用混沌差分聚类进行聚类算法改进,实现过程描述如下:
假设局部放电脉冲时间序列的数据集:
X={x1,x2,…,xn}⊂Rs
(15)
式中,局部放电脉冲时间序列中含有n个样本,其中样本xi,放电脉冲的时频熵特征点采样序列为i=1,2,…n,通过全局搜索性寻找聚类中心,时频熵的聚类特征矢量为:
xi=(xi1,xi2,…,xis)T
(16)
现在把有限时频熵特征点集合分X为c类,其中1 (17) 式中Vi为使用Logistic混沌时间序列的聚类中心的第i个矢量,基于模糊划分矩阵表示为: (18) 利用混沌变量的非线性随机性,把混沌扰动量引入到进化种群当中,得到局部放电脉冲的时频熵通过模糊C均值聚类后的聚类目标函数为: (19) 式中,m为最大迭代次数,(dik)2为时频熵特征样本xk与Vi的测度距离,其每个分量都在(0,1)之间,用欧式距离表示,为: (20) 随着聚类样本的增多,通过聚类中心的混沌差分进化,得到: (21) 产生随机矩阵z,为c×D维,求得时频熵特征的模糊C均值聚类的聚类中心以及模糊划分矩阵为: (22) (23) 综上所述,采用改进的聚类算法,能从高维的特征参数空间中实现对特征的优化聚类和识别。 为了测试本文设计的性能,进行仿真实验。实验的硬件环境为:Inter Pentium 4 3 000 MHz,内存1.5 G,显卡为nVIDIA GeForce 9600。编程软件利用Visual C++7.0和Matlab混合编程,实验中,局部放电的频率为3 dB,频带10 Hz~300 kHz,A/D转换器采样速率:0.1 μs/点,输出校准脉冲电压值5档可调:0.5 V、1 V、2.5 V、5 V、10 V,工作电源为可充电蓄电池,工作电压DC12 V,改进的模糊C均值聚类算法的参数设置如下:Gmax=30,D=12,c=3,NP=30,F=0.5,CR=0.1,m=2。根据上述仿真环境和参数设定,对108次/s的超宽带局部放电脉冲波形-时间序列进行特征量提取,取采样间隔为Δt=1去除前1 000个点,取长度为2 000点的x分量的一组数据,得到两组局部放电脉冲时间序列波形如图3所示。 图3 局部放电脉冲采集时间序列波形 从图可见,原始的局部放电脉冲采集时间序列波形受到干扰等因素的影响,如果不通过特征提取难以挖掘其内部有用特征,导致对脉冲的识别和检测有效性不好,采用本文的时频熵特征提取算法,在给定m=1,2,…,9下,进行时频熵特征的高维参量空间重构,进行局部放电脉冲非线性时间序列和特征提取,得到放电脉冲的时频熵特征提取结果如图4所示。 图4 局部放电脉冲的时频熵特征提取结果 基于改进的模糊C均值聚类算法,在高维特征参考了空间中,对上述时频熵特征提取结果进行数据聚类,实现脉冲特征的分类识别,得到数据聚类结果如图5所示。 图5 局部放电脉冲的时频熵聚类结果 通过图5分析可见,采用本文算法在高维的特征参数空间,通过利用改进的模糊C均值聚类算法对局放脉冲群进行分类,能有效实现对局部放电脉冲群的分类识别,分类准确度较高,采用10 000次蒙特卡洛实验进行定量分析可知,采用本文方法进行特征分类的准确概率为99.97%,比传统方法提高27.06%,展示了本文方法的优越性能。 在多局部放电源的超宽带检测技术以及模式识别系统设计中,需要通过放电脉冲特征提取,以此为数据基础进行特征分类,实现模式识别。本文提出基于时频熵的放电脉冲取特征提取算法,对108次/s的超宽带局部放电脉冲时间序列波形进行时频熵特征参数提出,采用混沌差分进化算法对模糊C均值聚类算法进行改进,进行超宽带局部放电脉冲的时频熵特征参数的聚类分析,实现对放电脉冲的特征分类检测和识别。仿真实验结果表明,改进算法特征提取,特征聚类的准确度提高,脉冲检测识别性能较高。研究结果为研制多局放源的局放超宽带检测技术以及模式识别系统提供了试验和理论依据。 [1]文天柱,许爱强,程 恭. 基于改进ENN2聚类算法的多故障诊断方法[J]. 控制与决策, 2015, 30(6): 1021-1026. WEN Tian-zhu, XU Ai-qiang, CHNEG Gong. Multi-fault diagnosis method based on improved ENN2 clustering algorithm[J]. Control and Decision,2015, 30(6): 1021-1026. [2]王喜莲,许振亮,王 翠. 开关磁阻电机转矩脉动与铜耗最小化控制研究[J].电机与控制学报,2015,19(7):52-57. WANG Xi-lian, XU Zhen-liang, WANG Cui. Torque ripple and copper losses minimization control study of switched reluctance motor[J].Electric Machines and Control,2015,19(7):52-57. [3]陶新民, 宋少宇, 曹盼东, 等. 一种基于流形距离核的谱聚类算法[J]. 信息与控制, 2012,41(3): 307-313. TAO Xin-min, SONG Shao-yu, CAO Pan-dong, et al. A spectral clustering algorithm based on manifold distance kernel[J].Information and Control,2012,41(3):307-313. [4]TIAN Gang, HE Ke-qing, WANG Jian, et al. Domain-oriented and tag-aided web service clustering method[J]. Chinese Journal of Electronics, 2015,43(7): 1266-1274. [5]WU Tao, CHEN Li-fei, GUO Gong-de. High-dimensional data clustering algorithm with subspace optimization[J]. Journal of Computer Applications, 2014, 34(8): 2279-2284. [6]辛 宇,杨 静,汤楚蘅, 等. 基于局部语义聚类的语义重叠社区发现算法[J]. 计算机研究与发展, 2015, 52(7):1510-1521. XIN Yu, YANG Jing, TANG Chu-heng, et al. An overlapping semantic community detection algorithm based on local semantic cluster[J].Journal of Computer Research and Development, 52(7):1510-1521. [7]余晓东,雷英杰,岳韶华,等.基于粒子群优化的直觉模糊核聚类算法研究[J].通信学报,2015(5):78-84. YU Xiao-dong, LEI Ying-jie, YUE Shao-hua, et al. Research on PSO-based intuitionistic fuzzy kernel clustering algorithm[J].Journal on Communications,2015(5):78-84. [8]宋亚奇,周国亮,朱永利. 智能电网大数据处理技术现状与挑战[J]. 电网技术,2013,37(4):927-935. SONG Ya-qi, ZHOU Guo-liang, ZHU Yong-li. Present status and challenges of big data processing in smart grid[J]. Power System Technology,201 3,37(4):927-935. (本文编辑:杨林青) Feature Extraction Algorithm Based on Time Frequency Entropy of Discharge Pulse CHENZhi-chun (PracticalTeachingCenter,MinnanUniversityofScienceandTechnology,Shishi362700,China) Thetraditionaldischargepulsefeatureextractionmethodisalineartimeseriesanalysismethod,whichextractsthecorrelationcharacteristicsofdischargepulseanddoesclassificationidentification.Duetothenonlinearpropertiesofdischargepulse,lineartimeseriesanalysismethodcannotextractnonlinearfeatures,resultinginbadperformanceinpatternrecognition.Basedontime-frequencyentropyofdischargepulseinfeatureextractionalgorithm, 108/stimesequenceultra-widebandpartialdischargepulsewaveformoftime-frequencyentropycharacteristicparametersisputforward;thechaosdifferentialevolutionalgorithmisadoptedtothefuzzyC-meansclusteringalgorithmisimproved;usingtheimprovedfuzzyc-meansclusteringalgorithm,inthecharacteristicparametersofhighdimensionspace,thetimeandfrequencyofultra-widebandpartialdischargepulseentropyclusteringcharacteristicparametersisanalyzed;thedetectionandidentificationofthecharacteristicsofdischargepulseclassificationarerealized.Thesimulationresultsshowthatthealgorithmcanbelimitedtothedischargepulseinfeatureextraction,improvingfeatureclusteringaccuracyaswellastheperformanceofpulsedetectionidentification. dischargepulse;featureextraction;fuzzyCmeans;dataclustering 10.11973/dlyny201506019 陈志椿(1991),硕士研究生,助理实验师,主要从事电气自动化及其控制等方面的教学和研究。 TP A 2095-1256(2015)06-0826-05 2015-11-053 仿真实验与结果分析
4 结语