支持向量机的低压故障电弧识别方法
2012-07-02徐贞华
徐贞华
(江西铜业股份有限公司德兴铜矿动力厂,德兴334224)
随着各种用电装置在国民生产生活中地位的不断提升,用电安全越来越受到人们的重视,设备制造商也积极采用新工艺、新器件来不断提高用电装置和配电产品的质量。但是线路老化、接触不良等一些由量变引起的绝缘失败和线路短路情况时有发生,由此引发的故障电弧能够造成严重的设备损坏、经济损失甚至人员伤亡[1]。
国外对于故障电弧的研究从19世纪20年代开始,并对故障电弧检测方法也作了深入研究。然而故障电弧的特性通常随着负荷变化而变化,即使使用同样的负荷,故障电弧也可能不同[2],因此基于数学方法的检测技术缺乏一定的泛化能力。本文设计了基于支持向量机SVM的故障电弧检测方法,具备检测的泛化能力,同时为电弧样本库奠定了基础。
1 研究背景
SVM适用于解决模式分类与非线性映射问题[3]。从线性可分模式分类来看,SVM的主要思想是建立一个最优决策超平面,使得该平面两侧距平面最近的两类样本之间的距离最大化,从而对分类问题提供良好的泛化能力。对于非线性可分模式分类问题,将复杂的模式分类问题非线性地映射到高维特征空间,只要变换是非线性的且特征空间的维数足够高,则原始模式空间能变换为一个新的高维特征空间,使得特征空间中模式以较高的概率线性可分。因此,应用SVM算法在特征空间建立分类的超平面即可解决非线性可分的模式识别问题[4]。
1.1 支持向量机的基本原理
从SVM的分类判别函数形式上看,它类似于一个3层前馈神经网络。其中隐层节点对应于输入样本与一个SVM的内积核函数,而输出节点对应于隐层输出的线性组合。图1给出SVM神经网络的示意图,其中K(X,XP)称为核函数,常用的有下述四种[5]。
线性核函数Linear:
多项式和函数Polynomial:
采用该函数的SVM是一个q阶多项式分类器,其中q为参数。
Gauss核函数RBF:
采用该函数的支持向量机是一种径向基函数分类器。
Sigmoid核函数:
采用该函数的支持向量机实现的是一个单隐层感知器神经网络。
“这是谁都勉强不了的事情!”汪队长拍拍头,面露难色,“这也不是你我说了算的事情,也不是你那个陈班长一厢情愿的事情,关键是要让李晓英心甘情愿才成!”
图1 支持向量机神经网络的示意图Fig.1 Diagram of SVM neural network
1.2 支持向量机模型参数
SVM模型中,核函数参数g和惩罚参数c是对SVM准确率影响最大的两个参数。其中核函数参数g的改变会影响映射关系,反映样本数据在高维空间分布的复杂程度;惩罚参数c的作用是确定调节SVM的置信区间和经验风险的比例,从而提高SVM的泛化能力。
在实际应用中,参数(c,g)的选择不是随机的,一般用交叉验证CV(cross validation)的方法找到一定意义下得最佳参数(c,g)。CV的基本思想是在某种意义下把原始数据进行分组,一部分作为训练集,一部分作为验证集。先用训练集对SVM进行训练,再利用相应的验证集测试训练得到模型(model),以准确率作为SVM性能的评价指标。
常用的CV方法是K-CV。原始数据被分成K组,将每个子集数据分别做一次验证集,同时其余的K-1组子集数据作为训练集,这样会得到K个模型,用这K个模型最终验证集的分类的准确率的平均数作为此K-CV下分类器的性能指标。K-CV可有效避免过学习及欠学习状态的发生。
用K-CV方法实现交叉验证,通常使用网格搜索法,整个优化流程如图2,在c,g双重循环下寻找到最优的CV_acc,返回最优的c,g的值。
图2 网络搜索法流程框图Fig.2 Diagram of grid search algorithm
几个关键参数为:
cmin,cmax——惩罚参数c的变化范围;
gmin,gmax——参数g的变化范围;
cstep,gstep——参数c和g每次变化的步长;
2 方案设计
2.1 样本数据采集
图3 故障电弧发生电路Fig.3 Generation circuit of arc fault
本试验平台电路如图3。供电电压为220V,50 Hz,电弧发生器参照美国UL1699标准[6]制作,由固定电极和移动电极组成。有尖锐末端的电极是碳棒,另一个是铜棒。电极相互接触时电路完全闭合,通过移动碳棒拉开空气间隙就可产生电弧。
考虑到一般家庭用电负荷特性,选取加热器、电吹风、电风扇、电钻、电脑等负荷及各种负荷并联情况。其中电钻、电脑、电吹风等非正弦工作电流与电弧电流的相似性为电弧的识别增加了难度。
样本编号如表1所示。
表1 样本编号Tab.1 Sample No.
从电饭锅、电吹风、电风扇、电机、电脑5种负载中选取1种负载相关样本作为检验集,其他样本作为训练集。该方案能反映出SVM对不同负载的泛化能力。本实验先选用电风扇作为检验集,其他负载作为训练集。
训练集436个样本:(1~92),(144~183),(244~273),(304~414),(438~478),(539~598)(619~678)。
检验集242个样本:(93~143),(184~243),(274~303),(415~437),(479~538),(599~618)。
2.2 数据预处理
采集到的原始数据不能直接区分出电弧故障,需进一步处理以获取更好的识别效果。本实验做了以下几种数据处理:
从过零点处开始采集,以便所得到的电流数据保持同相位;
采集数据的时间长度为5个周期,保证数据量能体现出故障电弧的特征;
归一化处理,采集到的波形必须归一化到一定的区间才能反映出内在规律。本实验采用[-1,1]区间归一化,将所有数据映射到区间[-1,1]内,变换式:
特征值的提取[7]。首先对归一化后的数据进行FFT变换,得到其频谱图,再经滤波后提取出频谱轮廓图,最后对得到的频谱轮廓进行峰值检测,按峰值大小顺序排序,取前M个频率点作为特性向量,与归一化后的数据共同作为SVM的输入参数。
2.3 模型参数确定
采用基于网格搜索法(grid search)的K-CV方法实现交叉验证,网格算法经历粗选和精选两个过程。首先进行参数粗选,在(-10,10)区间内确定准确率最高的log2c,log2g范围,将其作为精选的范围。然后以更小的步长来寻找更好的(c,g)。
3 结果分析
本节基于Matlab进行实验,将所有678个样本作为训练集,同时作为检验集,采用RBF核函数,用网格搜索算法对原始数据样本进行交叉验证,选取对全局最优的c、g参数。
交叉验证结果如图4所示,准确率最高处为98.82%,对应的最优参数(c,g)为(2.83,0.088)。在等高线图上,最优点位于右下角红色区域,在3D视图中,对应为曲面最高点。
采用最优参数(c,g,t)= (2.83,0.088,2),对SVM的泛化能力检验结果如图5和图6所示。
电机负载结果分布如图5所示。该样本下SVM的识别结果比较理想,对电机负载各种工况能做出正确的判断。电饭锅负载结果分布如图6所示。其中判断错误样本主要集中在检验样本220~230。经样本分析,该样本区间对应“电吹风+电饭锅运行”负载试验情况。
其他负载的检验结果见表2,除了对于电脑负载的识别率稍差,电饭锅、电吹风、电风扇、电机都具备较准确的识别能力。
图4 网络算法对原始数据样本进行交叉验证Fig.4 Results of best(c,g)with grid search algorithm
图5 电机负载电弧识别结果图Fig.5 SVM result of arc test with motor load
图6 电饭锅负载电弧识别结果图Fig.6 SVM result of arc test with rice cooker load
表2 SVM泛化能力检验结果Tab.2 SVM test results
4 结语
本文在工频市电条件下参照美国UL1699标准进行了模拟低压故障电弧发生实验,采集了相关电流数据,通过SVM对故障电弧识别,通过Matlab对识别方法进行验证、分析。结果表明,该方法能有效识别故障电弧,并具备一定的泛化能力,对各种负载以及不同负载并联情况均有较高的识别率。
[1] 符平发(Fu Pingfa).中外电气火灾十年数据分析及防控体系(The analysis of data and the system of prevention and control of the electrical fire at home and abroad in 10years)[J].电气技术(Electrical Engineering),2008,95(3):8-11.
[2] 邹云峰,吴为麟,李智勇(Zhou Yunfeng,Wu Weilin,Li Zhiyong).基于自组织映射神经网络的低压故障电弧聚类分析 (Cluster analysis of arc fault in lowvoltage based on SOM neural network)[J].仪器仪表学报(Chinese Journal Of Scientific Instrument),2010,31(3):571-576.
[3] 施彦,韩立群,廉小亲(Shi Yan,Han Liqun,Lian Xiaoxin).神经网络设计方法与实例分析[M].北京:北京邮电大学出版社,2009.
[4] 周梦(Zhou Meng).计算智能的数学基础[M].北京:科学出版社,2002.
[5] MATLAB中文论坛.MATLAB神经网络30个案例分析[M].北京:北京航空航天大学出版社,2010.
[6] 陈光英,张千里,李星(Chen Guanying,Zhang Qianli,li xing).特征选择和SVM训练模型的联合优化(Hybrid optimization selection and SVM training)[J].清华大学学报:自然科学版(Journal of Tsinghua University:Science and Technology),2004,44(1):9-12.
[7] 赵智,王艳松,鲍兵,等(Zhao Zhi,Wang Yansong,Bao Bing,etal)基于小波神经网络的配电网故障类型识别(Fault type ldentification in distribution network based on wavelet neural network)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2007,19(6):93-96.