基于随机森林模型的瓷绝缘子污秽等级判定研究
2018-02-08刘文明
虢 韬,沈 平,王 伟,刘文明
(1.贵州电网有限责任公司输电运行检修分公司,贵阳550002;2.贵州电力设计研究院,贵阳550002)
0 引言
高压绝缘子长期运行在恶劣的户外环境,表面会沉积大量的污染物,潮湿环境下绝缘强度会急剧降低,产生很大的泄漏电流,严重时引发污闪事故,导致供电中断,给电力系统的安全稳定造成严重的影响[1]。因此,对绝缘子的污秽状况进行实时在线监测,预防大面积污闪事故的发生,对电力系统的安全稳定运行具有重要的意义。
绝缘子污秽的检测方法主要有:等值附盐密度法,污层表面电导率法、电流脉冲计数法和泄漏电流法[2]。泄漏电流法因结合了环境的温湿度,可动态地全面反映绝缘子的污秽状态,是目前对绝缘子在线监测的主要方法。文献[3]利用人工神经网络的方法来判定绝缘子的污秽程度,但因神经网络具有收敛速度慢、结构选择难和局部极小等问题,判定效果不佳。文献[4]将支持向量机应用到绝缘子的污秽等级判定,取得了一定效果,但模型数据泛化能力较差,污秽判定结果准确性不高等缺点。文献[5]采用模糊逻辑与神经网络相结合的方法来评定绝缘子的污秽程度,虽准确性有了一定程度的提高,但存在着判定模型复杂,且模糊逻辑与神经网络存在两者融合困难等问题。
针对目前绝缘子污秽判定效果不佳的现状,笔者提出了一种基于随机森林算法的绝缘子污秽等级判定模型,该方法首先利用时域分析和离散小波时频分析来获取泄漏电流的重要相关特征量,然后由训练好的随机森林模型来判定绝缘子的污秽程度,并通过实验室模拟试验信号和现场运行实测信号来验证笔者所提方法的有效性和准确性。
1 随机森林算法基本理论
随机森林是指由多个决策树{h(x,θk),k=1,2,…n}组成的分类器,其中θk表示相互独立且同分布的随机向量[6]。对于每一个输入样本,每个决策树都会给出自己独立的诊断结果,随机森林的最终输出结果由所有决策树综合决定,即“投票”决定。随机决策树为随机森林中的最小决策单元,其生成主要包含两个“随机”特征:①决策树的随机训练样本由Bagging方法来生成;②随机决策树的节点分裂通过随机选择训练样本中的特征来进行。
当随机森林中的决策树数目较大时,可由大数定律和决策树的结构推导出如下定理:随着决策树数目的增加,对于所有的随机向量θ,分类器的泛化误差PE*趋向于
当决策树数目增加到一定程度时,分类器泛化误差PE*还将趋向于某一上界。随机森林的泛化误差的上界可表示为
式中:表示相关系数的均值,s表示决策树的分类强度,mr(x,y)表示随机森林的边缘函数。
式(2)表明,随机森林的泛化误差上界主要由两个参数来决定,即随机森林中每棵决策树的分类强度s和决策树之间的相互依赖程度ρˉ。
随机森林算法具有较少的参数调整,能够估计特征量的重要性,且适用性很强,对于数据集中存在大量未知特征和大量的噪音时,仍然能够取得很好的预测和分类性性能,最重要的是它的泛化能力很强[7],因此,随机森林算法在故障诊断等众多领域获得了广泛的应用,其实用性和高效性得到了有效的认证。
2 离散小波变换基本理论
小波是一种分析瞬态和不稳定波的灵活工具,它可以同时对信号的时域和频域进行分析[8],对于一个任意的信号x(t),其小波变换的定义为
对任意的信号x(t),其小波变换是一个二元函数。为了数值计算的简化和理论分析的简便,需要对小波变换进行离散化处理。将其参数对(a,b)离散化即可获得小波变换的离散形式。离散小波变换可表示为
对信号做离散小波变换的过程[9]为:一方面,信号x(t)由低通滤波器进行“下采样”,获得分辨率和尺度均降低一半的平均信号c(t),即低频信号成分;而另一方面,信号x(t)由高通滤波器进行“下采样”,获得分辨率和尺度均降低一半的细节信号部分d(t),即高频信号成分。信号分解可表示为
3 绝缘子泄漏电流信号分析
3.1 绝缘子泄漏电流信号的获取方法
为了获得绝缘子泄漏电流的实测信号,在高压试验室中进行了泄漏电流信号的相关采集试验,试验接线原理如图7所示,试品为7片XP-70绝缘子,所加相电压为63.5 kV,用以模拟110kV变电站及输电线路。污秽模拟采用的是可溶性的NaCl和不溶性的硅藻土,加入10g~100g的NaCl,用以模拟等值附盐密(ESDD,mg/cm2))的轻度污秽LP[0,0.1]、中度污秽MP(0.1,0.2]、重度污秽HP(0.2,0.3]、非常严重污秽VHP(0.3,+∞]四个污秽等级,绝缘子染污采用GB/T 4585—2004中所推荐的固体涂层法[10]。雾室的温湿度由由温湿度控制器来调节,其控制精度分别为±0.1℃和±0.2%。雾室内装有一台壁挂式湿度计和温度计来测量相对湿度和温度的大小。泄漏电流传感器为电磁式电流互感器,并在软件端将采集到的数据转换成信号实际值,系统采样频率为5 kHz。为避免恒定加压情况下由于泄漏电流热效应引起的绝缘子表面干燥现象,试验中采用瞬时加压法[11],迅速对绝缘子施加相应电压,存储好相应的波形后,再迅速降低电压。
绝缘子泄漏电流的现场数据样本则通过已投运到现场实际运行的多套输电线路及变电站的绝缘子泄漏电流在线监测系统,等值附盐密ESDD值由运行人员对绝缘子表面进行实测获得。
3.2 绝缘子泄漏电流信号的时域分析
为分析理解在不同污秽水平下绝缘子泄漏电流信号的形状和大小差异,利用本文建立人工污秽试验获取不同温湿度及污秽程度下的泄漏电流信号,见图1。温度18℃及相对湿度90%下的不同污秽程度泄漏电流波形如图2所示,图3为试验过程中重度污秽下的绝缘子电弧放电图。
图1 人工污秽试验接线图Fig.1 Sketch map of artificial contamination test
图2显示了所获得的污秽程度从0.05 ESDD到0.35 ESDD的泄漏电流波形,由图2可知在轻度污秽的初级阶段,泄漏电流波形近似为正弦波形,当污秽程度逐渐增大时,由图2(b)和图2(c)显示出将出现短暂的放电现象,导致泄漏电流波形发生畸变现象,且泄漏电流幅值也逐渐增大,当污秽程度达到重度污秽0.25 ESDD时,可以看到多个放电现象,而如果在非常严重污秽程度下0.35 ESDD,可以发现泄漏电流波形又近似为正弦波形,但幅值发生了剧增。
为提取不同污秽程度下绝缘子泄漏电流的时域特征量,笔者采用泄漏电流有效值的均值、最大值和标准差这3个特征量,从不同角度描述了当前泄漏电流的特点[12],泄漏电流有效值的均值反映的是泄漏电流的基本大小,最大值反映的是最大的脉冲电流值,而标准差则从另一个角度反映了泄漏电流各个采样值与均值之间的偏差度,即泄漏电流的分布离散程度。
图2 泄漏电流实测信号波形图Fig.2 Waveform figure of measured leakage current
图3 重度污秽下的绝缘子电弧放电图Fig.3 Photographs of arcing on the surface of insulator at high pollution class
式中:Ie表示泄漏电流有效值,Ime表示有效值均值,Imaxe表示有效值中的最大值,σ表示有效值与均值的标准差;x(t)表示时域泄漏电流值,T表示计算周期,N表示采样时段内的采样点数。
3.3 绝缘子泄漏电流信号的时频分析
泄漏电流时域分析结果表明随着污秽程度的加重,泄漏电流幅值将增大,但泄漏电流波形是非常不规则的,很难单独从泄漏电流波形的时域特征精确地判定其污秽程度。在严重污秽情况下,泄漏电流波形中可以看到很多波峰和波谷,很难通过短时间的泄漏电流波形来精确预测绝缘子的污秽程度。因此有必要进行泄漏电流波形的时频分析,笔者采用离散小波变换获取其时频特性。文献[13]研究表明Daubechies4小波在识别信号中由于高频成分引起的任何过渡是非常有用的,因此笔者选择Daubechies4小波作为离散小波变换的小波基函数。
标准差可以作为一种衡量均值为零的能量信号的有效手段[14],标准偏差值可以作为识别在不同的分解层级上细节成分的瞬态能量信号。尺度n上细节信号的标准偏差计算公式为
式中:Nn为dn的长度,μn为dn的平均值。
为了理解泄漏电流信号中的高频率扭曲现象,对波形畸变率进行相应的计算。计算公式如下:
不同污秽程度下离散小波变换后细节系数的变化情况Dn和DR值分别如图4、图5所示。
图4 不同污秽程度下的标准偏差值Fig.4 The standard deviation values at different pollution levels
图5 不同污秽程度下的波形畸变率Fig.5 The distortion values at different pollution levels
由图4可知,在轻度污秽条件下,D5要比D1,D2和D3更小,且随着电弧的形成,可以看到与D1、D2、D3相比,D5的值在增大,对图4分析还显示由于在潮湿表面污秽的增加导致有放电形成时,可以观察到D6的值会有相应的上升,D6对应泄漏电流的基频信号,这显然表明D5和D6有很大的相关性,因此DWT的D5和D6组件被认为是作为识别绝缘子污秽程度严重的一个重要的特征量。同样地,从图5可以看出,由于在潮湿表面污秽的增加导致有放电形成时,DR也会增加到60%以上。然而,当由于污秽增加导致几个长电弧形成时,DR中低于40%的数目也会增加,从图4和图5可以看出D5、D6、DR有很大的变化,很难单独通过它们来预测绝缘子的污秽程度。
3.4 基于随机森林的污秽等级判定研究
3.4.1 基于随机森林的污秽等级判定模型
对于获得的泄漏电流信号,通过时域分析和离散小波变换时频分析获取相应的特征量,并将其作为本文随机森林分类系统的输入,从而获得绝缘子的污秽程度。笔者提出的基于随机森林模型的污秽严重程度分类系统的整体示意图如图6所示:将收集好的特征量整合成一个综合特性集输入到随机森林模型,输入特征量集为8维的向量,分别对应为泄漏电流采集时的温度、湿度,通过时域分析获取的泄漏电流有效值的均值、有效值的最大值、有效值与均值的标准差,以及通过离散小波变换时频分析,获取的D5、D6和DR。随机森林模型的输出为绝缘子表面污秽等级1、2、3、4,分别对应轻度污秽LP、中度污秽MP、重度污秽HP、非常严重污秽VHP四个污秽等级。
图6 污秽等级判定流程图Fig.6 Overall schematic diagram of pollution severity classifier in this paper
为对随机森林进行训练,利用图1所示的实验装置及现场实测的方法来获取泄漏电流信号波形,表1为实验室和现场实测获取的绝缘子不同污秽程度的有效训练样本数。
表1 不同污秽程度的训练样本数Table 1 Training sample number at different pollution levels
3.4.2 基于随机森林的污秽等级判定结果
利用MATLAB软件来用于随机森林分类器的分析,随机森林在对训练集进行bootstrap抽取时,大约有三分之一的原始训练集样本不会被抽中,这部分数据就称为袋外数据(OOB数据)。这部分OOB数据可以用来估计随机森林的性能,Breiman已经通过实验证明了OOB误差估计是近似于交叉验证得到的误差,是对随机森林性能的无偏估计[15]。表2为随机森林分类器算法的不同参数。mtry代表在每个节点用于决定最佳分裂的变量数。Leo Breiman研究表明mtry的最佳取值为log2n和之间(n为特征量的数量),因此mtry的取值范围为2~3,笔者经多次试验发现取3的时候OOB最小。终端节点取最小尺寸3时可以导致更小的树木生长且花费更少的时间。ntree代表树的数量,笔者试验时从取值1变化到200,图7显示了随机森林方法中不同尺寸的森林下的OOB错误率。由图7可知为了得到一个稳定的零OOB错误率,随机森林中的树应超过62,为保留一定的裕度,笔者取值80。
表2 随机森林分类器的训练参数Table 2 Training parameters of RF classifier
对训练好的绝缘子污秽等级判定模型进行测试,测试样本数及测试结果如表3所示,而在不同污秽程度下随机森林分类器的投票数也能表明随机森林分类器的准确性[16],因此笔者对投票数也进行了统计,统计结果如表4所示。
图7 不同尺寸下随机森林的OOB错误率Fig.7 OOB error rate of RF for different forest sizes
表3 随机森林分类器的测试结果Table 3 The test results of RF classifier
表4 随机森林分类器的投票结果Table 4 The voting result of RF classifier
由表3和表4的测试及投票结果可知,笔者判定模型在任何污秽等级下的准确率都高于96%,随机森林中树的投票准确率大于97.3%,且对于LP和VHP的判断准确率为100%,只是对于MP和HP存在极少数的错误,相应地对于LP和VHP的投票准确率也比MP和HP更高。测试结果显示了污秽等级判定模型具有很高的准确性,本文方法是可行和有效的。
4 结论
绝缘子污闪是影响电力系统安全稳定运行的重要隐患,而准确地判定绝缘子的污秽程度是防止污闪的前提,同时也是绝缘子在线监测的重要研究内容。笔者在对绝缘子泄漏电流信号进行时域分析和离散小波变换时频分析的基础上,提取出与绝缘子污秽等级相关的重要特征量,并基于随机森林模型建立了绝缘子表面污秽等级判定模型。研究结果表明绝缘子污秽等级的预测值与实测值具有高度吻合性,验证了本文方法的可行性和有效性,可用于绝缘子污秽等级的在线评估,为瓷绝缘子的污秽监测及污闪的预防提供有效借鉴和参考。
[1] SHI Y,HU G,CHEN Y.Study on AC artificially pollution flashover performance of long porcelain insulator string[J].Applied Mechanics&Materials,2015,713-715:975-978.
[2]蒋兴良,赵世华,毕茂强,等.污秽绝缘子闪络特性与泄漏电流特性研究[J].中国电机工程学报,2013(31):220-226.JIANG Xingliang,ZHA Shihua,BI Maoqiang,et al.Re⁃search on flashover performance and leakage current per⁃formance of polluted insulators[J].Proceedings of the CSEE,2013,33(31):220-226.
[3]CHANDRASEKAR S.Wavelet transform and artificial neu⁃ral network approach to infer the surface condition of pow⁃ertransmissionlineceramicinsulators[J].2010,9(1):59-66.
[4]谭国梁,王思华.基于熵权模糊神经网络的绝缘子污闪状态评估[J].电瓷避雷器,2015(4):5-9.TAN Guoliang,WANG Sihua.Condition assessment of in⁃sulator pollution flashover based on entropy weight fuzzy neutral network[J].Insulators and Surge Arresters,2015,4:5-9.
[5]史丽萍,祝艳华,朱宁坦.应用最小二乘支持向量机在线预测绝缘子等值附盐密度[J].高压电器,2013(4):82-85.SHI Liping,ZHU Yanhua,ZHU Ningtan.On-line fore⁃casting insulator’s ESDD with least squares support vector machine[J].High Voltage Apparatus,2013,49(4):82-85.
[6]RODRIGUEZ-GALIANO V F,GHIMIRE B,ROGAN J,et al.An assessment of the effectiveness of a random forest classifier for land-cover classification[J].Isprs Journal of Photogrammetry&Remote Sensing,2012,67(1):93-104.
[7] 黄衍,查伟雄.随机森林与支持向量机分类性能比较[J].软件,2012,33(6):107-110.HUANG Yan,ZHA Weixiong.Comparison on classifica⁃tion performance between Random Forests and Support Vector Machine[J].Software,2012,33(6):107-110.
[8]曲天书,戴逸松.基于离散小波变换的自适应语音消噪方法[J].电工技术学报,2001,16(2):75-78.QU Tianshu,DIA Yisong.A new method for adaptive speech noise canceling based discrete wavelet transform[J].Software,2001,16(2):75-78.
[9]JOHNSON J D,LU J,DHAWAN A P,et al.Real-Time Identification of Flutter Boundaries Using the Discrete Wavelet Transform[J].Journal of Guidance Control&Dy⁃namics,2015,25(2):334-339.
[10]国家质量监督检验检疫总局,中国国家标准化管理委员会.GB/T 4585-2004交流系统用高压绝缘子的人工污秽[S].北京:中国标准出版社,2004.Genaral Administration of Quality Supervision,Inspection and Quarantine of the People’s Republic of China,Stan⁃dardization Administration of the People’s Republic of China.GB/T 4585-2004 Artificial pollution tests on highvoltage insulators to be used on AC systems[S].Beijing:Standards Press of China,2004.
[11]CHANDRASEKAR S,KALAIVANAN C,CAVALLINI A,et al.Investigations on leakage current and phase angle characteristics of porcelain and polymeric insulator under contaminated conditions[J].IEEE Transactions on Dielec⁃trics&Electrical Insulation,2009,16(2):574-583.
[12]陈伟根,夏青,李璟延,等.绝缘子污秽预测新特征量的泄漏电流时频特性分析[J].高电压技术,2010,36(5):1107-1112.CHEN Weigen,XIA Qing,LI Jingyan,et al.Time-fre⁃quency characteristic analysis of leakage current for new characteristics of insulators contamination prediction[J].High Voltage Engineering,2010,36(5):1107-1112.
[13]SARATHI R,CHANDRASEKAR S,YOSHIMURA N.In⁃vestigations into the surface condition of silicone rubber in⁃sulation material using multiresolution signal decomposi⁃tion[J].IEEE Transactions on Power Delivery,2006,21(1):243-252.
[14]CHANDRASEKAR S,KALAIVANAN C,CAVALLINI A,et al.Investigations on leakage current and phase angle characteristics of porcelain and polymeric insulator under contaminated conditions[J].Dielectrics&Electrical Insula⁃tion IEEE Transactions on,2009,16(2):574-583.
[15]BREIMAN L.Random Forest[J].Machine Learning,2001,45:5-32.
[16]DEVETYAROV D,NOURETDINOV I.Prediction with Confidence Based on a Random Forest Classifier[J].2010,339:37-44.