基于BOA-SVM的劣化绝缘子红外图谱诊断方法∗
2019-01-09裴少通刘云鹏陈同凡武建华梁利辉
裴少通,刘云鹏,陈同凡,武建华,梁利辉
(1.华北电力大学电气与电子工程学院,河北保定071003;2.国家电网河北省电力有限公司检修分公司,石家庄050000)
0 引 言
线路绝缘子作为高压输电线系统中至关重要的组成部分,承担着连接导体和电气绝缘的功能,绝缘子大多分布在野外,受到外界环境变化的一系列影响,有可能发生闪络、掉串等故障,为了保障电力系统安全可靠运行,需要安排人员定期进行绝缘子巡检工作,我国目前主流的巡检方法是通过驾驶直升机或遥控无人机,沿输电线路巡检,利用红外热像仪远距离进行电力设备的故障检测,采集海量视频和图像,对所获取的绝缘子红外图谱进行分类评估,可以大大提高电力巡检效率。
为了快速准确的诊断出劣化绝缘子,不少文献提出了将数据挖掘的方法应用到故障诊断的领域:BP神经网络[1],灰色预测[2],模糊计算,遗传算法[3],Petri网络及决策树[4],支持向量机作为一种传统的机器学习分类方法,已在人脸识别、故障诊断、图像识别等领域呈现良好的应用前景,越来越多引起人们的关注。
支持向量机在电力系统的故障诊断领域同样应用广泛,针对支持向量机的参数优化问题,文献[5-6]采取基于交叉验证的网格搜索法来确定支持向量机的最优参数,文献[7]采取布谷鸟搜索算法来确定支持向量机的最优参数,文献[8]采取免疫优化算法针对支持向量机的参数进行了有效的优化,文献[9]采取粒子群算法优化支持向量机的参数,文献[10]利用遗传算法对SVM的参数进行寻优。而贝叶斯优化算法在电气设备故障诊断这一领域应用较少,文献[11]以故障树与键合图为基础搭建贝叶斯网络模型,实现了异常行为元件的准确定位,文献[12]基于贝叶斯网络实现了分布式输电网的有效故障诊断及报警,但目前针对绝缘子故障诊断中的贝叶斯优化算法与支持向量机结合的应用尚属空白。
本文将支持向量机算法与劣化绝缘子红外图谱的分类识别相结合,实现劣化绝缘子红外图谱的算法评估诊断。具体通过提取绝缘子红外图谱中的方向梯度直方图(Histogram of Oriented Gradient, HOG)特征,利用主成分分析法(Principal Component Analysis,PCA)对所得特征进行降维处理,训练得到支持向量机分类器,利用贝叶斯优化算法(Bayesian Optimization Algorithm,BOA)对支持向量机的超参数进行优化,实验结果表明:与传统的优化算法随机搜索算法(randomsearch)和网格搜索算法(grid-search)相比,本文所提出的方法在样本集中具有较高的诊断准确率和诊断效率。
1 建立红外样本图谱数据库
1.1 红外检测基本原理及方法
绝缘子的红外检测是在其工作状态下通过红外测温仪检测绝缘子获取绝缘子的温度状态。根据绝缘子绝缘强度大小和绝缘子表面污秽度大小,绝缘子其主要导致发热原因的类型主要包括了三个方面:绝缘子沿面流过的泄漏电流致使发热;绝缘子其内部介质损耗会致使发热;劣化绝缘子内部产生贯穿性泄漏电流致使发热[13]。
通过红外成像仪得到的热分布图像可以一定程度上反映被测物体温度大小,红外图像的亮暗同时也表示着被测物体温度的高低,依根据不同的热特性[14],可以实现对绝缘子故障的红外检测,从而判断绝缘子是否存在缺陷问题[15-16]。
为了获得瓷质绝缘子的红外图谱,本文进行了如下的实验:选用三伞瓷质绝缘子XWP4-160为试验样品,本文选用的红外成像仪型号为Fluke Ti55TF,具有测量精度灵敏,感知温度差能力强的优势。以110 kV电压等级下实验接线为例,本文所用的实验器材、实验接线及实验平台搭建简图如图1所示。通过对实验对象施加一定时间的加压,待被测对象发热稳定后,利用红外热像仪对其进行多角度红外成像拍照、存储。
图1 劣化绝缘子中红外故障检测示意图Fig.1 Schematic diagram of infrared fault detection in deteriorated insulators
1.2 建立绝缘子红外图像样本数据库
在红外检测阶段,获得了718张绝缘子串红外图像。经过红外图片截取后,得到474张劣化单片绝缘子图片(负样本)和1 236个正常单片绝缘子图片(正样本)作为待处理图像。由于正负样本不均衡(比例3:1),容易对比例大的样本造成过拟合,预测偏向样本数较多的分类,大大降低模型的泛化能力,这里通过随机旋转负样本图像一定角度产生新的样本,使得正负样本的比例在1:1左右,从而解决数据不平衡问题,旋转产生的新样本如图2所示。
图2 数据增强产生的新样本Fig.2 New sample generated by data enhancement
在2 679张正负样本图像中,一般将训练集和测试集划为7:3左右,随机选取1 874幅图像作为训练集,选取805张图像作为测试集。训练集、测试集具体划分如表1所示。
表1 数据集分配表Tab.1 Allocation table of data set
2 贝叶斯优化支持向量机模型
如图3所示为贝叶斯优化支持向量机模型的结构框图,首先对红外样本图谱数据库中的全部样本图像进行预处理,使图像缩放到同一尺寸,以一定比例随机选取训练集与测试集,对训练集提取方向梯度直方图特征并进行PCA降维,送入支持向量机模型并进行贝叶斯寻优,得到优化后的支持向量机模型,依据测试集降维后的方向梯度直方图特征进行故障诊断。
图3 贝叶斯优化支持向量机模型结构框图Fig.3 Bayesian optimization support vector machine model
2.1 支持向量机分类模型
支持向量机(Support Vector Machine,SVM)方法的提出,最早由Corinna Cortes与Vapnik等在1995年提出,其主要思想主要为从原空间Rn通过变换Φ转换到高维的特征空间H,最终实现在高维空间H中寻找最优超平面进行分类,原理如图4所示。
针对数据集xi∈Rn,yi∈{-1,1},i=1 , …,l,以及核函数K(xi,xj)。K与高维特征空间Z的内积相对应, 即(φ(xi),φ(xj))=K(xi,xj), 变换φ(x)=Z将样本从输入空间x映射至高维特征空间Z,类似于逻辑回归,该模型基于线性函数ωTx+b,即在Z中寻找最优超平面(ω,φ(x))-b=0,其中ω为超平面法向量,决定了超平面的方向,b为位移项,决定了超平面和原点间的距离,显然划分超平面可以被法向量ω和位移b确定,样本集线性可分时,使分类间隔最大的问题即转化为求解支持向量机的基本型问题,式(1)为求解过程。
图4 最优分类超平面Fig.4 Hyperplane of optimal classification
其中约束条件yi((ω,(xi))-b) ≥1,i=1,2, …对于线性不可分的样本集,如公式(2)求解。
约束条件yi((ω,φ(xi))-b) ≥ 1-ξi,ξi≥ 0,i=1,2,…,其中,ξi是松驰变量,C为正则化参数。
通过对以上问题的求解,可以得到SVM回归表达式和二分类器如公式(3)所示。
其中aj为拉格朗日乘积因子。
2.2 主成分分析
主成分分析(Principal Component Analysis,PCA),是一种统计方法,其思路是通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的该组变量称为主成分。主成分分析法作为一种线性降维方法,能够将图像中存在的冗余特征信息进行清除,精简并保留图像特征中有效特征信息,降低计算复杂度,从而提升图像识别效率,降维效果的评估可以通过对比降维前后学习分类器的综合性能,如果其综合性能得到提高则认为降维起到了作用,通过可视化技术可以直观的判定降维效果,前提是降低维数为至二维或三维。PCA算法描述如图5所示。
图5 PCA算法流程Fig.5 Flow chart of PCA algorithm
2.3 贝叶斯优化算法
贝叶斯优化算法(BOA),于2000年左右由UIUC的Pelikan等提出。贝叶斯优化算法的思路主要是根据先验知识对每一次新的采样点来测试并更新先验分布,最终找出全局最优值。贝叶斯优化算法的优化流程如图6所示。
图6 贝叶斯优化算法流程Fig.6 Bayesian optimization algorithm
3 实验结果与分析
本文主要研究贝叶斯优化算法、随机搜索算法(random-search)和网格搜索算法(grid-search)这三种超参数寻优算法的寻优性能,将优化后得到的二进制支持向量机用于红外样本图谱数据库的分类。根据支持向量机训练分类结果,从寻优时间、寻参效率、训练准确率三个层面分析了三种算法在优化支持向量机参数的优缺点如表2所示,贝叶斯优化算法在略微牺牲寻优时间和寻参效率的情况下,可以实现94.041%的较高检测准确率。
表2 参数寻优方法对比Tab.2 Comparison of parameter optimization methods
对比三种优化算法可知,网格搜索速度最慢且训练成本较高,但在搜索整个搜索空间方面效果很好,而针对随机搜索来说,由于不能利用先验知识来选择下一组超参数,可能会错过搜索空间中的重要点,这一缺点在训练成本较高的模型中尤为突出。在测试一组新的支持向量机超参数时,网格搜索和随机搜索不会对先验分布加以利用,而是选择忽略前一组支持向量机超参数的信息。而贝叶斯优化算法可以根据先验知识,设立一个搜索函数,每当给出一组新的支持向量机超参数时,用于更新目标函数的先验分布,算法测试由后验分布给出的最小估计目标点。因此贝叶斯优化相比于随机搜索算法和网格搜索算法能够利用先验知识高效地调节支持向量机超参数,找到使结果向全局最大值提升的参数。图7为贝叶斯寻优算法参数寻优过程可视化过程。
图7 贝叶斯寻优算法参数寻优过程Fig.7 Optimizing process of Bayesian optimization algorithm
本文采取了随机搜索、网络搜索、贝叶斯优化这三种优化算法针对支持向量机的惩罚参数和高斯核函数的参数进行优化。优化算法的相关寻优过程对比效果如图8所示。
图8 支持向量机参数寻优图Fig.8 Optimizing figure of SVM parameter
在图 8(a)~图 8(c)分别代表 GS、RS、贝叶斯算法的寻优过程,贝叶斯算法的拟合度比GS、RS算法的拟合度要好,并且贝叶斯算法收敛速度相当快,相对于GS、RS有明显优势。
4 结束语
本文基于二进制支持向量机建立了绝缘子红外图谱故障诊断模型,引进了贝叶斯优化算法对支持向量机算法参数进行寻优。与传统的网格搜索法、随机搜索法相比,贝叶斯优化算法可利用先验知识更快的收敛到全局最优值,针对支持向量机的惩罚参数和高斯核函数的参数优化更有效。
实例表明,贝叶斯优化算法在收敛速度和准确度具有明显的优势。通过使用红外成像仪Fluke Ti55TF对被测绝缘子进行拍照,并采用本文提出的算法模型对绝缘子进行评估诊断,可以更好的检测绝缘子的运行状态。通过进行红外检测试验现场采集劣化绝缘子与正常绝缘子的红外图谱,再提取绝缘子红外图谱中的方向梯度直方图特征,利用主成分分析法对所得特征进行降维处理,训练得到支持向量机分类器,利用贝叶斯优化算法对支持向量机的超参数进行优化,所得到的模型可实现有效地对劣化绝缘子进行故障诊断,具有工程实际意义。