APP下载

基于HHOOGG特征和SSVVMM的绝缘子识别与定位

2015-03-11

交通运输工程与信息学报 2015年4期
关键词:识别率直方图绝缘子

李 岩

青藏铁路公司,西宁供电段,西宁 810006

0 引 言

绝缘子是接触网支持及悬挂装置的关键部件之一,起着悬挂装置中带电部分与绝缘部分的电气隔离及对悬挂装置的支撑作用。由于工作时间长,工作环境恶劣,绝缘子易出现由雷电、污秽等引起的闪络放电而导致的破损及夹杂异物等不良状态。当瓷瓶出现破损或受到一定程度的污染时,其绝缘性能可能降低,严重时甚至会发生闪络,造成跳闸事故,严重影响行车运营安全。

随着高速数字图像采样技术和数字图像处理技术的发展,具有对行车影响小且能实现实时检测的图像处理、智能识别技术开始应用在铁路系统中。该类方法已能实现接触网几何参数的检测[1]、接触线定位器定位坡度检测[2]、受电弓磨耗检测[3]、受电弓裂纹检测[4]、受电弓定位等[5]。在绝缘子检测方面,杨红梅等提出基于仿射不变矩的绝缘子片间夹杂异物检测方法[6],韩志伟等利用二代曲波系数形态学条带能量法检测绝缘子故障[7]。然而,上述方法在复杂背景和日间工况下对绝缘子的识别与定位仍有局限性。

本文针对复杂的接触网图片背景下绝缘子瓷瓶识别、定位的困难,采用近年来在目标检测研究[8,9]中应用较广的梯度方向直方图(histograms of oriented gradient,HOG)[10]提取绝缘子特征,较大程度上消除了光照变化和绝缘子角度变化对于识别效果的影响,使用支持向量机(support vector machine,SVM)作为机器学习工具,得到了较好的识别及定位效果。

1 梯度方向直方图描述(HOG)

HOG(Histograms of Oriented Gradients)最早由Dalal于2005年提出[10],并被用于行人检测中,且取得了很好的效果。它依据图像中局部目标的表象和形状能够被梯度或边缘的方向密度分布很好的描述的原理,通过统计图像局部区域的梯度方向信息作为该局部图像区域的表征。与很多的图像几何特征不同,HOG不从图像的整体上考察特征,而是将图像细分为多个小的细胞单元(cell),然后采集细胞单元中各像素点的梯度或边缘的方向直方图,因此对图像几何的和光学的形变都能保持很好的不变性。

2 绝缘子的HOG特征

2.1 绝缘子的特征

在基于计算机视觉的绝缘子识别方法中,绝缘子特征是指包含了绝缘子图像的特征。一般图像特征分为几何特征、灰度统计特征、变换系数与代数特征四类。几何特征由于其稳定系数较高,因而应用范围较广。

在几何特征中,存在较多的特征方法能够适应目标小范围的旋转和平移,称为图像的几何不变距,如Hu不变矩、归一化转动惯量等。而对于光照变化的适应,目前的方法一般需要在前期处理过程中将光照因素过滤掉(如通过色彩空间变换),通过实验得到的阈值提取出绝缘子区域并转化为二值图,再进行特征提取,其过程较为复杂,且在复杂背景下适用度不高。

而 HOG,既拥有几何不变矩的特性,又能够直接适应光照的变化,适合应用于复杂背景下的绝缘子识别。它既能够对单通道图像进行特征提取,也能够对多通道图像中的各通道分别进行特征提取,较为灵活。

2.2 HOG特征提取

绝缘子HOG特征提取流程如下:

Step l 标准化Γ空间。为了减少光照因素的影响,需要将整个图像进行规范化,这种处理能够有效地降低图像局部的阴影和光照变化。Γ压缩公式如下:

本文取Γ=1/2。

Step 2 计算梯度值。使用一维离散微分模板同时在水平和垂直两个方向上计算每个像素的梯度。该操作不仅能够捕获轮廓和一些纹理信息,还能进一步弱化光照的影响。

本文算法采用中心对称梯度算子[-1,0,1]进行卷积计算,分别算出x方向梯度Gx与y方向梯度Gy。然后利用公式(2)、(3)分别计算梯度大小和向量:

Step 3 为细胞构建梯度方向直方图。将整个图像窗口分割为多个8×8的细胞,每4个细胞组成一个块(见图 1),细胞中的每个像素点为直方图通道进行加权投票,其权值根据像素点的梯度幅值进行高斯加权计算而来。

图1 块与细胞结构图解Fig.1 The structure chart of block and cell

Step 4 在块中进行梯度归一化。在文献[10]中,Dalal分别使用了 L1、L2、L2-Hys三种方法进行了归一化操作,通过对比论证L2-Hys在复杂背景下块归一化效果明显优于L1、L2。因此本文选用L2-Hys方法进行归一化处理,即先用特征向量的L2范数归一化,然后把归一化后的结果限幅到0.2,重新用L2范数归一化:

式中:x为标准化前的特征向量;e为一个很小的标准化量以防止除数为0。

归一化进一步对光照、阴影和边缘进行压缩。由于每个单元格由多个不同的块共享,一个单元格的特征会以不同的结果多次出现在最后的向量中,我们将归一化之后的块描述符称为HOG描述符。

Step 5 获得区域特征向量。图像的梯度方向向量数由图像大小、细胞大小、每个细胞所取梯度维数等因素所决定。其计算方法为:

式中,Dc表示细胞维数;Sb表示块大小;Sc表示细胞大小;lb表示块移动步长;w与h分别表示图像的宽与高。

本文中进行HOG特征提取时,参数设置如下:输入图像大小为64×128,细胞大小为8×8,块大小为16×16,块的步进为8个像素,梯度方向将360°分为9个区间。

将一个块中 4个细胞的梯度直方图数据串联起来,再将所有块的特征向量组合,由计算可得输出 9×4×105=3780维向量,即该区域的 HOG特征向量。

3 实验与分析

本文提出的绝缘子识别与定位方法选取了武广高铁、石武高铁、京哈线、京九线、京广线等7条客专、普速线路中的15个区段不同时段、不同天气下拍摄的不同型号绝缘子作为训练集与测试集样本。其中,训练样本每区段采用10~15张(不同时段、不同天气情况)含有绝缘子的图片并将绝缘子提取出来作为正样本,选取20~30张不含绝缘子的图片作为负样本。测试集则由各区段中不同于训练样本的具有不同特点的图片构成。

在机器学习方面,本文采用支持向量机(Support Vector Machine,SVM)作为识别工具,它是一种由统计学发展而来的机器学习方法。其主要思想为从原空间Rn通过变换Φ转换到高维的特征空间H,在高维空间H中寻找最优超平面进行分类。因此它能很好地解决非线性、小样本、高维数等模式识别领域挑战性问题[11]。在训练分类器之前,需要制作训练集中的正样本并进行裁剪缩放等预处理。该预处理是计算HOG特征的需要,裁剪的窗口根据样本图像中绝缘子的大小设定。由于图像中绝缘子多以矩形形式存在,为了能更好地保留绝缘子整体的HOG特征,裁剪后的图像统一缩放至检测窗口(64×128)大小,图2给出了几组正样本制作示例。

图2 正样本制作Fig.2 Positive sample making

为验证算法的有效性以及各种参数配置对识别结果的影响,本文针对SVM核函数参数、误差惩罚因子C以及HOG检测窗口增长系数、块移动步长展开研究。

3.1 SVM参数最优化选择

Vapnik等人的研究表明,不同核参数对于一般分类都能达到很好的效果,核函数和误差惩罚因子C才是影响SVM性能的关键因素[12]。本文选取较常用的径向基(RBF)函数作为SVM核函数展开研究。RBF函数如下:

式中,γ为RBF核函数的参数。

本文选取了 315个正样本和 708个负样本进行HOG特征学习,选取了样本集外的500张图片作为测试集。在确定最优SVM参数时,首先采用网格搜索法取值,然后对该组参数进行K交叉验证,计算精确值(交叉验证的准确率等于能够被正确分类的数量百分比),寻求最优参数。由于训练集内样本并非取自公开的标准样本集,且识别问题的准确性不同于简单分类,而是以人的意识判断为基准,因而采用该方法时,并没有达到理想的效果。所以,本文在不同样本容量下用网格搜索法+K交叉验证进行参数粗选获得γ推荐值为0.03后确定误差惩罚因子C(见表1),然后结合经验选择法确定(C,γ)参数组合(见表2),并得到其变化趋势。

图3 不同背景下的识别效果Fig.3 The recognition effect under different backgrounds

表1、2中“误识别”指错将不是绝缘子的物体识别定位,“漏识别”指没有识别出图中绝缘子,“简单背景”表示除绝缘子外背景单一(见图3(a)),“复杂背景”表示除绝缘子外背景杂乱(见图3(b)),“综合背景”包含简单、复杂背景及缺失绝缘子的图片,最符合现场工况。表中误识别率、漏识别率、识别率分别由误识别图片数、漏识别图片数、识别图片数分别除以简单背景、复杂背景、综合背景图片总数求得。值得提出的是,由于在漏识别的情况下依然可能出现误识别,所以识别率并不等于 100%与误识别、漏识别率的差值。图 4为γ=0.03时误识别率和漏识别率随C的变化趋势。

表1γ=0.03时改变误差惩罚因子C在不同背景下的识别结果

Tab.1 Recognition results in different backgrounds with the change of parameterCwhenγ=0.03

简单背景 复杂背景 综合背景C 支持向量 误识别率/(%)漏识别率/(%)识别率/(%)误识别率/(%)漏识别率/(%)识别率/(%)误识别率/(%)漏识别率/(%)识别率/(%)0.1 564 3.09 12.37 82.68 7.96 12.39 78.76 5.93 9.51 83.85 0.3 444 8.25 3.09 89.69 23.89 1.77 78.76 15.74 2.09 84.90 0.5 426 10.31 1.03 90.52 31.86 0.00 74.51 20.76 0.57 82.71 0.7 418 10.31 1.03 90.52 37.17 0.00 70.27 22.36 0.57 81.43 1 419 10.31 0.00 91.75 40.71 0.00 67.43 23.27 0.00 81.38 2.5 418 11.34 0.00 90.93 40.71 0.00 67.43 23.95 0.00 80.84

表2 C=0.5时改变核参数γ在不同背景下的识别结果Tab.2 Recognition results in different backgrounds with the change of parameter γ when C=0.5

图4 γ=0.03时误识别率和漏识别率随C的变化趋势Fig.4 The fault and omit recognition rate change trendence with parameter C when γ=0.03

从表1和图4实验结果可以得知,当固定网格搜索法+K交叉验证推荐的γ值时,随C的变化误识别率与漏识别率成反比趋势:C较小时,漏识别率比较高;当C增加时急剧降低,即性能得到迅速的提高;当增加到一定值时,漏识别率基本不再变化,即此时C变化几乎不影响SVM的泛化能力。但由于泛化能力的迅速提高,误识别率也在增大。由于误识别可以通过添加规则排除,实际情况中更不希望漏识别的出现,在对比三种背景数据后,选取0.5作为误差惩罚因子C的最优参数。

从表2和图5中可以看出在固定误差惩罚因子C时,随γ的增加,三种背景下的识别率逐渐增长到峰值后回落,峰值时 γ=0.07,也就是说此时可以得到SVM 的最优值。我们通过参数(C,γ)的变化,选取最优参数组合来得到最终SVM的最优值,即此时具有最佳识别率。

3.2 样本比例的影响

图5 C=0.5时三种背景识别率随γ变化趋势Fig.5 Recognition rate change trendence with parameter γin different backgrounds when C=0.5

本文实验所有数据来自于自采集,用Visual Studio 2008+OpenCV 2.4.3编程实现,在进行HOG特征采集时,默认遍历整张正样本图片,但对负样本只随机抽取10个块做特征计算,因此输入正负样本比例并不平衡。本文通过改变样本容量及样本比例研究其对识别率的影响,实验结果及分析如表 3所示。

表3 正负样本比例改变时不同背景下的识别结果Tab.3 Recognition results in different backgrounds with the change of sample proportions

表 3是在正样本数 300张,(C,γ)参数组合为(0.5,0.07)下得出的实验数据,综合图 6、7可知,正负样本比例在1:2~1:2.5间有最好识别效果。在增加正样本数时,最优样本比例会有所下降,但仍大于1。当样本容量足够大时,将无限逼近于1。

图6 不同样本比例下误识别率与漏识别率变化趋势Fig.6 The fault and omit recognition rate change trendence with different sample proportions

图7 不同样本比例在不同景背下识别率变化趋势Fig.7 Recognition rate change trendence in different backgrounds with different sample proportions

3.3 识别率与识别速度的优化

在尽可能降低漏识别率时,误识别率也在增加,为了使误识别率降低以提高识别效果,可以对 HOG检测参数中的检测窗口增长比例Ss进行优化,该参数的优化能同时提高识别速度。

从表4和图8可以看出,Ss的增大会使误识别率降低而提高漏识别率,当Ss在1.03~1.09间变化时,误识别率降低较漏识别率提高明显,当Ss继续增大时,误识别率与漏识别率趋于稳定。

图8 不同Ss误识别率和漏识别率变化趋势Fig.8 The fault and omit recognition rate change trendence with different Ss

表4 Ss对识别率与识别速度的影响Tab.4 The influence of Ss on recognition rate and speed

图9显示,随着Ss增大,识别率有小幅提升,而识别用时大幅下降,当Ss大于1.5时,识别率与识别用时趋于稳定。本文实验所用的机器配置为CPU Core2 T6600 2.20GHz,内存4GB,处理图像大小为2448×2050像素,综合考虑识别率与识别时间关系,本文选取2.5为Ss最优值。此时识别率为90.21%,识别平均用时为72.1ms,基本达到实时要求,可以为后期绝缘子故障检测提供足够时间。

图9 不同Ss识别用时与识别率变化趋势Fig.9 The recognition rate and speed trendence with different Ss

4 结束语

本文针对复杂的接触网图片背景下绝缘子识别、定位的困难,通过借鉴目前广泛应用于行人检测研究中的HOG特征,提出了一种新的绝缘子识别方法。通过对不同背景环境下绝缘子识别效果的分析,针对复杂的现场综合环境优化了 HOG算子及SVM参数,在样本量较小的情况下达到了较好的识别效果,并在一定程度上优化了识别速度。由于样本容量与误识别排除算法的限制,该方法仍有很大的提升空间。

[1] 牛大鹏. 非接触式接触网几何参数检测系统研究[D]. 成都:西南交通大学,2008.

[2] 范虎伟,卞春华,朱挺,马千里. 非接触式接触网定位器坡度自动检测技术[J]. 计算机应用,2010(2):102-103+128.

[3] YANG Kai,WANG Li,GAO Xiao-rong,et al.Applica-tion of CCD Measurement Technique for Wear on Panto-graph Sliding Plates[C].4thInternational Symposium on Advanced Optical Manufacturing and Testing Technolo-gies:Optical Test and Measurement Technology and E-quipment.2009

[4] 韩志伟,刘志刚,陈坤峰等. 基于二代曲波系数定向映射的受电弓滑板裂纹检测技术[J]. 铁道学报,2011,33(11):63-69.

[5] 马莉,王泽勇,高晓蓉,等. 图像处理技术在受电弓滑板检测中的应用[J]. 机车电传动,2009,32(05):47-48,52.

[6] 杨红梅,刘志刚,韩志伟,韩烨. 基于仿射不变矩的电气化铁路绝缘子片间夹杂异物检测[J]. 铁道学报,2013,35(4):30-36.

[7] 韩志伟,刘志刚,杨红梅,韩烨. 基于二代曲波系数形态学条带能量法的绝缘子故障检测[J]. 铁道学报,2013,35(3):36-40.

[8] 曾春,李晓华,周激流. 基于感兴趣区梯度方向直方图的行人检测[J]. 计算机工程,2009,35(24):182-184.

[9] 常向魁,叶齐祥,刘先省,焦建彬,韩振军. 基于综合色度和梯度方向直方图的运动目标跟踪算法[J]. 河南大学学报(自然科学版),2007(6):629-634.

[10] Dalal N,Triggs B. Histograms of oriented gradients for human detection[C].Computer Vision and Pattern Recognition, CVPR, IEEE Computer Society Conference on. 2005

[11] 张学工. 关于统计学习理论与支持向量机[J]. 自动化学报,2000,01:36-46.

[12] 邓乃扬,田英杰. 数据挖掘中的新方法:支持向量机[M]. 北京:科学出版社,2004

猜你喜欢

识别率直方图绝缘子
符合差分隐私的流数据统计直方图发布
基于类图像处理与向量化的大数据脚本攻击智能检测
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
用直方图控制画面影调
提升高速公路MTC二次抓拍车牌识别率方案研究
中考频数分布直方图题型展示
高速公路机电日常维护中车牌识别率分析系统的应用
基于空间变换和直方图均衡的彩色图像增强方法
1000kV耐张绝缘子串单片绝缘子的带电更换技术
500kV绝缘子串含零值绝缘子时的电晕放电分析