结合聚合通道和复频域特征的防震锤检测算法
2020-04-08曹成功朱劲波
张 东,邱 翔,曹成功,朱劲波
(1.国网安徽省电力有限公司铜陵供电公司,安徽 铜陵 244000;2.安徽大学 电子信息工程学院,安徽 合肥 230601)
0 引 言
在电网系统中,输电线路中的防震锤是为了减少导线因风力引起的振动,所以对防震锤进行检测非常重要。随着计算机技术的快速发展,模式识别在各个行业得到广泛应用。图像处理、模式识别等技术的应用可以代替人工对输电线路中防震锤的检测。因此,基于图像处理的检测方法逐渐被用于智能巡检中,解决复杂背景中鲁棒的检测防震锤的问题[1-2]。例如,黄宵宁等[3]采用了基于遗传算法最大熵值法对绝缘子图像进行分隔,然后采用双结构级联滤波器滤除噪声,应用连通区域方法检测绝缘子串。Yu P等[4]提出一种基于SIFT特征匹配和OTSU的变电站视频检测塔倾角检测方法。该方法简单易行,可以及时检测电力塔的倾斜度。
林强等[5]利用Haar特征结合AdaBoost分类器检测防震锤,并针对漏检防震锤情况,给出基于多视角匹配的方法对防震锤漏检情况进行补充,从而达到优化检测结果的目的。陈晓娟等[6]提出了一种基于随机Hough变换的OPGW防震锤识别,通过对采集图像进行预处理,利用随机Hough变换检测防震锤的圆形部分, 对处理后的图像施加一定的形状约束条件,从而实现对防震锤的检测。
陈文师[7]提出了一种基于计算机图片处理技术的障碍物检测识别方法。首先对采集图像进行预处理,得到图像的边缘图,由于图像的边缘点包含了原图像大部分的信息,所以利用图像的边缘信息采用直线、圆、椭圆的检测方法,提取图像中直线、圆和椭圆等几何基元。根据线路的信息,几何基元之间或几何基元和相线之间有一定的结构关系,通过检验这些结构关系的存在就能实现输电线路上防震锤等的识别。宋伟等[8]结合直方图均衡化、形态学处理和RGB彩色模型的使用,利用防震锤正常和锈蚀情况下R通道的值存在明显不同的特性,通过防震锤正常与锈蚀情况的对比进行判断,从而实现锈蚀缺陷的检测。
由于所采集到的输电线路图像视野辽阔、背景复杂,视角、目标分辨率也不尽相同,这些都给防震锤的检测带来了极大的挑战。而以往对防震锤的检测都是基于单特征的提取,为了提高复杂背景下图像中的防震锤检测精度,文中引入了多尺度聚合通道特征和多方向对偶树复小波变换的方法。利用滑窗法固定大小和步长的窗口在图像中移动,提取图像的多尺度聚合通道特征,对图像进行图像分解,提取输电线路防震锤图像的空域特征和复频域特征,并使用Relief-F算法进行特征加权融合,采用Adaboost分类器得到候选窗的窗口,最后使用非极大值抑制算法(NMS)实现对图像中防震锤的检测。
1 特征提取
1.1 聚合通道特征
聚合通道特征[9]是积分通道特征的变体,最早用于行人检测算法中,使用聚合通道中的像素作为特征。为了得到更多的防震锤特征,提取图像的10个特征通道,包括LUV颜色通道(3个)、1个梯度的幅值通道以及6个方向的梯度方向直方图通道。对10个特征通道先使用[1 2 1]/4的模板进行滤波预处理,这样有助于去除初始图像中目标之外的不必要的细小噪声;再将通道按4×4分为互不重叠的小块;利用下采样双线性插值的方法求取每个小块中像素之和的平均像素;最后再利用[1 2 1]/4的模板对采取到的特征进行平滑处理并排列得到ACF特征[10]。
文中以滑窗法为框架,建立特征通道金字塔[11],利用滑动窗口逐层扫描特征通道,提取图像的多尺度ACF特征,解决不同大小的防震锤图像检测问题,提高检测的精度。多尺度ACF特征提取过程如图1所示。
图1 ACF特征提取
1.2 复频域的纹理和形状特征
空间域上的图像信息比较复杂,直接进行特征提取会引入较多的冗余信息从而降低特征提取的效率。如果将原图像分解成不同分量的信号,在这些分量中提取信号的特征,可以避免冗余的信息[12]。对偶树复小波变换(DTCWT)[13]具有平移不变、更好的方向选择性以及有限冗余等优点,为了进一步增加DTCWT的方向选择性,将DTCWT中的滤波器组与沙漏型滤波器组结合得到多方向对偶树复小波变换(M-DTCWT)。相较于DTCWT,M-DTCWT能更加有效地表示二维图像中具有多方向性的形状和纹理等几何特性。
图2给出了M-DTCWT对原始图像的分解过程的示意图。
(1)
其中,n1,n2为图像上对应的点,j,k为伸缩和平移指数,i是方向上子带个数,re,im分别是经过分解后的实部和虚部。
设M-DTCWT分解二维图像为f(n1,n2),通过一系列的复数尺度函数和复小波函数表示为:
(2)
图2 M-DTCWT对图像的分解示意图
图像的大部分信息集中在低频,高频信息仍然保留了大量冗余信息。形状或纹理信息的细节特征都是具有渐进变化特点的,而在经典的小波变换方法中,每一个层次分解的空间只能提供水平、垂直以及倾斜等三个角度的方向信息,常常难以适应方向的连续变化。而M-DTCWT提供了8个可供选择的方向,包括2个低频子带和6个高频子带。为保证低频的信息不丢失,取两个低频子带的平均值作为低频信息,并在低频图像中提取形状和纹理特征。其中形状特征用7个Hu不变矩量表示[15],纹理特征由灰度共生矩阵(GLCM)4个方向上的相关性、能量、同质性、对比度四种特征统计量的均值得到[16]。
1.3 基于Relief-F的多特征融合
Relief-F算法是一种建立在分类标签基础上的重要的属性加权方法[17]。Relief-F算法根据各个特征和类别的相关性赋予特征不同的权重,当一个特征的权重小于某一个阈值时就可以将这个特征移除。Relief-F算法的原理是在训练集B中选择和T同类的样本中寻找最近邻样本I,在和T不同类的样本中寻找最近邻样本N。所以Relief-F算法每次从训练样本集中随机取出一个样本T,然后从和T同类的样本集中找出T的k个近邻样本,从每个T的不同类的样本集中均找出k个近邻样本,然后更新每个特征的权重。特征权重的计算如下:
(3)
其中,diff(A,R1,R2)表示样本R1和R2在特征A上的差,Mj(C)表示C类中第j个最近邻样本。
diff(A,R1,R2)可用下式表示:
(4)
2 防震锤检测
2.1 分类器训练
文中对于防震锤目标检测的分类方法是将事先准备的数据集和标注文件作为输入,标注框中的目标部分作为前景,其余部分为背景,将前背景特征和对应标签投入到Adaboost弱分类器中进行训练。Adaboost是一种迭代算法[18],该分类器就是一种基算法分类器,利用根据分类器的错误率而分配不同权值参数的同一种基分类器(弱分类器)每次迭代训练更改权重,使分类错误的权值越来越大,那么在下一轮预测时会受到关注,选择错误率更小的分类器进行分类,再反馈分类结果。这样在多次迭代之后的错误率逐渐减小趋于一个理想值,最后将这些弱分类器累加加权形成一个强分类器作为总的预测输出。这里选用2 048棵决策树作为弱分类器,利用弱分类器对训练样本进行检测,基于分类器的错误率更改分类器的权重参数,将分类错误的部分加入到原始训练集中再次训练分类器,经过多次迭代,最后将这些弱分类器累加加权形成一个强分类器作为总的预测输出。
2.2 检测算法流程
防震锤检测算法的步骤如下:
(1)用设置好宽、高和滑动步长的滑动窗口,对输入图像按照滑动窗口提取ACF特征;
(2)对原图像进行M-DTCWT分解,提取复频域形状特征和纹理特征;
(3)将提取到的ACF特征和复频域特征进行特征融合并利用Relief-F算法加权;
(4)将前、背景特征和对应标签投入到Adaboost弱分类器中进行训练;
(5)被认为含有防震锤特征的窗口标记为候选窗,并记录候选窗的窗口坐标及得分;
(6)使用非极大值抑制(NMS)算法得到最终的目标区域。
详细的防震锤检测算法流程如图3所示。
图3 检测算法流程
3 实验结果及分析
实验数据来源于无人机白天在不同场景中拍摄的输电线路图像,对其中500幅标记出防震锤部分并作为训练集,实验环境为:Window10系统,Intel(R) Core(TM) i5-6200U,4 GB内存。利用文中算法对防震锤图像的初始检测结果如图4左图所示,经NMS算法得到的最终检测结果如右图所示。从图中可以看出:在初始检测阶段,含有防震锤特征的窗口都被标记为候选窗,NMS的过程是一个迭代-遍历-消除的过程,在这些候选窗中找到分数最大的一个窗作为标准,将其余的窗与其比较,若交集大于所设定的阈值,认为这两个窗相似性很大,则删除这个框。直到把分数小的窗都删除,剩下的窗即为目标的框。
测试集为不同场景下的300幅输电线路图像,图5为文中算法对输电线路图像的防震锤检测结果。
图4 目标检测过程
图5 防震锤检测结果
为了验证文中算法的有效性,对测试图像分别提取ACF特征、Haar特征以及文中算法特征,并利用Adaboost分类器进行分类。防震锤检测的正确率表示为预测正确的样本数除以所有的样本数,即实际正样本被预测正确的概率。防震锤检测的正确率如表1所示。
文中算法使用滑窗的方法提取图像的ACF特征,在复频域中提取图像低频信息来反映图像的主要信息,以此避免其他不必要的图像信息的干扰;同时考虑到不同特征在分类中所占的权重可能对分类结果有所影响,使用Relief-F消除或减小一些特征对分类结果的影响。在Adaboost分类器下提取ACF特征的正确率为89.6%;提取Haar特征识别正确率为88.3%;而文中算法识别的正确率可达到96.1%。通过比较可以看出,进行多特征融合和对特征的提取方法的选择可以明显提高图像检测的精度。因此,验证了文中算法对防震锤图像检测的有效性。
表1 不同特征检测正确率比较 %
4 结束语
利用数字图像处理技术,实现了在输电线路中对复杂背景下的防震锤图像检测。首先利用滑窗法,引入多尺度聚合通道特征,结合M-DTCWT对图像进行高低频的分解;然后提取输电线路图像的空间域特征和复频域特征,通过Relief-F算法对提取的特征进行加权融合,采用Adaboost分类器获取含有防震锤的窗口;最后根据NMS算法得到最佳的防震锤窗口。