基于U-net网络的航拍绝缘子检测
2018-07-12陈景文
陈景文, 周 鑫, 张 蓉, 张 东
(陕西科技大学 电气与信息工程学院, 陕西 西安 710021)
0 引言
绝缘子作为电力线路中的重要部件,长期暴露在外受自然界外力的侵蚀,极易发生破损、掉片和老化等故障;一旦故障,将会引起整条输电线路供电中断,甚至导致大面积停电,给人民生产生活造成巨大的经济损失.为了保证整条输电线路的安全可靠运行,必须及时有效的对输电线路绝缘子进行巡检并发现排除故障[1-3].随着智能电网技术的发展,无人机巡检技术在输电线路巡检中的应用较为成熟,相比于传统人工巡检,无人机巡检可以深入到人工难以接近的高电压工作区域进行自动巡检,很大程度上减小了工作量,缩短了巡线周期、降低了误检率.与此同时航拍绝缘子的图像识别成为判断输电线路运行状态的重要依据[4-6].
对于绝缘子检测方法已有相关研究,目前常用的检测方法主要有基于骨架提取的绝缘子检测法[7];基于绝缘子串特征提取的绝缘子检测方法[8];基于阈值分割的绝缘子检测法等[9];这些方法需要人为进行特征提取,工作量大,识别率低,容易因主观性信息丢失导致绝缘子误检或漏检.难以准确识别出无人机所获得的数量庞大、背景复杂的绝缘子图像.对此学者们提出了基于深度学习的图像分割方法[10-12],例如基于卷积神经网络(CNN)的绝缘子检测方法;相比传统检测方法能够自动分层进行特征提取,综合考虑整体和局部信息,减小了工作量的同时,提高了绝缘子检测准确率.但由于CNN在对绝缘子图像进行像素分类时,每个像素点都需要取一个图像分类块,对于复杂背景的绝缘子图像,相邻两个像素点的图像的分类块相似度很高,存在非常多的冗余,容易导致网络训练慢[13];因此又提出了目前较为先进的基于全卷积网络(FCN)的图像分割方法,能在不含有全连接层的情况下能进行密集预测,可以生成任意大小的图像分割图谱,提高了处理速度.但由于FCN网络中池化层感受视野扩大,聚合语境导致目标位置等细节信息的丢失,对于复杂背景的绝缘子图像,难以准确定位,导致检测准确率的降低[14].
针对这一问题文章提出基于U-net网络的航拍绝缘子检测方法,利用叠加方法将浅层特征与高维特征相融合,其中较浅的高分辨率特征图用来解决像素定位的问题,较深的高维特征图用来解决像素分类的问题,避免了目标位置等细节信息的丢失,提高复杂背景下绝缘子图像的定位精度,可以获得更为精确的绝缘子检测效果.
1 U-net网络
U-net网络是全卷积神经网络的改进和优化,与FCN不同的是U-net模型在全连接层后添加了上采样的过程,由于FCN在经过一系列卷积池化后,所得到的高维特征图丢失了目标位置等浅层细节信息,导致定位精度降低;因此,U-net网络提出通过叠加的方法将浅层特征与深层高维特征融合后再进行上采样,得到最终的像素分类结果;其中浅层的高分辨率绝缘子图像特征图一般为目标位置、边缘等细节信息,用来解决像素目标定位的问题,深层的高维特征送入softmax分类层,用来进行最终的像素分类,避免了位置信息的丢失[15].同时在处理具有更大感受野的目标时,U-net可以根据数据集自由加深网络结构精细化分割结果,提高检测精度.
2 U-net网络结构
U-net网络结构形似“U”型,由一个收缩路径组成,将图像折叠成一组高级特征,随后是使用特征信息构建像素分割掩码的扩展路径. U-net独特的地方就是它的“复制和合并”这些连接能够将信息从早期特征图传递到构建分割掩码网络的后续部分,允许网络同时并入高级特征和像素方面的细节.详细的U-net网络架构如图1所示.
由图1可知,U-net网络结构包含一个左侧的收缩路径(a)和一个右侧的扩张路径(b).左侧的收缩路径用于捕捉内容,右侧的扩张路径用于精准定位,两个网络路径为对称关系,形成一个 U 型结构.其中,收缩路径包含两次3*3的卷积,每一个均跟着一个修正线性单元( RELU) 和一个步幅为 2 的最大池化层.
在每一步下采样中加倍了特征通道的数量.在扩张路径中的每一步都包含着一个特征谱的上采样, 一个将通道数量减半的2*2卷积,以及一个来自相应收缩路径的图谱的连接, 和两次3*3的卷积, 且每一次均跟随着一个修正线性单元RELU.为避免卷积中的边界像素的缺失,需要进行裁剪.最后一层用一个 1* 1 的卷积将每一个 64组的特征向量映射到需要的类的数量.
(a)收缩路径 (b)扩张路径图1 U-net网络结构
U-net所需训练样本较少, 速度快, 比滑动卷积网络效果更好.使用绝缘子图像和对应的分割图谱来训练网络,网络使用能量函数计算每个像素点的softmax值,softmax的定义如下:
(1)
式(1)中:ak(x)表示像素位置x处的特征通道k的激活值,k表示的是类别的数量,其他输出图像中像素x处的值,当pk(x)≈1时,ak(x)取得极大值,像素x的分类结果最好.pk(x)是近似的最大函数.
利用二进制交叉熵作为目标来训练网络模型,并使用高斯分布初始化卷积核,采用随机梯度下降法来训练损失函数,使其收敛到极小值.具体公式如下:
(2)
E=∑j∈Ωθjlog(pk(x))
(3)
式(2)~(3)中:α为学习率设为0.002,θj为每一类的权值,通过调节θj可以调节整体分类的趋向性;Ω为所有像素的和.
3 实验结果与分析
文章实验图像来源于无人机750 kV线路巡检绝缘子图像,实验环境为IW4206-2Q深度学习工作站,Ubuntu 16.04 64位操作系统,62.8 GB内存,NVIDIA GeForce GTX1080*2显卡,CPU E5-1602V4, 最终在keras深度学习框架下实现U-net网络模型的搭建.
为了说明基于U-net网络的绝缘子检测方法的有效性,本文将其与FCN绝缘子分割结果进行比较分析;并分别对简单背景和复杂背景的绝缘子图像分割结果进行比较分析,详细结果如下.
3.1 简单背景下的绝缘子图像检测结果
简单背景的绝缘子图像检测结果如图2所示.其中,图2(a)和图2(d)分别为原图和标签,图2(b)和图2(c)分别为FCN和U-net的检测结果.对于简单背景的绝缘子FCN检测方法也能达到一定检测效果,但由于池化层扩大感受野、聚合语境导致了位置信息的丢失,部分相近的背景被误检为绝缘子,如图2(b)所示的检测结果;相比于FCN检测方法,基于U-net网络的绝缘子检测方法可以有效的排除相近背景的干扰,如图2(c)检测结果所示,有效分割出绝缘子,检测结果良好.
3.2 复杂背景下的绝缘子图像分割结果
复杂背景的绝缘子检测结果如图3所示.其中,图3(a)和图3(d)分别为原图和标签,图3(b)和图3(c)分别为FCN和U-net的检测结果.对于复杂背景的绝缘子图像,FCN检测方法由于池化层感受视野的扩大,导致定位信息的丢失,容易将绝缘子周围部件部分误检为绝缘子,难以排除复杂相近的背景影响,干扰较大;并且对于遮挡物容易被误识别为绝缘子,误检率较高,如图3(b)中检测结果所示.相比于FCN检测方法,基于U-net网络的绝缘子检测方法,利用叠加方法将浅层特征与深层高维特征相融合,其中浅层的高分辨率特征图用来进行像素定位,较深层用来解决像素分类的问题,避免了位置信息的丢失;能够排除复杂背景和遮挡物的干扰,有效分割出绝缘子图像,如图3(c)中检测结果所示,检测效果良好.
图2 简单背景绝缘子检测结果
图3 复杂背景的绝缘子检测
4 验证
为了进一步说明基于U-net网络的绝缘子检测方法的有效性,本文分别选取205张背景简单和背景复杂的绝缘子图像进行测试,分别对检测结果中存在的漏检和误检现象进行统计分析.对于简单背景的绝缘子图像FCN检测法存在漏检现象12张,误检现象5张;基于U-net网络的绝缘子检测法存在漏检现象10张,误检现象4张.对于复杂背景的绝缘子FCN检测法存在漏检现象20张,误检现象 9张;基于U-net网络的绝缘子检测法存在漏检现象16 张,误检现象7张.详细漏检率、误检率和准确率如表1所示.
表1 绝缘子测试图像检测效果对比
从表1可以发现,基于深度学习U-net网络的航拍绝缘子检测方法,相比于FCN检测法,简单背景的绝缘子图像漏检率降低1.1%,误检率降低0.5%,检测准确率达到93.1%;复杂背景的绝缘子图像漏检率降低2.1%,误检率降低1%;检测准确率达到88.9%.经比较分析发现,两种背景下的绝缘子图像漏检率和误检率均有所降低;但相比于简单背景,复杂背景下的绝缘子图像漏检率和误检率降低幅度增大,为简单背景下降低幅度的两倍,检测效果明显.
5 结论
文章针对复杂背景下航拍绝缘子图像检测中存在的目标位置等细节信息丢失的问题,提出一种基于深度学习U-net网络的航拍绝缘子检测方法,自动分层进行绝缘子特征提取,通过叠加的方法将浅层特征与深层高维特征相融合,其中浅层的高分辨率特征图用来进行像素定位,深层的高维特征图进行像素分类,避免了目标位置等细节信息的丢失,提高了定位精度;对于复杂背景的绝缘子图像,能够排除背景以及遮挡物影响,较大幅度的降低漏检率和误检率,准确率达到88.9%;能够有效检测出复杂背景下的绝缘子图像,检测效果明显.