基于卷积神经网络与ECOC-SVM的输电线路异物检测
2022-04-12余沿臻邱志斌周银彪
余沿臻,邱志斌,周银彪,朱 轩,王 青
(1.南昌大学能源与电气工程系,江西南昌 330031;2.国网江西省电力有限公司,江西南昌 330000)
0 引言
输电线路分布跨度大,输电通道气象和地理环境非常复杂,部分线路邻近城市、建筑施工等地区,鸟巢、风筝等异物悬挂于线路上会缩短放电距离而引发输电故障[1-2]。由于地理环境、气象、维护难度大等原因,人工巡检已经很难满足输电线路运行状态安全监测的需求,所以国内输电线路巡检方法大量采用无人机[3]、机器人[4-5]等设备代替人工采集线路巡检图像,再结合图像处理、计算机分析算法[6]等技术,实现图像的分类识别[7]、缺陷检测[8]、目标测距等[9],为线路运行状态监测提供智能检测技术。
在输电线路异物检测领域中,图像识别的应用可概括为传统特征提取与深度学习两种。传统特征提取方法如提取局部轮廓形状特征[10]、ORB 特征[11-12]和采用Hough 变换[13]等一般需要经过图像收集、预处理、特征提取、特征匹配来实现目标识别,过程繁杂且通用性较差[14]。随着深度学习在输电线路异物检测中的应用不断增多,能实现避免人工操作且同时拥有较高的检测精度。近年来的主流检测方法如Faster R-CNN[15]、TensorFlow[16]、Mask R-CNN[17]等算法利用卷积神经网络生成用于分类和回归的候选框或通过选择性搜索进行异物检测;YOLOv3[18-19]、YOLOv4[20]和SSD[21]等在异物图像上进行密集抽样并且通过卷积神经网络提取不同尺度特征用于分类和回归以实现异物检测。基于深度学习的检测方法能够得到较高的识别精度,但需要大量的训练数据,且对设备计算性能要求较高,存在训练时间长、检测速度慢等问题。
针对以上研究现状,本文提出一种基于卷积神经网络与纠错输出编码-支持向量机(Error Correcting Output Codes-Support Vector Machine,ECOC-SVM)的输电线路异物检测方法。构建了鸟巢、风筝、塑料、气球4 类异物图像数据集,并利用Otsu 自适应阈值分割算法提取感兴趣目标区域,再通过DenseNet201 提取目标区域的深度特征,最后通过ECOC-SVM 对特征数据进行训练与测试,并分析不同网络及特征深度对结果的影响。测试结果表明,本文所提方法能够准确地识别出输电线路上缠绕的异物,可辅助巡检人员开展线路除障工作。
1 异物图像目标区域提取
由于无人机航拍或者视频录像获取的异物图像中背景复杂多样,在一定程度上影响了图像特征的提取。为了提高特征提取的有效性与代表性,本文通过采用Otsu 自适应阈值分割算法[22]、形态学处理等方法实现感兴趣目标区域的提取,从而去除异物图像中大部分复杂背景,保留异物目标所在区域,以提高算法识别的精度。其具体实现步骤如下:
1)将输入异物彩色图像灰度化,将其灰度等级别分为N个,即(0,1,…,N-1),Gi表示灰度等级为i的像素点个数,则图像中所有灰度等级之和Gsum=G0+G1+…+GN-1。
2)设置初始阈值T,将[0,T]灰度等级区间内像素判定为目标,将[T+1,N-1]灰度等级区间内像素判定为背景。
3)按照式(1)计算目标与背景的类间方差g,并通过改变T的取值使得类间方差最大化,即为Otsu自适应阈值分割的最佳阈值T。即:
式中:μ0与μ1分别为目标类与背景类的平均灰度;w0与w1分别为目标类与背景类像素占整张图像的比例,其值可按照式(2)计算获得。即:
4)利用形态学开操作对分割二值图像进行处理,方法是先腐蚀图像消除噪点,再进行膨胀操作获取连通区域,并将不同区域进行着色。
5)基于最大连通区域,求取其质心与外接矩形,从而标记出感兴趣区域,最后进行裁剪提取。
以1 张输电线路鸟巢异物图像为例,展示出基于Otsu 自适应阈值分割算法的目标区域提取流程及其效果,如图1 所示。
图1 目标区域提取流程Fig.1 Extraction process of target region
2 输电线路异物检测算法
为了避免人工提取特征与复杂处理的流程,采用卷积神经网络提取异物图像的深度特征能够更加便捷且有效,实现更高的检测精度。因此本文采用基于DenseNet201 卷积神经网络与ECOC-SVM分类器进行输电线路异物的检测与识别,总体实现流程如图2 所示,下面对其算法结构进行详细介绍。
图2 输电线路异物检测流程Fig.2 Process of foreign body detection for transmission line
2.1 DenseNet特征提取网络
DenseNet(Densely Convolutional Networks)[23]于2017 年黄高等人提出的经典卷积神经网络。为解决网络结构复杂易引发的过拟合与梯度消失的问题,DenseNet 提出稠密连接的方式进行结构的设计,其核心就是通过深浅层的特征融合使得网络获得较强的抗过拟合能力,并应用跨连接的方法缓解网络层数加深而导致的梯度消失问题。
DenseNet 网络结构主要由多个密集块(Dense Block)和过渡层(Transition Layer)组成。Dense Block 模块结构如图3 所示,每一层的输出特征都融合前向所有层的非线性化输出,例如在第l 层输出的特征由前向所有层输出特征连接后,再利用式(3)非线性函数进行处理后即为第l 层输出的特征。f(x)包括批量归一化BN 层、ReLU 激活函数以及卷积Conv。
图3 Dense Block模块结构Fig.3 Structure of Dense Block module
式中:xl为第l层的输出特征;Hl(…)为在l层前的非线性变化函数,其中包括卷积Conv、批量归一化BN 层以及ReLU 激活函数;[x0,x1,x2,…,xl-1]为第l层前所有层的输出特征。
在每个Dense Block 的衔接处采用Transition Layer 进行下采样,其中包括BN 层、ReLU 激活函数、1×1 卷积层与2×2 池化层,从而避免特征融合过程中造成的特征通道维度过大问题,间接提高特征传输的效率。
目前DenseNet 网络发展出众多版本,其中包括DenseNet121,DenseNet169 以及DenseNet201 3 种。本文采用结构最深的DenseNet201 作为特征提取网络,以实现更加精确的异物检测。其结构如表1 所示,包含了4 个密集块与3 个过渡层;首先对输入图像(224×224)进行7×7 卷积与3×3 的最大值池化,初步降低图像的维度,然后通过多个密集块与过渡层提取图像的深度特征;最后提取出全局平均池化(Global Average Pool)层特征输入至ECOCSVM 模型,进行训练与测试。表中fully-connected为全连接,softmax 为分类器名称。
表1 DenseNet201网络结构Table 1 DenseNet201 network structure
2.2 ECOC-SVM异物分类器
ECOC-SVM 模型[24]就是通过纠错输出编码(Error Correcting Output Codes,ECOC)方式与支持向量机(Support Vector Machine,SVM)[25]的融合,实现在小样本异物图像数据下的多分类识别并纠正模型在传输过程中的错误。其分类思想是利用二进制编码方式将n分类转变为n(n-1)/2 个二分类问题进行求解。其模型主要包括编码、训练、解码3个步骤,如图4 所示。
图4 ECOC-SVM模型结构Fig.4 Structure of ECOC-SVM model
ECOC 常用的编码形式有一对多(One Versus All,OVA)、一对一(One Versus One,OVO)等编码矩阵构造方法,针对本文鸟巢、风筝、气球、塑料4 类输电线路异物,采用OVO 编码方案结合SVM 分类器来建立多分类ECOC-SVM 模型,其编码矩阵如表2 所示;表中Ci表示第i个SVM 分类器,+1 与-1 分别代表正样本与负样本,而0 则表示分类器忽略该类别,每一行编码值则代表每一类。
表2 ECOC异物编码矩阵Table 2 ECOC foreign body coding matrix
在模型预测时,分类器C1—C6对输入的测试样本进行决策,并通过Hamming(汉明)距离解码式(4)对决策编码进行解码,取其中最小距离值作为最终的判定结果,从而预测出图像中的异物类别。即:
式中:dij为解码后的距离;rkj,rjk分别为第i行与第j行的第k列二进制编码值;m为总列数(即总的分类器数)。
若min(dij)越大,则表示编码矩阵的纠错能力越强;且模型至少能够对[min(dij)-1]/2 列编码值进行纠错。
3 算例结果及分析
3.1 数据准备
本文通过电力巡检图像与网络公开图像构建出鸟巢、风筝、气球、塑料4 种输电线路异物图像数据集。为验证目标区域提取并克服样本数过小的问题,本文准备了A,B,C 3 类样本,其中样本A 为原始异物图像,样本B 为样本A 提取出的异物目标区域图像,而样本C 则是在样本B 的基础上增加了人工合成异物图像,通过Photoshop 将异物目标与输电线路融合,并在每一类异物中加入了原始图像数的近50%,具体见表3 所示。
表3 异物图像样本分布Table 3 Sample distribution of foreign body image
在算例实现中,将准备的3 类异物图像样本按照8:2 的比例将样本随机划分为训练样本和测试样本两个部分,再将划分后的样本转化为224×224×3的RGB 图像输入至DenseNet201 中进行特征提取,并提取出最深层的特征作为ECOC-SVM 的训练与测试数据,并对比分析了3 种样本情况下的检测效果、不同网络层提取特征的影响以及不同网络模型作为特征提取器的影响。训练后的ECOC-SVM 网络对测试样本进行预测,并将对应异物种类的标注在异物图像上方。
3.2 样本类型分析
为验证经过目标区域提取预处理的图像及加入人工合成异物图像样本对于分类器识别准确度的效果,利用DenseNet201 与ECOC-SVM 对3 类样本进行训练与测试,计算测试样本识别准确率。在测试中发现,随机样本分配偶尔出现测试样本识别准确率忽高忽低的异常值情况,为避免该问题,本文对每类样本进行5 次反复测试,并以5 次测试准确率的平均值为评价标准。其中,准确率的计算公式如式(5)所示,从而较为全面地进行对比与分析,不同样本类型下的识别结果如表4 所示。
表4 不同样本类型、不同组别的识别准确率Table 4 Recognition accuracy of different sample types and proups %
式中:TP+TN为模型预测正确的正样本与负样本的个数;TP+FP+FN+TN为总样本数。
通过表4 结果的对比分析可知,样本B 的每组测试准确率较样本A 都有提升,且样本B 的平均准确率相对于样本A 提高了3.16%,验证出经过目标区域提取后的异物图像能够较大程度地降低背景因素的影响,有效提高ECOC-SVM 对异物种类的识别准确度;同时加入50%人工合成异物图像的样本C 较样本B 的平均准确率提高了4.11%,验证出加入人工合成异物图像能进一步提高ECOC-SVM 的拟合效果,并且提高分类器的鲁棒性。
3.3 特征提取层
为分析网络模型中特征提取的位置对测试识别准确率的影响,本文根据DenseNet201 的网络结构,选取的每一个密集块与过渡层提取之后的特征,共4 组特征数据;同时根据网络深度由浅到深选取6 组特征数据,总计10 组特征数据.本文仿真不同的样本类型下的ECOC-SVM 模型测试效果,如图5 所示。
图5 不同特征提取层的识别效果Fig.5 Recognition results of different feature extraction layers
根据图4 结果可知,随着网络层数的加深,对于异物图像识别的准确率大体上呈现上升的趋势,且样本C 较其他样本类型提高更快.同时可以发现,在3 种样本类型下,以较浅层所提取的特征数据作为训练样本时,ECOC-SVM 模型的识别准确率都相对较低,而以较深层的特征数据作为训练样本时,模型的识别准确率相对较高。其原因可能是深层的特征经过更多的卷积、池化、激活函数等操作,可以实现更为复杂的非线性拟合,学习效果更好。
3.4 特征提取网络
为了验证本文采用的DenseNet201 网络模型相对于其他模型的学习性能,同时选取ResNet-50、GoogleNet、AlexNet 3 种卷积神经网络作为特征提取网络进行测试,皆采用样本C 作为数据输入,按照8:2 的比例划分训练集与测试集,同样取每一种网络重复5 次测试准确率的平均值为评价标准,表5为不同网络作为特征提取器的识别准确率。
表5 各类网络结构、不同组别识别准确度对比Table 5 Comparison of recognition accuracy between different network structures and proups %
根据表5 结果可知,本文采用的DenseNet201在特征提取能力中表现更优,其原因在于DenseNet具有更强的梯度流动、参数量少、减轻梯度消失、特征融合等特点,使得其在提取异物图像特征中优于ResNet、AlexNet、GoogleNet 卷积神经网络,从而基于DenseNet201 与ECOC-SVM 的模型识别准确率高于其他网络。针对电力巡检获取的异物图像,本文以4 种未参与训练与测试的异物图像为例,其具体识别结果如图6 所示。
图6 输电线路异物图像识别结果Fig.6 Recognition results of foreign body images for transmission lines
4 结论
本文根据电网巡检与公开数据构建输电线路异物图像数据集,开展基于卷积神经网络与ECOCSVM 的输电线路异物检测算例,采用自适应阈值Otsu 算法提取目标区域,分析样本、网络层数和特征提取网络产生的影响,得出结论如下:
1)提出基于自适应阈值Otsu 算法的目标区域提取的图像预处理方法,能够有效去除异物图像中的复杂背景,在实验中相对于未经过处理的图像识别准确度有所提高。
2)采用具有较高泛化能力的卷积神经网络DenseNet201 作为特征提取器,ECOC-SVM 作为分类器,可以实现在小样本情况下提取更加有效的特征,实现异物图像的准确识别,辅助输电线路巡检人员开展输电线路除障工作。
本文方法具有较强的泛化能力和鲁棒性,对4种类典型输电线路异物具有较高的识别准确度。在实际工程应用中,可根据需求收集更加丰富的输电线路悬挂异物图像,并将本文方法应用于其中以实现更多类型异物的识别,从而提高输电线路运维的效率。