双通道卷积神经网络模型电力设备图像识别

2019-05-25周仿荣马仪沈志黄俊波

云南电力技术 2019年2期

周仿荣，马仪，沈志，黄俊波

（1.云南电网有限责任公司电力科学研究院，昆明 650217；2.云南电网有限责任公司带电作业分公司，昆明 650000）

0 前言

目标识别技术指的是使用计算机来对图像进行加工处理，提取其中有意义的信息，实现对图像中有意义的事物或现象的分析、描述、判断和识别[1-2]。变电站电力设备种类众多，众多设备颜色比较单一、外观类似，还存在众多干扰目标，因此，传统的图像识别技术难以满足电力设备图像识别的需求[3-4]。

文献[5]基于多尺度小波边缘检测信息融合与Hough变换直线检测算法，对输电线路的覆冰厚度进行了识别。文献[6]运用动态自适应遗传算法对模糊参数进行优化，并进行电力设备的热异常定位及故障诊断。文献[7-8]将提取出的热红外图像特征向量用于BP神经网络的训练，并对图像进行了分类识别。文献[9]基于标记分水岭模型实现了巡检图像的目标分割与特征量提取，并基于Hsim函数完成最终的目标识别。这些智能算法应用于图像识别均取得了不错的效果，但是在变电站红外图像识别上精度不高，而且处理复杂环境和众多设备的能力差，不适用于变电站红外图像识别。

文献[10]基于卷积递归网络提出了一种基于卷积递归网络的电流互感器红外故障图像诊断方法，指导设备故障部位识别。文献[11]在卷积神经网络(CNN)的结构及原理的基础上，提出基于卷积神经网络的输电线路区内外故障判断及故障选相新方法。文献[12]提出基于卷积神经网络的深度学习训练改进方案，对面部表情进行分类。这些研究表明，卷积神经网络作为一个端到端的机器学习系统，可直接作用于原始数据，自动逐层进行特征学习，所得到的特征跟手工特征相比较，更加抽象，表达能力更强。深度学习使用了复杂的模型，能够有效降低模型的偏差，同时，用可扩展的梯度下降算法来求解大规模优化问题，并通过大数据来提高统计识别的准确度，可充分满足变电站复杂电力设备红外图像识别的需求。

新建的智能变电站以及一些改造的无人值守变电站正逐步采用高清视频监视、红外热像等智能化监测技术手段；采用直升机、无人机、机器人等搭载照相（摄像）机、红外成像仪等手段实现高效、快速的变电站巡检也得到迅速推广和应用；传统的人工巡检也会采集大量的可见光、红外、紫外等检测图像。这些大量的媒体数据流为使用深度学习来进行电力设备识别提供了数据基础。

基于以上考虑，本文针对传统识别方法的不足，通过引入深度学习来对电力设备进行识别。在特征提取方面，本文在AlexNet模型的基础上，通过两个独立的CNN模型来提取电力设备的特征，提出一种双通道CNN模型；在识别算法方面，本文借鉴传统机器学习方法的优势，结合随机森林（Random Forest，RF）的优点，采用了结合深度学习的随机森林分类方法。利用所提出的双通道CNN模型和随机森林分类方法对各类电力设备的图像进行了分类，验证了本文所提出方法的有效性。

1 特征提取算法

1.1 AlexNet模型

AlexNet是Hinton的学生Alex Krizhevsky于2012年设计的一种典型的卷积神经网络，它可以看成是一个特征引擎[13]。AlexNet模型一共有8层，其中间的卷积层可以很好的描述图像的局部特征(Local Feature)，倒数第二层和第三层为全连结层，可以很好的描述图像的全局特征 (Global Feature)。

AlexNet模型的过程可以描述成：从样本集取一个样本(X, Xp)，其中X为输入图像，Xp为X所属类别，将X作为整个网络的输入值，计算输出：

其中W(n)(n=1,2…,8)为权值，B(n)(n=1,2…,8)为偏置，Fn(n=1,2…,8)为每一层的运算，n为AlexNet模型的层数。

AlexNet模型可以通过后向传播来计算神经网络的error(Op与Xp之间的差值)和梯度值，把计算出来的梯度加到原始模型上去即可得到修改后的模型值。通过训练获得CNN模型参数后即可使用测试数据集来测试当前模型的准确率。

1.2 DCNN模型

为了提高AlexNet模型的识别准确率，同时降低模型训练时间、提取能反映不同设备特点的特征，本文在AlexNet网络结构的基础上进行扩展和修改，提出了一种双通道CNN模型，该模型通过两个独立的CNN模型来获得两组设备特征，这两组特征在顶端经过交叉混合操作，即可得到最终的设备图像特征。

DCNN对两组特征数据进行二次交叉混合操作。即先将两个全连接层的输出进行一次交叉连接，作为下一个全连接层的输入；然后将下一个全连接层拆分为两部分，并对这两部分数据进行一次混合连接，得到的特征向量即为图像的最终特征。所设计的11层的深度卷积神经网络的DCNN模型如图1所示。

图1 DCNN模型结构

为了保证两组CNN所提取的特征不一样，增加特征的鲁棒性，本文对输入的图像进行适当的变换，使得CNNa和CNNb在输入上存在差异，具体为：(1) CNNa的输入为原始图像经过归一化处理后，大小为256×256的图像；(2)CNNb的输入为对原始图像进行HSV 变换后所提取的V 通道分量。CNNa和CNNb结构相同，均为9层神经网络，其中卷积层5个，全连结层4个。

在第10层，DCNN先将CNNa的第9层和CNNb的第9层的输出进行一次交叉连接，作为第11层的输入，并在第10层将交叉后的结果拆分为两部分，每部分的神经元个数为512；然后在第11层将两条变换流提取的CNN特征再次进行混合操作，得到一个256维的特征向量，这个256维的特征向量即为DCNN就算所得的图像最终特征值。

2 变电站特征提取

按照本文所述的DCNN模型，可以得到电力设备特征提取的步骤，具体的特征提取流程框图如图2所示。

图2 电力设备特征提取流程框图

对于DCNN模型，在训练时，FP通过多次卷积操作和下采样操作来获取图像的特征；BP则根据已知图像的信息来对网络参数进行误差修正。

2.1 FP算法

设XL为前面一层的输出结果，FP的输出可以表示为：

其中，XL代表权值矩阵，gL代表激活函数。

在网络顶层，使用对数损失误差函数来计算输出结果与实际结果之间的差值，则L层的损失函数可表示为：

其中，xi为输入值，n为测试集中图像的数量，yi为xi所属类别，λ是L2正则化系数。

2.2 BP算法

CNN网络的目标函数为

BP算法使用公式(5)对wL的值进行更新：

在求取目标函数最优解的过程中，通过不断使用公式（5）进行迭代操作即可使模型的输出值和实际值之间的误差达到收敛状态。

DCNN的两个交叉混合层的权值使用公式（6）来进行更新：

式（6）中，gA和gB分别表示交换流A和交换流B的变换函数；wA和gB分别表示交换流A和交换流B的权值矩阵。

3 电力设备图像识别

电力设备场所环境复杂，导致所获取的图像背景复杂。Logisitc分类器和Softmax分类器可以解决多分类问题，但是对于复杂的易混淆的物体，分类准确率不高[14]。鉴于此，本文将深度学习与传统机器学习理论融合在一起，采用了结合深度学习的随机森林分类方法[15]。通过构建多颗由随机选取的样本子集和特征子空间生成的决策树组成决策“森林”，随后在分类阶段以投票方式输出分类结果。

随机森林分类方法由训练阶段和测试阶段两部分构成。在训练阶段，首先在设备图像数据库上，使用1.2中提出的DCNN模型从数据库中随机选取图像并提取图像特征；然后，基于随机森林分类的适应性来对所学习到的特征进行分析，并基于分析的结果进行特征选择。

在测试阶段，使用DCNN提取测试图像的特征，并选择在训练阶段中所选择的特征维度来表示图像特征，最后使用训练好的随机森林对测试图像进行分类。

3.1 特征提取试验结果分析

本文对变电站中绝缘子，变压器，断路器，输电线电杆和输电线铁塔五种电气设备进行测试。测试所用图像数据库PowerΙmage为实验室自行收集和整理的电力系统设备图像数据库，共3万多幅图像，图像的尺寸从256×256到1024×1024，主要包括变压器，绝缘子，断路器，输电线，杆塔等20多种电气设备，平均每类物体约含1000幅图像，在训练时对每类图像随机选取一部图像作为训练样本，其余的为测试样本。跟人工提取的颜色特征、形状特征、纹理特征等相比较，使用DCNN提取到的特征更加抽象，能够更好地反映图像的本质特征。

3.2 变电站图像识别实验结果分析

为了测试本文所提双通道CNN所提取特征的有效性，本文分别对使用单独的CNN，和使用DCNN进行特征提取的结果进行了分类比较。测试中，绝缘子、变压器、断路器、输电线电杆和铁塔的图像分别为3000幅、2000幅、2000幅、3000幅和500幅。其中，选择绝缘子图像2000幅、变压器图像1500幅、断路器图像2000幅、输电线杆塔1000幅和铁塔300幅为训练样本，其余的作为测试样本。

图3和图4分别是使用单独的CNN和使用DCNN进行训练时所得到的误分类率曲线。

图3 单CNN的训练过程

通过对图3进行分析可以发现，在对模型进行训练时，当迭代次数为61时，单CNN的误分类率达到最小值，为9.0%。如果继续进行迭代操作，单CNN的误分类率会有所减少，但是在进行2次迭代操作后，也就是在第63次迭代操作时，误分类率又会变大，其后几乎不发生波动。

通过对图4进行分析可以发现，在对模型进行训练时，当迭代次数为53时，DCNN的误分类率达到最小值，为5.5%。如果继续进行迭代操作，DCNN的误分类率会有所减少，但是在进行5次迭代操作后，也就是在第58次迭代操作时，误分类率又会变大，其后几乎不发生波动。

图4 DCNN的训练过程

使用单独的CNN和DCNN对训练数据和测试数据中的五种设备进行识别后，所得分类准确率如表1所示，平均准确率和平均时间如表2所示。

表1 两种模型所得到的分类准确率(%)

表2 两种模型所得到的平均准确率和时间复杂度

通过对表1和表2进行分析，可以看出：

1）使用单独的CNN和DCNN两种深度学习模型对设备图像进行分类，平均准确率均可达到85%以上，这充分说明了卷积神经网络所提取的图像特征抽象层度高，表达能力强，在对设备图像进行识别时，可以获得较高的精度；

2）与DCNN相比较，单独使用CNN的识别率降低了4.4%，主要原因为是跟单CNN相比较，DCNN模型的“宽度”更宽，可以提取更加丰富的图像特征，但是由于DCNN在深度上并没有显著增加，因此其GPU运行时间的复杂度跟单CNN相比较并没有增加多少，仅仅为0.3s；

3）对于绝缘子，变压器，断路器，输电线电杆和输电线铁塔五种设备图像，输电线路铁塔的识别率最低，主要原因在于铁塔的数据集太小，只有500幅图像，而其他几种设备的图像均超过了2000幅，更多的训练样本，可以很好地提高卷积神经网络模型的泛化能力，减少过拟合的风险，获取更大的识别精度；

4）在CPU上运行深度学习算法的时间远远高于在GPU上运行所花时间，这说明深度学习算法比较耗时，因此在实际应用中，如果要用到深度学习方法，需要GPU的支持。

3.3 不同识别方法的结果分析

为了测试本文所提随机森林树方法的有效性，本文分别对三种识别方法，即卷积神经网络+Softmax分类器（方法1），卷积神经网络+随机森林树分类器（方法2）以及传统手工参数提取+随机随即森林树分类器（方法3），用于电力设备图像识别的结果进行了分类比较，如表3所示。表3中，类型A代表训练识别率，类型B代表测试识别率。

表3 三种识别方法进行分类识别的准确率

根据表3，可以得到：

1）使用方法1和方法2对设备图像进行分类，平均准确率均可达到80%以上，这充分说明了卷积神经网络所提取的图像特征抽象层度高，表达能力强，在电力设备图像识别上可获得较高的精度；

2）方法1的准确率比方法2低8.4%，这是因为Softmax分类器直接使用最后一个混合全连接层的深度特征来进行分类处理，而不同设备最有效的特征是不一样的，因此，对深层卷积神经网络的特征进行有效选择可以进一步提高分类性能；

3）与方法1和方法2相比较，方法3的识别率最低，平均识别率只有75.2%，这是因为方法3使用颜色、纹理、方向等手工特征进行分类识别，无法完全刻画设备的本质特征，而深度学习的方法要比传统特征提取的方法性能更好，因此最终识别率也远远高于传统方法；

4）对于绝缘子、变压器、断路器和输电线电杆四种电力设备图像，方法1和方法2的识别率均超过了85%，而输电线铁塔的识别率低于方法3，主要原因在于铁塔的数据集太小，只有500幅图像，在小样本情况下，深度学习的表现不如传统的特征提取方法。这也说明了深度学习算法对训练样本的要求较高，但是当足够的训练样本训练好后，深度学习算法的精度会大大改善识别精度。