基于VSA-UNet的电气设备紫外图像分割
2023-02-18陈思林秦伦明杨苏航左安全
陈思林,秦伦明*,王 悉,杨苏航,左安全
(1.上海电力大学 电子信息工程学院,上海 201306; 2.北京交通大学 电子信息工程学院,北京 100044)
0 引言
随着社会和经济的发展,在自身需求的驱动和社会外部的压力下,提高电网供电稳定性和安全性成为电力行业追求的目标[1]。电力设备的正常运行是电网系统安全稳定运行的必要条件之一。一些电气设备由于长期处于暴晒、雨淋、高压和大电流等恶劣环境,容易出现各种各样的问题。据统计,电网20%的故障是由外绝缘放电引起的,并且故障后电网恢复难度较高。因此,有效解决电力设备放电故障对维护电网的稳定和安全十分重要。
电气设备放电评估需要精准的数据支撑,而电气设备电晕放电的紫外图像分割能提供放电面积数据。因此,紫外图像分割的准确度直接影响放电评估的结果。传统的图像分割方法有很多,例如文献[2]根据对不同增益下的紫外图像灰度值相加求平均,再选取合适阈值进行分割。该方法简单易行,但对灰度值较高的非放电区域过于敏感,会对噪声进行误判,产生的结果存在较大误差。文献[3-5]在进行边缘检测时分别采用了改进Sobel算子、Canny算子和改进Canny算子。这3种方法检测的边缘并不是连续的,大多呈现离散型,因此还要加入构建完整边缘轮廓的算法进行补充。文献[6]以数学形态学方法进行图像分割,首先对紫外图像进行图像增强,再选取适当的结构元素进行数学形态学分割。文献[7]通过判断有无紫外信号,获取泊松概率映射图,最后利用改进大津算法进行分割。这2种方法流程比较复杂且不易实现。以上传统方法在进行图像分割时,都先要对图像进行预处理,例如图像增强和滤波去噪等。因此,增强方法与滤波器性能的好坏直接影响最终分割精度,加大了分割的复杂性。从文献[8-9]可知,近期利用紫外图像面积预测放电强度仍然使用传统方法分割图像,出现了大量噪声,影响了预测精度。从上述研究来看,目前紫外图像放电区域分割方法不够智能,且分割结果存在过分割和欠分割现象。
卷积神经网络(Convolutional Neural Network,CNN)是深度学习的代表算法之一,因其高自动化程度与高泛化能力等优点受到学者们的关注。在图像分类、识别等领域CNN都优于传统方法,但其并不适合端到端的图像分割领域。直到2015年,全卷积神经网络(Fully Convolutional Network,FCN)[10]利用全连接层,直接获取每个像素的分割结果,但其并没有考虑像素与像素之间的关系,缺少全局信息的指导。所以在FCN的基础上学者们又提出了许多优秀的语义分割网络,如PSPNet[11],U-Net[12],DeepLabv3[13],DeepLabv3+[14],LEDNet[15]和SPNet[16]等模型。其中,U-Net网络多用于数据集少、分割类别少且准确度要求高的医学图像,故将其应用在同样条件紫外图像分割任务中。但传统U-Net网络在紫外图像分割时,对小区域、大区域和多区域的分割效果都存在过分割以及欠分割的现象。
针对上述问题,本文提出了VSA-UNet(VGG16Net, Improved SENet, and ASPP based U-Net)网络来提高紫外图像分割精度。该网络以U-Net为基础,首先引入VGG16Net[17]来减少紫外区域过分割现象,但在一定程度上增加了欠分割现象。其次利用空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块获得不同尺度的特征信息,增大感受野的同时,提高对大面积目标的分割准确度,减少欠分割现象。最后利用密集连接卷积网络(Densely Connected Convolutional Network,DenseNet)[18]的特征重用思想,改进压缩和激励网络(Squeeze and Excitation Network,SENet)[19]模块。在改变通道权重的同时,有效防止了由于卷积操作造成的图像细节丢失问题,从而全面提高分割结果的准确性。
1 算法原理
1.1 基于VGG16Net的U-Net改进
U-Net网络模型在FCN模型的基础上提出,因形似U而得名。为了使分割结果与原图重合,去掉了原网络的剪切部分。上采样阶段只改变图像尺寸,并没有增加上采样通道数,以减小计算量,其结构如图1(a)所示。左半部分为用于特征提取的编码器,右半部分为与之对应的解码器,用于恢复图像尺寸。下方的虚线为跳跃连接部分,用于拼接编码器中低级语义特征与解码器中的高级语义特征。
(a) U-Net网络结构
(b) VGG16Net网路结构
(c) 改进U-Net网络结构图1 基于VGG16Net的改进U-Net网络结构Fig.1 Improved U-Net network structure based on VGG16Net
由文献[20]可知,VGG16Net是常见的CNN模型之一,结构如图1(b)所示。该网络所有卷积层都采用大小为3×3,步长为2的卷积核,池化层均采用2×2的最大池化核。相比经典网络AlexNet[21]中较大的卷积核与池化核,小卷积核具有参数少、梯度爆炸可能性小的优点,同时小的池化核能够捕获更多的细节信息。此外,VGG16Net结构深度更深,对特征信息的提取能力更强。
基于上述VGG16Net的优点,将U-Net网络编码器部分替换成VGG16Net网络,如图1(c)所示。改进算法加深了U-Net网络结构,有利于提取紫外图像高维特征信息,增强网络学习能力。
1.2 ASPP模块引入
为了提高FCN的全局信息指导能力,Chen等[13,22-23]经过几代的改进提出了DeepLabv3+网络,引入了ASPP模块。它是在金字塔池化模块基础上引入空洞卷积而形成,克服了单一空洞卷积时由于网络效应导致局部信息丢失和远距离信息缺少相关性的缺点[24]。U-Net语义分割缺点在于最大池化过程虽然使感受野增大,但也会使图像分辨率降低,图像模糊。ASPP模块利用不同空洞率的卷积,能增大感受野的同时还不会降低分辨率,是个不错的选择[25]。
ASPP模块结构如图2所示。将特征层分别采用空洞率为1,6,12和18的卷积核进行卷积和全局平均池化(Global Average Pooling,GAP),随后进行拼接,再通过1×1的卷积核调整通道数,最后用批归一化算法(Batch Normalization,BN)与激活函数ReLU对特征层进行优化,计算方法为:
图2 ASPP模块结构Fig.2 ASPP module structure
(1)
(2)
(3)
(4)
(5)
(6)
1.3 改进的SENet模块
人类在观察物体时会根据自己的意愿将视线集中在感兴趣的区域,无兴趣的信息会被大脑自动剔除。本文引入SENet注意力模块来模仿大脑机制,对紫外图像中的重要信息进行加强特征提取。
在使用U-Net网络的下采样阶段进行特征提取时,一些无用信息不会被剔除,同时一些有用特征会在卷积操作中消失不见,这都影响了紫外分割的准确率,然而单一的SENet模块并不能解决后者的问题。为了更好地分割图像,引入了改进SENet模块,其网络结构如图3所示。
图3 改进SE模块网络结构Fig.3 Network structure of improved SE module
该模块首先利用SENet模块的自适应学习能力,依据特征通道的重要程度,赋予不同权值,减少不重要信息干扰。其次,利用DenseNet的特征重用思想对2个特征层进行拼接(concat),避免因卷积操作而丢失图片细节。对于紫外图像,改进SENet模块不仅可以降低无用特征信息的重要性,提高有效特征信息通道的重要性,还补充了丢失掉的细节,从而提升紫外图像分割的准确度。
改进SENet模块分为压缩(Squeeze)、激励(Excitation)和拼接3步操作。图3中,F为C′×W′×H′的特征图,对F经过若干卷积操作得到通道数为C的特征图Fc,然后对Fc每个通道在空间平面H×W上进行全局平均池化操作,即所说的压缩操作Fsq,压缩公式为:
(7)
式中,(i,j)代表像素坐标;Z代表全局信息,利用全连接层W1对Z进行参数降低,这样在提高运算速度的同时提高网络泛化能力,然后引入ReLU函数建立各通道之间的相关性,最后经过全连接层W2将参数升高至原来的维度。激励操作公式为:
Sc=Fex(Z,W)=σ(W2δ(W1Z)),
(8)
式中,Fex表示激励操作;δ为引入ReLU函数;σ代表引入Sigmoid函数进行激活,得到通道注意力系数Sc。最后,将注意力系数Sc加入到原始的特征通道中,并与起始特征层拼接,在增强有用信息比重的同时补充因卷积消失掉的特征。拼接公式为:
(9)
式中,Fscale(Fc,Sc)为将权值系数Sc赋值到特征层Fc中;concat为拼接操作,将原本特征层F与经过SENet模块后的特征层进行跨层拼接。
1.4 VSA-UNet网络结构
U-Net作为主网络,可以通过较少数据集获得不错的分割效果,但在紫外图像分割任务中对小区域、大区域和多区域的紫外光斑分割效果存在过分割和欠分割的现象。针对上述问题,提出了基于VSA-UNet的紫外图像分割方法,其网络结构如图4所示。
图4 VSA-UNet网络结构Fig.4 Network structure of VSA-UNet
将该网络分为编码器、解码器和跳跃连接3个部分。图4左边为主网络的编码器部分,紫外图像输入网络后先经过4个卷积模块和4个池化操作,其中包含10次3×3卷积操作用于提取图像特征,以此来获得4个初步的有效特征层,4次最大池化操作目的是来降低图片维度,以提高运行速度。在第4次最大池化后加入ASPP模块,对特征层进行不同空洞率的卷积,扩大感受野,获得更多的特征信息,提高对面积较大的紫外区域的分割准确度。图4右边为解码器部分,由卷积层和上采样层构成,其中包含4个大小为2×2,步长为2的反卷积层和9个3×3的卷积操作。图4中间为跳跃连接部分,在跳跃连接阶段去除了原先的剪切(Crop)操作,目的是保证输入图像和输出图像大小的一致性。改进SENet模块添加在跳跃连接阶段,是将DenseNet网络中特征重用思想与SENet模块结合起来。将每一层的起始特征层、SENet模块后的特征层和上采样后的特征层进行跳跃拼接,补充因卷积操作丢失的细节信息。最后通过不断迭代,直到损失值不再变化或达到最大迭代数,输出紫外图像分割结果。
2 实验结果与分析
2.1 数据集及数据增强
由于目前没有公开的紫外图像数据集,本文使用的数据集是从网络上搜索的不同电气设备,如对绝缘子串、均压环和电力线缆等拍摄的紫外图像。为了使实验效果更直观、更具有说服力,选取共计58张大小不尽相同且各有特征的图像,部分数据集及对应标注如图5所示。其中包含形状不规则、多噪声、大区域、小区域和多区域紫外图像等。通过图片的明暗变化、旋转等操作扩充数据集至500张。将数据集的10%作为验证集,剩余图片按照1∶9的比例划分,分别用于测试集和训练集。使用Labelme标注工具进行标注,红色部分为标注的放电区域。
2.2 参数设置
实验硬件配置:Windows 10操作系统,Intel®Xeon®Gold 6230处理器,NVIDIA Tesla V100-PCIE-16 GB显卡,320 GB RAM。软件参数设置如表1所示。
表1 实验软件参数设置Tab.1 Experimental hardware configuration
分割模型的总体性能不仅取决于神经网络结构,损失函数对分割的效果也起到至关重要的作用。紫外图像分割任务中紫外光区域像素往往少于非紫外光区域像素,分布不均衡,如果仅采用交叉熵损失函数(Cross Entropy Loss,CE Loss),神经网络的训练将会由像素较多的非紫外光区域主导,降低了网络的有效性,从而影响分割效果。为了解决这个问题,结合Dice Loss函数和CE Loss函数组合训练VSA-UNet网络,计算如下:
(10)
LossCE=-∑N[Ptrue×lnPpred],
(11)
Loss=LossDice+LossCE,
(12)
式中,TP为目标区域预测准确的像素数量;FN,FP依次为目标区域和背景区域预测错误的像素数量;Ppred为某类的预测概率;Ptrue为该类标签真实值结果;N为类的个数。
2.3 评价指标
从主观与客观2方面对分割效果进行评价。主观评价主要从直观视觉上对紫外图像的整体分割及边缘细节的分割情况进行比对。客观评价则以平均交并比(Mean Intersection over Union,MIoU)和平均准确率(Mean Pixel Accuracy,MPA)作为评价指标,其计算公式为:
(13)
(14)
式中,Pi为某类别像素的准确率,计算公式为:
(15)
2.4 各模块对U-Net模块的影响
以各模块对U-Net网络的影响进行实验,结果如图6所示。由图6可知,添加不同模块对U-Net网络有着不同的效果。单独的U-Net网络在分割紫外图像时出现过分割与欠分割现象,分割边缘也比较粗糙。在用非线性单元更强的VGG16Net替换后,分割精确度明显提升,过分割现象明显减少,但有些图出现欠分割现象。添加SE模块主要是降低非关键信息的重要程度,增加关键信息的重要程度。经实验发现,添加SENet模块后一定程度降低了噪声的干扰,并且对过分割和欠分割都有缓解作用。ASPP模块可以通过感受野的扩大,加强对大物体的分割准确度。通过图像可以看出,添加ASPP模块后对大的紫外光斑分割更加完整,但对小的紫外区域出现漏分割的情况。利用特征重用思想进行跨层拼接,对通过卷积层后可能漏掉的特征进行补充。实验证明,跨层拼接对除去噪声和加强边缘分割都有积极作用。最后,通过将以上模块嵌入到U-Net网络中,相比于U-Net原始网络,使用的网络无论是在紫外区域分割的准确率上还是分割完整度上都优于添加各个模块的网络。
图6 采用不同模块的U-Net网络紫外图像分割结果Fig.6 UV image segmenting results with U-Net with different modules
为了更全面、真实地表现添加不同模块对传统U-Net网络的提升,本文对其做了数据量化,结果如表2所示。
表2 采用不同模块的U-Net网络紫外图像分割结果指标对比Tab.2 Comparison of UV image segmentation results indicators using U-Net with different modules
U-Net作为原始网络,MIoU为74.56%,MPA为86.04%。不同模块对传统网络有不同程度的提升。当整合所有模块到U-Net网络时,MIoU为81.78%,MPA为95.97%,分别提升了7.22%,9.93%,充分证明了改进模型的正确性和有效性。
从紫外区域的交并比(Intersection over Union,IoU)与像素分割准确度(Pixel Accuracy,PA)两方面比较各个模块对U-Net的影响,如图7所示。由图7可知,排除背景的干扰,添加ASPP模块对整体提升最大,这与图6展示的对比图基本相似。改进网络模型在PA方面更是高达92.67%,远高于U-Net的72.77%,在IoU方面同样是增长14.17%,这都进一步证实了VSA-UNet的优越性。
(a) 采用不同模块的U-Net网络分割紫外区域的IoU值
(b) 采用不同模块的U-Net网络分割紫外区域的PA值图7 采用不同模块的U-Net网络对紫外区域分割结果的指标对比Fig.7 Comparison of indicators of UV region segmentation results using U-Net with different modules
2.5 损失函数选取
由于紫外图像存在正负平衡问题,对有无Dice Loss损失函数对分割效果的影响进行实验。CE Loss的MIoU为80.32%,MPA为93.27%;CE Loss+Dice Loss的MIoU为81.78%,MPA为95.97%。在本文所提的模型下使用复合混合函数效果要比单独使用交叉熵损失函数效果要好。
2.6 不同算法分割性能比较
各种网络的分割结果如图8所示,图8(a)和图8(b)分别为收集的紫外图像和紫外图像的标签;图8(c)~图8(g)为不同分割网络的分割结果;图8(h)为本文分割网络的分割结果。
图8 采用不同分割模型的紫外图像分割结果Fig.8 UV image segmentation results with different segmentation models
紫外图像分割任务中,过分割和欠分割是决定最终分割结果的主要因素。由实验结果可以看出,各种算法对噪声少、放电区域小、单一放电点的紫外图像都有较好的分割效果;对放电点单一且放电区域大的紫外图像,SPNet由于网络增加条状池化,在条形边缘容易出现过分割与欠分割现象,PSPNet和LEDNet出现过分割情况;对多区域且面积大小不均的紫外图像,PSPNet欠分割现象严重,LEDNet出现分割边缘模糊。相比之下,传统U-Net网络在数据集较少时分割更为准确,但也出现了少量过分割与欠分割现象。本文模型解决了这个问题,分割出的紫外区域图像边缘更加清晰、图像更加完整、分割更加准确,分割结果与真实标签最为接近。
虽然从分割图像能直接观察到分割结果进行主观评价,但是由于数据集太多,不易将每张图片都进行对比,因此从客观定量上进行总体评价。不同分割网络对紫外图像分割效果的定量指标如表5所示。由表5可以看出,本文模型在2项指标上都优于其他网络,其在所给的45张测试集的MIoU达到81.78%,MPA达到95.97%,与传统的U-Net网络比较分别提升了7.22%,9.93%。综上所述,本文提出的VSA-Net网络在紫外图像分割的主观评价和客观评价上都有很大提升,更能提供真实的放电区域。
表4 不同模型对紫外图像分割指标对比Tab.4 UV image segmentation indicators by different models
3 结束语
电气设备正常运行是保证电力系统稳定的关键,紫外图像分割是否精确将直接影响电气设备状态评估的结果。为了提高紫外图像分割准确度,提出了一种基于VSA-UNet网络的紫外图像分割算法。该算法在U-Net基础上依次添加VGG16Net、改进SE模块和ASPP模块。与U-Net,PSPNet,DeepLabv3+,SPNet和LEDNet等网络的对比实验表明,改进网络在图像分割结果主、客观方面均优于其他网络,并且较好地解决了分割大区域、小区域和多区域的紫外图像时出现的过分割和欠分割现象。改进分割网络虽然相比其他网络在紫外图像分割上具有较高的分割精确度,但从实验结果看出本网络仍存在不足之处,例如在分割较大噪音时也会出现少量误分割的情况,这也是未来需要重点研究的问题。