基于超参数优化轻量化深度神经网络的安全围栏图像分割技术
2024-11-05王健王建薛念明李超乔建苹吕越
摘 要:在电力杆塔作业过程中,规范设置安全围栏是保证施工过程安全顺利的重要手段。当前,人工智能技术已经较为广泛地应用于电力杆塔作业中安全围栏设置规范性的检测。通过图像分割手段将施工区域从背景图像中提取出来,可以有效降低图像复杂度,提高人工智能检测技术的准确度。基于深度神经网络的图像分割是实现此目标的有效方法,但是深度神经网络结构复杂、参数量大,需要大量的计算资源和计算时间。因此,文章提出一种轻量化的深度神经网络模型,用于安全围栏图像的分割,并使用超参数优化手段自动调整超参数设置,提高网络模型性能,达到更好的分割效果。实验结果表明,所提方法可以大幅降低网络模型参数量,同时分割精度达到90%以上。
关键词:电力安全围栏;图像分割;深度学习;轻量化
中图分类号:TP301 文献标识码:A 文章编号:2096-4706(2024)16-0123-04
Safety Fence Image Segmentation Technology Based on Hyperparameter-optimized Lightweight Deep Neural Networks
Abstract: Standardizing the installation of safety fences during power poles and towers operation is an important means to ensure safety. Currently, Artificial Intelligence technology is widely used in the detection of safety fence installation in power poles and towers operation. Using image segmentation to extract the construction region from the background image can effectively reduce image complexity and improve accuracy of Artificial Intelligence detection technology. The image segmentation based on Deep Neural Networks is an effective way to achieve this goal, but the Deep Neural Networks has complex structures and large parameters, which needs lots of computing resources and time. Therefore, this paper proposes a lightweight Deep Neural Networks for segmentation of safety fence images, and uses Hyperparameter-optimized means to automatically adjust the hyperparameter settings, so as to improve network model performance and achieve better segmentation results. Experimental results show that the proposed method can significantly reduce the amount of network model parameters while achieving a segmentation accuracy higher than 90%.
Keywords: electric power safety fence; image segmentation; Deep Learning; lightweight
0 引 言
电力杆塔作业安全围栏是保障作业人员安全的重要设施,设置安全围栏可以防止无关人员误入作业区域,避免发生意外事故,提醒作业人员注意作业过程中的安全;有效隔离作业区域,避免设备损坏和触电事故的发生;提高作业效率,减少不必要的延误和资源浪费。高永键[1]通过调查发现,供电企业对现场作业安全的把控仍然存在非常突出的问题。因此,施工现场的安全监督检查非常有必要。现有施工现场的检查中,主要依靠安排监督人员在现场进行监督,但是电力杆塔作业数量庞大,逐一检查耗时耗力,且现场地理位置特殊,检查难度大,易受天气、环境等因素影响,导致检查不及时。
近年来人工智能技术蓬勃发展,已有较多研究应用人工智能技术解决上述问题。例如,孙倩等[2]设计了一种电力施工安全规范模型的验证方法,使用基于目标检测模型YOLOv5的深度学习技术,对作业工程中的视频监控进行分析,从而实现实时监测以及对违章场景进行预警提醒。最终通过对作业工程中易发多发并且有一定危险性的违章场景进行建模,提早发现并纠正相应的违章场景,实现电力作业施工的过程管控,避免发生事故。胡明辉[3]将深度学习用于改进使用无人机进行的电路巡检。由于无人机得到的杆塔图像背景复杂,导致杆塔异常检测准确度不高。胡明辉通过将多元特征混合训练与基于迁移学习的目标检测模型相结合,在小样本数据下实现了高效的杆塔异常图像检测。余萍等[4]使用人工智能方法对电力施工过程中的围栏摆放合规性检测进行研究,使用OpenCV分析施工现场的图像及视频,提取围栏轮廓并设计算法判断围栏是否存在缺口,从而发现施工现场中安全围栏合规性摆放问题,保证电力系统工程安全、顺利进行。张怀军等[5]设计了智能型安全围栏,在传统围栏的基础上增加了红外感应功能,从而可以主动判断人员非法闯入,并且增加了声光警示模式以警告非法闯入人员,提高了传统围栏的警示作用、解决了传统围栏只能被动防护等问题。
人工智能技术已经较为广泛地应用于电力杆塔作业中安全围栏的设置检测,但是基于人工智能方法的检测效率和精度受到图像复杂度的严重影响,而图像分割技术可以将感兴趣区域从图像中提取出来,再进行检测,从而降低输入检测算法部分的图像复杂度,提高人工智能检测方法的效果和效率。本文提出使用基于U-Net的轻量化深度神经网络进行电力杆塔作业安全围栏图像的分割,在保证图像分割精度的同时,通过使用SqueezeNet的Fire模块降低模型复杂度、减少参数数量,提高模型计算效率。同时使用基于贝叶斯优化的超参数优化策略,自动调整优化模型超参数,达到更好的分割效果。
1 相关工作
基于深度学习的图像分割技术通常可以达到较好的图像分割效果。Long等[6]设计并提出了全卷积神经网络(FCN),它可以快速地对不同大小的图像进行分割。Ronneberger等[7]提出了U-Net网络,该网络结构由编码器和解码器组成,成字母U型网络结构。编码器用于提取图像特征,而解码器用于将特征映射回输入图像空间以生成分割结果。编码器和解码器之间的Skip-Connection结构使得U-Net具有很强的语义信息抓取能力,从而实现精确的分割。
尽管上述基于深度学习的图像分割技术虽然取得了较好的分割效果,但其网络结构往往较为复杂,参数量非常大,计算复杂度高,需要大量的计算资源。因此,需要通过网络轻量化技术手段对深度学习模型进行压缩、优化和简化,减小模型参数和计算量,从而使模型具有较小的尺寸和更高的运行速度。常见的网络轻量化模块包括MobileNet、ShuffleNet、SqueezeNet等。MobileNet[8]是由Google团队于2017年提出的轻量级卷积神经网络,通过深度可分离卷积来减少参数量和计算量,如图1(a)所示,从而实现模型的轻量化。ShuffleNet[9]的设计思路是通过使用通道重排和组卷积来减少参数量和计算量,从而实现模型的轻量化,如图1(b)所示。SqueezeNet是在深度学习领域具有里程碑意义的AlexNet的基础上发展来,SqueezeNet在保持与AlexNet相同精度的前提下,参数量减少了50倍。SqueezeNet由若干个Fire模块结合卷积网络中的卷积层、降采样层、全连接等组成。Fire模块是SqueezeNet的主要创新点,由Squeeze和Expand两部分组成,如图1(c)所示。Squeeze部分采用1×1卷积核对上一层特征图进行卷积,其主要目的是降低特征图的通道数,从而减少参数量;Expand部分使用Inception结构,包括1×1和3×3卷积,然后拼接,通过使用1×1卷积来替代部分3×3卷积,可以将参数减少至原来的1/9。
2 基于U-Net的轻量化深度神经网络图像分割模型
U-Net模型是一种广泛应用于图像分割领域的模型,其核心是由编码器和解码器组成的U形结构。编码器由多层卷积和池化操作构成,它的作用是将输入图像的空间分辨率逐渐降低,并提取出越来越高级别的特征表示。编码器中的每一层都可以看作是一个特征提取器,它通过卷积操作将输入特征映射到高维特征空间,从而实现对图像的信息提取。解码器由多层反卷积和上采样操作构成,它的作用是逐渐恢复空间分辨率,并利用编码器提取的特征对图像进行分割。解码器中的每一层都可以看作是一个特征重建器,它通过反卷积和上采样操作将高维特征映射到低维特征空间,从而实现对图像的分割。通过编码器和解码器的结合,U-Net模型能够充分利用输入图像的特征信息,从而实现对复杂图像的高效分割和分析。
U-Net神经网络在前向传播的过程中,涉及大量的矩阵运算,由于Skip-Connection的存在,需存储大量中间结果。神经网络的每个神经元都与前一层的所有神经元相连,这意味着神经网络中会有大量的权重参数需要存储。这些权重参数通常以大型权重矩阵形式存储,该矩阵的大小与神经网络的层数、神经元数量等因素有关。考虑到以上因素,为了解决安全围栏图像分割网络模型计算复杂度高、模型庞大等问题,本文提出了一种基于轻量化卷积神经网络的图像分割方法,如图2所示。该方法采用SqueezeNet[10]中的Fire模块轻量化网络结构,在保证较高分割准确率的前提下,大幅降低了计算复杂度和运行时间。为进一步提升分割性能,本文引入了注意力机制,使网络能够学习不同空间位置的重要性。此外,还采用了基于贝叶斯优化的超参数自动调优算法,以自动获取最优超参数设置。
Fire模块通过以1×1卷积代替3×3卷积,将参数减少至原来的1/9。同时,在SqueezeLayer中通过1×1卷积减少输入通道数量,进一步减少参数数量。在解码器部分,引入Attention结构,对编码器各分辨率上的特征与解码器中对应特征进行拼接,重新调整编码器的输出特征。通过迭代学习调节门控信号,控制不同空间位置特征的重要性,使网络模型更专注于感兴趣区域,从而提高图像分割效果。
超参数在深度神经网络中具有重要作用,合理设置超参数值可提升模型性能并加速收敛。然而,超参数优化面临验证评估目标函数计算量大的难题,每次尝试新超参数均需重新训练完整模型。贝叶斯优化[11]利用先验过程调整参数,可以更快地进行参数搜索并找到具有最佳泛化能力的参数组合,避免花费大量时间来评估“坏”超参数。贝叶斯优化首先为目标函数建立先验知识,在训练过程中不断更新先验知识,形成后验分布,并根据选择函数选择下一组超参数进行训练。选择函数通常使用预期改进法,以选择一组超参数x最大化其预期的改进:
其中,y*表示目标函数的阈值,x表示给定的超参数,p(y|x)表示代理函数,用以表示y的概率的替代概率模型。
3 实验及结果
3.1 实验验证数据
本文使用的数据集为电力杆塔作业过程围栏图像自建数据集,包含774幅图片实现施工现场拍摄的场景。图片经过专业人员进行标注施工安全区域。实验中,图像数据按照8:1:1比例随机分为训练集、验证集和测试集,分别用来进行模型的训练、验证以及测试模型效果,能够更全面地评估模型在新数据上的表现。
3.2 评价指标
Dice系数是一种常用于评估两个集合相似度的指标,通常用于图像分割等领域。Dice系数的计算式如下:
其中,A和B表示两个集合,|A|表示集合A的元素个数,|B|表示集合B的元素个数,||表示A和B的交集中元素的个数。需要注意的是,Dice系数的取值范围为0到1,值越接近1表示预测分割结果和真实标签结果越相似,值越接近0表示预测分割结果和真实标签结果差异越大。
3.3 实验验证结果
与U-Net网络模型相比,本文轻量化网络参数数量仅为2.6M,比U-Net模型31.4M参数数量减少了12倍。通过在电力杆塔作业的安全围栏区域图像上的试验验证,本文提出的轻量化网络在分割精度上达到了0.904 4,相比U-Net模型的0.911 5,降低了约0.78%。因此,本文的轻量化深度神经网络在保证分割精度的同时,有效减少了网络参数量。图3展示的4幅随机选择的实例图像,是本文所提方法的分割效果与金标准(人工标注结果)及U-Net方法分割效果对比图。通过对比可以发现,本文方法与U-Net方法分割效果非常接近,同时与金标准相比存在过分割现象。
超参数设置对于深度神经网络性能有重要影响。以学习率为例,图4为不同学习率下模型训练过程的Loss曲线,当学习率设置过小时,网络模型不容易收敛,需要较长时间训练;而如果学习率过大,模型可能不收敛。因此,需要通过超参数优化算法自动调整超参数,以在更短时间内达到更好的网络模型效果。本文使用贝叶斯优化方法,其可以使用先验知识选择下一组超参数进行验证,并且支持早停策略,以避免在验证全部可能的超参数上花费过多时间。通过图5所示的贝叶斯优化过程中不同d4c4a3b1a80dcea81093ce98a74e65af超参数下的验证效果,可以发现绝大部分超参数的验证只需要5个以下Epoch,从而可以更快地进行参数搜索并找到具有最佳泛化能力的超参数。
4 结 论
本文提出了一种轻量化的深度神经网络,用于电力杆塔作业中安全围栏图像的分割。通过本文提出的方法,网络模型的参数量相对于基础网络模型降低了12倍,同时保持与原网络模型基本一致的分割效果。此外,通过使用贝叶斯算法自动优化超参数设置,能够快速搜索并找到具有最优效果的超参数,提高网络模型的收敛速度以及整体性能。本文所提出的方法可以有效地进行电力杆塔作业过程中安全围栏图像分割,简化图像复杂度,从而提高安全围栏设置规范性检测方法的效果。这有助于避免电力杆塔作业的安全隐患,提高施工作业安全性。因此,本文方法具有重要的理论研究研究意义以及实用价值。
参考文献:
[1] 高永键.现场供电作业风险评估方法研究 [D].广州:华南理工大学,2019.
[2] 孙倩,赵李强,高雪林.一种电力施工安全规范模型验证方法 [J].云南电力技术,2022,50(3):9-14.
[3] 胡明辉.基于迁移学习的无人机杆塔巡检图像异常识别技术及实验对比 [J].粘接,2023,50(6):136-139.
[4] 余萍,宋祥宇.基于Open CV围栏合规性摆放检测方法研究 [J].科学技术与工程,2022,22(28):12449-12459.
[5] 张怀军,曹付民,彭梓元,等.智能型电力施工安全围栏的设计与应用 [J].湖北科技学院学报,2018,38(3):7-11.
[6] LONG J, SHELHAMER E, DARRELL T. Fully Convolutional Networks for Semantic Segmentation [C]//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Boston:IEEE,2015:3431-3440.
[7] RONNEBERGER O,FISCHER P,BROX T. U-Net: Convolutional Networks for Biomedical Image Segmentation [C]//Medical Image Computing and Computer-Assisted Intervention - MICCAI 2015. Munich:Springer,2015:234-241.
[8] HOWARD A G,ZHU M L,CHEN B,et al. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications [J/OL].arXiv:1704.04861 [cs.CV].[2023-09-20].https://doi.org/10.48550/arXiv.1704.04861.
[9] ZHANG X Y,ZHOU X Y,LIN M X,et al. ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices [C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Salt Lake City:IEEE,2018:6848-6856.
[10] IANDOLA F N,HAN S,MOSKEWICZ M W,et al. SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size [J/OL].arXiv:1602.07360 [cs.CV].[2023-09-20].https://arxiv.org/abs/1602.07360v4.
[11] TURNER R,ERIKSSON D,MCCOURT M,et al. Bayesian Optimization is Superior to Random Search for Machine Learning Hyperparameter Tuning: Analysis of the Black-Box Optimization Challenge 2020 [J/OL].arXiv:2104.10201 [cs.LG].[2023-09-20].https://arxiv.org/abs/2104.10201v2.