APP下载

轻量型YOLO-IoU网络在公路绿化检测中的应用

2024-05-20彭佳君冯善铭叶思红

现代计算机 2024年5期
关键词:公路绿化卷积精度

林 海,彭佳君,冯善铭,叶思红

(湛江幼儿师范专科学校信息科学系,湛江 524084)

0 引言

随着生活水平的不断提高,公路建设对于城乡的美化、自然环境的保护、以及道路的交通安全等方面都有着至关重要的影响。公路绿化[1]也随之成为我国发展经济的重要内容之一。当下传统的公路绿化管理[2]主要采用人工巡视、评估和维护的方式,管理过程消耗人力、浪费时间,但效果并不显著,存在问题颇大。为了解决好这些问题,更好地维护公路绿化这个重要环节,基于深度学习的智能目标检测技术[3]逐渐受到广泛关注。新兴的智慧公路绿化管理技术[4]采用了深度学习的智能目标检测技术,解决了传统管理所存在的不足。

本文主要探讨基于深度学习的智能目标检测技术在公路绿化中的应用与优化,旨在提高公路绿化管理的效率和水平,牢固树立和践行绿水青山就是金山银山的理念,深入推进绿美广东生态的建设[5],推动我省高质量发展。

目标检测[6]在计算机视觉领域中是不可或缺的重要研究方向,旨在从图像或视频中识别和定位特定目标,因其在实时性、准确率、泛化能力等方面的优势,逐渐被广泛应用于公路绿化管理中。与传统的人工巡视[7]相比,基于深度学习的智能目标检测技术能够实现对公路上的绿化目标的快速、准确的检测识别,对于推动公路绿化管理的可持续性和可发展性产生积极的作用。尽管目标检测技术已经发挥了很好的作用,但是在公路绿化管理中还需要克服一些困难和挑战,如天气、光照等外部因素的影响,需要相应地对检测模型进行调整和优化,同时,GPU 资源也是限制目标检测速度和准确率的重要因素。

所以,针对上述问题,本文提出了一种轻量型YOLO-IoU 网络,从数据集扩充、网络结构、特征提取、损失函数等方面对网络模型进行优化,并总结了该技术对公路绿化管理的可持续性和可发展性将产生的重要影响。

本文的主要贡献包括:

(1)在YOLOv5 算法的基础上,对YOLOv5目标框损失函数进行重新设计,从而提出一种新的目标检测算法YOLO-IoU,使其能够更加适应边缘设备的特点,减少计算成本,提高算法的执行效率和精度。

(2)提出了一种用于公路绿化检测的数据集。

(3)实验数据表明,本文所提出的轻量型YOLO-IoU 算法在实际场景中的可行性和优越性,为公路绿化检测提供了一种新的解决方案。

综上所述,本文的重点是探索一种轻量型YOLO-IoU 目标检测网络,旨在提高公路绿化检测的实时性和准确性。接下来,我们将具体介绍该算法的设计和实现细节,并进行实验验证和分析。

1 相关工作

1.1 SSD网络模型概述

SSD[8](Single Shot MultiBox Detector)是一种基于深度学习的目标检测模型,由Google 团队于2016 年提出。与传统的目标检测模型不同,SSD 是一种单阶段的检测模型[9],能够直接在图像上进行目标检测,无需像RCNN系列模型那样进行多个阶段的操作,网络结构模型如图1所示。

图1 SSD网络模型结构

SSD 模型的核心思想是,在不同的卷积层上提取多尺度的特征[10],然后针对每个特征图位置预测相应的目标框和类别概率。SSD 模型的输出是一组预测框,每个框包含目标的位置和类别信息。在训练过程中,SSD 模型通过监督学习优化预测框的位置和类别,从而提高模型的准确性和稳定性。

相比传统模型,SSD具有以下优点:

(1)SSD 是一种单阶段的模型,无需多个阶段的操作,因此速度更快、更高效。

(2)SSD 采用多尺度特征提取和预测,能够更好地适应不同尺寸和比例的目标,提高检测的准确性。

(3)SSD 适用于各种目标检测任务,如人脸检测、车辆检测、行人检测等,具有较强的通用性和灵活性。

除此之外,SSD 网络目前还存在特征表达能力有限、负样本过多、多尺度匹配不准确、目标长宽比有偏差等问题。

1.2 Faster R-CNN网络模型概述

Faster R-CNN[11]是计算机视觉领域中一种目标检测算法,它基于R-CNN[12]和Fast R-CNN[13]算法,并相较于这两种算法具有更快速、更准确的特点,能够实现高精度和高效率的目标检测,网络结构如图2所示。

图2 Faster R-CNN网络结构

Faster R-CNN 的完整流程包括四个部分。首先,通过卷积神经网络(CNN)对录入图像进行特征提取;其次,针对所提取的特征图进行区域建议管理,即生成候选框;再次,对候选框进行特征提取、分类和回归处理;最后,通过后处理对分类和回归结果进行优化,得到最终的检测结果。其中,Faster R-CNN 包括如下的关键要素。

1.2.1 卷积神经网络(CNN)[14]

Faster R-CNN 采用预训练的CNN 作为基础网络,用于提取图像的特征。该CNN 包含多个卷积层和池化层,能够将图像映射到另一个特征空间,更好地表示图像中不同区域的特征。

1.2.2 区域建议网络(RPN)[15]

RPN 是Faster R-CNN 的核心模块之一,取代了以往目标检测算法中繁琐的去重和筛选策略,使算法更加高效。通过在CNN 的特征图上应用RPN,可以快速生成候选框,用于后续的分类和位置回归。

1.2.3 Fast R-CNN

Fast R-CNN 是在一组候选框上进行目标分类和位置回归的算法。在Faster R-CNN 中,Fast R-CNN 用于最终的检测分类和位置回归处理。我们将CNN 提取的特征图输入Fast R-CNN 模块,便可对候选框进行区分和位置回归,从而取得最终的目标检测结果。

总体来说,Faster R-CNN 还存在训练速度慢、计算成本高、不适用于小目标检测、检测精度有限、网络结构复杂等问题

1.3 YOLO网络模型概述

YOLO[16](You Only Look Once)是一系列目标检测算法,包括YOLOv1、YOLOv2、YOLOv3、YOLOv4 和YOLOv5,它们在目标检测领域取得了显著的进展。

1.3.1 YOLOv1[17]

YOLOv1 是YOLO 系列的第一个版本,于2015 年提出。它采用单个卷积神经网络,在一次前向传递中同时预测多个边界框和类别,并使用非极大值抑制进行结果过滤。然而,YOLOv1在检测小目标和处理重叠目标方面存在困难。

1.3.2 YOLOv2(YOLO9000)

YOLOv2 在YOLOv1 的基础上进行了改进,于2016 年发布。它引入了一些技术,如卷积核大小的变化、多尺度预测、Anchor 框的使用等。此外,YOLOv2 结合了COCO 和ImageNet 数据集,可以检测更多的类别。

1.3.3 YOLOv3[18]

YOLOv3 于2018 年发布,进一步改进了目标检测性能。它采用了多尺度预测、特征金字塔网络和跳跃连接等技术,提高了小目标检测的准确性。YOLOv3 还引入了Darknet-53 作为其骨干网络,提供了更强大的特征提取能力。

1.3.4 YOLOv4

YOLOv4于2020年发布,是YOLO 系列中的最新版本。它引入了一系列创新技术,如CSPDarknet53、SAM、PAN、YOLOv4 Neck 等,进一步提升了检测精度和速度。此外,YOLOv4还提供了更高级的功能,如多尺度训练、数据增强和学习策略优化。

1.3.5 YOLOv5[19]

YOLOv5 是由Ultralytics 于2020 年提出的YOLO 版本。它基于PyTorch 实现,并提供了简单而高效的目标检测框架。YOLOv5通过采用轻量级网络结构、自动调整模型大小和推理速度等策略,实现了快速、精确的目标检测。

总的来说,YOLO 系列模型通过不断的改进和创新,在目标检测领域取得了显著的进展,提高了检测精度和速度,同时在处理小目标和重叠目标方面取得了更好的性能。

2 YOLO-IoU网络模型

2.1 网络模型结构

YOLO-IoU网络模型采用了以下优化结构:

(1)骨干网络使用更小的CSPDarknet-S,该网络去除了原Darknet 的最大池化层和一些卷积层,网络通道数也有所减小,参数量减少到6.9 M。这使得YOLOv5s 的运算速度更快,模型体积更小。

(2)预测框的数量减少到2 个,进一步减小了模型大小。

(3)网络在骨干网络输出层之前的特征层数量从5个减少到4个。

因此,YOLO-IoU 保留了YOLOv5 的主要创新点,但通过采用更小的骨干网络、减少预测框数量和中间特征层等措施显著减小了模型大小和提高了速度,这使其非常适合在资源受限的平台上使用。

YOLO-IoU 网络结构分为三个部分:主干网络、连接层和预测层,如图3所示。

图3 YOLO-IoU网络结构

为了适应边缘计算平台,输入端采用320*320的最小输入尺寸。

2.1.1 主干网络

YOLO-IoU 的主干网络基于CSPDarknet53,它是一个轻量级的卷积神经网络,由多个残差块合成。每一个残差块就包含了两个3×3 卷积层和一个跨步卷积层,一个残差连接和一个通道数减半层。在CSPDarknet53 中使用了Cross Stage Partial Networks(CSP)模块,可以大量减少参数数量,并且保持了模型的性能。

2.1.2 连接层

YOLO-IoU 连接层由SPP、PANet 两个模块组成。SPP 模块主要实现了空间金字塔池化(Spatial Pyramid Pooling),该操作可以在不改变图像尺寸的情况下提取不同尺度的特征。PANet(Path Aggregation Network)模块则实现了特征金字塔网络。该模块可以将从不同层级得到的特征图进行融合和聚合,从而提高检测精度。

2.1.3 预测层

预测层主要负责输出预测结果。其由三个卷积层和一个全连接层组成,其中全连接层的输出大小为3×(类别数+5),分别代表每个边界框的五个属性(中心坐标、宽、高、置信度和类别概率)。

2.2 损失函数

DIoU(Distance-IoU)[20]是一种用于目标检测中边界框重叠度量的距离度量方法,它结合了IoU 和边界框间距离的信息。下面我们使用DIoU重新设计了YOLO-IoU目标框损失函数:

假设有N个边界框需要预测,其中第i个边界框的预测框为,真实框为令pi∈RC+5表示第i个边界框的预测概率和坐标信息,其中C是类别数。对于一个预测框,我们可以通过计算其与真实框bi的DIoU 距离来评估两者之间的匹配程度。具体地,DIoU 公式可以表示为

式中:cb̂i和cbi分别表示预测框和真实框bi的中心点坐标,c表示两个边界框的最小外接矩形的对角线长度。

进一步地,我们可以将DIoU 距离用于计算目标框损失。假设第i个边界框的预测框属于第k类,则该边界框的目标框损失公式为

式中:λcoord和λIoU分别是坐标损失和IoU 损失的权重系数。通常情况下,λcoord取比较大的值,以便更加注重坐标精度;λIoU取比较小的值,以保证不会影响到目标检测的召回率。

3 实验内容

3.1 公路绿化数据集

为了测试YOLO-IoU 模型在公路绿化检测任务上的性能,我们通过实地拍摄和收集网络的公路绿化图片素材,并选取不同光照、不同场地的图片共10000 张,创建了公路绿化数据集,按类型不同,分为树、花、草三类,并对其进行了标注,其中7000 张做为训练集,3000 张做为验证集,如图4所示。

图4 公路绿化数据集部分图片

3.2 实验软硬件环境配置

实验软硬件环境配置见表1,训练网络为YOLO-IoU 网络。batch size 值为18,迭代次数为800,初始学习率为0.01。

表1 软硬件环境配置

在训练过程中我们对数据集采用Mosaic 数据增强技术,在相同训练轮次和超参数的情况下,可以提高模型的性能表现。Mosaic 增强可以将多张图片合成一张,从而增大了训练数据集的样本量和样本多样性。这有助于模型更好地学习物体的形状、大小、位置等信息,并提高检测精度。

3.3 实验数据及分析

在本实验中,我们使用YOLO-IoU 模型来检测公路绿化情况。输入尺寸为320×320像素大小的图样,运用训练数据集对其进行训练。在训练期间,我们使用随机梯度下降(SGD)算法和学习率衰减等技术来优化模型参数。此外,我们使用AdamW优化器来加速收敛,同时避免过拟合。

为了评估模型在测试集上的性能,我们统计了平均精度(mAP)和精确度(Precision)等指标。结果显示,本文模型能够在不到一秒的时间内精确地检测出公路的绿化情况,同时保持高的精度和鲁棒性。实验检测结果如图5所示。

图5 YOLO-IoU目标检测结果

根据提供的训练数据,可以看到模型在每个Epoch 的性能指标。该模型在不同Epoch 下的性能评估部分数据见表2。训练可视化图如图6所示。

表2 前4个和后4个Epoch的训练数据

图6 训练可视化图

根据这些指标,可以看到模型在训练过程中逐渐提高了性能。边界框损失、置信度损失和分类损失在逐渐降低。Precision(精确度)、mAP@0.5(IoU 阈值为0.5 时的平均精度均值)和mAP@0.5∶0.95(IoU 阈值从0.5 到0.95 时的平均精度均值)在逐渐增加。这表明模型在训练过程中学习到了更准确的目标检测能力,并且在不同的IoU 阈值下都有较好的表现。训练到279 个Epoch 值时,mAP@0.5 和mAP@0.5∶0.95 的值分别达到99.48%和92.76%。这表明,本文的YOLOv5s 模型可以非常准确地检测出公路绿化的情况,并且具有很高的鲁棒性。另外,本文模型可以在极短的时间内结束检测任务,因此适用于需要快速响应的实时应用程序。

4 结语

随着深度学习技术的不断进步,人工智能逐渐渗透到各个领域。在智能交通领域中,智能目标检测技术作为人工智能应用的重要组成部分,可以实现公路绿化情况的自动分析和监测,提高公路绿化管理的效率和精度。本文的重点是探索一种轻量型YOLO-IoU 目标检测网络模型,实验结果证明了该网络模型具有准确率高、运算成本低的优点,具有很好的鲁棒性。

猜你喜欢

公路绿化卷积精度
公路绿化环保工程设计与施工管理分析
基于3D-Winograd的快速卷积算法设计及FPGA实现
从滤波器理解卷积
公路绿化生态恢复与绿化养护技术
基于DSPIC33F微处理器的采集精度的提高
基于傅里叶域卷积表示的目标跟踪算法
浅谈公路绿化与环保
GPS/GLONASS/BDS组合PPP精度分析
改进的Goldschmidt双精度浮点除法器
浅谈公路绿化设计的重要性及应遵循的原则