APP下载

改进YOLOv8的道路损伤检测算法

2023-12-11井方科

计算机工程与应用 2023年23期
关键词:卷积精度道路

李 松,史 涛,井方科

1.华北理工大学 电气工程学院,河北 唐山 063210

2.天津理工大学 电气工程与自动化学院,天津 300384

道路网络是经济的支柱,交通系统和交通运输系统能够满足人们的出行需求、商业和工业的发展。但这些公路面临着来自人口增长、基础设施恶化和道路建设成本迅速上升的挑战。要保持国家的经济发展势头,就需要显著改善交通基础设施。路面裂缝是路面常见病害,严重影响道路安全和行车安全,保持高质量的路面是维护道路安全的关键之一。道路损伤的及时检测对预防道路损伤、维护交通道路安全具有重要意义。

道路损伤目标检测技术主要分为传统的目标检测算法和基于深度学习的目标检测算法。传统的裂缝检测方法大多是基于人工检测或提取特征识别路面病害的图像分割技术,例如,初秀民等[1]利用路面破损图像二值化方法设计基于阈值的裂缝分割技术,韩锟等[2]提出了一种基于区域生长的特征的路面裂缝检测方法。然而,这些方法都严重依赖于人工特征提取,在复杂多变的道路环境中由于难以使用统一的特征模型来有效提取特征裂缝,导致检测鲁棒性较差。近年来,随着深度学习技术的快速发展,目标检测技术也取得了显著的成就。目标检测技术主要分为单阶段算法和两阶段算法。常用的两阶段算法包括R-CNN、Fast R-CNN、Faster R-CNN、U-net 等。Kang 等[3]使用更快的区域卷积神经网络(Faster R-CNN)算法的集成来检测裂纹区域。Yamaguchi 等[4]使用U-Net 与数据增强和形态变换相结合,通过激光雷达开发一种完全自动、准确和定量评估道路裂缝的方法。另一类是单阶段检测方法,直接分离特定的类别并回归边界。常用的单阶段目标检测算法[5]包括You Only Look Once系列和Single Shot MultiBox Detector(SSD)等。两阶段算法相比单阶段算法在检测精度上有一定优势,但是检测速度远低于单阶段算法。因此,在道路损伤检测中单阶段算法更受关注。黄凯枫等[6]在SSD 网络结构的基础上将其基础网络替换为Dense-net网络,使得特征信息更加容易被获取,并降低网络参数数量,有效的提升病害识别的准确性。安学刚等[7]基于YOLOv4,通过引入自适应空间特征融合,改进Focal Loss损失函数等方法进行训练,从而提高了路面病害的检测精度。Yu 等[8]提出了基于YOLOv5 的道路裂缝检测算法,并进行了轻量化改进,大幅度缩减了模型参数体量,提升了检测速度到85 FPS。倪昌双等[9]基于YOLOv7改进沥青路面病害检测算法,使用K-means++聚类算法和漏斗激活函数F-ReLU改善了传统卷积网络对沥青路面病害检测时存在的检测精度低、定位不准等问题。

单阶段目标检测算法YOLO自面世以来,就受到业界学者的广泛关注,近年来,YOLO算法不断优化、更新版本,Ultralytics团队在2023年提出了YOLOv8版本,算法在满足实时性的同时,还具备了较高的检测精度和较为轻量化的网络结构,适合运用于对道路裂缝中目标的检测进行针对性改进。因此,本文基于YOLOv8n 对模型进行优化,提高模型的精度,首次提出了一种基于YOLOv8n的道路损伤检测算法YOLOv8-RD,本文的主要贡献如下:

(1)引入Bottleneck Transformer[10],针对道路损伤图像可以更好地捕获远程依赖,获取更多全局信息。

(2)添加坐标注意力(coordinate-attention,CA)[11]模块,增强相关特征的提取,提高算法的检测精度。

(3)在YOLOv8 颈部网络中,增加了C2fGhost[12]模块,实现模型压缩,保持检测精度的同时减少模型参数,加快特征融合。

1 相关原理

1.1 YOLOv8算法介绍

You Only Look Once(YOLO)算法,将图像分割成多个网格,预测每个网格内的边界框和其所包含的物体类别,并使用非极大值抑制(NMS)算法消除重叠的边界框。YOLOv1[13]的检测速度相对较快,但对于彼此距离较近的物体和较小的目标,YOLOv1的检测速度并不有效。YOLOv2[14]算法采用Darknet19 作为特征提取网络,能够适应不同尺寸的图像,提高对小目标检测精度。YOLOv3[15]增加了特征金字塔(FPN)和空间池化金字塔(SPP)模块,以提高检测不同尺度和语义信息的能力。YOLOv4[16]引入Mish 激活函数,提高准确率。YOLOv5[17]引入C3 模块和SPPF 模块,改善特征扰动,提高检测能力。YOLOv7[18]引进了可扩展的高效层聚合网络E-ELAN、创新的过渡模块和重参数化结构等策略,增强特征提取和语义信息表达的能力,进一步优化目标检测效果。

YOLO算法作为经典的单阶段检测算法之一,已经升级到YOLOv8。本文提出了一种YOLOv8n的改进方法,不仅提高了检测精度,而且实现了计算量、参数量和模型尺寸最小化。图1 以YOLOv8n 为代表的结构为例,对网络的各个组成部分进行了描述。骨干网由CBS模块、C2f 模块和SPPF 模块组成,使用的依旧是CSP 的思想,不过骨干网络颈部网络参考了YOLOv7的ELAN结构设计思想,将YOLOv5 中的C3 模块替换成了梯度流更丰富的C2f 结构,C2f 结构可以增强卷积神经网络的特征融合能力,提高推理速度,实现了进一步的轻量化,同时YOLOv8 依旧使用了YOLOv5 架构中使用的SPPF 模块,SPPF 模块是一个空间金字塔池化层,可以扩展接受域,实现局部和全局特征融合,丰富特征信息。Head部分相比YOLOv5 改动较大,换成了目前主流的解耦头结构,将分类和检测头分离,YOLOv8 改变了以往的Anchor-Base,使用了Anchor-Free 的思想;在损失函数上,YOLOv8 使用BCE Loss 作为分类损失,使用DFL Loss+CIOU Loss 作为回归损失,在样本匹配方面,YOLOv8 改变了以往的IOU 匹配或者单边比例的分配方式,而是使用了Task-Aligned Assigner匹配方式。

图1 YOLOv8n网络结构Fig.1 YOLOv8n network architecture

1.2 算法存在的问题

将YOLO 算法应用于道路损伤检测任务时,需要考虑移动设备有限的硬件性能。不能简单地选择YOLOv8x 算法。该方法检测效果最好,但对道路损伤检测任务实时性要求较高。因此,本文选取了YOLOv8n算法的最小权值模型,但是在实际的检测过程中,YOLOv8n算法存在一些问题。首先,YOLOv8n算法使用了大量的标准卷积和C2f 模块,提高了算法的准确性,但降低了运行速度,增加了模型的参数。其次,场景在移动检测中变化很快,需要足够的检测精度。但YOLOv8n 算法对于道路损伤的检测处理并不理想,容易出现误检和漏检的问题。

2 算法改进

为了改进道路损伤检测的精度,提出了一种改进YOLOv8n 的检测网络模型YOLOv8-RD。图2 为改进后的YOLOv8n结构示意图,在YOLOv8n骨干网的SPPF模块之后嵌入结合CNN 与Transformer 优势的BOT 模块。YOLOv8n的颈部网络采用了C2f Ghost模块,并且在YOLOv8n 骨干的末尾和颈部的C2f Ghost 后面嵌入CA 模块。BOT 模块增强了特征信息处理能力。CA 模块的目的是通过突出道路损伤检测的关键信息来增强网络的特征提取能力,从而提高在多场景下的准确率。C2fGhost 模块的目的是进一步减少模型的参数和计算量。

图2 YOLOv8-RD网络结构Fig.2 YOLOv8-RD network architecture

2.1 BOT模块

CNN 的优点是参数共享和高效的局部信息聚合,但裂缝检测任务的目标通常是长而窄的,其长度远大于宽度,在空间上呈现出细长的形状,这种结构特征使得裂缝检测任务需要更长的依赖关系来获取上下文信息。为了集成全局信息,基于CNN 的模型需要叠加更多层3×3卷积,尽管堆叠更多层确实提高了这些主干的性能,但基于CNN的模型不易获取全局信息,更关注局部信息的聚合,在特征提取时容易丢失部分特征,导致检测精度下降,而Transformer 可以捕获长距离依赖关系,更加注重全局信息。Vision Transformer(ViT)[19]是谷歌在2020年提出的直接将Transformer应用在图像分类的模型,在ImageNet1K上能够达到88.55%的准确率,此后很多优秀算法都将CNN 和Transformer 结合起来,让网络继承CNN 和Transformer 的优势,无需那么多卷积层也能保留全局特征和局部特征。

BoTNet网络是伯克利和谷歌的研究人员对卷积网络和Transformer 结合的探索。它使用一种混合的方法,基于Transformer 的模型具有固有的全局信息获取能力,在视觉任务中使用Transformer 中的多头自注意(MHSA)层替换空间卷积层,同时利用CNN 的特征提取能力获得了比单独CNN 或Transformer 更好的性能,在ImageNet 中准确率为84.7%。CNN 和Transformer 的结合,达到了优势互补的效果。图3显示了多头自注意层(MHSA),MHSA的具体实现可以类似于Transformer block或非局部块(non-local block)。BoTNet中用MHSA块代替了标准的3×3卷积模块CBS。BoTNet(bottleneck Transformer)的结构如图4所示。

图3 多头自注意层(MHSA)Fig.3 Multi-head self attention layer(MHSA)

图4 BoTNet结构Fig.4 BoTNet structure

目前大多数道路损伤检测的深度学习检测方法都是使用交替卷积层和池化层来实现的。卷积运算擅长于提取局部细节,但在大规模道路损伤检测任务中,卷积层难以掌握道路损伤的全局信息。相比之下,Transformer的自我注意能力擅长于掌握全局信息,但需要大量的数据进行训练。本文利用BoTNet 网络框架与C2f结构结合,提出的BOT 模块如图5 所示,它仅在主干末尾结构使用,实现仅以微弱的计算量提升提高了检测的准确率。将CNN 和Transformer 的优势相结合,取长补短,实现了充分提取全局和局部特征,提高了模型检测精度。

图5 BOT模块Fig.5 BOT module

2.2 CA模块

由于道路损伤所处的环境复杂多变,为了提高模型对道路损伤的特征表达能力,在YOLOv8骨干网末端和颈部每两次特征融合之间增加了注意力机制进行局部特征增强,使网络忽略无关信息干扰,使融合后的特征图包含更多有效信息。注意机制一般可分为通道注意机制、空间注意机制和两者的结合。传统的注意机制squeeze and inspire attention(SE)和convolutional block attention module(CBAM)等存在很多不足,SE 注意力中只关注构建通道之间的相互依赖关系,忽略了空间特征。CBAM中引入了大尺度的卷积核提取空间特征,但忽略了长程依赖问题。虽然没有这个问题的其他注意模块也有很好的效果,但参数量太多,不适合应用程序部署。

CA 模块是针对通道注意提出的一种新的注意模块,坐标注意机制不仅能捕获跨通道信息,还能捕获定向感知和位置感知,有助于模型更准确地定位和识别感兴趣的目标。CA 模块非常灵活,可以添加到现有模型的多个位置,且不会带来过多的参数量和计算量。其结构如图6 所示,输入水平和垂直地汇集在一起,以保持两个方向的长距离依赖关系。然后缝合两个方向的信息。接下来,对特征图进行分割和卷积,以同时关注水平和垂直方向。模块输出的两部分特征图可以精确指向感兴趣目标对象的行和列。

图6 CA模块Fig.6 CA module

2.3 C2fGhost模块

在标准卷积中,许多特征通道的特征映射非常相似。从标准卷积中提取的特征在一定程度上是重复的。因此,不需要进行完整的卷积运算来获得所需的feature map。Ghost 模块(见图7)使用标准卷积获得部分特征图,然后通过线性运算生成更多的特征图。最后,将两组特征映射拼接到指定的维数上,以较少的参数和计算量获得更多的特征映射。

图7 Ghost模块Fig.7 Ghost module

在任何卷积层中生成n个特征图的操作可以表示为:

其中,X∈Rc×h×w表示卷积的输入,c表示输入通道数,h和w分别表示输入feature map 的高度和宽度,Y ∈Rh′×w′×n是有n个通道的输出feature map,h′和w′是输出feature map 的高度和宽度,f∈Rc×k×k×n是这一层的卷积滤波器,它的核大小是g·g,b是偏置项。在这个卷积中,计算的结果为:

使用Ghost模块的计算量为:

Ghost模块改进的标准卷积的计算量为:

因此,Ghost模块的计算量约为标准卷积的1/s。

在主流的深度神经网络中,提取的特征图包含了丰富甚至冗余的信息,这有助于对输入数据进行全面的理解。深度神经网络中存在冗余特征映射的情况,而Ghost 模块以一种低成本高效益的方式改进了这个问题,首先生成一些内在的特征映射,然后利用线性操作来增强特征图,增加信道。这种方法既减少了模型体积,又能充分揭示内在特征背后的信息。

图8 中的Ghost Bottleneck 由两个Ghost 模块堆叠而成,用于网络中的特征映射处理。第一个Ghost 模块作为扩展层,用于增加通道数目,第二个Ghost模块用于减少通道数目,使其与输入通道数匹配,并实现shortcut功能。

图8 Ghost Bottleneck模块Fig.8 Ghost Bottleneck module

新的C2fGhost 如图9 所示,使用Ghost Bottleneck替换网络中C2f 模块中的Bottleneck 模块,使模型拥有足够的信息来理解输入数据。这种改进在不增加网络参数的情况下减小了模型的总体尺寸,同时提升了对冗余信息的理解速度。在实现网络轻量化的同时保证网络的检测精度。

图9 C2fGhost模块Fig.9 C2fGhost module

3 实验与结果

3.1 数据集

RDD 2022[20]:本文使用开源的RDD 2022 数据集实现模型的训练。RDD 2022由东京大学发布,其中包括来自日本、印度、捷克共和国、挪威、美国和中国6 个国家的47 420 幅道路图像。这些图像已经标注了55 000 多起道路损坏事件。数据集中捕捉到4 种类型的道路损坏,即D00(纵向裂缝)、D10(横向裂缝)、D20(网状裂缝)和D40(坑洞)。带注释的数据集旨在开发基于深度学习的方法,以自动检测和分类道路损坏。该数据集已作为基于人群感应的道路损坏检测挑战赛(CRDDC’2022)的一部分发布。由于挪威的图像尺寸过大,与其他国家相差过多,难以用于训练。因此在RDD 2022 数据集其他国家中随机选取10 000 张照片作为数据集。选择了8 000张照片进行训练,2 000张照片进行验证。训练集、验证集的比值为8∶2。

知识经济时代强调创新精神,突出创新人才的培养,要求建立系统性、开放性、创新性的高校教育管理体系。校友无疑是这一工作中的重要力量。校友与母校、与在校生之间结成的天然感情纽带,是高校不同于其他地方的独特魅力所在。在沈阳化工大学实施“113”人才培养战略中,特别是合作化育人环节中,校友能很好的平衡高校教育中知识、能力和实践的关系,是完善人才培养不可或缺的一环。校友在招生、就业以及品牌影响等诸多方面也起到了重要的作用。

3.2 实验设备及评价指标

本模型的开发语言主要是Python,使用开源深度学习框架PyTorch 作为网络框架,采用CUDA11.3 对训练进行加速。本模型的硬件测试环境CPU 选用Intel®Xeon®Platinum 8255C CPU@2.50 GHz,GPU选用NVIDIA的RTX 3080,10 GB显存。

训练时,将输入图像设置为640×640,使用SGD 作为优化函数对模型进行训练。模型训练周期(epoch)为300,批量大小为32,初始学习速率为0.01。本实验采用与原YOLOv8算法相同的数据增强算法。

本文使用的评价指标有F1 分数、mean average precision(mAP)、number of parameters(Params)、Giga浮点运算每秒(GFLOPs)、frames per second(FPS)。其中,以正确率和查全率作为基本指标,以根据正确率和查全率计算的F1 分数和mAP 作为最终评价指标,衡量模型的识别正确率。GFLOPs 用于度量模型或算法的复杂性,而Params 表示模型的大小。通常,Params 和GFLOPs 越小,表示模型所需的计算能力就越小,对硬件的性能要求就越低,在低端设备中构建就越容易。FPS是指每秒检测到的帧数,其大小不仅与算法的权重有关,还与实验设备的硬件配置有关。

精确率为所有预测为正样本的结果中,预测正确的比率。定义如下:

召回率是根据正确预测的所有目标的比例来计算的。定义如下:

其中,TP表示检测结果中正确目标的个数,FP表示检测结果中错误目标的个数,FN表示正确目标中缺失目标的个数。

n个类别的平均准确率计算公式如下:

F1-score 综合考虑了准确率和召回率,较全面地反映网络的整体性能。取两个指标的谐波平均值计算,如式(9)所示:

采用模型参数量(Params)和计算量(GFLOPs)度量模型复杂度,采用帧数每秒(FPS)度量推理速度。FPS是指每秒检测到的帧数,其大小不仅与算法的权重有关,还与实验设备的硬件配置有关。

3.3 不同注意力机制对网络性能的影响

实验还使用了其他一些注意力机制模块,如SE 注意力模块和CBAM注意力模块。实验结果如表1所示。

表1 多种注意力机制对比结果Table 1 Comparison results of multiple attention mechanisms

从表1中可以看出,相比于其他被研究的注意机制模块,如SE 和CBAM 模块,CA 模块的加入大大提高了网络的检测精度。

3.4 C2fGhost模块对网络性能的影响

为了验证在不同位置引入C2fGhost 模块与网络性能的关系,设计如表2 所示消融实验。Ghost-all 表示将骨干网络和颈部网络中的所有C2f模块替换为C2fGhost模块。Ghost-backbone 是指骨干网中的C2f 模块被C2fGhost 模块替代,而颈部网络保持不变。Ghost-neck表示颈部网络中的C2f模块被C2fGhost模块替换,骨干网中的C2f模块保持不变。在YOLOv8n骨干网中引入Ghost模块,这些改进降低了模型的计算成本,但模型的整体性能低于基准模型。原因是改进后的模型参数减少,导致骨干网特征提取性能不足,导致模型精度下降。将Ghost 模块引入到YOLOv8n 的颈部网络中,改进后的算法在检测精度没有显著变化。这是因为骨干的特征提取性能没有发生变化,而颈部网络中的Ghost模块允许特征层有足够的信息来维持对输入数据的理解。这种改进在不增加网络参数的情况下减小了模型的总体尺寸,使得网络对冗余信息的理解速度越来越快。实验结果表明用颈部网络中的C2fGhost 模块替代C2f可以获得最佳性能。

表2 C2fGhost不同位置对比结果Table 2 Comparison results of different positions of C2fGhost

3.5 消融实验对比

为了验证本文改进算法的准确性,需要通过建立YOLOv8n、YOLOv8n-B、YOLOv8n-C、YOLOv8n-G、YOLOv8n-BC、YOLOv8n-BG、YOLOv8n-CG、YOLOv8-RD几个模型进行实验。其中,YOLOv8n-B是在YOLOv8n骨干网的SPPF模块之后嵌入BOT模块。YOLOv8n-C是在YOLOv8n 骨干的末尾和颈部的C2f 后面嵌入CA 模块来实现的。YOLOv8n-G是将YOL-Ov8n的颈部网络的C2f 模块引入Ghost 结构。YOLOv8-RD 是本文提出的算法。

如表3所示,改进算法采用了更高效的网络结构对YOLOv8n的网络结构进行了改进,提高了精度,降低了模型的参数量和计算量。同时也证明了C2fGhost 模块并没有降低算法的精度,反而降低了模型的参数量和计算量。引入BOT 结构和CA 注意力机制仅提高了少量参数,有效地提高了检测精度。将上述改进与YOLOv8n算法相结合,可以使模型体积最小化,模型参数量仅为2.8×106,计算量仅为7.3×109,分别降低了6.7%和8.5%,有效地降低模型在移动终端部署难度与成本,并且使得算法在满足实时性的同时精度有了较大提升。

表3 消融实验结果Table 3 Results of ablation experiment

3.6 实际应用检测评价

RDD2022 数据集中捕捉到四种类型的道路损坏,即D00(纵向裂缝)、D10(横向裂缝)、D20(网状裂缝)和D40(坑洞)。图10显示了YOLOv8-RD算法在RDD2022数据集上的检测效果,改进后的算法相比原算法识别出来更多的裂缝目标,第一张图中D20目标原算法检测不完整,改进后算法的检测更精准;第二张图中改进算法比原算法检测出更多的D10目标;第三张图两种算法均识别出了D40坑洞目标,但改进算法额外检测出了D20网状裂缝;第四张图原算法错误地检测出了D10 目标,但改进算法没有出现失误。结果表明,改进的YOLOv8-RD 算法能够有效地检测出道路损伤目标,并且准确地识别它们的位置和类别,表现出较强的鲁棒性和准确性。

图10 检测效果Fig.10 Detection effect

为了进一步验证模型对不同目标的检测效果,表4展示了YOLOv8n 和改进模型YOLOv8-RD 在不同损坏情况下的性能。数据显示,YOLOv8-RD 在4 个类别上的检测精度均高于YOLOv8n,其中类别D20(网状裂缝)的检测效果提升最为明显。与YOLOv8n 相比,mAP50和mAP50-90分别提升了3.8和2.3个百分点。需要注意的是,在所有道路裂缝目标中,D40(坑洞)的检测精度最低,这是因为D40 目标较小且训练样本数量较少,模型难以学习到更多的特征。

表4 RDD2022数据集各类型损伤的检测结果对比Table 4 Comparison of detection results for various types of damage in RDD2022 dataset 单位:%

为了评估本文所提出的YOLOv8-RD 在实际应用中的性能,还针对Road Damage 数据集进行了训练和测试,同时也使用了原始的YOLOv8n 模型作为对比。Road Damage 数据集由3 321 张实际道路损伤图像组成,这些图像均是使用智能手机相机拍摄的,尺寸约为1080P。与之前的实验设计类似,将道路损伤目标分为4 种分类:D00(纵向裂缝)、D10(横向裂缝)、D20(网状裂缝)和D40(坑洞),同时训练集和验证集的比例为8∶2。如表5 所示,YOLOv8-RD 在4 个类别上的检测精度明显优于YOLOv8n。具体来说,在mAP50 方面,横向裂缝(D10)的检测效果提升最为明显,增加了6 个百分点;而在mAP50-95 方面,网状裂缝(D20)的检测效果提升最明显,增加了3.2 个百分点。此外,对于四种类型目标的整体检测效果,相较于YOLOv8n,YOLOv8-RD 也有了显著提升,mAP50 和mAP50-90 分别提高了3.7 和2.9 个百分点。这些实验结果验证了YOLOv8-RD 模型在常规道路损伤目标检测方面的显著能力提升。

3.7 与不同算法的检测结果的比较

为了进一步验证算法的性能,本研究使用RDD 数据集比较了YOLOv8-RD 和其他主流目标检测算法的表现,结果如表6 所示。与两阶段算法Faster-RCNN、Cascade-RCNN 和单阶段算法Efficientnet、CenterNet 相比较,YOLOv8-RD 在mAP50 指标上分别提高了9.9、6.3、2.1和10.1个百分点,在mAP50-95指标上分别提高了8.4、5.9、2.7 和9.4 个百分点,FPS 也有显著的提升。与最新的实时目标检测算法RT-DETR 相比,YOLOv8-RD的F1和mAP50几乎没有下降,但其参数量和计算量仅为RT-DETR 的8.5%和6.8%,并且mAP50-95 和FPS均有显著提升。

表6 不同算法对比结果Table 6 Comparison results of different algorithms

另外,为了验证算法在YOLO 系列中的检测性能,将YOLOv8-RD与YOLOv3tiny、YOLOv4tiny、YOLOv5s、YOLOv6n、YOLOv7tiny、YOLOv8n 等YOLO 系列轻量级网络进行比较,从表6 中可以看出,与这些轻量级网络相比,YOLOv8-RD在保证运行速度的前提下,不同程度地降低了计算量和参数量,且mAP50 分别提高了10.1、15.6、10.5、4.9、3.2和2.0个百分点,mAP50-95分别提高了8.2、13.1、5.4、3.9、5.3 和1.3 个百分点。并且在YOLOv7tiny 的基础上,以YOLOv8-RD 同样的改进方法设计了YOLOv7-RD,相较于YOLOv7tiny,检测精度有所提升。然而,相比之下,在YOLOv8n 上的改进效果要明显优于在YOLOv7tiny 上的改进。原因在于YOLOv8具有更好的可扩展性,容易通过改进来提升性能,而YOLOv7 受到模型结构和超参数的限制,因此改进效果不太显著。

实验结果表明,与其他主流目标检测算法比较,YOLOv8-RD算法以最小的模型体积实现了极高的检测精度,使用成本更低、检测效率更高、部署更加简单,具有高效性和优越性。

4 结语

本文提出了一种改进YOLOv8n的道路损伤检测算法,解决了传统的YOLOv8n 应用于目标检测的难题。提出BOT结构全面提取道路损伤图像的全局特征信息和局部特征信息,提高道路裂缝检测精度。CA 注意力机制可以明显提高模型的检测精度,而只增加少量的计算量。在YOLOv8n 网络中引入了C2f Ghost 模块,大大压缩了模型参数量,保持了检测精度和速度。与其他算法相比具有相当或更好的检测性能。

实验表明,YOLOv8-RD具有参数量更少、计算量更低、检测精度更高等优点,满足实时性要求。与现有模型相比,该方法具有较高的检测精度的同时降低了对平台计算和储存能力的要求,易于部署在资源受限的设备上。未来的研究重点是将改进的模型部署到资源受限的嵌入式检测设备上,在实际应用中完善所提出的算法。

猜你喜欢

卷积精度道路
坚持中国道路——方向决定道路,道路决定命运
道听途说
基于3D-Winograd的快速卷积算法设计及FPGA实现
我们的道路更宽广
从滤波器理解卷积
基于DSPIC33F微处理器的采集精度的提高
基于傅里叶域卷积表示的目标跟踪算法
GPS/GLONASS/BDS组合PPP精度分析
一次骑行带来的感悟
改进的Goldschmidt双精度浮点除法器