基于数据挖掘和YOLO的道路裂缝检测

2024-12-15李佳霖曹威威

科技风 2024年34期

摘要：道路裂缝检测的及时性对于降低交通事故风险、延长道路使用寿命以及提升运输效率具有至关重要的作用。在当前大数据和人工智能的背景下，本文提出了一种结合数据挖掘和SCDYOLO的道路颠簸异常检测方案，旨在为道路裂缝检测提供一种高效、准确的新方法。该方法显著提升了道路裂缝检测的精准度和效率。通过优化数据清洗方法并引入创新的计算机视觉技术，我们有效降低了时间与计算成本，并增强了模型的通用性和鲁棒性。

关键词：道路裂缝检测；卡尔曼滤波算法；模拟退火算法；SCDYOLO

路面是至关重要的基础设施，而路面裂缝的存在对交通安全存在重大危害。2022年3月，交通运输部、科学技术部联合发布的《“十四五”交通领域科技创新规划》提出要推动智慧交通与智慧城市协同发展，大力发展智慧交通，推动云计算、大数据、物联网、移动互联网、区块链、人工智能等新一代信息技术与交通运输融合，开展智能交通先导应用试点。因此，本研究拟针对智慧交通领域开展研究，符合我国现代信息技术与交通运输管理和服务全面融合战略发展需求，具有重要的理论研究意义与实际应用价值。立足于智慧交通领域，旨在以数据赋能推动智慧交通建设，聚焦于道路颠簸检测，针对以往道路颠簸检测需要耗费大量成本、时间和检测精度有待提升的痛点，提出了一种新的基于数据挖掘和SCDYOLO的道路颠簸异常检测方案。

一、当前面临的问题和解决方案

（一）路面裂缝检测数据量庞大，检测耗费时间成本和计算资源高

路面裂缝检测复杂，涉及大量图像数据的处理。道路网络广泛分布，状况多样，收集和标注的数据集耗时耗力。裂缝类型、尺寸和方向各异，增加数据多样性和复杂性，需更多数据提升模型泛化能力。高分辨率、多角度拍摄进一步增加数据量和处理需求，数据量增大，传统算法尤其是机器视觉方法需要更强的计算资源，导致硬件成本、能源消耗和时间成本上升。

（二）当前的路面裂缝检测算法的精度有待进一步提高

尽管深度学习在图像识别和分割上有所突破，但路面裂缝检测算法的精度仍有待提高。裂缝形态多样，受光照、材料、老化等因素影响，算法难以准确识别和定位所有类型裂缝。此外，背景噪声、路面标记等干扰因素也影响算法性能。

道路裂缝形态各异，背景环境复杂多变，这使得特征提取成为一项具有挑战性的任务。针对道路裂缝特征难以提取的问题，设计全新特征提取模块SWC2f，该模块的设计结合了shiftwiseoperator（SW）。此外，不同型号的道路裂缝图像分辨率各异，导致在同一数据集中裂缝像素的区域大小存在显著差异，这里就需要考虑到特征融合方法。特征金字塔网络（FPN）［1］虽能有效融合多尺度特征以改善目标检测性能，但其局限性在于未将低级定位信息反馈至高级语义特征，且层间特征传递限于相邻层级，导致融合不均衡。为解决此问题，PANet网络通过自底向上路径增强结构融合了浅层与FPN特征。而NASFPN则利用神经网络结构搜索自动优化特征网络设计。

二、数据集

RDD2022是全球首个道路损伤数据集，旨在推动损伤自动检测与分类算法的研发。它涵盖了六国的高质量道路图像，含55000个以上损伤实例，包括纵向、横向裂缝、鳄鱼裂缝和坑洞等。该数据集经过两年迭代，引入多国新数据，采用多种采集方式。为了增强模型的泛化能力，采用了多种数据增强技术来丰富RDD2022数据集，包括调整图像的亮度和饱和度、添加噪声以及进行随机平移。这些操作使得数据集得到有效扩展，样本数量增加至95068个，进一步增强了模型的鲁棒性和适应性。

三、基于移动传感器的数据清洗方法

采用卡尔曼滤波算法降低数据噪声。卡尔曼滤波是一种通过结合传感器测量和预测模型来估算动态系统状态的方法，能降低测量噪声对结果的影响。它通过区分测量噪声和模型误差，并在不同时间更新状态估计值，同时考虑测量误差，从而提高数据的质量和可靠性。基本步骤包括状态预测、协方差预测、测量更新和协方差更新。

模拟退火算法是一种全局优化方法，模拟固体退火过程，通过温度变化规律在复杂搜索空间中寻找最优解。

四、SCDYOLO道路裂缝检测模型

（一）YOLOv8网络介绍

YOLOv8，作为YOLO系列物体检测模型的最新版本，被细分为YOLOv8n、YOLOv8s、YOLOv8m、YOLOv8l和YOLOv8x等不同配置。鉴于模型大小与精度的权衡，本文选用了体积小巧且精度出众的YOLOv8n网络。YOLOv8n模型检测网络的核心结构包括以下四大部分。

Input阶段，采用Mosaic数据增强技术以丰富数据集，但在最后10个epoch时，这一增强技术会被关闭。此外，YOLOv8n采用anchorfree机制，直接预测对象的中心，而非依赖于已知锚框的偏移量，从而减少了锚框预测的数量，并加速了非最大抑制（NMS）过程。Backbone部分，负责从输入图像中提取关键特征图。YOLOv8的主干网络与YOLOv5相似，但关键差异在于使用C2f模块替换了C3模块，这一改进显著降低了模型的复杂度。Neck部分，专注于多特征融合。YOLOv8通过引入PANFPN方法，显著增强了不同尺度特征图之间的融合与利用。Head部分，负责预测目标的位置、类别以及置信度分数等关键信息。

（二）位移感知卷积模块（SWC2f）

在路面裂缝检测中，多样的裂缝形态增加了识别难度［2］。尽管YOLOv8的C2f结构在目标检测中表现出色，但在裂缝检测方面，其有限的感受也难以捕获所有关键特征。为解决这一问题，研究通常采用大卷积核如LKA和SlaK，但这增加了计算负担和内存消耗。基于shiftwiseoperator对C2f结构进行了优化，通过分解大卷积核为多个小卷积核，并利用位移操作，实现了在降低计算资源消耗的同时提高模型对裂缝的感知能力，旨在提升检测的精确度和鲁棒性。

ShiftWiseOperator方法首先指定一个focus长度和focus宽度的矩形区域，然后选择尺寸小于或等于焦距宽度的卷积核，并调整这些卷积组的分布以进行信息融合。focus长度不需要小于当前特征图的大小，其公式如下：

y（p（i，j））=∏f（kw，kh，A）k=0∑Am=0∑An=0w（p（Δm，Δn）+Δp）·x（p（i，j）+p（Δm，Δn）+Δp）

Δm=m-A2；Δn=n-A2

Δp=g（kh，k），（k∈［0，f（kw，kh，A）］）

其中，w表示所有预先确定的非重叠小卷积；A表示小卷积核的大小；kw和kh分别表示focus长度和focus宽度；f（kw，kh，A）表示与（kw，kh，A）相关的函数。相应地，权重和特征偏移量Δp是与（kh，k）相关的函数，将这个函数表示为g。

（三）跨尺度注意力融合模块（CCAFM）

针对背景复杂、噪声多的道路裂缝图像，采用了通道融合变形卷积注意力机制，以提升模型对狭长裂缝的特征识别能力。该机制结合通道融合和形变卷积，克服了传统CAM注意力机制在局部细节和多尺度特征交互上的不足，通过增强特征图交互和空间信息捕获，提高了模型在道路裂缝检测的准确性和泛化性［3］。

假设输入特征图为x∈瘙綆

C×H×W，其中C表示通道数，H和W分别表示高度和宽度：

k=Conv（x）⊙σx+IConvPool（x）CW=ChannelAttention（out）

out=k⊙CW+DC（k）⊙（1-CW）

这个模块的前向传播过程可以描述为对输入特征图x进行卷积操作得到特征图Conv（x），然后应用形变卷积操作DC提取特征。同时，对经过平均池化和卷积操作得到的特征图ConvPool（x）进行Interpolation插值操作调整尺寸与输入特征图相同，然后通过通道注意力模块ChannelAttention计算通道权重。最终将通道注意力模块的输出与插值后的特征图相加，并经过Sigmoid激活函数σ处理，得到最终输出。将CFD注意力机制融入CCFM结构中，能够有效提升特征的提取精度，并实现特征间的协同融合。

（四）动态检测头（Dyhead）

道路裂缝具有尺度和形态的多样性，以及多变的旋转角度和位置。为了有效检测，本研究采用了DynamicHead技术，它结合了尺度、空间和任务三种注意力机制，提高了对裂缝的精确检测能力，并增强了模型在复杂场景中的目标识别和理解。

给定特征张量F∈RL×S×C，自注意力的表达式就是：

W（F）=π（F）·F

其中π（·）是注意力函数。一个简单的实现方法就是用全连接层来实现该注意力函数。但直接在所有的维度上学习该注意力函数是非常消耗算力的，由于张量的维度很高，这不太现实。于是将该注意力函数转化为三个连续的注意力，每个只关注于一个角度：

W（F）=πC（πS（πL（F）·F）·F）eq4·F

其中πL（·），πS（·），πC（·）分别是三个不同的注意力函数，应用在L、S、C三个维度上。

1.尺度自适应注意力（ScaleAdaptiveAttention）

为了有效应对不同尺度的对象，研究设计了一种尺度自适应注意力模块。该模块通过学习特征层之间的相对重要性，能够动态地调整特征表示，从而实现对不同尺度对象的灵活适应。这一设计有助于提高模型的尺度不变性，进一步提升其在处理多尺度目标时的性能。数学上，这可以通过以下公式表示：

πL（F）·F=σ（f（F））·F

其中，F是输入的特征张量；f（·）是一个线性函数通过1×1卷积层近似；σ（x）是sigmoid激活数。

2.空间一致性注意力（SpatialCoherenceAttention）

本研究引入空间一致性注意力模块，通过可变形卷积和跨层级特征汇聚，增强模型对对象空间连贯性的理解，提升任务表现。其公式可以表示为：

πS（F）·F=1L∑Ll=1∑Kk=1wl，k·F（l；pk+Δpk；c）·Δmk

其中，L是特征层的数量；K是稀疏采样位置的数量；+Δpk是通过自学习的空间偏移量；mk是在位置k的自学习重要性标量。

3.任务导向注意力（TaskOrientedAttention）

本研究开发了任务导向注意力模块［4］，它能动态调整特征通道，按需激活或抑制通道以优化分类和边界框回归等任务，提升了模型在多样检测任务中的适应性和表现。其公式如下：

πC（F）·F=maxα1（F）·Fc+β1（F），α2（F）·Fc+β2（F）

其中，Fc是第c个通道的特征切片；α1、α2、β1、β2是通过全局平均池化和全连接层学习的超函数，用于控制激活阈值。

最后，由于上述三个注意力机制是按照一定顺序进行应用的，研究采用了串联嵌套方式，并通过对串联数量的调整实现了最佳效果。

结语

我们提出一种结合移动传感器的道路裂缝检测，这一创新方法显著降低了所需的计算资源和时间成本。通过应用卡尔曼滤波算法去除数据噪声，并结合启发式算法来精确识别路面的颠簸点，我们能够准确地定位道路裂缝。

此外，我们引入了SCDYOLO，这是一种新型的计算机视觉方法，专门为提高道路裂缝检测的精确度而设计。SCDYOLO模型采用了独特的架构，集成了SWC2f特征提取模块、CCAFM特征融合机制和Dyhead检测头，这些均构建在YOLOv8n的基础之上。SWC2f模块扩展了模型的感受，提升了特征提取效率；CCAFM机制优化了特征融合过程，增强了模型的表征能力；而Dyhead的集成则强化了检测头，确保了结果的准确性和稳定性。这些创新使得SCDYOLO在平均精度均值（mAP）上比基准模型提高了4.1%，并在性能上超越了当前主流的目标检测算法。

参考文献：

［1］李朝勇，张成，韦海丹.基于多尺度特征融合网络的路面裂缝分割方法研究［J］.时空信息学报，2023，30（03）：425430.

［2］刘毅，陈一丹，高琳，等.基于多尺度特征融合的轻量化道路提取模型［J］.浙江大学学报（工学版），2024，58（05）：951959.

［3］王恒涛，张上，张朝阳，等.基于YOLOv5的轻量化PCB缺陷检测［J］.无线电工程，2022，52（11）：20942100.

［4］罗禹杰，张剑，陈亮，等.基于自适应空间特征融合的轻量化目标检测算法［J］.激光与光电子学进展，2022，59（04）：302312.

基金项目：2020年海南省哲学社会科学规划课题资助“海南省海洋渔业生态经济系统脆弱性及发展效率研究”［HNSK（QN）2012］

作者简介：李佳霖（1988—），女，汉族，硕士研究生，博士在读，讲师，研究方向：应用数学；曹威威（1985—），男，汉族，博士，副教授，研究方向：自然地理学。

基于数据挖掘和YOLO的道路裂缝检测

杂志排行

科技风的其它文章