YOLOv8-VSC：一种轻量级的带钢表面缺陷检测算法

2024-01-11王春梅

计算机与生活 2024年1期

王春梅，刘欢+

1.西安邮电大学计算机学院，西安 710121

2.西安邮电大学陕西省网络数据分析与智能处理重点实验室，西安 710121

近年来，随着人工智能技术的发展，缺陷检测系统在工业生产中的应用越来越广泛[1-4]。在带钢生产过程中，表面缺陷检测是非常重要的一项工作，使用基于深度学习的目标检测技术对带钢表面缺陷进行检测变得可行。然而，用于训练和测试的深度学习模型所需的计算资源较为庞大，进行缺陷检测的终端设备计算能力有限，给带钢表面缺陷检测领域的实际应用带来了一定的困难和挑战。因此，如何在保证检测精度的前提下，尽可能地减少深度学习模型的复杂度和计算量，是该领域需要解决的重要问题之一。

目前主流的目标检测算法有两阶段的RCNN（region-based convolutional neural network）[5]、Fast RCNN[6]、Faster RCNN[7-9]、Mask RCNN[10]算法，一阶段的SSD（single shot multibox detector）[11]、YOLO（you only look once）[12]算法，以及基于Transformer 的目标检测算法DETR（detection transformer）[13]。两阶段目标检测算法是先产生候选框，对候选框中的内容进行特征提取，再对区域内容进行目标回归，通常这类算法具有较高的检测精度，但由于要先进行候选框的筛选，损失了一部分的检测速度。单阶段目标检测算法是基于回归的算法，将定位与分类任务合并，获得了更快的检测速度，在实时检测方面有着巨大的优势。基于Transformer 的目标检测算法DETR 将目标检测问题转化为一个对象查询问题，可以一次性检测整张图像中的所有目标，避免了传统目标检测方法中需要使用滑动窗口等方式进行多次检测的问题，提高了检测速度，而且DETR的可扩展性较强，可以很容易地扩展到新的目标检测任务中。然而，在带钢表面缺陷检测领域，这些基于深度学习的目标检测模型受到终端检测设备计算能力的限制，在模型部署上仍然面临着巨大的挑战，如何对计算量庞大的目标检测模型进行轻量化处理，使其可以部署在计算资源有限的设备上，是当前带钢表面缺陷检测领域研究的一个热点问题。

为解决主流的目标检测模型在计算资源有限的终端检测设备上的部署问题，蔡剑锋等人[14]将MobileNet 引入Mask RCNN 目标检测框架中，将MobileNet 作为骨干特征提取网络，有效地降低模型的参数量和计算量。Zhou等人[15]提出YOLOv5s-GCE轻量级带钢表面缺陷检测模型，引入了Ghost 模块和CA（coordinate attention）注意力机制，在不影响检测精度的情况下减小了模型的体积和计算量。Yang 等人[16]提出改进的CBAM-MobilenetV2-YOLOv5 模型，同时引入了MobilenetV2 模块和CBAM（convolutional block attention module）注意力模块，得到更加轻量的带钢表面缺陷检测模型。随后，张政超[17]对YOLOv5 进行了改进，使用了更加轻量的Shuffle Netv2 作为骨干网络，降低了模型的复杂度，在检测速度方面具有一定的优势。Qin 等人[18]提出EDDNet轻量级带钢表面缺陷检测算法，引入EfficientNet 作为骨干特征提取网络，有效减少了计算开销。近年来，阎馨等人[19]提出的改进的SSD 算法引入了Involution 算子和Transformer 多头注意力模块，在提升模型检测精度的同时降低了计算资源的使用。卢俊哲等人[20]提出一种轻量级带钢表面缺陷检测算法DCNYOLO（deformable convolutional network-YOLO），该算法引入了轻量级卷积块DSConv 和ECA（efficient channel attention）注意力模块，在不影响检测精度的情况下得到更加轻量的模型。Wang等人[21]提出一种基于多分支扩张卷积聚合和多域感知检测头的轻量级带钢表面缺陷检测模型DAssd-Net，有效降低了模型体积，并且在一定程度上提升了模型的检测精度。周颖等人[22]提出的光伏电池缺陷检测方法YOLOv8-EL，使用GauGAN 进行数据增强解决了数据集中各类缺陷不平衡问题，在骨干网络和特征提取网络中引入上下文聚合模块（context aggregation module，CAM）来抑制背景噪声，最后构建多注意力检测头（multi-attention detection head，MADH）有效提升了检测精度。Phan 等人[23]提出一种检测光伏电池故障的新方法，在YOLOv8 中引入了粒子群优化算法来优化模型参数，使模型达到最佳的检测精度。以上研究对计算量庞大的目标检测模型做了一定的轻量化处理，有一定的启发意义。然而，在带钢表面缺陷检测领域，终端检测设备的计算能力往往只有几个GFLOPs 级别，且内存小于8 GB，而主流的目标检测模型如YOLO 系列的计算量高达40～150 GFLOPs，预测一张1 024×1 024 的图像需要占用约16 GB 的内存，这样的计算需求已经超过了终端检测设备的处理能力，在不增加计算资源的情况下终端检测设备无法保障计算量庞大的目标检测模型稳定运行。此外，还需要更高的检测精度来满足实际的生产需求。

基于上述研究存在的局限性，本文以YOLOv8n为基线提出一种轻量化的带钢表面缺陷检测模型YOLOv8-VSC，该模型引入轻量级网络VanillaNet[24]作为骨干特征提取网络，有效降低了模型的复杂度，同时在骨干特征提取网络中引入SPD（space-todepth）[25]模块，加快模型的推理速度，提升模型性能。此外，在特征融合网络中引入轻量级的上采样算子CARAFE（content-aware reassembly of features）[26]，提高输出特征的质量和丰富度，从而提升检测精度。综上所述，本文的主要贡献如下：

（1）提出一种轻量级的带钢表面缺陷检测模型YOLOv8-VSC，将轻量级网络VanillaNet 作为骨干特征提取网络，去除特征提取网络中大量的分支结构，有效降低了模型的复杂度。

（2）在特征提取网络中引入SPD 模块，网络在下采样过程中能够得到无信息损失的二倍下采样特征图，扩大感受野，提升模型检测性能，同时减少网络层数和模型参数量，加快模型的推理速度。

（3）在特征融合网络中引入CARAFE 上采样算子，模型在上采样过程中能够恢复更多的细节信息，有效整合上下文信息，增强输出特征的表达能力。

（4）在NEU-DET 数据集上进行了大量实验，与主流的目标检测算法相比，本文算法在提升检测精度的同时所需的计算资源更少。此外，在VOC 数据集上进行了实验，结果表明本文提出的YOLOv8-VSC具有良好的鲁棒性。

1 相关工作

1.1 产品表面缺陷检测

随着工业自动化水平的提高和智能制造技术的快速发展，基于深度学习的工业产品表面缺陷检测系统得到广泛的应用。Li 等人[27]提出一种航空发动机部件表面缺陷检测模型YOLO-KEB，在YOLO 的骨干特征提取网络中引入ECA-Net（efficient channel attention network）注意力模块，提升模型的特征提取能力，并在特征融合网络中引入了BiFPN（bidirectional feature pyramid network）模块，充分融合多尺度特征，提升模型的检测性能。Chen 等人[28]为了解决织物瑕疵受纹理干扰导致误检的问题，将频率分析中的Gabor 滤波器嵌入Fast RCNN 网络中，使得模型能够更好识别织物缺陷，提升了检测精度。Dang 等人[29]设计了一种用于下水道管道内部缺陷检测框架DefectTR（defect transformer），提高了下水管道缺陷检测精度。Cui 等人[30]通过引入特征保留块（feature retaining block，FRB）和跳过密集连接模块（skip densely connected module，SDCM），解决了因纹理变化和缺陷尺寸较小导致检测精度差的问题。Zhang等人[31]提出改进DETR 的铸件缺陷检测算法，引入动态anchor boxes 和改进的多尺度可变形注意力模块，提高transformer 结构对输入位置信息和尺度大小的敏感度，为其他场景的缺陷检测任务提供了新思路。

1.2 轻量级模型

当前先进的基于深度学习的目标检测算法都因其模型过于复杂、计算量庞大导致在一些工业生产场景中受终端检测设备计算能力的限制而难以部署。为解决上述问题，Suryarasmi 等人[32]提出一种用于织物缺陷检测的基于CNN（convolutional neural networks）的轻量级架构FN-Net，与先进的轻量级架构相比，FN-Net的训练速度更快，需要的计算资源更少。Ding 等人[33]设计了一种轻量级的管道焊缝表面缺陷检测算法，以MobileNetV2为主干网络构建缺陷分类模型，同时引入了CBAM 双通道注意力模块，在降低模型复杂度的基础上提升模型的检测精度。Shi等人[34]提出了一种基于坐标注意的轻量级传输线缺陷检测方法。该方法基于YOLOv5 在通道和空间上对网络中的大卷积核进行解耦，减少了卷积核的参数和卷积运算的计算量，实现了网络的轻量化。Ma等人[35]基于Ghost模块设计了GMANet（gradient mask attention network）作为骨干特征提取网络，并且对特征融合网络进行重新设计，得到轻量级的铝材表面缺陷检测算法。

2 算法描述

2.1 基线YOLOv8n

本文采用一阶段检测算法YOLOv8n 作为基线模型，如图1 所示该网络由骨干特征提取网络（Backbone）、特征融合网络（Neck）以及检测头（Head）三部分组成。在骨干网络中，与YOLOv5相比，YOLOv8n采用更轻量的C2f 模块，替换了YOLOv5 中的C3 模块，第一层卷积由原本的6×6 卷积改为3×3 卷积，深度由C3 模块的3、6、9、3 改为C2f 的3、6、6、3；在特征融合网络中，相比YOLOv5，YOLOv8n 移除了1×1 卷积的降采样层，同时将C3 模块换成了C2f模块；在检测头中，YOLOv8n使用解耦头结构，将分类任务和回归任务解耦，同时将Anchor-Based 换成了Anchor-Free。此外，YOLOv8n 使用BCE Loss 作为分类损失，使用DFL Loss+CIOU Loss作为回归损失。

图1 YOLOv8n网络结构图Fig.1 YOLOv8n network framework

2.2 本文所提算法YOLOv8-VSC

针对基线模型YOLOv8n 因计算量庞大、模型复杂度高，导致在带钢表面缺陷检测领域进行部署时受终端设备计算能力限制的问题，本文提出一种轻量化的带钢表面缺陷检测模型YOLOv8-VSC。该模型的网络结构如图2所示，在骨干特征提取网络中引入轻量级的VanillaNet，减少骨干网络中不必要的分支结构，以降低模型的复杂度，同时在VanillaNet 模块之前引入了SPD 模块，将特征图的通道数量扩充为原来的4倍，得到没有信息丢失的二倍下采样特征图，从而提升网络的检测性能。此外，在特征融合网络中引入轻量级的CARAFE 上采样模块，使得网络在上采样的过程中恢复尽可能多的细节特征信息，进一步提升模型的检测性能。

图2 YOLOv8-VSC网络结构图Fig.2 YOLOv8-VSC network framework

2.2.1 VanillaNet模块

由于带钢表面缺陷检测的终端设备计算能力有限，导致在部署计算量庞大的缺陷检测模型时受到限制。因此本文在基线模型YOLOv8n 的骨干特征提取网络中引入了VanillaNet模块，VanillaNet只包含基本的卷积层和池化层，没有复杂的连接或跳跃连接，从而减少了模型的计算量和参数量，特别适用于终端检测设备计算资源受限的情况。因此本文基于YOLOv8，引入VanillaNet[24]网络将其作为骨干特征提取网络，以达到降低模型复杂度的目的。Vanilla-Net 的网络结构如图3 所示（以6 层的网络结构为例）。该网络包含3 个阶段，在Ⅰ阶段中Stem 将原始的3 通道图像通过下采样的方式转换为含有C个通道的特征图，之后通过第Ⅱ阶段使用步长为2的最大池化层调整特征图的尺寸并将通道数扩充为上一层的2 倍。最后通过第Ⅲ阶段的全连接层输出分类结果。为了保留特征图所包含的特征信息以使用尽可能小的计算成本，所有卷积层均使用1×1 的卷积核，同时将BN 添加至每层的最后从而简化网络的训练过程。

2.2.2 SPD模块

为了进一步提升带钢表面缺陷检测模型的性能，本文在基线模型YOLOv8n 的骨干特征提取网络中引入了SPD 模块，SPD 模块的参数量和计算量较小，只包含一个1×1 的卷积层，较好地控制模型参数的增加，避免过度复杂化，有效提升模型的推理速度。SPD[25]是一种特殊的下采样方法，它的下采样示意图如图4所示。给定一个大小为W×H×C特征图X，然后按照每行每列隔一个像素进行采样，最终得到4个子特征图，这4个子特征图大小均为W/2×H/2×C，之后将这4个子特征图进行拼接，最终得到一个没有信息丢失的二倍下采样特征图，该特征图大小为W/2×H/2× 4C。这种设计将W、H上的特征信息集成到通道维度上，将通道数扩充为原来的4 倍，无信息损失的二倍下采样方法使得网络在进行特征提取时能够保留更多的特征信息。相比普通卷积，SPD减少了参数计算，在一定程度上加快了模型的推理速度。同时，SPD 还扩大了模型的感受野，提升了模型的检测性能。

图4 SPD下采样示意图Fig.4 Schematic of SPD downsampling

2.2.3 轻量级上采样算法CARAFE

由于带钢表面缺陷数据集的背景噪声较大，导致模型在上采样过程中无法辨别有用的缺陷信息，生成的特征图质量较差，无用的干扰信息较多，从而影响模型最终的检测精度。为了增强输出的缺陷特征信息的表达能力，本文在基线模型YOLOv8n的特征融合网络中引入了轻量级的上采样算子CARAFE[26]，它解决了传统上采样算子忽略特征图的语义信息和感受野过小的问题。CARAFE 包含上采样核预测模块和内容感知重组模块，其中上采样核预测模块负责生成用于特征重组的上采样核，根据下采样特征图核上采样位置的映射关系来预测每个上采样位置的注意力权重，在特征重组过程中保持空间细节和上下文信息。内容感知重组模块的作用是在上采样过程中保留尽可能多的空间信息，更好地保持物体边界的准确性。整个上采样的具体过程可以描述为：输入初始的特征图X，特征图的大小为C×H×W，上采样比为σ（σ为整数），经由CARAFE 生成一个大小为C×σH×σW的新特征图X′，对于X′的任何目标位置l′=(i′,j′)在X上都有一个对应源位置l=(i,j)，其中，i=[i′/σ]，j=[j′/σ]。将N(Xl,k)表示为以位置l为中心的X的k×k子区域，即Xl的邻域。首先，核预测模块Ψ根据Xl的邻域为每个位置l′预测一个位置核Wl′，如式（1）所示：

之后通过内容感知重组模块Ф对特征进行重组，将Xl的邻域与内核Wl′重新组合，如式（2）所示：

3 实验与分析

3.1 数据集与评价指标

本文使用东北大学公开的带钢表面缺陷数据集（NEU-DET），该数据集收录了带钢表面主要的6 种缺陷。如图5 所示，分别为开裂（Crazing）、内含物（Inclusion）、斑块（Patches）、点蚀表面（Pitted_surface）、轧制氧化皮（Rolled_in Scale）和划痕（Scratches）缺陷。每种缺陷分别有300张图片，共计1 800张图片。将数据集按照8∶1∶1的比例划分为训练集、验证集和测试集，最终得到训练集1 440张图片、验证集180张图片、测试集180张图片。

图5 带钢表面6种缺陷Fig.5 6 types of defects on surface of strip

本文从模型的mAP（mean average precision）、FPS（frames per second）以及模型的参数量（Params）和计算量（GFLOPs）4 个指标来评估模型的性能。mAP 是指模型在测试集上检测到的所有目标的平均精度，该指标值越高，表明模型在不同类别目标上的检测效果越好。FPS 反映了模型在单位时间内处理图像的数量，FPS值越高，表明模型的实时性能越好。模型的参数量（Params）用来评估模型的复杂度，参数量越小模型越轻便。GFLOPs 指标用来评估模型的计算效率，GFLOPs 越低，表明模型的计算效率就越高。

3.2 实验设置

本文在训练阶段采用单张GPU（GeForce RTXTM 3060 12 GB），图片输入尺寸为640×640，采用Mosaic方式进行数据增强，初始学习率设置为0.01，使用余弦退火的策略调整学习率，Batchsize 设置为16，选择SGD 优化器，训练轮数设置为300。除特别说明外，本文所有实验均采用以上实验设置。

3.3 消融实验

本文以YOLOv8n 为基线，在骨干特征提取网络中引入VanillaNet 模块以降低模型的复杂度，同时在骨干特征提取网络中引入SPD 模块以减少网络层数加快模型的推理速度；此外在特征融合网络中引入CARAFE 上采样算子以增强输出特征的表达能力，进一步提升模型的检测精度。为了验证本文对基线模型改进的有效性，在NEU-DET 数据集上从两方面设置了消融实验：

（1）在基线模型的基础上，每次只引入一种改进模块，验证单个模块对模型参数量、检测精度、检测速度的影响。

（2）在最终模型（YOLOv8-VSC）上每次只消除一个改进模块（不包括消除VanillaNet 模块），验证单个改进模块对最终模型性能的影响。实验结果见表1。

表1 在NEU-DET数据集上的消融研究Table 1 Ablation studies on NEU-DET dataset

通过表1的消融实验结果可知，在骨干特征提取网络中单独引入VanillaNet 模块后，参数量由基线的3.01×106降至1.73×106，降低了1.28×106，计算量由基线的8.1 GFLOPs降至5.0 GFLOPs，降低了3.1 GFLOPs，FPS 相较于基线提升了71，同时提升了开裂（Cr）、斑块（Pa）和划痕（Sc）等缺陷的检测精度，其中对开裂（Cr）缺陷检测精度的提升最为显著，提升了10.9 个百分点。VanillaNet 使用连续的卷积-池化结构提取特征，不同块之间没有直接的连接，特征图需要通过卷积和池化层不断下采样传递到后续块，同时避免了分支结构，从而减少了大量运算。因此将轻量级的VanillaNet 模块作为骨干特征提取网络可以有效降低模型的复杂度并提高推理速度。另外，在网络中单独引入SPD 模块后，通过扩充通道数得到一个没有特征信息丢失的二倍下采样特征图，提升了感受野，这种方式减少了模型的层数，降低对非线性激活的依赖，从而降低模型的计算量和参数量，提升模型的推理速度和梯度反转速度。改进后模型的计算量较基线降低2.6 GFLOPs，对模型推理速度的提高最为显著，FPS 由基线的232提高至333，提高了101。模型的mAP较基线提升了0.8个百分点，对开裂（Cr）和轧制氧化皮（Rs）缺陷的检测精度均有提升，其中轧制氧化皮（Rs）缺陷的检测精度达到最高为65.7%。在特征融合网络中单独引入CARAFE 上采样模块后，网络在上采样过程中可以通过学习邻域内像素的关联关系来实现上采样，从而捕捉到更丰富的上下文信息，有利于细节特征的重建，使得融合后的特征图包含更多的有用的细节特征信息，虽然轻微地增加了计算量，但是显著提升了模型的检测精度，改进后模型的mAP由基线的79.0%提升至80.2%，提升了1.2个百分点，对开裂（Cr）、内含物（In）和斑块（Pa）等缺陷的检测精度均有提升，其中内含物（In）缺陷的检测精度达到最高为86.9%。参数量和计算量较基线分别增加1.3×105和0.5 GFLOPs，FPS 降低了19。在同时引入VanillaNet 模块和SPD 模块后，模型的参数量和计算量相较于基线分别降低了1.19×106和2.6 GFLOPs，FPS 提高了38，mAP 提升了1.2 个百分点，对开裂（Cr）、斑块（Pa）、点蚀表面（Ps）和划痕（Sc）缺陷的检测精度均有提升，其中划痕（Sc）缺陷的检测精度达到最高为94.0%，较基线提升3 个百分点。在同时引入VanillaNet 模块和CARAFE 上采样模块后，模型的mAP 与基线一致，对斑块（Pa）缺陷的检测精度最高，由基线的92.9%提升至96.4%，提升了3.5 个百分点。模型的参数量和计算量相较于基线分别降低了1.16×106和2.3 GFLOPs，FPS提升了31。本文提出的最终模型同时引入VanillaNet 模块、SPD 模块和CARAFE 上采样模块，模型的mAP 达到最高80.8%，其中开裂（Cr）和点蚀表面（Ps）缺陷的检测精度达到最高，分别由基线的47.4%和91.9%提升至60.1%和94.2%，提升了12.7 个百分点和2.3 个百分点。同时最终模型也保持着较低的参数量和计算量，仅为基线的65.1%和74.1%，FPS 较基线提高了31。综上所述，本文提出的带钢表面缺陷检测模型与基线相比，有效降低了模型的复杂度，同时保持着较好的检测精度和实时性能。

3.4 定性分析

为了直观地比较本文提出的YOLOv8-VSC 与基线模型在检测带钢表面缺陷上的检测性能，分别使用YOLOv8n和YOLOv8-VSC在NEU-DET数据集的测试集上定性分析，定性结果如图6所示。第一行为基线模型的检测结果，第二行为YOLOv8-VSC 的检测结果。

图6 在NEU-DET数据集上的定性分析Fig.6 Qualitative analysis on NEU-DET dataset

由图6 的定性结果可知，对比每一列的检测结果，可以看出本文提出的YOLOv8-VSC 检测出了基线模型漏检的缺陷，在图6中已用蓝色箭头标示。此外，在同一位置缺陷的检测上，本文提出的YOLOv8-VSC 的置信度也高于基线模型。在NEU-DET 数据集上的定性结果表明在带钢表面缺陷的检测上，本文提出的YOLOv8-VSC相比基线模型有一定的优势。

3.5 鲁棒性验证

为了进一步验证本文提出的YOLOv8-VSC 的鲁棒性，分别将基线算法与YOLOv8-VSC 在铝材表面缺陷数据集（APSPC）和VOC2012数据集上进行了实验。铝材表面缺陷数据集（APSPC）收集了1 885 张铝材表面缺陷，共包含10 种缺陷类别，分别为凹陷、不导电、擦花、桔皮、漏底、碰伤、起坑、凸粉、涂层开裂和脏点等缺陷。VOC2012 数据集收集了17 125 张图片，包含20种目标类别。将上述两个数据集按照8∶1∶1的比例划分训练集、验证集和测试集，实验设置与3.2节一致，实验结果见表2、表3。

表2 在APSPC数据集上的鲁棒性研究Table 2 Robustness study on APSPC dataset

表3 在VOC2012数据集上的鲁棒性研究Table 3 Robustness study on VOC2012 dataset

由表2的实验结果可得，在铝材表面缺陷数据集上，本文提出的YOLOv8-VSC相较于基线，mAP获得了1.4 个百分点的增益，模型参数量由基线的3.01×106减少至1.96×106，减少了1.05×106，模型的计算量由基线的8.1 GFLOPs 降低至6.0 GFLOPs，降低2.1 GFLOPs，FPS较基线提高9。

由表3 的实验结果可得，在VOC2012 数据集上，本文提出的YOLOv8-VSC 相较于基线，mAP 提升了0.3 个百分点，模型参数量由基线的3.01×106减少至1.96×106，减少1.05×106，模型的计算量由基线的8.1 GFLOPs 降低至6.0 GFLOPs，降低2.1 GFLOPs，FPS较基线提高10。

在铝材表面缺陷数据集（APSPC）和VOC2012数据集上的实验结果表明，本文提出的YOLOv8-VSC具有良好的鲁棒性。

3.6 与当前先进算法的对比

将两阶段的目标检测算法Fast RCNN 和一阶段的目标检测算法SSD、YOLOv5、YOLOv7、YOLOv8和CG-Net[36]以及基于Anchor-Free 的CenterNet[37]等当前先进的目标检测算法与本文提出的YOLOv8-VSC 在NEU-DET 数据集上进行对比实验，实验结果见表4。

通过表4的实验结果可以看出，本文提出的带钢表面缺陷检测算法YOLOv8-VSC 在mAP、模型参数量、模型计算量以及FPS方面均达到了最优。相比基线YOLOv8，将mAP 提升了1.8 个百分点，模型参数量减少1.05×106，模型的计算量由8.1 GFLOPs 降至6.0 GFLOPs，降低2.1 GFLOPs，FPS 提升了31。与基于Anchor-Free 的CenterNet 相比，在带钢表面缺陷检测上的优势更为显著，将mAP 提高7.4 个百分点，模型参数量减少了3.071×107，仅为CenterNet 的6%，模型的计算量降低64.2 GFLOPs，仅为CenterNet 的8.5%，FPS 提高了222。综上所述，本文提出的YOLOv8-VSC 在保证模型检测精度的情况下有着模型体积小、计算量低以及实时性高的优势，便于在一些计算能力较弱、计算资源有限的终端检测设备上部署。

4 结束语

在带钢表面缺陷检测领域中，由于负责检测的终端设备计算资源有限，导致基于深度学习的缺陷检测算法部署困难。本文提出一种轻量级的带钢表面缺陷检测算法YOLOv8-VSC。在NEU-DET 带钢表面缺陷数据集上的mAP 达到80.8%，模型参数量和计算量仅为基线的65.1%和74.1%。在VOC2012数据集上的实验结果表明本文算法具有良好的鲁棒性。与主流的目标检测算法相比，本文提出的YOLOv8-VSC 在保持高检测精度的同时所需的计算资源更少，在带钢表面缺陷检测领域有一定的竞争力。经过研究发现，对于整体检测精度影响最大的是带钢表面开裂和轧制氧化皮这两类缺陷，原因是这两类缺陷的背景噪声较大，极难分辨缺陷与背景，导致这两类缺陷存在误检、漏检的概率较大。下一步任务是解决这两类缺陷检测困难的问题，进一步提升带钢表面缺陷检测模型的精度。