改进FSSD的差速器壳体表面缺陷实时检测算法

2022-11-20王国东唐金亮陈特欢

计算机工程与应用 2022年22期

王国东，唐金亮，陈特欢，崔杰

1.宁波大学机械工程与力学学院，浙江宁波 315211

2.浙江华朔科技股份有限公司，浙江宁波 315800

随着人们生活水平的提高，汽车已逐步走进了千家万户，成为人们日常生活中普遍的交通工具。差速器作为调整车轮转速的重要零部件，主要由行星齿轮、半轴齿轮、差速器壳体、行星齿轮轴等零件组成[1]。其中，差速器壳体由于有着较高的输出功率和启动扭矩，需要承受来自差速器各部分的载荷，因此成为汽车底盘承载扭矩的关键主承力构件。然而在壳体铸件的生产过程中，由于加工环境恶劣，不可避免地产生气孔、裂纹与表面划痕等缺陷，严重影响壳体的表面质量与物理机械性能。因此，差速器壳体表面的缺陷检测成为生产过程中的关键环节，但由于缺陷和图像背景的复杂性，使得检测难度大大增加。

随着目标检测与人工智能的发展，基于深度学习的方法能够适应各种复杂的真实环境，具有较好的鲁棒性和准确率，已经普遍应用于目标检测中[2]。基于深度学习的目标检测算法分为两大类：一类是基于区域建议的两阶段（two-stage）算法，最具代表的是R-CNN（region convolutional neural network）[3]、Fast R-CNN[4]和Faster R-CNN[5]，这类算法的检测精度较高，但是检测速度较慢。另一类是基于回归的单阶段（one-stage）算法，代表是YOLO（you only look once）[6]和SSD（single shot multibox detector）[7]以及各种改进版本。这类算法由于不需要预先提取目标候选区域，检测速度大大提高，能够做到实时检测，但检测精度一般低于两阶段算法。其中，SSD结合了YOLO算法的回归思想和Faster R-CNN的anchor机制，但SSD算法由于缺少深浅层信息的特征交流，对于小目标的检测效果还有待进一步地提高。

辛鹏等[8]在SSD算法的基础上提出了一种多层特征融合的飞机检测方法，将深层和浅层的特征经过采样后在同一尺度进行融合，提高了遥感图像中的目标检测精度，但该方法对小目标的检测效果较差。马露等[9]提出一种基于FSSD（feature fusion single shot multibox detector）的跌倒检测算法，移除了FSSD网络结构中的Conv7特征层，虽然最终的检测精度有所提高，但检测速度仍然较慢，不具有较好的实时性。Fu等[10]提出了DSSD（deconvolutional single shot detector）算法，将ResNet-101作为基础骨干网络，并使用反卷积层来增加大量的上下文信息，有效提升了检测精度，但整体的特征融合策略较为复杂，增加了大量的预测模块和反卷积模块，严重牺牲了检测速度，也难以满足实时应用的需求。

在差速器壳体等铸件缺陷检测方面，王永祥[11]提出一种基于机器视觉的差速器壳体识别方法，将差速器壳体彩色图像进行图像滤波和边缘检测处理，研究两种图像形状特征提取算法的同时改进BP算法，能够较准确地识别差速器壳体。但该方法只是针对差速器壳体进行型号识别，识别目标的形状体积较大，并未针对差速器壳体表面缺陷这类小目标的物体进行识别，且在检测时易受到差速器形状和不同复杂真实环境的影响而降低准确率，模型鲁棒性不高。陈辉等[12]提出一种针对铸件汽缸缺陷的超声波检测方法，该方法对仪器、探头等进行选择，确定了缺陷反射波形特征的判定方式，对于铸件缺陷的检测具有一定有效性。但这类传统检测方法只适用于一些精度要求不高的场合，且检测原理有限，可检测缺陷的种类也受到了限制。Ferguson等[13]通过将目标检测结构中的特征提取层进行分离，结合迁移学习对X射线图像中的铸件缺陷进行识别定位，提高了铸件缺陷的检测精度。但该方法检测精度仍然较低，且模型训练过程复杂，计算成本较大。目前将深度学习网络应用在差速器壳体表面缺陷检测的研究较少，研究利用深度学习对差速器壳体表面缺陷进行实时且准确的检测具有重要的实用价值。

针对在加工过程中差速器壳体表面产生的各种缺陷，本文在FSSD算法的基础上进行改进，提出一种改进的FSSD_MobileNet检测模型，提升对差速器壳体表面不同位置和形状的小目标缺陷的检测能力，实现在复杂真实环境下的高精度实时检测。本文的主要贡献如下：

（1）将FSSD算法的基础骨干网络VGG16（visual geometry group-16）[14]替换成MobileNet网络，在确保检测精度的同时进一步提升检测速度，保证算法的实时检测性能。

（2）将MobileNet网络中的Conv3、Conv5和Conv11深度可分离卷积层进行特征融合，提升对小目标缺陷的检测效果。

（3）根据汽车差速器壳体表面缺陷尺寸的特点，调整默认框的尺寸，使得默认框和真实框在训练过程中能更好地匹配，进一步提升对小目标缺陷的检测精度。

（4）采用RMSProp（root mean square propagate）梯度下降算法，优化损失函数在更新中存在摆动幅度过大的问题，从而加快网络的收敛。

实验结果表明相比于Faster R-CNN、SSD、FSSD和YOLOv5等算法，本文所提出的FSSD_MobileNet网络模型能准确且更快速地自动检测汽车差速器壳体表面的缺陷，满足实际生产中的准确性和实时性要求。

1 基础网络模型与性能分析

1.1 SSD与FSSD

SSD是利用单个深度神经网络进行目标检测的算法模型。由于浅层特征层图适合检测小目标，深层特征图适合检测大目标[15]，SSD采用特征金字塔的多尺度级联结构进行预测，有效改善了单层特征图检测算法的检测精度。

但由图1可知这些特征层之间是相互独立的，缺少特征信息的交流，因此不同特征图所蕴含的信息并未融合在一起。浅层特征缺乏深层特征所具有的语义信息，使得SSD算法对小目标物体的检测并不理想。

FSSD在SSD的基础上进行改进，网络结构图如图2。FSSD[16]基于FPN[17]的思想建立了一种将浅层特征与深层特征相融合的特征融合模块，但它们的特征融合方式不同。

从图3（a）可以看出，FPN网络是以一种反向生成特征金字塔的方式来进行特征融合，需要做多次通道拼接[18]，并且新生成的每层特征图仅能融合同层和高层的特征，效率不高，同时降低了检测速度。从图3（b）可以看出，FSSD网络则是通过调整特征图的大小，在SSD的基础上添加了一个高效的、轻量级的特征融合模块，一次性对多个不同尺度不同层次的特征图进行融合，并从融合的特征中生成特征金字塔。

由上述可知再加入了高效的特征融合模块之后，FSSD网络具有了将浅层细节特征和深层语义特征结合在一起的能力，因此在复杂工作环境下，能够进一步提升准确率，从而更好地检测汽车差速器壳体表面的缺陷目标。

1.2 MobileNet网络模型

MobileNet[19]网络模型是一种轻量级深度神经网络。MobileNet的基本单元是深度可分离卷积，将一个卷积操作分解成深度卷积和逐点卷积，深度卷积使用3×3卷积核的深层卷积层，而逐点卷积使用1×1卷积核的普通卷积层。深度卷积和逐点卷积在输出结果的时候都加入了修正线性单元（rectified linear unit，ReLU）和BatchNorm（batch normalizaton）层，相比于传统卷积提高了网络的收敛速度和提取特征的稳定性。

2 本文FSSD_MobileNet网络模型及改进

2.1 基础骨干网络优化

VGG16作为FSSD的基础骨干网络，权重参数较大，适合于解决COCO（common objects in context）[20]、PASCAL VOC（pattern analysis，statistical modelling and computational learning visual object classes）[21]这类大型数据集的目标检测任务。但本文差速器壳体表面缺陷的种类和数量均远小于这类大型公开数据集，且只需判断检测目标是否是差速器壳体表面缺陷，因此可以简化模型，在保证检测精度的同时可以有效缩减模型收敛的时间，进一步加快检测速度。本文把FSSD原有VGG16基础骨干网络替换成轻量级网络MobileNet，替换后的网络模型结构如图4。

在替换完FSSD的基础骨干网络之后，由图4虚线框可以直观地看出，MobileNet网络中的深度可分离卷积已经替代了图2传统FSSD结构中的普通卷积层，不仅网络前端的特征融合模块由深度可分离卷积构成，网络后端的6个不同尺度特征图所组成的特征金字塔同样由深度可分离卷积构成。

传统卷积核与深度可分离卷积核对比如图5，假设用DK×DK表示卷积核长宽，用DF×DF表示输入的特征图尺寸，分别用M、N表示输入和输出的通道数，卷积参数计算对比如下：

传统卷积计算量：DK×DK×M×N×DF×DF

深度可分离卷积的计算量为深度卷积和逐点卷积计算量之和。

深度卷积计算量：DK×DK×1×M×DF×DF

逐点卷积计算量：1×1×M×N×DF×DF

深度可分离卷积计算总量：DK×DK×1×M×DF×DF+1×1×M×N×DF×DF

计算量缩小：

一般情况下N会比较大，对于传统3×3的卷积核来说，深度可分离卷积的计算力会提升9倍左右。因此FSSD_MobileNet网络模型的关键改进在于结合了FSSD和MobileNet这两种网络类型的优势，在保持原有FSSD特征融合结构的基础上显著减少了计算量，降低了资源消耗，使模型的检测速度大大提升。

2.2 特征融合结构优化

在替换完骨干网络后，检测速度得到了极大改善，但仍然存在小目标缺陷检测能力不佳的问题。原因是目标缺陷尺寸在原图中所占的长宽比例普遍较小。由图6可以看出小目标缺陷是所需检测的主要对象，因此需要针对本数据集的尺寸特点进一步改进网络结构。

为了进一步提升对小目标检测的效果，本模型将MobileNet中Conv3、Conv5和Conv11这3个不同尺度的深度可分离卷积层的特征图进行Concate融合。FSSD_MobileNet算法模型结构如图4所示，前端的MobileNet网络负责初步提取目标特征，后端的6个深度可分离卷积特征图则是对提取好的目标特征进行多尺度特征检测。Conv3特征图的尺寸为75×75，Conv5特征图的尺寸为38×38，Conv11特征图的尺寸为19×19。针对Conv3和Conv11分别通过图4中下采样（downsample）和上采样（upsample）操作，将特征图尺寸调整为与Conv5相同的38×38，再将它们与Conv5特征图进行Concate特征融合，融合之后的通道数为768。

特征融合后接着进行批量标准化（BatchNorm）操作，这时通道数由768减小到512，通过下采样生成新的特征金字塔，并最终在新生成的特征金字塔上预测目标。特征融合模块的数学表示如下：

式中，Xi表示原始特征金字塔上的各层特征图；ζi表示在融合前，每层特征图Xi为缩放至同一尺度需进行的转换函数；φf表示特征融合函数；Xf表示特征融合后的特征图；φp表示基于融合后的Xf生成新的特征金字塔的函数；X′p表示新生成的特征金字塔；φc,l表示通过新生成的特则金字塔来预测loss和class的函数。

相比于传统FSSD特征融合模块中的Conv7_2卷积层，FSSD_MobileNet特征融合模块中的Conv3深度可分离卷积层的特征图的尺寸更大，感受野更小，能够获得更多的细节信息，因此更有利于检测小目标，保证较快检测速度的同时，针对实际复杂环境下的变化目标具有更好的鲁棒性。

2.3 默认框尺寸优化

为了检测图片中不同位置和大小的目标，提升对目标形状检测的鲁棒性，FSSD在不同尺度的特征图中选取不同尺度和宽高比的默认框。这些默认框是由一系列固定大小的边界框组成。基于FSSD默认框的产生原理，FSSD_MobileNet的默认框是从6层深度可分离卷积输出的特征图产生，这6个特征图的尺寸分别为38×38、19×19、10×10、5×5、3×3和1×1。默认框的个数分别为4、6、6、6、4、4，默认框宽高比依次为[2]、[2，3]、[2，3]、[2，3]、[2]、[2]。每张特征图上的默认框的尺度计算如下：

式中，Sk表示默认框尺寸占原图的比例，Smax表示默认框尺寸占原图比例的最大值，Smin表示默认框尺寸占原图比例的最小值，m表示特征图的个数。

原始SSD和FSSD将Smax和Smin的值设为0.9和0.2，得到各特征层的默认框最小尺寸分别为30、60、111、162、213、264，各特征层的默认框最大尺寸分别为60、111、162、213、264、315。然而这些原始默认框尺寸主要是针对大型数据集中的各类物体而设计的，各类物体之间所具有的目标特征差异较大，因此原始默认框尺寸具有广泛性而不具有专一性。并且从图6可以得知，本文数据集中的汽车差速器壳体表面的缺陷普遍较小，因此原始默认框尺寸并不适用于小尺度目标占比较大的汽车差速器壳体表面缺陷检测，在训练过程中默认框和真实框不能较好地匹配，需要对默认框尺寸进行调整。

为了使本数据集中的缺陷实现更好的检测效果，本文将Smax和Smin的值设置为0.95和0.15，调整后各特征层的默认框最小尺寸分别为22.5、45、105、165、225、285，各特征层的默认框最大尺寸分别为45、105、165、225、385、345。实验结果表明，在改进默认框尺寸后，汽车差速器壳体表面缺陷的检测精度得到了进一步提高，尤其针对小目标缺陷。

2.4 梯度下降算法优化

梯度下降作为常用的计算梯度的方法，其目的是通过迭代收敛找到损失函数的最小值。随机梯度下降（stochastic gradient descent，SGD）算法由于不同权值参数的梯度的数量级相差较大，很难找到一个全局的学习步长来进行参数的更新，收敛速度较慢的同时也难以选择合适的学习率来进行训练。

为了改善上述问题并修正损失函数在更新中较大的学习步长，本模型采用RMSProp（root mean square propagate）[22]梯度下降算法来进行优化。RMSProp算法不像传统梯度下降算法孤立地更新步长，而是联系之前每次的梯度变化情况进行更新。算法首先计算前n次梯度平方的指数加权平均值，然后在更新权重W和偏置b时，将第n次的梯度除以对应平均值的平方根，得到学习步长的更新比例，根据此比例去得到新的学习步长，相当于对梯度做了归一化操作，实现了梯度的均方根传递。具体的迭代更新过程如下：

式中，dW和db表示损失函数反向传播时所求得的梯度；dW2和db2是梯度的逐元素平方操作；SdW和Sdb表示梯度平方的指数加权平均值；α表示网络的全局学习率；β是控制指数加权平均的一个衰减系数；ε是用来防止分母为0并维持数值稳定性而添加的常数。

由上述迭代过程可以看出，RMSProp算法首先通过式（10）和（11）将每轮的梯度值进行逐元素平方操作，再使用指数加权平均值进行累积。如此一来，在式（12）和（13）进行权重W和偏置b的更新时，将当前梯度除以指数加权累积值的平方根，即可有效调节某一梯度值较大或较小所造成的在更新过程中的大幅度振荡。

当dW或db很大时，除以之前累积的相应较大的平方根后，减少了W或b的变化幅度，则W或b的更新减慢；当dW或db很小时，除以之前累积的相应较小的平方根后，加大了W或b的变化幅度，则W或b的更新加快。因此，RMSProp算法可以修正更新过程中的异常振荡幅度，使得损失函数的更新路径更加精准，进而可以减少算法收敛过程中的迭代次数，加快网络的收敛。

RMSProp算法在设置全局学习率之后，每次通过全局学习率逐参数地除以经过衰减系数控制的累积梯度平方和的平方根，动态调整权重和偏置的学习率。因此RMSProp梯度下降算法能够调整不同参数方向上的步长，继而减小参数更新过程中的振荡幅度，同时加速或至少不减慢前往损失函数最小值的路径上的学习，即使在使用较大学习率的情况下，网络也能够较快地收敛。

3 实验及结果分析

3.1 数据集

本文选用MV-CA060-10GM工业相机和开孔背光源进行图像采集工作，采集过程中考虑到实际检测环境下的汽车差速器具有不同的摆放位置，从而进行多角度多方位的静态拍摄，以保持样本的多样性。采集后图像的分辨率是3 072×2 048像素，图像格式为jpg。采用样本标注软件LabelImg对图像中的缺陷进行标注，标注缺陷位置的同时标注类别为“defect”。为了防止模型由于训练样本数量较少而出现的过拟合现象，原始图像样本为300张，采用数据增强中的镜像和翻转方式，将原始图像的数量扩增至5 415张，并将标好的样本数据按9∶1的比例分为两部分，按照PASCAL VOC的格式构建4 873张训练集以及542张测试集。

最后将上述含有缺陷真实框位置和类别信息的xml文件，与原始图像一起放入FSSD_MobileNet检测程序的相应路径中，以完成数据集的准备工作。

3.2 评价指标

本文分别采用mAP（mean average precision）和FPS（frame per second）作为检测缺陷精度和速度的评价指标。其中，mAP和各类别AP（average precision）的具体数值与准确率P（precision）和召回率R（recall）有关，具体计算过程如下：

式中，TP表示所有预测图像中实际包含缺陷且被检测出是缺陷的数量，即为正检总数；FP表示实际不包含缺陷但被检测出是缺陷的数量，即为误检总数；FN表示实际包含缺陷但被检测出不是缺陷的数量，即为漏检总数。

每个检测类别都可以根据准确率P和召回率R画一条P关于R的曲线，该曲线在0到1范围内与坐标轴围成的面积即为该类别的AP值，可以表示为：

式中，P(R)表示准确率P关于召回率R的函数；AP表示为每一类别的召回率R从0到1的平均准确率。

将各个类别的AP值取平均，即为最终的mAP值，计算公式如下：

式中，N表示待检测目标的类别总数；表示第k个类别的AP值。此外，FPS表示单位时间内能够检测图像的数量，是衡量模型检测速度快慢和是否满足实时性的重要指标。

3.3 实验环境与模型训练

本实验基于Ubuntu16.04系统，CUDA 10.1、CUDNN 7.6.4和Python3.6运行环境。CPU型号为Intel Core i9-9900K，GPU型号为GeForce RTX 2080Ti，内存为32 GB，采用Pytorch框架完成网络的训练与测试。

在训练时采用迁移学习的方法来改善模型的性能。首先采用在ImageNet上训练的MobileNet模型作为本网络的预训练模型进行训练，然后将基于该缺陷数据集训练好的FSSD_MobileNet检测模型进行迁移学习，迁移训练权重和参数再次训练，进一步提升模型的检测性能。权重衰减设置为0.000 5，动量设置为0.9，Batch_Size设置为16，epoch设置为250。

采用RMSProp梯度下降算法来优化损失函数，由于RMSProp算法将梯度进行均方根传递，相比于SGD算法，能够进一步优化损失函数在更新中摆动幅度过大的问题，并有效地提高模型的收敛速度。

为了使RMSProp梯度下降算法有更好的性能，需要设置合理的学习率，设置过大可能会陷入局部最小值，设置过小则会降低收敛的速度。本实验设置初始学习率为0.000 1，在150 epoch后每隔50 epoch学习率减小为1/10，最终达到0.000 001，以确保参数能够达到最优值。

3.4 实验结果对比

本文通过5组对比实验来验证FSSD_MobileNet模型的检测性能。首先，为了验证本文FSSD_MobileNet模型在替换基础骨干网络前后的检测速度和模型大小，选取原始FSSD的基础骨干网络VGG16和本文选取的轻量级网络MobileNet进行对比，由表1可知，在替换为轻量级网络MobileNet之后，本文模型中的提取网络和检测网络均由深度可分离卷积组成，相比于普通卷积构成的VGG16，检测速度提高了2.1倍，而模型大小却仅占VGG16的15.7%，极大地改善了模型的实时性和轻量性。

表1 基础骨干网络替换前后的检测性能对比Table 1 Comparison of detection performance before and after replacement of basic backbone network

在替换完基础骨干网络之后，为了验证本文FSSD_MobileNet模型的特征融合结构对小目标的检测效果，选取3组特征融合结构进行对比实验，分别将MobileNet网络13层深度可分离卷积中的Conv3、Conv11、Conv13，Conv5、Conv11、Conv13和Conv3、Conv5、Conv11进行特征融合，与原始特征融合结构（Conv3、Conv5、Conv13）比较它们对小目标的检测效果，检测效果如图7。图中的红色填充框是预测框位置，蓝色未填充框是真实框位置。

由于浅层特征利于检测小目标，深层特征利于检测大目标，从图7（a）～（c）可以看出，在融合了层数较深的Conv13卷积层之后，部分小目标的检测效果并不理想。相比于前三者，图7（d）融合了更浅的特征层，因此更有利于检测小目标。4组融合结构的检测性能对比如表2。

由表2可知，将Conv3、Conv5、Conv11进行特征融合的FSSD_MobileNet模型，由于融合的特征层普遍较浅，更有利于检测本文以小目标缺陷为主的汽车差速器壳体表面，相比原始的特征融合结构，检测精度提升了6.3个百分点，最大程度地保留了缺陷的细节和语义信息。同时具有更快的检测速度和更精简的检测模型，能更加实时且高效地进行小目标缺陷检测。

表2 不同特征融合结构的检测性能对比Table 2 Comparison of detection performance of different feature fusion structures

在确定特征融合结构后，针对默认框尺寸进行对比实验，对比的检测效果如图8。

由图8可以看出，对默认框尺寸进行调整后，默认框和真实框能够更好地匹配。这使得模型在保持原有较快速度的基础上进一步提高对小目标缺陷的检测能力，能够更好地检测出汽车差速器壳体表面不同大小、长短、粗细的小目标缺陷。

由于小目标缺陷可提取到的鉴别特征较少，缺乏充足的外观信息，并且在实际检测过程中极易受到复杂周围环境的影响，而难以将它们与背景或类似的其他缺陷区分开来，这对于检测模型的定位精度有着较高的要求。因此目前许多其他的改进模型对于小目标缺陷的检测效果并不理想，很难做到对小目标缺陷检测精度的进一步提升。

针对上述难题，本文模型采取的调整默认框尺寸的方法，使得改进后的模型检测精度提升了10.8个百分点，如表3所示。相比于改进前有着较为明显的提高，可以更好地应用于以小目标缺陷为主的汽车差速器壳体表面的实时检测，具有较好的应用价值和实际意义。

表3 不同默认框尺寸的检测精度对比Table 3 Comparison of detection accuracy of different default box sizes

在原始特征融合结构和原始默认框尺寸相同的条件下，将本文的RMSProp梯度下降算法与SGD算法进行对比实验，检测对比效果如图9。

由于RMSProp算法使用了微分平方加权平均数，能够加速或至少不减慢前往损失函数最小值的路径上的学习，在相同epoch的条件下可以更快地收敛，从而明显地提升改进模型的检测精度。由表4可知使用RMSProp梯度下降算法后，检测精度提升了16个百分点。

表4 不同梯度下降算法的检测精度对比Table 4 Comparison of detection accuracy of different gradient descent algorithms

最后，为了验证本文网络模型的检测精度和检测速度，将本文FSSD_MobileNet网络模型与Faster R-CNN、SSD、FSSD、YOLOv5等几种经典的检测模型进行比较。除具体的网络结构不同外，所有实验的实验环境和实验设置均保持相同。各模型的检测效果如图10。

通过图10和表5可以看出，经典双阶段算法Faster R-CNN由于模型复杂度高，检测速度只有24 FPS，很难满足实时检测，而模型大小却达到了546.8 MB，效率不高的同时检测精度也较低。传统的FSSD由于在SSD的基础上加入了特征融合模块，增加了模型大小，使得检测速度略低于SSD网络，但改进前的FSSD_MobileNet由于在FSSD的基础上将骨干网络替换成轻量级网络，使得检测速度和模型大小相比于SSD和FSSD均有极大的提升，但检测精度却有所下降。本文改进后的FSSD_MobileNet网络模型，检测精度达到了96.7%，相比于改进前提升了16.2个百分点，检测速度有了进一步提升，同时检测模型更为精简，模型大小只有19.7 MB。

表5 不同模型的检测性能对比Table 5 Comparison of detection performance of different models

对于同样作为单阶段算法典型代表的YOLO网络，本文选取YOLOv3和YOLOv5系列网络模型作为对比，本文改进后的FSSD_MobileNet网络模型的检测速度达到了191 FPS，高于目前YOLO系列中速度较快的YOLOv5s网络，虽然模型大小略低于YOLOv5s的14.4 MB，但是检测精度却比YOLOv5s提升了4.4个百分点，也同样高于深度和宽度较大的YOLOv5m、YOLOv5l以及YOLOv3网络，更加满足实际生产中对准确性和实时性的综合要求。

4 结束语

在汽车差速器壳体的生产过程中，表面缺陷的检测至关重要。然而在实际检测过程中极易受到复杂周围环境的影响而难以进行准确且快速的检测。因此本文在FSSD网络模型的基础上，提出一种改进的FSSD_MobileNet检测方法。该方法首先将FSSD模型的基础骨干网络VGG16替换为MobileNet，接着将MobileNet网络中的深度可分离卷积层Conv3、Conv5、Conv11进行特征融合，最后对默认框尺寸进行调整，并采用RMSProp梯度下降算法来优化损失函数，加快网络的收敛速度。实验结果表明，本文改进的FSSD_MobileNet模型的检测精度mAP达到96.7%，检测速度达到了191 FPS，相较于单阶段算法SSD、FSSD、YOLO和双阶段算法Faster R-CNN，本文模型在检测精度和检测速度上均得到了一定程度的提升。同时模型较为精简，能够实时、准确地检测出汽车差速器壳体表面不同形状和位置的小目标缺陷，具有更强的稳定性和鲁棒性。

在未来的工作中，将进一步优化损失函数并增加训练样本的数量，同时采用更高效的特征融合策略，进一步提升模型的检测性能。