基于多尺度卷积和注意力机制的枣品种识别

2024-06-17雷浩苑迎春何振学

中国农机化学报 2024年6期

雷浩苑迎春何振学

摘要：为提高自然场景下枣品种识别方法的准确率，提出一种融合多尺度卷积和注意力机制的枣品种识别模型（Jujube-ResNet-18）。以自然场景下的10类枣品种为对象，根据枣品种图像的特点，该模型在ResNet-18基础上进行改进。引入多尺度卷积模块，增强模型对枣果多尺度特征的提取能力；在每个残差块中加入注意力机制CBAM，提高枣果特征信息权重，减弱复杂背景等无用特征的影响。试验结果表明，Jujube-ResNet-18在枣品种数据集上的准确率为89.5%，参数量和权重大小分别为1.135×10⁷和43.41 MB。与其他算法相比，Jujube-ResNet-18有更好的特征提取能力、抗干扰能力和较小的模型复杂度，可为自然场景下的枣品种识别研究提供参考。

关键词：枣品种识别；深度学习；残差网络；多尺度卷积；注意力机制

中图分类号：TP391.4

文献标识码：A

文章编号：2095-5553 （2024） 06-0135-08

收稿日期：2022年10月15日

修回日期：2022年12月15日

*基金项目：国家自然科学基金（62102130）；河北省自然科学基金（F2020204003）

第一作者：雷浩，男，1999年生，河北邢台人，硕士研究生；研究方向为深度学习与图像处理。E-mail： 2251081642@qq.com

通讯作者：苑迎春，女，1970年生，河北清苑人，博士，教授；研究方向为智能信息处理与大数据。E-mail： nd_hd_yyc@163.com

Jujube varieties recognition based on multi-scale convolution and attention mechanism

Lei Hao， Yuan Yingchun， He Zhenxue

（College of Information Science and Technology， Hebei Agricultural University， Baoding， 071001， China）

Abstract： In order to improve the accuracy of jujube varieties recognition method in natural scenes， a jujube varieties recognition model （Jujube-ResNet-18） was proposed by integrating multi-scale convolution and attention mechanism. In this study， ten types of jujube varieties under natural scenes were taken as objects. According to the characteristics of jujube variety images， the model in this paper was improved on the basis of ResNet-18. Firstly， the multi-scale convolution module was introduced to enhance the ability of the model to extract multi-scale features of jujube fruit. Secondly， the attentional mechanism CBAM was added into each residual block to increase the weight of jujube fruit feature information and weaken the influence of complex background and other useless features. The experimental results showed that the accuracy of Jujube-ResNet-18 on the date variety dataset was 89.5%， while the number of parameters and weight were only 1.135×10⁷and 43.41 MB， respectively. Compared with other algorithms， Jujube-ResNet-18 has better feature extraction ability， anti-interference ability and smaller model complexity， which can provide a reference for the study of jujube varieties recognition in natural scenes.

Keywords： jujube varieties recognition; deep learning; residual network; multi-scale convolution; attention mechanism

0 引言

枣树为鼠李科枣属植物，原产于中国，栽培历史悠久、种质资源丰富、营养价值高，在我国果树领域中占据重要地位^[1]。枣品种准确识别对枣果的病害防治、自动采摘、分选加工等环节具有重要意义。例如，依照不同枣品种与不同病害间的相关性，识别枣品种可针对性防治病害；在枣果成熟期，枣品种识别是枣园自动化分类采摘的前提；对枣果进行品质分级及加工前，同样需要对其品种进行识别分类。因此，研究一种高效、准确的枣品种智能识别方法，可为枣产业高质量发展提供有力支撑^[2]。

在果品种类识别领域，基于机器学习的图像处理技术已有广泛应用^[3]。苏军等^[^4]以4类干制红枣为研究对象，提取每类红枣的颜色特征和纹理特征，采用SVM进行分类。Sabanci^[5]利用图像处理技术提取苹果的形状和颜色特征，利用MLP算法建立判别模型。上述研究均取得较优效果，但品种特征设计、选取和调节的过程较为复杂，易受主观因素影响，不适用于多类品种和复杂环境下的识别研究。

随着深度学习的不断发展，卷积神经网络在图像识别领域的应用越来越多^[6]，具有代表性的卷积神经网络有AlexNet^[7]、VGG^[8]、ResNet^[9]、Inception^[10]等。与传统机器学习相比，卷积神经网络可自动学习图像特征，特征提取更加充分、客观，能有效提升识别精度。余游江等^[^11]利用3种卷积神经网络构建Stacking集成模型用于识别五种红枣，准确率达到92.38%。El-Kahlout等^[12]通过构建卷积神经网络对3类品种的桃子进行识别，测试集准确率可达100%。倪建功等^[13]提出一种花生荚果识别模型，该模型在AlexNet网络的基础上，通过设置不同尺寸的卷积核以提高特征提取能力。赵腾飞等^[14]通过对构建的卷积神经网络进行推理优化，实现核桃仁的分类识别，识别准确率为99.44%。Hu等^[15]最先提出了通道注意力SENet，通过调整特征通道权重以获取输入特征中的有效信息。苏宝峰等^[16]提出融合注意力机制的残差网络用于自然背景下的葡萄品种识别，准确率达到88.75%。张继成等^[17]在残差网络中嵌入SENet，有效缓解自然状态下成熟草莓识别中复杂环境的干扰。耿磊等^[18]提出一种融合注意力结构的苹果品种分类模型，在7类苹果品种上准确率高达96.78%。

针对自然场景下的枣品种识别问题，本文选取10类枣品种开展研究，考虑到不同品种间的颜色、形状、纹理等特征复杂多样，且部分品种间存在特征相似、区分难度大和易受复杂环境干扰等问题。本文融合多尺度卷积和注意力机制对深度学习方法进行改进，以提取更多枣果细微特征，同时增强其抗环境干扰能力，实现对自然环境下的枣品种准确、高效的识别。

1 试验数据

本文枣图像采集于河北省沧县国家枣树良种繁育基地，采集时间为2021年9—10月，采集设备为小米手机和尼康D7500单反数码相机，分辨率分别为2 250像素×4 000像素和2 784像素×1 856像素。选取茶壶枣、大荔龙枣等10类枣品种进行研究，具体品种如图1所示，拍摄场景涵盖晴天、阴天、雨天等自然场景。每张图像上仅包含单个枣果或多个分离枣果且都包含一定的复杂背景，例如枣果叶片、树枝、树干等等，图像采集数量总计1 153张，各品种图像数量如表1所示。

本研究首先将枣数据集按照3∶2比例划分为训练集和测试集。为使模型得到充分学习，提升其泛化性能，防止出现过拟合等现象^[19]，本文对训练集中的图像进行扩增。采取的数据扩增方式为改变图像色度、对比度、亮度、高斯模糊、垂直和水平翻转图像、随机旋转一定角度等。扩增前后数据集分布情况如表1所示。图像在输入到模型之前，通过等比缩放将图像最小边缩放至256像素，保证输入图像不发生扭曲变形。再通过图像中心裁剪得到模型标准输入尺寸224像素×224像素，最后对图像进行归一化处理。

2 枣品种识别模型

本文提出的枣品种识别模型是以ResNet-18网络为基础实现改进，引入多尺度卷积模块代替ResNet-18网络中第一层的7×7卷积核，丰富模型提取到的特征信息。同时，每个残差块中添加注意力机制CBAM，增强模型对图像中枣果特征信息的学习，降低复杂背景对分类性能的影响；其他位置的结构和参数均保持不变。Jujube-ResNet-18模型结构如图2所示，模型参数如表2所示。

2.1 基础网络选取

神经网络的深度与模型性能具有较强相关性。理论上，通过加深网络深度，可提升网络的特征提取能力。然而研究表明，随着网络层数的不断加深，模型存在梯度消失、难以收敛等问题，从而导致模型性能退化。为此，He等^[9]在2015年提出了残差网络ResNet，该网络中的残差结构一定程度上缓解了神经网络深度增加所带来的梯度消失、退化等问题，并在同年的ImageNet分类竞赛中获得冠军。ResNet中的残差结构如图3所示。

设x为残差结构的输入，F（x）为输入x经过权重层后的特征映射，H（x）为残差结构的特征映射，残差块右侧的通路为恒等映射。其中H（x）=F（x）+x，而F（x）=H（x）－x又被称为残差映射。试验表明，相比于直接学习残差块的特征映射H（x），残差映射F（x）更易优化。残差结构在输入特征x的基础上继续学习残差映射，使模型有更好的性能。

常见的ResNet残差网络有ResNet-18、ResNet-34、ResNet-50、ResNet-101等，充分考虑到本文数据集规模和模型参数量、性能等因素，本文选择ResNet-18作为基础网络结构。

2.2 多尺度卷积模块

ResNet-18网络第一层卷积核大小为7×7，用来提取图像大范围下的粗粒度信息，特征尺度较为单一。在不同环境和时期下采集的枣品种图像中，枣果特征复杂各异，且部分品种间在某些生长时期的特征较为相似，仅使用大尺寸卷积核难以提取到各类枣果的多尺度特征信息。因而采用不同尺寸的卷积核对图像进行卷积，可以帮助模型更充分地提取到多种局部特征，得到不同粒度特征上的响应^[20]。本文构建的多尺度卷积模块如图4所示。

输入图像首先经过4个并行通路进行卷积操作，分别为1×1卷积、3×3卷积、两个3×3卷积串联和三个3×3卷积串联，最后将卷积后的4部分特征图在通道维度上进行拼接融合，得到多尺度特征图。融合过程计算如式（1）所示。

Y=concat（X₀，X₁，X₂，X₃）（1）

式中：Y——多尺度特征图；

X_i——各通路输出特征图，i∈[0，3]。

其中，堆叠三个3×3卷积层与一个7×7卷积层具有相同的感受野^[21]，两个3×3卷积层与一个5×5卷积层具有相同的感受野。该结构在保证感受野相同的前提下，堆叠多个卷积层和非线性激活函数，加深了网络的深度，不仅可以提高网络的非线性判别能力，还能减少模型中的参数。4个通路的卷积核在特征提取过程中分别获得不同尺度的感受野，最后通过融合不同尺度的特征，丰富模型提取到的枣果特征信息。

2.3 注意力机制

在自然场景下采集的枣品种图像中，存在叶片、树枝等复杂环境信息。模型在对输入图像进行特征提取时，除学习枣果特征外，还会学习到环境噪声信息。因此在模型中引入注意力机制来提高其表征能力，增强对分类任务有益的特征权重并抑制复杂背景干扰。Woo等^[22]提出一种融合空间注意力和通道注意力的注意力机制CBAM（Convolutional Block Attention Module），相比于仅考虑通道注意的SENet，特征选择更加全面。CBAM结构如图5所示。

在该模块中，输入特征图F首先与通道注意模块生成的通道注意权重M_C相乘，以校准特征图F通道维度上的权重，得到通道注意力调整后的特征图F_C。再将F_C与空间注意模块中生成的空间注意权重M_S相乘，完成空间维度上的特征标定，输出特征图F_S。其过程公式为

F_C=M_S（F）UF（2）

F_S=M_S（F_C）UF_C（3）

在通道注意模块中，主要筛选特征图通道维度上的重要特征，抑制冗余信息。通道数为C，尺寸为H×W的特征图首先在空间维度上分别进行全局最大池化和全局平均池化，得到两个C×1×1的特征向量，然后分别通过多层感知机。最后将多层感知机的两个输出结果相加，再经过Sigmoid激活函数后得到通道注意权重。计算如式（4）所示。

M_C（F）=σ{MLP[AvgPool（F）]+MLP[MaxPool（F）]｝=σ｛W₁[W₀（F^c_avg）]+W₁[W₀（F^c_max）]｝（4）

式中：AvgPool——平均池化；

MaxPool——最大池化；

W₀、W₁——隐藏层的权重；

σ——Sigmoid激活函数。

在空间注意模块中，重点关注同一特征图中对分类任务起关键作用的像素区域。通道数为C，尺寸为H×W的输入特征图在通道维度上分别进行全局最大池化和全局平均池化，得到两个1×H×W的特征向量，然后将两个结果在通道维度上进行拼接，通过卷积核大小为7×7的卷积操作将通道数降维至1，最后经过Sigmoid激活函数后得到空间注意权重。计算如式（5）所示。

M_S（F）=σ（f⁷^×7（[AvgPool（F）;MaxPool（F）]））=σ（f⁷^×7（[F^s_avg;F^s_max]））（5）

式中：f⁷^×7——卷积核大小为7×7的卷积运算。

随着网络中特征信息的不断传递，噪声信息所占权重会不断增加，最终导致模型识别性能降低。为最大限度减少噪声信息干扰，在ResNet-18的每个残差块中引入注意力机制CBAM，使网络在特征提取过程中，不断调整特征图权重，增强对关键特征信息的提取能力。改进后残差结构如图6所示。

2.4 评价指标

本文将准确率Accuracy、精确率Precision、召回率Recall、F1-score作为模型的评价指标。为了平衡模型性能和复杂度，同样将模型参数量、模型权重大小作为评价指标，用以综合评价模型性能。

式中：TP——模型将正样本预测为正样本的个数；

FN——模型将正样本预测为负样本的个数；

FP——模型将负样本预测为正样本的个数；

TN——模型将负样本预测为负样本的个数。

3 试验结果与分析

3.1 试验设置

本研究中的各项试验环境参数如表3所示。

模型训练过程中，批处理大小为32，迭代次数为100，优化器为SGD，学习率为0.01。

3.2 试验对比分析

为验证本文模型在枣品种识别研究上的有效性，在保证相同的试验条件下，选取在图像识别领域具有代表性的卷积神经网络进行对比分析，其中包括AlexNet、ResNet-18、ResNet-34、ResNet-50、InceptionV3。不同模型的准确率、参数量和权重大小对比如表4所示。

由表4可知，Jujube-ResNet-18在识别准确率上均高于其他卷积神经网络，在测试集上的准确率达89.5%。且参数量和权重大小都相对较小，分别为1.135×10⁷和43.4 MB。相比于AlexNet，准确率提升约6%，由于该模型相较于Jujube-ResNet-18深度较浅，特征提取能力不足，从而准确率较低。相比于准确率较高的InceptionV3，提升了0.7%，而参数量和模型权重大小均减少约48%。相比于ResNet-18，本文在充分利用其性能优势的基础上，又引入多尺度卷积和注意力机制对其进行改进，准确率提升3.3%。由于在残差结构中加入了注意力机制CBAM，模型参数量和权重大小都略有增加，但相比于ResNet-18，模型参数量仅增加1.5%，权重大小仅增加1.6%。Jujube-ResNet-18在ResNet-18的基础上，以增加较小的模型复杂度为代价，带来模型分类效果的显著提升，较好地平衡了模型的识别性能和复杂度，表明本文模型更适用于枣品种识别。

3.3 消融试验

为验证Jujube-ResNet-18中各改进模块的有效性，对仅采用多尺度卷积模块改进ResNet-18的模型（试验2）同分别采用注意力机制SENet（试验3）和CBAM（试验4）改进ResNet-18的模型进行对比试验，试验对比如表5所示。

从表5分析可知，多尺度卷积模块和注意力机制均能有效提升网络的准确率。试验2相比于试验1，准确率提高1.3%，参数量略有减小。因为使用多尺度卷积结构代替7×7卷积核后，增强了模型的特征提取能力，模型可提取到不同感受野下的细粒度特征，使其有更好的分类效果，多个小卷积核代替大卷积核也减小了模型参数。试验3、4模型准确率相比于试验1分别提高1.1%和2.2%，表明在残差结构中添加注意力机制，可增大模型中枣果特征信息的权重，抑制对复杂背景特征信息的提取。同时，试验4中的CBAM从通道和空间两个维度上关注枣果特征，相比于试验3中只关注通道注意的SENet，可取得更好的效果。Jujube-ResNet-18则有效融合多尺度卷积块和CBAM，准确率进一步提升。

3.4 混淆矩阵

混淆矩阵可直观表明模型在各个品种上的分类效果。ResNet-18和Jujube-ResNet-18在测试集上的混淆矩阵如图7、图8所示。分析可知，在枣果特征区分较为明显的茶壶枣和月牙枣上，本文提出的Jujube-ResNet-18相比于ResNet-18，识别正确的数量分别增加3个和4个。在枣果特征较为相似的品种上，例如在大荔龙枣、酥园铃和小紫枣之间，大荔龙枣识别正确的数量增加1个，消除了识别为酥园铃的错判；其中在小紫枣上提升效果最明显，识别正确的数量增加8个，消除了识别为大荔龙枣和酥园铃的错判。但在酥园铃上，错判为大荔龙枣和小紫枣的情况依旧存在。

根据混淆矩阵计算出两种模型在每类枣品种上的精准率、召回率和F1-score，评价指标对比如表6所示。

本文提出的Jujube-ResNet-18在测试集上的平均精准率为90.4%、召回率为89.4%、F1-score为89.5%；ResNet-18在测试集上的平均精确率为86.2%、召回率为86.2%、F1-score为86%。在上述三种指标中，表明本文提出的模型具有较好的识别效果。

3.5 模型验证

为验证Jujube-ResNet-18模型的泛化性能，本文重新采集10类枣品种图像各20张，使用训练好的Jujube-ResNet-18模型进行识别，结果如表7所示。

由表7可知，本文提出的Jujube-ResNet-18在200张验证图像上的准确率可达89.0%，与测试集上的准确率相当，表明本文模型有较好的泛化性能。

3.6 特征可视化

Grad-CAM^[23]是一种特征可视化方法，通过生成的热力图可帮助理解卷积神经网络各层学习到的特征。在热力图中，颜色越深的区域代表模型的关注度越高，红色区域即为重点关注区域。本文随机选取以下四类枣品种图像，利用Grad-CAM方法对ResNet-18和Jujube-ResNet-18模型的最后一个卷积层进行可视化，生成的热力图如图9所示。

从图9可以看出，Jujube-ResNet-18模型相比于ResNet-18，不仅关注到枣果的细粒度特征而且减少了对复杂背景信息的学习。例如在茶壶枣上，其显著性特征为枣果上半部的凸起部分；在月牙枣上，其中下部略有弯曲。本文模型不仅重点关注到这些区域，而且减少了叶片、树枝等信息的干扰。

4 结论

针对自然场景下的枣品种识别问题，提出一种基于改进ResNet-18的枣品种识别模型，并通过试验验证。

1）在继承ResNet-18优点的基础上，引入多尺度卷积模块代替单一尺度卷积核，使模型获取到枣果不同尺度的特征信息，更有助于表征不同枣品种。注意力机制的加入，增强模型的抗噪声干扰能力和鲁棒性，模型分类性能显著提升。

2）本文模型在十类枣品种数据集上的准确率达89.5%，参数量为1.135×10⁷，模型权重大小为43.41 MB，较好地平衡模型复杂度和分类精度，且综合性能优于AlexNet、ResNet-18、InceptionV3等主流的卷积神经网络。充分表明本文模型适用于自然场景下的枣品种识别。

3）在之后研究工作中，将继续优化本文模型，考虑加入度量学习方法使枣品种图像特征类内聚合，类间分散，进一步提升模型的分类性能。同时将增加枣品种数据集的种类，扩大本文模型的实际应用范围。

参考文献

[1]刘孟军，王玖瑞，刘平，等. 中国枣生产与科研成就及前沿进展[J]. 园艺学报， 2015， 42（9）： 1683-1698.

Liu Mengjun， Wang Jiurui， Liu Ping， et al. Historical achievements and frontier advances in the production and research of Chinese jujube （ziziphus jujuba） in China [J]. Acta Horticulturae Sinica， 2015， 42（9）： 1683-1698.

[2]刘孟军，王玖瑞. 新中国果树科学研究70年——枣[J]. 果树学报， 2019， 36（10）： 1369-1381.

Liu Mengjun， Wang Jiurui. Fruit scientific research in New China in the past 70 years： Chinese jujube [J]. Journal of Fruit Science， 2019， 36（10）： 1369-1381.

[3]阳灵燕，张红燕，陈玉峰，等. 机器学习在农作物品种识别中的应用研究进展[J]. 中国农学通报， 2020， 36（30）： 158-164.

Yang Lingyan， Zhang Hongyan， Chen Yufeng， et al. The application of machine learning in crop variety recognition： A review [J]. Chinese Agricultural Science Bulletin， 2020， 36（30）： 158-164.

[4]苏军，饶元，张敬尧，等. 基于GA优化SVM的干制红枣品种分类方法[J]. 洛阳理工学院学报（自然科学版）， 2018， 28（4）： 65-69， 93.

Su Jun， Rao Yuan， Zhang Jingyao， et al. Study on classification method of jujube varieties based on GA optimized SVM [J]. Journal of Luoyang Institute of Science and Technology （Natural Science Edition）， 2018， 28（4）： 65-69， 93.

[5]Sabanci K. Different apple varieties classification using KNN and MLP algorithms [J]. International Journal of Intelligent Systems and Applications in Engineering， 2016， 4（S1）： 166-169.

[6]张珂，冯晓晗，郭玉荣，等. 图像分类的深度卷积神经网络模型综述[J]. 中国图象图形学报， 2021， 26（10）： 2305-2325.

Zhang Ke， Feng Xiaohan， Guo Yurong， et al. Overview of deep convolutional neural networks for image classification [J]. Journal of Image and Graphics， 2021， 26（10）： 2305-2325.

[7]Krizhevsky A， Sutskever I， Hinton G E. Image Net classification with deep convolutional neural networks [J]. Communications of the ACM， 2017， 60（6）： 84-90.

[8]Simonyan K， Zisserman A. Very deep convolutional networks for large-scale image recognition [J]. arXiv Preprint arXiv： 1409.1556， 2014.

[9]He K， Zhang X， Ren S， et al. Deep residual learning for image recognition [C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition， 2016： 770-778.

[10]Szegedy C， Liu W， Jia Y， et al. Going deeper with convolutions [C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition， 2015： 1-9.

[11]余游江，喻彩丽，尚远航，等. 基于Stacking模型的红枣品种分类识别[J]. 北方园艺， 2022（8）： 139-148.

Yu Youjiang， Yu Caili， Shang Yuanhang， et al. Classification and recognition of jujube varieties based on Stacking model fusion [J]. Northern Horticulture， 2022（8）： 139-148.

[12]El-Kahlout M I， Abu-Naser S S. Peach type classification using deep learning [J]. International Journal of Academic Engineering Research， 2019， 3（12）.

[13]倪建功，杨昊岩，李娟，等. 基于改进型AlexNet的花生荚果品种识别[J]. 花生学报， 2021， 50（4）： 14-22.

Ni Jiangong， Yang Haoyan， Li Juan， et al. Variety identification of peanut pod based on improved AlexNet [J].Journal of Peanut Science， 2021， 50（4）： 14-22.

[14]赵腾飞，胡国玉，周建平，等. 卷积神经网络算法在核桃仁分类中的研究[J]. 中国农机化学报， 2022， 43（6）： 181-189.

Zhao Tengfei， Hu Guoyu， Zhou Jianping， et al. Research on convolutional neural network algorithm for walnut kernel classification identification [J]. Journal of Chinese Agricultural Mechanization， 2022， 43（6）： 181-189.

[15]Hu J， Shen L， Sun G. Squeeze and excitation networks [C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition， 2018： 7132-7141.

[16]苏宝峰，沈磊，陈山，等. 基于注意力机制的葡萄品种多特征分类方法[J]. 农业机械学报， 2021， 52（11）： 226-233， 252.

Su Baofeng， Shen Lei， Chen Shan， et al. Multi-features identification of grape cultivars based on attention mechanism [J]. Transactions of the Chinese Society for Agricultural Machinery， 2021， 52（11）： 226-233， 232.

[17]张继成，李德顺. 基于深度残差学习的成熟草莓识别方法[J]. 中国农机化学报， 2022， 43（2）： 136-142.

Zhang Jicheng， Li Deshun. Ripe strawberry recognition method based on deep residual learning [J]. Journal of Chinese Agricultural Mechanization， 2022， 43（2）： 136-142.

[18]耿磊，黄亚龙，郭永敏. 基于融合注意力机制的苹果品种分类方法[J]. 农业机械学报， 2022， 53（6）： 304-310， 369.

Geng Lei， Huang Yalong， Guo Yongmin. Apple variety classification method based on fusion attention mechanism [J]. Transactions of the Chinese Society for Agricultural Machinery， 2022， 53（6）： 304-310， 369.

[19]马岽奡，唐娉，赵理君，等. 深度学习图像数据增广方法研究综述[J]. 中国图象图形学报， 2021， 26（3）： 487-502.

Ma Donggao， Tang Ping， Zhao Lijun， et al. Review of data augmentation for image in deep learning [J]. Journal of Image and Graphics， 26（3）： 487-502.

[20]Peng G， Tuo X， Shen T， et al. Recognition of rock micro-fracture signal based on deep convolution neural network inception algorithm [J]. IEEE Access， 2021， 9： 89390-89399.

[21]黄英来，艾昕. 改进残差网络在玉米叶片病害图像的分类研究[J]. 计算机工程与应用， 2021， 57（23）： 178-184.

Huang Yinglai， Ai Xin. Research on classification of corn leaf disease image by improved residual network [J]. Computer Engineering and Applications， 2021， 57（23）： 178-184.

[22]Woo S， Park J， Lee J-Y， et al. CBAM： Convolutional block attention module [C]. Proceedings of the European Conference on Computer Vision （ECCV）， 2018： 3-19.

[23]Selvaraju R R， Cogswell M， Das A， et al. Grad-CAM： Visual explanations from deep networks via gradient-based localization [C]. Proceedings of the IEEE International Conference on Computer Vision， 2017： 618-626.