APP下载

基于改进MobileNet v3-Small模型的草莓病害识别方法

2024-07-03王晶崔艳荣

江苏农业科学 2024年10期
关键词:草莓准确率卷积

王晶 崔艳荣

doi:10.15889/j.issn.1002-1302.2024.10.031

摘要:为了对草莓病害进行及时的诊断与治疗而提升草莓产量,将深度学习与农业生产结合以快速高效地进行病害检测。传统神经网络进行病害识别时间较长,参数量较大,难以迁移到移动端设备上,基于此提出一种改进MobileNet v3-Small模型的识别方法。首先收集了7类常见草莓病害图像样本(如角斑病、叶斑病等),通过旋转、镜像等多种数据增强方式对图像进行处理以增加图片数量,提高模型泛化能力。接着以MobileNet v3-Small模型为基础,基于原始Inception_A提出部分卷积权值共享的多尺度卷积结构,以更高效地提取草莓病害不同尺度特征。随后,在网络深层引入了ULSAM轻量级子注意力机制,形成草莓病害更高层次的抽象表示。同时,将深度可分离卷积中的第2个PW卷积替换为CondConv卷积形成PDC结构,克服了PW卷积只拥有局部感受野的缺陷,同时也降低了模型参数量。试验结果表明,改进后的MobileNet v3-Small模型准确率达到98.62%,较原模型94.91%的准确率提高了3.71百分点,并且参数量减少了0.04 M,远优于同级轻量化模型,且以远低于ResNet18的参数量取得更好的特征提取效果。综上所述,本研究所提出的改进后的MobileNet v3_Small模型能更好地在真实场景下进行草莓病害识别,为草莓生产贡献了一份力量,助力智慧农业发展。

关键词:草莓病害;图像分类;MobileNet v3-Small;Inception_A;ULSAM轻量级子注意力机制;CondConv

中图分类号:S126;TP391.41  文献标志码:A

文章编号:1002-1302(2024)10-0225-09

收稿日期:2023-11-22

基金项目:国家自然科学基金面上项目(编号:62077018)。

作者简介:王  晶(2000—),女,湖北鄂州人,硕士研究生,从事机器学习与人工智能研究。E-mail:410885413@qq.com。

通信作者:崔艳荣,博士,教授,从事网络安全、信息处理研究。E-mail:cyanr@yangtzeu.edu.cn。

我国是世界上最大的草莓生产国,同时也是第一大草莓消费国,草莓种植面积居全球第1位[1]。然而,草莓在种植过程中容易受到各种病害的影响,造成草莓的质量和产量降低,故病害防治是防止草莓降产的重要途径。

现有的草莓病害防治方法主要依赖于人工识别,通过研究人员的经验对病害进行检测,进而采取有效措施。但这种检测方法存在较大的弊端,会耗费大量人力、物力资源且效率低下。随着人工智能技术的迅速发展,将计算机技术应用在农作物病害识别领域已经成为了研究热点。学者们通过使用支持向量机(SVM)、K近邻算法(KNN)、BP神经网络(BNN)等方法提高了对农作物病害识别的准确率与识别速率[2]。Liu等将主成分分析法(PCA)与支持向量机(SVM)相结合,在4类玉米叶片病害数据集上识别准确率最高能达到95.78%[3]。Chaudhary等针对多类花生病害分类问题,提出了一种改进的随机森林分类器方法,分类准确率达到了97.80%[4]。张开兴等利用图像处理技术和BP神经网络识别玉米叶部病害,平均识别率达到了93.4%[5]。虽然这些方法相比于人工检测有了较大的改善,但实现往往需要经过复杂的图像预处理过程,且容易受到环境因素的影响,导致模型不能进行很好的训练,模型泛化性较低[6]。

近年来,随着人工智能技术的迅速发展,基于深度学习的农作物病害识别方法得到了越来越多国内外研究学者们的关注和青睐[7]。相比于传统机器学习方法,它能够自动提取病害特征,可以避免繁杂的图像预处理过程。姚建斌等使用VGG16网络通过迁移学习方式训练,最终在小麦病虫害数据集上识别准确率达到95%[8]。刘敏等利用深度可分离卷积对VGG16网络进行改进,与Swin Transformer网络相结合,提出了一种多尺度特征融合网络,实现了苹果叶片病害检测93.98%的准确率[9]。陈伟文等采用数据增强与随机失活部分神经元的方法对AlexNet网络进行改进,在Plant Village数据库中选取10类番茄病害,识别准确率达到95.8%[10]。熊梦园等在ResNet50模型基础上添加CBAM注意力机制与FPN特征金字塔网络,对玉米叶片病害的识别准确率达到97.5%[11]。黄铝文等将金字塔卷积与深度超参数化卷积相结合,提出一种深度超参数化金字塔卷积残差网络,对7类草莓病害的识别准确率达到97.867%[12]。Yu等提出一种基于残差网络的MSO-ResNet苹果叶部病害识别模型,对5种叶部病害的平均识别精度达到了95.7%[13]。Ma等使用迁移学习方法训练一种深度卷积神经网络(DCNN),对6类草莓病害识别准确率达到93.16%[14]。

虽然基于深度学习方法的农作物病害识别解决了人工检测和传统机器学习方法的不足,能达到较高的识别准确率和识别速度,但现有的针对草莓病害识别的深度学习方法也存在着一些不足之处:基于深度学习的方法大部分都采用的是传统的卷积神经网络识别草莓病害,传统神经网络虽然识别准确率高,但模型参数量较大,实用性差,难以在移动端上部署;现有的草莓病害图像数据较少,导致大模型没有充足的数据训练;并且由于草莓病害具有多尺度的特点,现有的草莓病害识别模型仍然有提升空间。

针对目前研究中存在的问题,本研究在MobileNet v3模型基础上进行改进,改进后的模型能够准确识别草莓叶片及果实病害,并且改进后的轻量化网络容易部署在移动端,及时准确地检测草莓病害,以期为农业生产与发展提供智能化的解决方案。

1  数据集来源及预处理

1.1  数据集来源

本次试验所用数据来自Afzaal公开提供的草莓病害图像[15]。该数据集是在真实的农田与自然光照条件下多个温室中采集到的图像,以确保环境因素的多样性。相比在实验室中采集的图像,此数据集的背景更加复杂,包括背景改变、复杂的现场条件、不同的光照设置等,这些变化可以使得模型具有更高的容量、更强的鲁棒性和可推广性,且草莓病害经过了领域专家的验证,可靠性更强。选取该数据集中草莓叶片上的角斑病、叶斑病、白粉病、草莓花朵枯萎病以及草莓果实上的白粉病、灰霉病、炭疽病等7种草莓常见病害类别图像共2 500张。部分草莓病害示例见图1。

1.2  数据预处理

图像增强对克服数据样本,尤其是针对数据集的局限性十分重要。通过图像增强技术能够扩大现有小样本数据集的规模,有助于提高模型的性能和泛化能力,增强模型的鲁棒性,使模型更好地学习到数据的特征和变化模式,以提高模型在实际应用中的表现。草莓病害原始数据集样本过少,且各类别样本数量极度不平衡,容易导致模型在训练时出现过拟合现象。为了提高模型的泛化能力,防止模型训练时过拟合,本研究对原始草莓病害数据集通过镜像翻转、高低对比度、高低亮度等多种常见数据增强方法进行扩增。经过增强后的部分数据见图2。扩增后的草莓病害共有22 500张图像,将扩增之后的数据集按照6 ∶2 ∶2划分为训练集、验证集和测试集,扩增后数据集见表1。

2  草莓病害识别模型构建

2.1  MobileNet v3-Small模型

MobileNet是一系列轻量级的卷积神经网络模型,主要用于在移动端和嵌入式设备上进行实时图像识别和分类任务。MobileNet系列模型比起传统卷积神经网络的优点是参数量少、计算量较低、识别速度快,能够更好地在移动设备上实现高效的推理。MobileNet是轻量化网络的开端,为后续轻量化网络发展奠定了基础。MobileNet共分为3个系列,MobileNet v3[16]是在MobileNet v1[17]和MobileNet v2[18]基础上的进一步改进。

相比于传统卷积神经网络,MobileNet v3主要有以下几点贡献:(1)使用深度可分离卷积代替普通卷积,它由2个部分组成:深度卷积(depthwise,简称DW)和逐点卷积(pointwise,简称PW),深度卷积输入的每个通道分别对应1个卷积核,即每个输入通道都有自己的1组卷积核,用于提取特征;逐点卷积使用1×1的卷积核对深度卷积的输出进行卷积,用于改变特征图的深度以实现特征融合和维度变换。深度可分离卷积大大减少了模型的参数数量和计算量,使得模型比标准卷积网络更加小巧,内存占用率更低。(2)在bneck中引入了SE注意力机制,通过显式的建模特征通道之间的依赖关系来提高网络的表示能力,核心思想是对卷积层特征通道进行动态性的加权,强化特征图中有用的特征并抑制不重要的特征。(3)对激活函数进行了更新,将bneck中的swish激活函数换成h-swish,sigmoid激活函数换成h-sigmoid,提高了模型的非线性能力,更适合在移动设备上高效运算。(4)使用网络架构搜索NAS技术找到最优的网络层配置,以提高模型效率和性能。MobileNet v3模型的网络单元结构见图3。

根据参数量和模型大小的不同,MobileNet v3分为Small和Large版本,为了更适合嵌入移动端设备,本研究选用模型参数量和网络层数更少的Small版本,网络结构见表2,草莓病害识别流程见图4。

2.2  多尺度特征提取模块

Inception是由Google在GoogleNet中提出的一种神经网络架构单元,是GoogleNet最核心的模块[19]。原始的Inception模块结构见图5。Inception模块的主要思想是让网络自适应地选择不同尺寸的卷积核,能在同一卷积层内捕获不同尺寸信息,增加网络的深度和宽度,从而增强模型对草莓病害图像的多尺度特征提取能力。它是一种复合结构,在同一层内并行地应用不同尺寸的卷积核和池化操作。Inception模块共包含4个并行组件:3×3卷积用于捕获中等尺度的空间相关性;5×5卷积用于捕捉更大范围内的空间相关性;3×3最大池化用于提供另一种形式的空间抽象。最终,通过concat操作将卷积与池化之后得到的所有特征图形成模块地最终输出,能够捕捉到不同尺度的特征,但不同尺寸的卷积核和池化层同时也增加了网络的复杂性。

Inception v4是Google对Inception v1至v3系列的改进[20]。Inception_A模块与原始的Inception模块相比在降低了计算量的同时也增强了特征捕获能力。如图6所示,Inception_A模块借鉴了ResNet的设计,通过添加残差连接来促进更深的网络训练,有助于解决深层网络中梯度消失和爆炸问题[21]。Inception_A模块将Inception模块中的5×5卷积分解为2个连续的3×3卷积,在卷积之前使用1×1卷积降维的同时也能捕捉特征图通道之间的局部相关性,在减少参数量和计算量的同时保持了相同的感受野,能够有效处理草莓病害的多尺度问题。

2.3  ULSAM注意力机制

注意力机制模仿人类视觉系统,能在复杂场景中找到显著区域,并根据信息的重要程度分配有限的信息处理资源[22]。在深度学习领域,注意力机制被广泛运用在图像检测与识别领域。然而, 在处理大型输入或模型时,现有的注意力机制如SE[23]、ECA[24]、 CBAM[25]等通常会增加网络的参数数量,

增加模型的复杂性而导致模型更难训练和优化,同时也需要更精细的调参和更长的训练时间。因此,本研究引入了一种ULSAM超轻量级子空间注意力机制,在不显著增加模型参数的同时提高模型识别精度[26]。与传统的注意力机制为所有通道生成单一的注意力图不同,ULSAM为每个特征图子空间单独推断注意力图,通过学习对应特征图的每个子空间注意力图来减少特征图中的空间冗余与通道冗余,从而促进模型的多尺度与多频率特征学习,使得模型更好地把草莓病害特征与复杂背景区分开来,对于细粒度图像分类任务十分有效,ULSAM结构见图7。

具体的实现步骤如下:若输入的特征图为F∈Rm×h×w,其中m为特征图的通道数,h与w分别为特征图的空间维度,ULSAM将F分成g个互斥的组,分别是[F1,F2,…,F,…,Fg],其中每个组有G个特征图,定义F为中间一组特征图, 每个子空间中的注意力图A是由F推断得出的注意力图,A通过学习收集跨通道信息来捕捉特征之间的非线性依赖关系。经过ULSAM处理之后的结果如下:

A=softmax〔PW1{maxpool3×3,1[DW1×1(F)]}〕;(1)

F⌒(AF)F;(2)

F⌒=concat([F⌒1,F⌒2,…,F⌒,…,F⌒g])。(3)

式中,表示逐点相乘;表示逐点相加;F⌒表示将各特征图相连接之后的最终输出。

2.4  模块

CondConv(conditional convolution)是一种条件卷积模块,相比于传统卷积能更好地提升模型尺寸和容量,提取草莓病害特征[27]。在传统的卷积操作中,所有位置都共享相同的卷积核权重,故无论输入数据的具体特征如何,在不同位置上学习到的特征表示都是相同的。CondConv通过引入条件参数,使得卷积核的权重可以根据输入数据的条件进行自适应调整,即每个卷积核都有一个对应的条件参数向量,通过条件参数向量与输入数据进行运算,生成动态的卷积核权重,这样模型就可以在不同位置和不同条件下学习到病害的不同特征表示。

CondConv结构采用更细粒度的集成方式(图8)。CondConv引入了1个条件参数生成器,用于根据输入条件动态生成卷积核的权重,针对不同条件输入生成卷积核的权重,再将这些权重进行加权减少卷积次数,从而得到特定条件的特征表示。

具体步骤如下:将CondConv中的卷积核参数化为n个专家的线性组合,(α1W1+…+αnWn)×x可将卷积过程公式化为

Output(x)=σ[(α1W1+…+αnWn)×x]。(4)

式中,x为输入;σ为激活函数;α1,…,αn是x通过路由函数得到的权重标量。其中路由函数定义为

r(x)=Sigmoid[GlobalAveragePool(x)R]。(5)

其中,R为x映射到n个权重标量的权重矩阵,根据输入的不同得到相应的路由权重向量, 通过增加专家的数量可以扩大CondConv的容量。

2.5  改进的MobileNet v3-Small模型

为了提高MobileNet v3-Small模型对草莓病害的多尺度特征提取能力以及模型泛化性,本研究在MobileNet v3-Small模型基础上进行了改进。

针对草莓病害图像具有多尺度特征导致病症难以准确识别问题,在原有模型基础上引入了Inception_A模块,并且对Inception_A模块进行改进:本研究将Inception_A模块第4个分支中的2个3×3卷积修改为1个3×3卷积,且其输入来自于第3个分支的输出,使得第4个分支与第3个分支共享同一个卷积,实现权重共享,同时在特征拼接完成后添加1×1卷积使得输出通道数与下一层的输入一致。由于局部特征具有平移不变性,相同的特征可以共享相同的权重,通过共享卷积层,能使模型在一定程度上避免重复学习类似的特征,在减少模型参数的同时也能提高泛化能力,改进后的Inception_A结构见图9。将改进后的Inception_A模块添加到模型主干网络第3个bneck后,第3个bneck的输出特征图尺寸为28×28×24,包含了更多的局部细节信息,如病害边缘、纹理等,经过改进后的Inception_A模块能更好地提取到草莓病害的不同尺度特征。

此外,由于MobileNet v3模型bneck中的SE注意力机制只关注到了通道间的信息,本研究在模型主干网络的第8个和第9个bneck之间、最后1个bneck后引入ULSAM注意力机制。在网络深层引入ULSAM注意力机制, 使模型整合低层次的特征,

形成更高层次的抽象表示。

为了提升MobileNet v3-Small模型容量的同时也不增加模型的复杂度,本研究在深度可分离卷积中引入了条件卷积模块,改进后的深度可分离条件卷积模块相比传统卷积利用动态的方式更好地覆盖病害样本之间的关系,克服了常规卷积只拥有局部感受野的缺陷。本研究将深度可分离卷积倒残差结构中的第2个PW卷积替换为CondConv卷积形成PDC(PW-DW-CondConv)结构,改进后的深度可分离条件卷积模块见图10。改进后的MobileNet v3-Small结构见图11。

3  结果与分析

3.1  试验环境和参数设置

本研究使用的Python版本为3.6, 深度学习框

架为Pytorch1.10.2,CPU型号为12th Gen_Intel CoreTM i5-12500H,GPU型号为NVIDIA GeForce RTX 3050,操作系统为Windows11。

本试验采用SGD优化器训练所有模型,训练轮数设置为100轮,批次大小为128,初始学习率设置为0.01,动量值设置为0.7,采用余弦退火学习率更新策略。

3.2  评价指标

本研究采用Top-1准确率(Accuracy)、平均精确率(Precision)、平均召回率(Recall)、平均F1得分(F1)、模型参数量用于评估改进后的模型性能,以这些指标为基准,列出模型混淆矩阵,展示分类模型在不同类别上的预测结果。TP表示模型将正样本预测为正样本的数量,FP表示模型错误地将负样本预测为正样本的数量,TN表示模型将负样本预测为负样本的数量,FN表示模型错误地将正样本预测为负样本的数量。其中Top-1准确率表示模型正确预测的样本比例,计算公式为Accuracy=TP+FNTP+TN+FP+FN;精确率表示预测为正例的样本中被正确预测为正例的比例,计算公式为Precision=TPTP+FP,平均精确率是每个类别上精确率的平均值;召回率表示实际为正例的样本中被正确预测为正例的比例,计算公式为Recall=TPTP+FN,平均召回率是每个类别上召回率的平均值;F1得分用于平衡精确率和召回率之间的权衡关系,计算公式为F1=2×precision×recallprecision+recall,平均F1得分是每个类别上F1得分的平均值。

3.3  试验结果

3.3.1  基于改进MobileNet v3-Small的草莓病害识别

本研究模型是在MobileNet v3-Small的基础上改进得到的,由图12和图13可知,在训练轮数均为100轮的条件下,本研究改进后的模型在验证集的准确率更高,可达到98.29%,相比于改进之前的95.06%提高了3.23百分点,训练损失值由原来的0.005 8下降到0.000 9。由此可知,改进后模型的训练曲线更加平稳,损失值下降更快。

3.3.2  不同模型对识别效果的影响

为更好地验证本研究模型的识别效果,本研究对比了包括传统卷积神经网络和轻量化网络在内的各网络模型,使得对比结果更具说服力。对比的模型有:MobileNet v3-Small模型、SqueezeNet1_1模型、ShuffleNet v2模型、ResNet18模型、AlexNet模型,对比结果见表3。

改进后的MobileNet v3-Small模型在Top-1准确率、平均精确率、平均召回率、平均F1得分4个评价指标上都达到了最优,Top-1准确率为98.62%,

平均精确率为98.16%,平均召回率为96.84%,平均F1得分为97.45%;与此同时参数量从1.53 M下降至1.49 M,各模型验证集准确率见图14。

3.3.3  消融试验

本研究针对草莓病害识别,在MobileNet v3-Small模型基础上进行了3个方面的创新。为了验证这3个创新点对模型整体性能的影响,在控制变量的前提条件下进行消融试验,重新训练模型并导入最优权重,消融试验结果见表4,改进后模型的混淆矩阵见图15。

从试验结果可以看出,与原模型相比,在分别添加改进后Inception_A、ULSAM、CondConv替换PW后模型性能有所上升,当其中2个创新点一起作用时模型效果变得更好,但当3个创新点结合在一起作用时,模型的识别效果才能达到最好。

4  结论

针对真实种植场景下草莓病害图像背景复杂的情况,本研究提出了一种改进的MobileNet v3-Small轻量化模型,首先将改进后的多特征提取模块Inception_A添加到MobileNet v3-Small主干网络的第3个bneck后,能够较好地提取草莓病害不同尺度的特征;其次,在网络深层引入了ULSAM轻量级子注意力机制,能够形成草莓病害更高层次的抽象表示;最后,本研究将深度可分离卷积中的第2个PW卷积替换为CondConv卷积形成PDC结构,克服了PW卷积只拥有局部感受野的缺陷,与此同时也降低了模型参数量。试验结果表明,改进后的MobileNet v3-Small模型能更好地识别草莓各类病害,与原模型相比,Top-1准确率提高了3.71百分点,平均精确率提高了5.96百分点,平均召回率提高了6.43百分点,平均F1得分提高了6.23百分点,同时参数量减少了0.04 M。虽然改进后模型相比原模型总体性能得到了提升,但仍有一些需要提升的地方,如进一步优化模型减少参数量,改进主干网络结构提升准确率等,以期更便捷高效地实现草莓病害检测。

参考文献:

[1]刘  畅,王  晓,李宪松,等. 我国草莓生产态势及国内外比较分析[J]. 中国果树,2023(7):136-140.

[2]麻剑钧,刘晓慈,金龙新,等. 基于机器视觉的农作物病害识别研究进展[J]. 湖南农业科学,2023(9):97-100.

[3]Liu Z X,Du Z X,Peng Y,et al. Study on corn disease identification based on PCA and SVM[C]//2020 IEEE 4th Information Technology,Networking,Electronic and Automation Control Conference (ITNEC).Chongqing:IEEE,2020:661-664.

[4]Chaudhary A,Kolhe S,Kamal R. An improved random forest classifier for multi-class classification[J]. Information Processing in Agriculture,2016,3(4):215-222.

[5]张开兴,吕高龙,贾  浩,等. 基于图像处理和BP神经网络的玉米叶部病害识别[J]. 中国农机化学报,2019,40(8):122-126.

[6]苏仕芳,乔  焰,饶  元. 基于迁移学习的葡萄叶片病害识别及移动端应用[J]. 农业工程学报,2021,37(10):127-134.

[7]何雨霜,王  琢,王湘平,等. 深度学习在农作物病害图像识别中的研究进展[J]. 中国农机化学报,2023,44(2):148-155.

[8]姚建斌,张英娜,刘建华.基于卷积神经网络和迁移学习的小麦病虫害识别[J]. 华北水利水电大学学报(自然科学版),2022,43(2):102-108.

[9]刘  敏,周  丽. 基于多尺度特征融合网络的苹果病害叶片检测[J]. 中国农机化学报,2023,44(8):184-190.

[10]陈伟文,邝祝芳,王忠伟. 基于卷积神经网络的种苗病害识别方法[J]. 中南林业科技大学学报,2022,42(7):35-43.

[11]熊梦园,詹  炜,桂连友,等. 基于ResNet模型的玉米叶片病害检测与识别[J]. 江苏农业科学,2023,51(8):164-170.

[12]黄铝文,郑  梁,黄  煜,等. 基于多尺度卷积与通道域增强的草莓病害识别方法[J]. 江苏农业科学,2023,51(10):202-210.

[13]Yu H L,Cheng X H,Chen C C,et al. Apple leaf disease recognition method with improved residual network[J]. Multimedia Tools and Applications,2022,81(6):7759-7782.

[14]Ma L,Guo X L,Zhao S K,et al. Algorithm of strawberry disease recognition based on deep convolutional neural network[J]. Complexity,2021,2021:6683255.

[15]Afzaal U,Bhattarai B,Pandeya Y R,et al. An instance segmentation model for strawberry diseases based on mask R-CNN[J]. Sensors,2021,21(19):6565.

[16]Howard A,Sandler M,Chen B,et al. Searching for MobileNet v3[C]//2019 IEEE/CVF International Conference on Computer Vision (ICCV).Seoul:IEEE,2019:1314-1324.

[17]Howard A G,Zhu M L,Chen B,et al. MobileNets:efficient convolutional neural networks for mobile vision applications[EB/OL]. (2017-04-17)[2023-09-10].http://arxiv.org/abs/1704.04861.pdf.

[18]Sandler M,Howard A,Zhu M L,et al. MobileNet v2:inverted residuals and linear bottlenecks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Salt Lake City:IEEE,2018:4510-4520.

[19]Szegedy C,Liu W,Jia Y Q,et al. Going deeper with convolutions[C]//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Boston:IEEE,2015:1-9.

[20]Szegedy C,Ioffe S,Vanhoucke V,et al. Inception-v4,inception-ResNet and the impact of residual connections on learning[C]. Proceedings of the  Thirty-First AAAI Conference on Artificial Intelligence.San Francisco:ACM,2017:4278-4284.

[21]He K M,Zhang X Y,Ren S Q,et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Las Vegas:IEEE,2016:770-778.

[22]皇甫晓瑛,钱惠敏,黄  敏. 结合注意力机制的深度神经网络综述[J]. 计算机与现代化,2023(2):40-49,57.

[23]Hu J,Shen L,Sun G. Squeeze-and-excitation networks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Salt Lake City:IEEE,2018:7132-7141.

[24]Wang Q L,Wu B G,Zhu P F,et al. ECA-net:efficient channel attention for deep convolutional neural networks[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).Seattle:IEEE,2020:11531-11539.

[25]Woo S,Park J,Lee J Y,et al. CBAM:convolutional block attention module[C]//European Conference on Computer Vision.Cham:Springer,2018:3-19.

[26]Saini R,Jha N K,Das B,et al. ULSAM:ultra-lightweight subspace attention module for compact convolutional neural networks[C]//2020 IEEE Winter Conference on Applications of Computer Vision (WACV).Snowmass:IEEE,2020:1616-1625.

[27]Yang B,Bender G,Le Q V,et al. CondConv:conditionally parameterized convolutions for efficient inference[EB/OL]. (2019-04-10)[2023-09-11]. http://arxiv.org/abs/1904.04971.pdf.

猜你喜欢

草莓准确率卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
从滤波器理解卷积
高速公路车牌识别标识站准确率验证法
基于傅里叶域卷积表示的目标跟踪算法
草莓
空腹吃草莓
一种基于卷积神经网络的性别识别方法