基于改进BiSeNet的葡萄黑麻疹病害程度分级预测
2024-06-25白春晖陈健郜鲁涛
白春晖 陈健 郜鲁涛
收稿日期:2024-01-24
基金项目:云南省基础研究专项面上项目(202101AT070248)
作者简介:白春晖(2001-),男,河南驻马店人,在读硕士研究生,研究方向为语义分割、植物病虫害检测,(电话)19803601291(电子信箱)2815985035@qq.com;通信作者,郜鲁涛(1987-),男,河南新乡人,副教授,在读博士研究生,主要从事计算机应用技术研究,(电话)15987171851(电子信箱)2013015@ynau.edu.cn。
白春晖,陈 健,郜鲁涛. 基于改进BiSeNet的葡萄黑麻疹病害程度分级预测[J]. 湖北农业科学,2024,63(5):187-193,222.
摘要:为了准确对葡萄(Vitis vinifera L.)黑麻疹病害程度进行分级预测,通过语义分割模型将叶片部分和病斑部分分割出来,以同一叶片上病斑面积与总叶面积的比值作为疾病严重程度分级的依据,对葡萄黑麻疹病害程度进行分级预测。精确标注了PlantVillage公开数据库中的419张葡萄疾病图像,细分为背景、叶片和病斑3个类别,并应用了数据增强技术增加样本多样性。以BiSeNet作为基准模型,引入GhostNet作为上下文路径的主干提取网络,不仅保持了较小的模型参数量,而且在精度上实现了明显提升,满足病害程度分级预测的需求。提出了累加空洞空间金字塔池化(CASPP)模块,用来替换BiSeNet模型中单一的上下文嵌入模块,以增强BiSeNet模型的多尺度上下文信息提取能力,提高了模型的分割精度。经过测试,本研究模型在测试集中的平均交并比为94.11%,在对葡萄黑麻疹病害程度进行分级预测时,准确率达98.21%,能够精确地对葡萄黑麻疹病害程度进行分级预测。
关键词:BiSeNet;深度学习;语义分割;病害程度;分级预测;葡萄(Vitis vinifera L.);黑麻疹
中图分类号:TP399 文献标识码:A
文章编号:0439-8114(2024)05-0187-07
DOI:10.14088/j.cnki.issn0439-8114.2024.05.033 开放科学(资源服务)标识码(OSID):
Prediction of severity grading of black measles disease in grapes based on improved BiSeNet
BAI Chun-hui,CHEN Jian,GAO Lu-tao
(College of Big Data/Yunnan Engineering Technology Research Center of Agricultural Big Data/Yunnan Engineering Research Center for Big Data Intelligent Information Processing of Green Agricultural Products,Yunnan Agricultural University, Kunming 650201,China)
Abstract: In order to accurately grade and predict the degree of black measles disease in grapes(Vitis vinifera L.), a semantic segmentation model was used to separate the leaf and lesion parts. The ratio of lesion area to total leaf area on the same leaf was used as the basis for disease severity grading, and the degree of black measles disease in grapes was predicted. 419 grapes disease images from the PlantVillage public database were accurately annotated and subdivided into three categories: background, leaves, and lesions, and data augmentation techniques were applied to increase sample diversity. Using BiSeNet as the benchmark model and introducing GhostNet as the backbone extraction network for context paths not only maintained a small number of model parameters, but also achieved a significant improvement in accuracy, meeting the needs of disease severity classification prediction. A cumulative atrous spatial pyramid pooling (CASPP) module was proposed to replace the single context embedding module in the BiSeNet model, in order to enhance the multi-scale context information extraction ability of the BiSeNet model and improve the segmentation accuracy of the model. After testing, the average Intersection over to Union of this research model in the test set was 94.11%. When predicting the degree of black measles disease in grapes, the accuracy reached 98.21%, which could accurately predict the degree of black measles disease in grapes.
Key words: BiSeNet; deep learning; semantic segmentation; disease severity; grading prediction; grapes(Vitis vinifera L.); black measles disease
中国葡萄(Vitis vinifera L.)的产量和消费量均领先于其他国家。葡萄作为一种重要的经济作物,被广泛种植于全球许多地区[1]。云南省有着得天独厚的葡萄种植条件,地处云贵高原,享有充沛的阳光和显著的日夜温度变化,这些条件有助于提高葡萄中的糖含量。因此,云南省不仅能种植鲜食葡萄,还能生产出适合酿酒的优质葡萄。但是,各类病害对葡萄生产造成损害,降低葡萄的产出并且对经济增益产生负面效果。因此,快速准确地识别葡萄疾病类型并判断疾病严重程度对于及时实施预防措施至关重要[2,3]。
近年来,深度学习技术的进步推动了卷积神经网络(CNN)在识别植物疾病和害虫方面的发展[4-6]。然而,目前大多数深度学习模型被广泛应用于病虫害的分类和识别方面,且取得了较好的效果[7-14],但是在疾病严重程度检测方面所做的工作较少[15]。从实际角度来看,与疾病分类相比,可靠、准确、及时地检测植物病害严重程度对于农民来说更为重要,因为病害严重程度检测有助于农民做出有效决策,采取适当措施防止植物病害,减轻因感染引起的损失[16]。
基于人工智能的病虫害严重程度分类是农业智慧种植领域新的热点任务。Sun等[17]采用电子鼻(E-nose)和气相色谱-质朴联用仪(GC-MS)从入侵严重程度方面检测茶尺蠖(Ectropis obliqua)对茶树(克隆龙井43)的侵害情况,提出了一种基于金属氧化物传感器响应分段函数的特征提取方法,将该方法提取的特征送入多层感知机(MLP)训练后,平均分类准确率超过95%。但该方法设备价格昂贵,数据获取难度大,不易于推广。Zeng等[15]针对柑橘感染黄龙病的严重程度进行研究,将叶片分为早期感染、中期感染和严重感染3类,分别对比了AlexNet、DenseNet-169、Inception V3、ResNet-34,SqueezeNet-1.1和VGG13 6种模型,最终Inception V3效果最好,准确率达92.60% 。Wang等[18]基于语义分割技术对黄瓜霜霉病、白粉病和病毒病的严重程度进行评估,将叶片染病部分与叶片面积的比值作为病害严重程度分级的依据,提出了基于DeepLabV3+和U-Net的两段式黄瓜叶病分割模型,平均分级准确率为92.85%。
葡萄黑麻疹(Grape black measles)是一种葡萄藤疾病,由真菌引起,主要影响葡萄的果实、叶片和茎部,葡萄叶片出现黄化、黑色斑点、枯死和凋落,枝干出现黑色斑点,以及果实出现褐色或黑色坏死斑点。葡萄黑麻疹会影响葡萄藤的正常生长和养分吸收,最终导致葡萄减产或死亡。本研究通过语义分割模型对图像中的叶片和病斑区域进行分割,以同一叶片上病斑面积与总叶面积的比值作为疾病严重程度分级的依据,对葡萄黑麻疹病害程度进行分级预测。
1 BiSeNet模型结构
BiSeNet[19]是一种用于实时语义分割的模型。它的设计主要用于提高图像分割任务的速度,同时尽量保持较高的准确度。BiSeNet利用其创新的双路径架构,有效捕获高分辨率图像的细节及全局上下文信息,实现图像的快速分割。该模型由2个互补路径构成:空间路径(Spatial path)专注于保持图像细节,从而捕获更加细腻的边缘和轮廓,而上下文路径(Context path)则致力于提炼全局上下文特征,利用较深的网络结构,通过多次下采样迅速扩大感受野,捕获图像的上下文信息,二者的融合为图像分割任务提供强有力的支撑。BiSeNet进一步融合了注意力机制,即注意力引导模块(Attention refinement module,ARM)和特征融合模块(Feature fusion module,FFM)。ARM用于加强上下文路径中的特征表达,而FFM则用于整合空间路径和上下文路径的特征。BiSeNet基本结构如图1所示。
[Conv+BN+ReLU][8倍下采样][16倍下采样][32倍下采样][空间路径][FFM][8倍上采样][ARM][ARM][avg][上下文路径][Conv+BN+ReLU][Conv+BN+ReLU]
2 模型改进
2.1 改进主干网络
尽管深层卷积网络在性能上达到了显著成效,但因为其众多卷积层而需要庞大的计算资源,从而显著增加了计算成本[20]。虽然MobileNet引入了深度卷积[21],但剩余的1×1卷积层仍然会占用相当大的内存。Han等[22]认为主流卷积神经网络中的中间特征普遍存在较大程度的冗余,为了解决该问题引入了创新性的Ghost module,该模块利用成本效益更高的线性变换来生成特征图,基于Ghost module模块,进一步开发GhostNet架构,其在确保网络性能的同时提升计算效率。
GhostNet架构的主要模块是Ghost module,该模块通过线性操作输出额外特征图,在减少运算成本和参数量的同时保持较好的性能。这是因为在主流卷积神经网络模型中存在较多的特征图重复信息。首先,使用常规的卷积操作生成少量的特征图,称为原始特征图。其次,对每个原始特征图应用更简单的线性操作(如普通的线性卷积或深度卷积)来生成多个冗余特征图。这些特征图可以看作是原始特征图的不同线性变换版本,它们是通过廉价的操作生成的,从而减少了计算成本。最后,原始特征图及由线性变换生成的冗余特征图通过拼接操作输出最终的特征图。这种方法允许模型保持更多信息的同时又保证计算资源的高效利用。拼接后的特征图既包括由常规卷积生成的原始特征,也包括由简单操作变换得到的冗余特征,同时保持了特征的多样性。Ghost module使用更少的常规卷积操作,减少了模型的参数量,通过计算成本更加廉价的线性变化生成更多特征图,使得基于Ghost module设计的GhostNet卷积神经网络虽然减少了模型参数量,但模型性能依然能得到保证。
BiSeNet选用了Xception39这一以深度可分离卷积(DWConv)为基础的网络作为其上下文路径的主干网络,有效减少了模型整体的参数量[19]。然而,就精度而言,Xception39并未能充分满足病害程度分级预测的需求。为此,本研究引入GhostNet作为上下文路径的主干提取网络。GhostNet架构起始于一个常规的卷积层,该层负责从输入图像中提取初始特征。此后,网络通过多个Ghost bottleneck结构的串联不断深化特征提取。每个Ghost bottleneck结构由2个Ghost module顺序堆叠而成。第一个Ghost module的作用在于增加特征通道的维数,为后续处理提供丰富的特征信息;第二个Ghost module则旨在减少通道数,以匹配和优化残差连接的结构。通过在Ghost module的输入与输出之间建立残差连接,实现特征的有效传递和网络深度的加强,而不增加额外的计算负担。Ghost bottleneck的结构如图2所示。GhostNet不仅保持了较小的模型参数量,而且在精度上实现了显著提升,满足病害程度分级预测的需求。
2.2 改进上下文嵌入模块
在上下文路径的末端,BiSeNet通过添加全局平均池化模块为网络提供全局上下文信息,从而拓展接收域(即感受野)。这种设计实现了特征的有效融合,但对于病害场景,全局平均池化模块这种全局化的方法未必充分。因为在病害场景中,目标的形状更加复杂,尺寸也不一,单一尺度的全局信息不能捕捉到所有细节,从而影响分割效果。为了克服该问题,PSPNet基于金字塔池化原理,创新性地引入了由多尺度池化块构成的金字塔池化模块(PPM)[23]。PPM能捕捉并整合来自不同尺度子区域的层次化全局信息,减少在尺度变化中上下文信息的损失。经过试验证实,与传统的单尺度方法相比,PPM在处理具有复杂上下文关系的场景上具有更强的信息保持能力,从而在图像分割任务中实现更高的性能。DeepLabv2首创的空洞空间金字塔池化模块(ASPP)采用了不同膨胀系数的膨胀卷积来进一步扩大感知域[24]。DeepLabV3对ASPP进行了改进[25],通过这些优化,使模型的分割性能得到进一步提升。
基于病害场景目标性状的复杂性,本研究提出了累加空洞空间金字塔池化(Cumulative atrous spatial pyramid pooling,CASPP)模块,该模块在ASPP模块的基础上对每个分支与前面分支进行相加操作,更好地提取到图像多尺度、深层次信息,具体结构如图3所示。本研究使用累加空洞空间金字塔池化模块来替换BiSeNet模型中单一的上下文嵌入模块,以增强BiSeNet模型的多尺度上下文信息提取能力。CASPP模块旨在解决病害图像中目标边界模糊的问题,特别是在尺度变化的条件下。CASPP模块通过综合利用不同尺度的空间特征,明确描绘对象的边缘,从而显著提升了分割的精确性。鉴于场景中目标的多样尺寸,CASPP模块能够有效处理各种尺度的对象,并优化分割结果。CASPP模块通过捕获一系列复杂的语义层次,为模型提供深刻的视觉理解,保证在语义分割任务中的全面性和鲁棒性。
2.3 葡萄黑麻疹病害严重程度分级方法
病害严重程度分级是制定防控策略的依据之一,在实践中通常使用以下3种方法:第一种方法是计算单位面积内感染植株数与总植株数的比值;第二种方法是计算同一株植物患病叶片数与总叶片数的比值;第三种方法是计算同一叶片上病斑面积与总叶面积的比值。根据文献[18]中对黄瓜霜霉病严重程度提出的标准,本研究采用第三种方法,以同一叶片上病斑面积与总叶面积的比值作为病害严重程度分级的依据,将葡萄叶片黑麻疹病害严重程度分为5级。这种方法不仅提高了病害评估的准确性,而且也为葡萄病害的早期检测与管理提供了科学依据。
3 试验设计与评价指标
3.1 数据集
本研究所需的图像数据均来源于PlantVillage网站(http://plantvillage.psu.edu)的公开数据库,共包含54 309张图片,涵盖14种不同作物,从中挑选了419张葡萄黑麻疹病害图片来研究病害分级预测的效果。原始图像分辨率为256 px×256 px,为了更有效地实现语义分割,将图像分辨率调整至512 px×512 px,使用Labelme工具对图像中的叶片和病斑区域进行细致地标注处理,划分成背景、叶片、病斑3个类别,生成相应的掩膜图像。这些标注图像为评估分割模型的准确性提供了标准,数据集示例如图4所示。
鉴于深度学习模型的训练需要大量数据,本研究对标注精确的419张图像进行数据增强处理以提高模型的分割精度。数据增强后,图像总数达1 676张,具体增强策略如下。①增加噪点:在图像上施加均值为0、标准差为25的高斯噪点,生成变化后的图像。②降低亮度:通过将亮度因子设置为0.7来减少原始图像的亮度,得到一张新的图像。③增加亮度:通过将亮度因子设置为1.5来提高原始图像的亮度,得到一张新的图像。数据增强效果如图5所示。
上述方法通过模拟不同的光照条件和干扰,增加了图像的多样性。增强后的图像按照8∶2的比例划分为训练集和测试集,用于模型的训练与性能评估。
3.2 试验平台与设计
在进行试验之前,建立一个稳定、高效的试验平台至关重要。因此,本研究选择Linux x86_64服务器作为基础硬件平台。在操作系统方面,采用稳定且广泛支持的Ubuntu 20.04.6 LTS版本,为确保试验顺利执行提供了必要的软件环境和兼容性。在硬件选择方面,CPU采用高性能的Intel(R) Xeon(R) Silver 4210R,频率为2.40 GHz,以支持复杂的计算任务。为了处理深度学习中密集的图形计算,选用NVIDIA GeForce RTX 3090 GPU,它拥有24 GB的显存,保证大规模数据处理和模型训练的高效性。在软件环境方面,采用PyTorch框架,版本1.11.0,构建和训练基于BiSeNet改进的深度学习模型。PyTorch凭借其灵活性和易用性,在学术研究中被广泛应用。配合Python 3.8.8的稳定性和CUDA 11.3的强大并行处理能力,整个试验环境被优化以确保最大的运行效率。
在模型训练阶段,设定批量大小为8,意味着每次送入模型的图像数量为8张。为了进一步增强模型的泛化能力,实施了随机尺度缩放的数据增强策略,缩放尺度为0.75~2.00。随后,图像被随机裁剪至512 px×512 px的分辨率以符合模型输入需求。本研究模型的训练将经历 80 000次迭代更新。在参数优化方面,采用随机梯度下降(SGD)作为优化算法。初始学习率设定为0.01,动量参数为0.9和权重衰减率为5×10-4。此外,本研究应用了一个多项式学习率衰减策略,衰减指数设置为0.9。为了在训练初期获得更稳定的更新步骤,还采用了一个指数预热学习率策略,其中预热期为前1 000次迭代,初始学习率预热比率为0.1。
[ratio= warmupratio1? α,iter≤1 000ratio= (1? α)power,iter>1 000] (1)
式中,[ratio]表示学习率比率;[warmupratio]表示初始学习率预热比率;α表示当前迭代次数相对于总迭代次数的比例;[power]表示指定的多项式衰减指数;iter表示训练迭代次数。
在语义分割领域,类别不平衡和稀有困难样本的存在经常导致模型性能受损。以葡萄病害分割为例,叶片图像通常居于主导地位。这种倾向性会使模型在训练时偏向于识别叶片,进而忽略识别病斑,导致模型在病斑的预测上性能显著下降。本研究在交叉熵损失函数中融入在线困难样本挖掘(OHEM)策略[26],目的是强化模型对于这些难以分割和较少见类别的学习,借此提升模型在全局任务中的表现。
3.3 评价指标
采用平均交并比(Mean intersection over union,MIoU)、宏观平均F1得分(Macro F1 score)、像素准确率(Pixel accuracy,PA)及模型的参数量(Parameters,Params)来评估分割模型的性能。准确度指标是通过构建混淆矩阵来计算的。该矩阵包含真正例(True positives,TP)、假正例(False positives,FP)、真负例(True negatives,TN)、假负例(False negatives,FN)4个关键成分。在混淆矩阵中,行用于表示实际类别,而列代表模型的预测类别。对于多类别分割任务,混淆矩阵将展开为一个多维数组,每个维度对应于特定的类别,以此来表征模型性能的多面性,混淆矩阵的表达式如下。
[C11???C1j???C1N?Ci1?CN1???Cij?CNj???CiN?CNN] (2)
式中,Cij表示类别为i预测为j的样本数;N表示类别数。
交并比(IoU)是语义分割任务中常用的评价指标,用于度量模型在多个类别上的性能。交并比是通过比较模型预测区域与实际区域的重叠程度来度量分割结果的准确性。IoU的计算公式如下。
[IoU= TPTP+FP+FN] (3)
然后,MIoU是对所有类别的IoU取平均值,MIoU的计算公式如下。
[MIoU= 1Ni=0N-1IoUi] (4)
式中,N表示类别数;i表示第i个类别。
Macro F1 score对每个类别计算F1分数,然后取平均值,在处理不平衡类别的情况下,对每个类别平等看待;F1分数是一种评估分类模型性能的指标,同时考虑了精确率和召回率,对于平衡模型在每个类别上的性能非常有用,计算公式如下。
[precision= TPTP+FP] (5)
[recall = TPTP+FN] (6)
[F1=2×precision×recallprecision+recall] (7)
[Macro F1= 1Ni=0N?1F1i] (8)
[PA= i=1NCiii=1Nj=1NCij] (9)
式中,i表示第i个类别;Cii表示表示类别为i预测为i的样本数;N表示类别数; precision表示精确率;recall表示召回率;像素准确率(PA)表示模型分割图与标签的比值。
4 结果与分析
4.1 消融试验
为了验证本研究提出方法的有效性,设计了消融试验以评估各项改进所带来的影响。选取BiSeNet作为比较基线,在此基础上逐步改进。第一组方案采用基准模型BiSeNet。第二组方案在基准模型的基础上将上下文路径的Xception39主干网络替换为GhostNet主干网络。第三组方案在第二组的基础上使用累加空洞空间金字塔池化(CASPP)模块替换原有的上下文嵌入模块。使用MIoU、Macro F1 score、PA、Params作为分割模型的评价指标,消融试验结果如表1所示。
第三组方案明显提高了模型的性能。在第一组方案中,基准模型的MIoU为91.83%,Macro F1 score为95.58%,PA为98.13%,同时模型的参数量保持在0.19×107的水平。在第二组方案中,将主干网络Xception39替换为GhostNet,虽然模型的参数量有所增加,但模型性能比第一组方案有明显提升,MIoU为93.60%,Macro F1 score为96.60%,PA为98.55%。在第三组方案中,以第二组为基础引入了基于膨胀卷积的累加空洞空间金字塔池化模块,替代BiseNet模型中的全局平均池化上下文嵌入模块,模型性能进一步增强,MIoU为94.11%,Macro F1 score为96.89%,PA为98.68%。这些改进虽然导致了参数量的轻微增加,但模型仍符合轻量级的分割网络要求。
4.2 对比试验
为了验证本研究模型的性能优越性,选取BiSeNet[19]、BiSeNetV2[27]、DDRNet[28]和PIDNet[29] 4个目前较先进的轻量级分割模型作为对照,使用MIoU、Macro F1 score、PA、Params作为分割模型的评价指标,以实现对各模型分割性能的全面分析。
由表2可知,本研究模型显示出优越的性能,MIoU、Macro F1 Score、PA分别为94.11%、96.89%、98.68%。特别是在MIoU指标上,本模型比PIDNet模型高1.67个百分点。本研究模型的参数量符合轻量级分割网络的设计标准。通过与当前领先的轻量级分割模型进行对比分析,本研究模型在病害场景的分割任务中表现出色,并且完全符合对于葡萄病害严重程度分级预测的需求。
由图6可知,虽然BiSeNetV2模型和PIDNet模型在分割任务上表现出色,但它们在分割多个微小病斑时效果并不理想。本研究所提出的模型在处理葡萄病斑的细微部分时展示了优异的性能,避免了细微病斑被遗漏的情况,整体上实现了更精确、全面的分割效果。
4.3 病害严重程度分级预测
以同一叶片上病斑面积与总叶面积的比值作为病害严重程度分级的依据,将葡萄叶片黑麻疹病害严重程度分为5级。本研究模型在测试集上分级预测准确率达98.21%。
由图7可知,本研究模型在进行葡萄病害严重程度的分级预测方面表现出色。模型预测的病斑面积与总叶面积的比值与真实标签之间的接近度很高,即使在预测分级错误的个别样本中,差值也小于0.20个百分点。综上,本研究模型能够对葡萄黑麻疹的严重程度进行准确的预测。
5 小结
为了开发能准确预测葡萄黑麻疹病害程度的分割算法,本研究精确标注了PlantVillage公开数据库中的419张葡萄疾病图像,细分为背景、叶片和病斑3个类别,并应用了数据增强技术增加样本多样性。鉴于葡萄黑麻疹病害分割任务对精度与模型轻量化的双重需求,选择BiSeNet作为底层架构,并对其进行优化以满足葡萄黑麻疹病害图像分割的要求。选用GhostNet作为主干网络,在保持参数量仅轻微增加的情况下,明显提升了模型的精度。此外,本研究设计了一种新颖的累加空洞空间金字塔池化模块,有效取代了原有采用全局平均池化的上下文模块。经过测试,本研究模型在测试集中的平均交并比达94.11%,相较于业内领先的轻量级分割模型PIDNet,平均交并比提高了1.67个百分点。在参数量上,本研究模型优于PIDNet模型,满足了对轻量级的需求。本研究模型在测试集上分级预测准确率达98.21%,表明该模型能够精确评估病害的严重程度。本研究主要用于简单背景下的葡萄黑麻疹病害程度预测,未来的工作将拓展到在复杂背景及不同作物种类下的病害程度预测,以全面提高模型的适用性和实用性。
参考文献:
[1] FRAIWAN M, FAOURI E, KHASAWNEH N. Multiclass classification of grape diseases using deep artificial intelligence[J]. Agriculture, 2022, 12(10): 1542.
[2] AMPATZIDIS Y, DE BELLIS L, LUVISI A. IPathology:Robotic applications and management of plants and plant diseases[J]. Sustainability, 2017, 9(6): 1010.
[3] CRUZ A C, LUVISI A, DE BELLIS L, et al. X-FIDO: An effective application for detecting olive quick decline syndrome with deep learning and data fusion[J]. Frontiers in plant science, 2017, 8: 1741.
[4] BARBEDO J G A. Plant disease identification from individual lesions and spots using deep learning[J]. Biosystems engineering, 2019, 180: 96-107.
[5] FERENTINOS K P. Deep learning models for plant disease detection and diagnosis[J]. Computers and electronics in agriculture, 2018, 145: 311-318.
[6] RAMCHARAN A, MCCLOSKEY P, BARANOWSKI K, et al. A mobile-based deep learning model for cassava disease diagnosis[J]. Frontiers in plant science, 2019, 10: 425916.
[7] BARBEDO J G A. Factors influencing the use of deep learning for plant disease recognition[J]. Biosystems engineering, 2018, 172: 84-91.
[8] BOCK C H, BARBEDO J G A, DEL PONTE E M, et al. From visual estimates to fully automated sensor-based measurements of plant disease severity:Status and challenges for improving accuracy[J]. Phytopathology research, 2020, 2(1): 1-30.
[9] JI M, WU Z. Automatic detection and severity analysis of grape black measles disease based on deep learning and fuzzy logic[J]. Computers and electronics in agriculture, 2022, 193: 106718.
[10] BRAHIMI M, ARSENOVIC M, LARABA S, et al. Deep learning for plant diseases: Detection and saliency map visualisation[J]. Human and machine learning, 2018: 93.
[11] LU Y, YI S, ZENG N, et al. Identification of rice diseases using deep convolutional neural networks[J]. Neurocomputing, 2017, 267: 378-384.
[12] MOHANTY S P, HUGHES D P, SALATHé M. Using deep learning for image-based plant disease detection[J]. Frontiers in plant science, 2016, 7: 1419.
[13] RAMCHARAN A, BARANOWSKI K, MCCLOSKEY P, et al. Deep learning for image-based cassava disease detection[J]. Frontiers in plant science, 2017, 8: 1852.
[14] SLADOJEVIC S, ARSENOVIC M, ANDERLA A, et al. Deep neural networks based recognition of plant diseases by leaf image classification[J]. Computational intelligence and neuroscience, 2016, 6: 1-11.
[15] ZENG Q, MA X, CHENG B, et al. Gans-based data augmentation for citrus disease severity detection using deep learning[J]. IEEE Access, 2020, 8: 172882-172891.
[16] ZHANG D, HUANG Y, WU C, et al. Detecting tomato disease types and degrees using multi-branch and destruction learning[J]. Computers and electronics in agriculture, 2023, 213: 108244.
[17] SUN Y, WANG J, CHENG S. Discrimination among tea plants either with different invasive severities or different invasive times using MOS electronic nose combined with a new feature extraction method[J]. Computers and electronics in agriculture, 2017, 143: 293-301.
[18] WANG C, DU P, WU H, et al. A cucumber leaf disease severity classification method based on the fusion of DeepLab V3+ and U-Net[J]. Computers and electronics in agriculture, 2021, 189: 106373.
[19] YU C, WANG J, PENG C, et al. BiSeNet: Bilateral segmentation network for real-time semantic segmentation[A]. Computer vision foundation proceedings of the european conference on computer vision (ECCV)[C]. Berlin: Springer,2018.325-341.
[20] HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition[A]. Proceedings of the IEEE conference on computer vision and pattern recognition (CVPR)[C]. New York: IEEE xplore,2016.770-778.
[21] HOWARD A G,ZHU M,CHEN B,et al. Mobilenets: Efficient convolutional neural networks for mobile vision applications[J/OL]. arXiv preprint arXiv:1704.04861, 2017.
[22] HAN K, WANG Y, TIAN Q, et al. Ghostnet:More features from cheap operations[A]. Proceedings of the IEEE/CVF conference on computer vision and pattern recognition (CVPR)[C]. New York: IEEE xplore,2020.1580-1589.
[23] ZHAO H,SHI J, QI X, et al. Pyramid scene parsing network[A]. Proceedings of the IEEE conference on computer vision and pattern recognition(CVPR)[C]. New York:IEEE xplore, 2017.2881-2890.
[24] CHEN L C, PAPANDREOU G, KOKKINOS I, et al. Deeplab: Semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected crfs[J]. IEEE transactions on pattern analysis and machine intelligence,2017, 40(4): 834-848.
[25] CHEN L C, PAPANDREOU G, SCHROFF F, et al. Rethinking atrous convolution for semantic image segmentation[J]. arXiv preprint arXiv:1706.05587, 2017.
[26] SHRIVASTAVA A, GUPTA A, GIRSHICK R. Training region-based object detectors with online hard example mining[A]. Proceedings of the IEEE conference on computer vision and pattern recognition (CVPR)[C]. New York: IEEE xplore,2016. 761-769.
[27] YU C, GAO C, WANG J, et al. BiSeNet V2: Bilateral network with guided aggregation for real-time semantic segmentation[J]. International journal of computer vision, 2021, 129: 3051-3068.
[28] PAN H,HONG Y,SUN W,et al. Deep dual-resolution networks for real-time and accurate semantic segmentation of traffic scenes[J]. IEEE transactions on intelligent transportation systems,2022,24(3): 3448-3460.
[29] XU J, XIONG Z, BHATTACHARYYA S P. PIDNet: A real-time semantic segmentation network inspired by PID controllers[A]. Proceedings of the IEEE/CVF conference on computer vision and pattern recognition (CVPR)[C]. New York: IEEE xplore,2023: 19529-19539.