APP下载

基于改进YOLO v3 的红掌佛焰与病虫害特征检测研究

2023-12-11谭富林

实验室研究与探索 2023年9期
关键词:红掌耦合病虫害

何 平, 刘 荣, 谭富林

(1.浙大宁波理工学院机电与能源工程学院,浙江宁波 315100;2.杭州电子科技大学机械工程学院,杭州 310018)

0 引 言

随着农业现代化的持续推进和农业经济趋向多元化,我国花卉产业也在不断实现技术化和规模化[1]。红掌由于常年开花不断,已成为市场上最为流行的观赏花卉之一,有着极高的经济价值和观赏价值[2]。红掌在大棚栽培中因其品质参差不齐,给红掌定价带来了很大的困难,所以红掌出棚前需要按品质进行分级。红掌分级是根据红掌佛焰数、病虫害、冠幅、株高和花盖度等特征检测来确定。目前红掌品质鉴定多为人工方式[3],鉴定过程多次直接接触和搬运红掌,容易对红掌造成损伤,且人工鉴定存在一定的主观因素,不适合大批量红掌分级鉴定,所以迫切需要一种准确、高效的红掌特征检测技术,实现红掌准确分级。

目前深度学习已广泛应用于多个领域,并且展现出优秀的效果[4]。卷积神经网络作为深度学习网络的重要组成部分,主要负责对目标特征的检测和提取[5-6]。红掌佛焰与病虫害特征较复杂,传统的检测算法难以实现对其检测与提取。本文利用卷积神经网络能提取图像深层特征的功能,提出改进YOLOv3 网络模型来实现对红掌佛焰与病虫害特征的提取与检测。

1 改进YOLOv3 模型

1.1 YOLOv3 模型

YOLOv3 利用残差网络与多尺度检测实现目标检测,在目标检测方面具有泛化性高、精度高和实时性等优势,是目前流行且较为成熟的目标检测算法之一,能够快速对图像中目标进行定位和检测[7-8]。YOLOv3网络模型由Backbone、neck和head3 组成,结构如图1所示。其中Backbone 为DarkNet53,Darknet53 是YOLOv3 的特征提取层,其包含了卷积层、池化层、残差层等模块。Neck 为特征金字塔网络(Feature Pyramid Networks,FPN),能实现不同尺度的输出。Head为YOLO head,主要负责对特征图进行检测输出。模型的输入尺寸为640 ×640 ×3,利用Darknet53层提取图像的特征图,将特征图输入neck 层,得到3个尺寸(20 ×20 ×1024、40 ×40 ×512 和80 ×80 ×256)的特征图,将其传递到YOLO head 层进行检测。每个网格检测出3 个不同宽、高比的目标检测框及对应预测置信度c,使用NMS 非极大值抑制算法对重复的检测框进行合并和剔除,通过置信度阈值对预测框进行筛选,得到符合需求的目标检测结果。

图1 YOLOv3结构图

1.2 使用BiFPN加强网络对特征的融合

红掌细菌性叶斑病和炭疽病在自然环境下存在尺寸较大差异、分布区域较为分散和部分目标较小的问题,YOLOv3 的小目标检测性能较弱。为提升模型在小目标检测的精度,采用双向特征金字塔网络(Bidirectional Feature Pyramid Network,BiFPN)结构进行多尺度特征融合,利用跨尺度连接(Cross-ScaleConnections)和加权特征融合(Weighted Feature Fusion),得到底层和高层语义信息的全局特征图,以提高网络模型对小目标红掌病虫害目标以及红掌佛焰检测的精确率[9]。

BiFPN的具体工作原理为网络的不同特征层P4、P5、P6、P7和P8,将特征图分别通过卷积层和全局池化层,获得特征图Pin4、Pin5、Pin6、Pin7和Pin8,将Pin8进行上采样并与Pin7堆叠得到Ptd7;将Ptd7进行上采样并与Pin6进行堆叠得到Ptd6,以此类推,获得特征图Pout4、Pout5、Pout6、Pout7和Pout8。以Ptd7和Pout7为例:

式中:conv 为对应卷积操作;Resize 为上或下采样操作;Pin为输入特征层;Pout为输出特征层;Ptd为特征融合过程中的中间层;ωi为需要学习的权重;ε 为微小量。

经过BiFPN层处理实现了多尺度特征融合,同时实现了从输入端实现自上向下和自下向上的特征融合,使得输出的Pout4、Pout5、Pout6、Pout7和Pout85 个同时含有高层与低层语义信息的全局特征。本文在原有特征图中将底层特征图与深层特征图进行融合,提升网络的检测能力。由于YOLOv3 网络每个网格有3 个检测框,本研究通过3 个特征层的融合改进BiFPN结构,得到BiFPN-3 结合YOLOv3 网络结构,有效提升了模型的感受野,增强模型泛化能力。

1.3 通道注意力模块CAM

BiFPN-3 结构的优势是充分融合了浅层和深层的特征,预测特征图语义全局性水平不断增强,语义信息内容更加丰富,同时提升了模型对于小目标的检测能力。BiFPN-3 结构在多尺度特征融合中也存在些问题,过程会融合不同特征层的噪声特征,影响网络模型的检测效果。为解决上述问题,本文提出通道注意力模型(Channel Attention Module,CAM)[10],在BiFPN-3的输出层接入通道注意力模块,将通道注意力模块输出的特征图送入到YOLO head 检测层进行预测。以提升模型的检测精确率与表达能力。

CAM将输入的特征图按照通道权重进行重新划分,能使模型更加注意有用的信息,同时抑制噪声对模型的干扰。

1.4 解耦合检测头

YOLOv3 的输出为目标框的坐标回归、目标类别的预测和Object预测3 个部分,通过骨干网络提取特征、颈部优化特征和耦合的检测头检测进行输出。目标框的坐标回归更加关注目标的边缘信息,目标类别的预测更加关注目标的纹理特征和深度特征,耦合的检测头不能很好地兼顾两者的关注点,故本文采用解耦合的检测头,来提升模型的泛化能力和精度[11]。检测头解耦操作如图2 所示:将YOLOv3 耦合检测头,分别解耦合为Class预测、Object预测和Regress预测。

图2 解耦合检测头

基于YOLOv3 目标检测模型改进主要有:

(1)添加BiFPN-3 结构,使得模型实现多尺度、浅深层特征的融合。

(2)添加通道注意力模块CAM,可强化有效特征并减少噪声。

(3)耦合检测头为解耦合检测头,使得检测头能够更加关注分类和回归的任务。

改进YOLOv3 网络模型如图3 所示。在使用改进YOLOv3 对红掌佛焰进行检测时,使用DarkNet53 对输入网络的红掌图像进行特征提取,使用BiFPN-3 进行多尺度、浅深层特征融合得到特征图,将特征图输入通道注意力模块得到强化的特征图,使用解耦合检测头对强化的特征图进行检测,实现对红掌佛焰和病虫害特征检测。

图3 改进YOLOv3网络模型

2 实验结果与分析

本文使用精确率P,召回率R,整体精度F1指标和平均精度值mAP对检测结果进行评估,精确率

式中:TP为模型正确检测红掌的目标数量;FP为模型错误检测红掌的目标数量。召回率

式中,FN为模型未被检测出红掌的目标数量。整体精度

F1表示P和R的加权调和平均值,F1值越接近于1则说明模型越好。平均精度值

式中:S为算法检测目标类别个数(本算法中S=1);k为阈值;N为引用阈值的数量。

2.1 数据收集与模型训练

为获取红掌佛焰和病虫害数据,本文使用工业摄像机采集红掌视频,并对红掌视频按照2 s 一帧抽取红掌图像,并使用LabelImg 标注软件对所有采集到的红掌佛焰图像和病虫害图像进行标注,共打标14 678个红掌佛焰目标、6 235 个细菌性叶斑病目标和5 430个炭疽病目标。

改进YOLOv3 模型使用带动量的SGD 优化器,初始学习率为0.001,Batch Size设置为8,从0 开始训练整个网络,一共训练300 个Epoch。图4 所示为网络训练过程中Loss的变化情况,在整个训练过程中,Loss的整体变化趋势是持续减小,且没有出现幅度较大的波动。表明,本设计的模型网络以及训练时使用的参数是合理的。

图4 改进YOLOv3训练过程中loss的变化

图5 所示为网络训练过程中mAP 精度的变化情况,由图可知,模型开始训练mAP震荡较大,随着训练周期的增加,mAP逐渐趋于平缓并稳定在0.93 左右,表明本文所提改进YOLOv3 网络模型收敛较稳定,同时对佛焰和病虫害的识别精度也较高。

图5 改进YOLOv3训练过程中mAP的变化

2.2 综合检测性能对比

对改进YOLOv3 进行消融试验,各性能指标见表1,其中:“0”为没有使用对应改进结构;“1”为使用了对应改进结构。由消融实验结果可得,使用BiFPN-3改进后的模型精确率P、总体精度F1和平均精度mAP分别提升0.86%、0.73%和0.42%。BiFPN-3 通过融合多尺度特征和多层特征,提升了模型的感受野,从而提升了模型检测性能。使用CAM 模块改进后的模型mAP提升了0.68%,其余指标提升较少。注意力机制能够强化特征并减少噪声,提升模型的检测精度。使用解耦检测头模型精确率P、F1精度、mAP 精度分别提升0.71%,1.01%、1.18%。解耦检测头能使模型更加关注分类和回归各自的任务,提升模型的性能。综合使用BiFPN-3、通道注意力模块和解耦合检测头后的模型在精确率P提升了2.3%,F1精度提升了2.01%,mAP提升了1.66%,所有性能指标提升比较明显。BiFPN-3 实现多尺度特征融合提升模型感受野,注意力机制强化了有效特征,解耦合检测头使得检测分别关注分类和回归,将三者联合使用,能有效提升模型的检测精度和泛化能力。

表1 改进YOLOv3 消融实验结果

将其他算法与本文改进YOLOv3 进行性能对比,结果见表2。

表2 改进YOLOv3 与其他网络模型性能对比

实验对比了YOLOv3 原模型、使用了CSPDarknet53 为主干提取网络的CSP-YOLOv3 模型和双阶段模型Mask R-CNN。由表可得,改进YOLOv3 模型的mAP较YOLOv3 和CSP-YOLOv3,分别高出1.66%和1.46%,表明本文对YOLOv3 网络模型的改进是有效的。在平均精度值mAP 上改进的YOLOv3 低于双阶段模型Mask-RCNN,在实际的红掌分级中,不仅要考察算法的精度也需要考虑算法的运行速度,虽然Mask R-CNN检测精度较高,但其检测速度慢,不能满足红掌分级的实时性。由表2 可知,改进YOLOv3 检测速度是Mask-RCNN的近30 倍,所以Mask-RCNN不能选用。改进YOLOv3 在不明显降低检测速度的同时提升了模型的精度P、召回率R、F1精度以及mAP 精度,证明本文对YOLOv3 的改进是有效的。

3 结 语

由于红掌佛焰与病虫害特征较复杂,且病虫害存在小目标,为使红掌佛焰和病虫害特征检测更加精确,本文提出改进YOLOv3 网络模型。通过对YOLOv3 网络模型的改进,创新性地将YOLOv3 的FPN网络修改为BiFPN-3,加强网络层不同尺度特征的融合,提升模型的感受野。在BiFPN-3 后加入通道注意力模块CAM,加强网络对有效特征的提取能力,提升网络泛化性。创新性地将耦合YOLOv3 检测头改为解耦合检测头,使检测头更加关注各自的分类和回归任务,提升模型的精度。通过将YOLOv3、CSP-YOLOv3 和Mask-RCNN目标检测模型与改进YOLOv3 模型进行试验与讨论,得出改进YOLOv3 模型对红掌佛焰与病虫害特征检测具有更高的精确率和召回率,检测效果有明显提升。结果表明,改进YOLOv3 检测网络能适用于大量红掌佛焰和病虫害的检测,满足实际生产需要,在红掌检测应用上实现了突破。

猜你喜欢

红掌耦合病虫害
非Lipschitz条件下超前带跳倒向耦合随机微分方程的Wong-Zakai逼近
芽大小、6-苄氨基嘌呤和活性炭对红掌芽生长的影响
春季葡萄苗病虫害咋样防治
夏季玉米主要病虫害有哪些
美丽的红掌
三招搞定花卉病虫害
红掌鲜切花温室栽培技术探究
红掌
基于“壳-固”耦合方法模拟焊接装配
求解奇异摄动Volterra积分微分方程的LDG-CFEM耦合方法