APP下载

基于改进YOLOv5模型的经济林木虫害目标检测算法研究*

2022-04-24何颖陈丁号彭琳

中国农机化学报 2022年4期
关键词:虫害算法特征

何颖,陈丁号,彭琳

(云南农业大学大数据学院,昆明市,650201)

0 引言

经济林木是指经济价值较高的林木,我国森林资源的重要组成部分[1]。在林木生长阶段,一旦发生虫害,后果将十分严重,在经济效益受损的同时,生态平衡也会被打破。从源头控制森林虫害,采取虫害精确检测的防治措施是提升经济林木资源保护,促使林业生态环境持续优化的重要举措[2]。

近年来,我国研究人员在基于光谱分析技术对作物的光谱图像进行虫害检测分析领域,进行了大量探索性研究。例如,田有文等[3]利用主成分分析法(PCA)和BP神经网络对苹果高光谱图像进行虫害快速检测。刘子毅[4]利用对农田虫害光谱数据进行图像数据特征分析,实现了农业虫害的自动化检测。邓小玲等[5]利用柑橘叶片荧光数据进行概率神经网络建模及分类处理,实现了对健康的、非黄龙病黄化的以及患有黄龙病的三种柑橘植株的鉴别。但上述方法所需数据的获取和处理成本较高,不利于推广。随着农业信息设施的推广,虫害照片图像的采集和存储变得越来越容易,同时深度学习也在图像处理领域取得了新的进展,因此采用深度学习对虫害数据进行分析越来越受到关注。例如,张军国等[6]首先对无人机航拍的虫害数据进行去噪处理,然后利用分水岭算法对虫害区域进行分割提取。杨国国等[7]通过AlexNet卷积神经网络模型实现茶园害虫检测,并采用图像显著性分析和Grabcut算法对茶叶害虫进行定位,其检测准确率可达91.5%;李衡霞等[8]利用VGG16卷积神经网络提取油菜虫害图像的特征,然后用区域候选网络滑窗生成油菜害虫位置候选框,最后Fast R-CNN实现候选框的分类和定位。Tetila等[9]首先使用简单线性迭代聚类(SLIC)方法分割图像,然后使用CNN分类模型对大豆叶片虫害进行识别。但上述方法需要对数据进行预处理,同时也大多局限于单种作物的虫害检测。并且,针对经济林木虫害数据集(含20种经济林木虫害)的目标检测研究还未见报道。

本文针对经济林木虫害目标小,一张图片含多个目标等问题,采用特征融合技术和修改自适应Anchor计算方法对YOLOv5主干网络模型进行改进,并在含20种经济林木虫害的图像数据集上进行试验,旨在为经济林木虫害预警系统提供算法支撑。

1 试验方法

1.1 基于改进YOLOv5模型的经济林木虫害目标检测算法

1.1.1 YOLOv5网络简介

YOLOv5模型是You only look once(YOLO)系列最新的一阶段算法模型,是在YOLOv3[10]的基础上进行改进,具有模型尺度灵活多变,部署成本低,训练时间和推理速度更快等特点。YOLOv5模型结构可分为四部分,分别是输入端、骨干网、特征网络架构以及输出端[11]。

由输入端包括Mosaic数据增强、自适应图片缩放以及自适应锚框三部分。Mosaic数据增强将四张图片进行有序组合,达到丰富图片背景的效果。自适应图片缩放是将原始图片自适应添加黑边,统一缩放到一个标准尺寸,再送入检测网络中。自适应锚框是指每次训练时,自适应的计算训练集中的最佳锚框值。

骨干网结构主要包含了Focus、BottleneckCSP模块和SPP(空间金字塔池化),Focus模块是将图像进行切片操作,如图1所示,将一张2×2×3的图像进行切片之后变成1×1×12的特征图,将输入通道扩充为原来的4倍,并经过一次卷积操作得到下采样特征图,减少了模型的计算量,提升了运算速度。BottleneckCSP模块参考CSPNet[12](跨阶段局部网络)由卷积层和X个Resnet模块组成,增强整个算法模型学习性能的同时大幅减少计算量,图片经过BottleneckCSP模块后提取特征,再经过空间金字塔池化提取固定大小特征,解决了输入图像大小必须固定的问题,从而可以使得输入图像高宽比和大小任意。

图1 Focus操作示意图Fig. 1 Focus operation diagram

特征网络架构采用了与PANet[13](路径聚合网络)结合的结构,主要解决目标检测中的多尺度检测问题,FPN(特征金字塔网络)将高层的特征信息通过使用自下而上,自上而下,横向连接三种方式进行特征传递融合,提高最后网络层特征信息能力,不过FPN只增强了语义信息传递,对浅层定位信息传递较弱。而PANet是在FPN通过3×3卷积后再添加一个自底向上的金字塔,加强定位信息的传递。YOLOv5将FPN生成的76×76的特征作为输出。同时,将PANet生成的38×38,19×19的特征作为输出,结合Anchor,完成不同尺度目标的检测。

输出端采用GIOU_Loss(广义交叉联合)做Boundingbox(边框回归)的损失函数,在目标检测的后处理过程中,针对很多目标框的筛选,通常还需要Non-Maximum Suppression(非极大值抑制)操作,生成的三种不同大小特征图用于后面的loss(损失函数)计算。

YOLOv5模型结构如图2所示。

图2 YOLOv5网络模型Fig. 2 YOLOv5 network model

1.1.2 YOLOv5模型改进

针对YOLOv5模型在经济林木虫害检测中的实际需求,本文对YOLOv5模型做出如下改进。

1) 根据感受野计算公式(1),在卷积神经网络中网络结构特征图的感受野是随着卷积层数加深而越变越大的如图3所示,而感受野区域内的像素点会影响特征信息的输出。于是选择合适大小Anchor去覆盖特征图上感受野可提高模型检测召回率。YOLOv5模型依靠人工设计9个不同大小的Anchor框,来定位不同特征层级上不同尺度大小的目标,如果Anchor太小只能观察到局部的特征,不足以得到整个目标的信息。如果Anchor过大则会引入过多噪声和无效信息。因此合理的调整Anchor的大小,可减少网络模型计算量以及提高定位的准确率。而通常Anchors是基于bounding boxes(边界框)与Anchor之间平均欧氏距离进行计算,本文将自适应锚框计算方法修改为1-IoU(bboxes,Anchors)[14],具体步骤为在所有的bboxes中随机挑选k(k大于类别数)个作为簇的中心,再计算每个bboxes离每个簇的距离1-IoU(bboxes,Anchors),根据1-IoU计算每个bboxes距离最近的簇中心,并分配到离它最近的簇中。然后根据计算中值重新计算每个簇中的bboxes簇中心,一直重复上述操作直到每个簇中元素不在变化,如图4所示(k=3)。

(1)

式中:Hk——第k网络层的感受野大小;

Fk——第k层卷积核大小;

Si——第i层步长。

(a) stage0_Focus_features

(b) stage14_Conv_features图3 不同特征层感受野对比Fig. 3 Comparison of receptive fields in different feature layers

(a) 开始

(b) 第4次

(c) 第13次

(d) 第15次

(e) 第19次

(f) 结束图4 修改K-means聚类获得Anchor区间Fig. 4 Modify K-means clustering to obtain Anchor interval

2) 根据CNN(卷积神经网络)特性,特征信息会随着卷积操作而减少或者消失,从而增加了小目标物体的检测难度。针对上述问题,在骨干网络额外添加一层特征提取层,这样可在不增加计算量的情况下,提升模型对浅层特征的提取能力。同时将提取的特征层信息与最后几层卷积层进行融合,提升模型对小目标物体的特征信息。具体改进如图5所示,将网络层经过Focus后进行1×1的卷积分支操作,提取图片浅层特征信息如经济林木虫害颜色特征,边缘特征等,并对特征图进行上采样等处理,使得特征图继续扩大,同时在第5层时,将获取到的大小为160×160的特征图与骨干网络中第4层网络层进行级联融合,以获得对小目标物体具有更多语义信息的特征图。骨干网络经过Focus操作后经过3×3Conv+BN+ReLU运算后,输入到BottleneckCSP层进行非线性运算将得到的特征图直接传入下一级颈部网络中,重复上述步骤,这样可以增强模型其对于不同缩放尺度对象的检测,从而能够识别不同大小和尺度的同一个物体。

图5 改进的YOLOv5骨干网络模型Fig. 5 Improved YOLOv5 Backbone network model

3) 输入图片经YOLOv5网络中的主干网络提取特征后,需要经过检测颈部网络进行预测输出。本文对数据集虫害图像进行分析,发现多数害虫目标都属于中小尺寸情况如图6所示。

图6 数据集虫害目标尺寸分布Fig. 6 Data purpose object size distribution

为提升模型对小目标物体的检测效果,改进原模型PANet结构。使用BiFPN(加权双向特征金字塔网络)[15]对原始的FPN模块进行改进增添上下文信息的边,并乘以一个相应的权重(图7),将YOLOv5模型中低层特征与高层特征进行高效融合,使其具有强语义信息的同时对细节仍有较强的感知力,达到提升模型对小目标检测的精度,具体改进如图8所示。

图7 加权双向特征金字塔网络Fig. 7 Weighted bi-directional feature pyramid network

改进PANet网络结构只有单条输入和输出边的结点,在输入输出结点是同一层级时,使用残差方式[16]增加一条额外的输入和输出边,这样可以在不增加额外开销的同时融合更多图片特征,通过不同层级连接和同级跨越连接这样高效的多尺度特征融合方式,并对每一条边引入了加权策略,重复上述操作最终获得四个不同层级的特征图,增强网络模型的预测信息。

(b) Our图8 改进之后的特征网络架构对比Fig. 8 Comparison of improved feature network architecture

1.2 试验平台

本文所有试验基于Pytorch深度学习框架,实现网络的训练和测试,实验室服务器的主要配置如下,硬件平台是NVIDIAGeForceRTX3090显卡运行内存为24 GB和AMDEPYC7302中央处理器并且运行内存为64 GB,操作系统为Ubuntu20.04,使用Python语言编程训练和测试。

1.3 模型训练

模型进行训练时,使用COCO上的预训练权重初始化网络参数,同时为了防止梯度爆炸将初始学习率设置为0.01[17],采用Adam[18]算法作为神经网络训练算法,动量因子设置为0.9,权重衰减系数设置为0.001。

2 试验结果与分析

2.1 试验方案

由于经济林木虫害数据稀缺且难以收集,为了保证收集数据准确性,本文试验数据集部分来源于大规模开源数据集IP102[19],部分来源于北京林业大学昆虫数据集[20]。以经济林木为范围,本文收集了20种经济林木虫害,共3 907张图片,部分图片如图9所示,具体类别如图10所示。

为选取最优模型,本文采用多项指标对模型的性能进行评估,具体指标包括交并比(IoU)、准确率(P)、召回率(R)、平均精度均值(mAP)。

(2)

式中:Ba——预测框的区域;

Bb——真实框的区域。

(a) Adristyrannus (b) Aphids

图10 各个类别以及Anchor图Fig. 10 Various categories and Anchor diagrams

IoU越高,代表预测框与真实框的重叠度越高,则预测值就越接近真实值。

(3)

(4)

(5)

式中:TP——正样本被检测为正样本数量;

FP——负样本被检测为正样本数量;

FN——正样本被检测为负样本数量;

N——检测样本类别数量。

2.2 改进模型的检测可视化结果

分别用YOLOv5模型与最终改进YOLOv5模型对经济林木虫害进行检测,对比虫害识别准确率以及识别位置。图11和表1是两种模型识别对比结果。

(a) 未改进模型检测效果

Bird cherry-oata phid

Fig. 11 Comparison of two model detection effects

从图11(a)可知未改进模型对大目标物体识别准确率为70%,且小目标物体并未识别出来存在明显不足,而经过改进的模型,不仅对大目标物体识别准确率提升了15%,而且小目标物体也能达到与大目标物体一样的准确率。

2.3 数据增强效果

本文将图片大小进行resize操作,统一保持输入图片像素为640×640。然后采用随机亮度变换、Random Erasing、随机添加高斯噪声等数据增强方法进行数据扩充,数据分布如图12和图13所示。再按8∶2比例划分训练集、测试集,将原始数据与增强之后数据在本文改进的模型上进行对比试验,增强结果如表2所示。由表3可知,通过增强后的数据,模型能明显提升对经济林木虫害特征的提取,mAP提升了0.172。

(a) 数据增强前真实框在原图位置分布图

(b) 数据增强前真实框长宽分布图图12 数据增强前真实标签分布图Fig. 12 Real label distribution before data enhancement

(a) 数据增强后真实框在原图位置分布图

(b) 数据增强后真实框长宽分布图图13 数据增强后真实标签分布图Fig. 13 Real label distributim after data enhancement

表2 各类别真实框数量对比Tab. 2 Comparison of the number of true boxes of various categories

因一张图片可能包含多种类别,多个数量。所以表2真实框数量远远大于图片数量。

表3 数据增强对比试验Tab. 3 Dataenhancementcomparison test

2.4 改进主干网的效果

采用增强后数据集作为输入数据,将改进主干网络与未改进主干网络进行对比试验,结果如表4所示。由表可知,改进的主干网络模型比未改进的模型mAP提高了0.002。证实了该改进的有效性。

表4 主干网络对比试验Tab. 4 Comparison test of backbone network

2.5 采用自适应锚框的效果

首先采用自适应锚框算法得出数据集合适Anchor(锚框)大小,如表5所示,更改模型Anchor大小与未改进模型进行对比试验,结果如表6所示。可证实改进之后自适应锚框大小更符合本文数据集,相比mAP提升0.017。

表5 调整自适应锚框大小结果Tab. 5 Results of resizing adaptive Anchor box size

表6 调整自适应锚框对比试验Tab. 6 Improved adaptive Anchor box contrastive experiment

2.6 改进特征网络架构的效果

采用增强后的数据集作为输入数据,只进行特征网络架构改进与未改改进特征网络架构对比试验,结果如表7所示。可以看出,经过改进特征网络架构后的特征提取能力更强,与改进前相比,其mAP提升了0.04。

表7 特征网络架构对比试验Tab. 7 Feature network architecture comparison test

2.7 消融试验结果

为了验证本文提出的所有改进能否取得更好的检测效果,在增强后数据集上进行对比测试实验。为了确保试验严谨,本消融试验中,网络设置、训练步骤、所用Pytorch版本、CUDA版本以及显卡平台均保持一致。上述试验已验证了改进后主干网络结构模型的有效性,因此后续试验都将使用改进后的主干网络作为基准模型,针对自适应锚框和改进特征网络架构进行消融实验,试验结果所表8所示。由表8可知,本文提出的所有改进能够在经济林木虫害数据集上取得更好的检测效果,与原始YOLOv5模型相比,改进模型mAP提升了0.111。

表8 多改进消融试验Tab. 8 Multiple improvement of ablation test

2.8 与不同算法模型的对比结果

为了更好地证明本文改进算法的性能,还与各个先进模型在检测精度与推断速度进行试验比较,结果如表9所示,效果对比如表10以及图14所示。

表9 本文算法与先进目标检测算法实验对比Tab. 9 Comparative comparison of this algorithm and advanced object detection algorithm

表10 各模型检测对比Tab. 10 Comparison of each model detection

综合来看,本文算法相比于其他算法,对经济林木虫害的检测效果更好。与YOLO系列算法模型YOLOv3、YOLOv4相比不仅在mAP上保持优势,而且在推断速度上也保持领先地位。与二阶段算法传统模型Faster-RCNN相比mAP提升相对较少,但是在推断速度上依旧保持着单阶段算法的优势达到了64.9帧,并且模型大小只有其1/5,与Anchor-free模型CenterNet相比在保持更大尺寸图片输入情况下,检测精度更高。

本文在相同环境下与Faster-RCNN、YOLOv3、YOLOv4、CenterNet四种模型进行对比,实验结果表明:本文提出的改进模型在推断速度上明显优于二阶段目标检测方法,原因是本文提出的改进算法属于一阶段目标检测算法。虽然本文提出的改进模型与YOLOv5算法相比在精确度上处于领先位置,但推断速度稍逊于YOLOv5,原因是本文增加了小目标特征提取层和检测层,这种改动在增强目标特征提取能力的同时也增加了模型参数。

图14 检测图片真实框分布图Fig. 14 Detect picture ground truth box profile

3 结论

1) 本文提出了一种基于改进YOLOv5模型的经济林木虫害目标检测算法,这种方法精度高、速度快,其平均精度均值达到了0.923,平均检测一张图片时间仅需0.015 s,该方法可直接用于经济林木病虫害预警系统。

2) 本文采用随机亮度变换、Random Erasing、随机添加高斯噪声等方法进行数据扩充,解决数据样本不平衡会影响模型的性能问题,实验结果证明了数据增强的有效性。针对经济林木虫害这个目标小、大小不一的特点,本文采用了自适应锚框,相对于模型原有的锚框参数,自适应锚框可以根据数据集对锚框参数进行调整,从而提高了模型的性能。由于本文数据集没有做背景去除处理,因此特征的提取也变得更难,本文增加了一层小目标特征提取层、修改特征金字塔结构以及增加一层检测层,相对于原有网络结构,这种方式提取目标特征的能力更强,其平均精度均值提高了0.113。

3) 本文改进的YOLOv5模型在经济林木虫害数据集上的平均精度均值为0.923,推断速度达到64.9帧,模型大小为99.6M,其结果明显优于与之对比的目标检测算法模型(YOLOv3、YOLOv4、Faster-RCNN、CenterNet),此外也证明了本文所有改进(数据增强、改进主干网络、改进特征网络架构和自适应锚框)在经济林木虫害数据集上的有效性,可为经济林木虫害预警系统提供算法支撑。受限于试验数据集中虫害种类的局限性,本文在后续研究中将增加经济林木虫害的种类以扩充数据集。

猜你喜欢

虫害算法特征
苦参碱对小麦虫害的防治效果试验分析
Travellng thg World Full—time for Rree
抓特征解方程组
乡村无人机喷药
气候变化下的林业虫害防治措施
学习算法的“三种境界”
算法框图的补全
算法初步知识盘点
美国油梨虫害进一步加重
春天来啦(2则)