APP下载

基于改进AlexNet的岭南水稻虫害识别方法研究

2023-02-24江顺黄红星莫里楠韩威威高卓君卓钟洪

江苏农业科学 2023年23期
关键词:深度学习

江顺 黄红星 莫里楠 韩威威 高卓君 卓钟洪

摘要:通过改进经典AlexNet深度学习模型在几种典型的水稻害虫识别中的深度不足和过拟合问题,探索出一套泛化能力更强、识别精度与计算效率更加均衡的深度学习网络模型,达到在一定计算资源支持下能适应复杂情境的精准辨识水稻害虫的需求。本研究中AlexNet-enhanced模型经过了以下改进:(1)采用通过缩小卷积核和增加卷积层深度的方式提升对图像深层次特征提取的能力;(2)删除LRN层和删除一个全连接层提升模型计算性能;(3)使用RReLU激活函数改进模型鲁棒性。试验数据使用多种网络数据集和自采集数据,选择稻纵卷叶螟、稻大螟、稻二化螟、稻三化螟、稻飞虱、稻象甲等具有代表性的南方水稻害虫数据作为试验数据,并加入健康水稻影像数据构建试验数据集。选择VGG-16、经典AlexNet、LeNet等3种模型训练作为本研究的对比模型,对4种模型的准确率、混淆矩阵、精确率、召回率、F1分数等结果参数进行综合比对分析评估模型性能。结果表明:(1)AlexNet-enhanced模型對比经典AlexNet模型在训练时间上有较大升高,但对比VGG-16这类结构更深的神经网络模型具备明显的训练时间优势;(2)与经典AlexNet模型相比,改进后的模型对水稻害虫的识别率有较大的提升,对幼虫的识别率提升更加明显;(3)对试验结果的分析发现4种模型对各类型害虫的成虫识别率均明显高于幼虫。本研究结果表明,改进的AlexNet模型对南方水稻害虫的识别问题有不错的应用效果,可以作为大田间水稻害虫智能识别的有效解决方案;同时,神经网络模型的训练受特征采样条件约束较强,需要对生产中的数据采集设备进行针对性的改进。

关键词:深度学习;南方水稻;害虫识别

中图分类号:TP391.41  文献标志码:A

文章编号:1002-1302(2023)23-0187-08

岭南水稻种植对我国农业和社会具有重要的经济和社会意义。它不仅可以保障国内粮食安全,还可以为农村劳动力提供就业机会,提高农村收入,保护生态环境等。在我国南方地区,水稻作物易受到虫害,这些害虫包括稻飞虱、稻田螟、稻虫、稻蝗等[1-4]。它们对水稻作物造成的损害主要体现在减少产量和降低质量。如果不及时采取防治措施,这些害虫可能对农业生产造成严重损失[5-7]。因此,对于南方水稻害虫的防治是十分重要的。智能识别技术在水稻害虫防治中的应用可以分为2个方面:识别和监测[7]。识别:可以帮助生产者识别害虫种类。例如,使用图像识别技术可以快速识别害虫,帮助农民制定更有效的防治措施[8-11]。监测:可以用于监测害虫数量和蔓延范围,以便及时采取防治措施[12-14]。例如,使用无人机技术可以对水稻田进行快速监测,获取害虫数量和分布情况的精确数据[15-17]。总的来说,识别技术在水稻害虫防治中的应用可以提高防治效率,减少农业生产的损失,并保护粮食安全。本研究即对南方水稻害虫的智能识别技术开展探索性的方法研究。

1 数据与方法

1.1 数据准备

本研究使用多种网络数据集和自采集数据,抽取其中的南方水稻种植常见的害虫相关数据,约 5 000 张图片数据,笔者所在研究团队通过长期对试验基地害虫数据进行观测,积累常见南方水稻病害虫图片约10 000张。并在训练集中加入2 000张健康水稻样本图像,在测试集中加入600张健康样本图像。将采集的害虫影像数据进行加入噪声和翻转调整角度等处理,最终获得训练样本数据 27 000 张,测试数据8 600张,在本研究中,采用广东常见的6种害虫作为分类集:稻纵卷叶螟、稻三化螟、稻二化螟、稻大螟、稻飞虱、稻象甲等,由于每种害虫又有成虫与幼虫之分,故最终将训练集分类为13类。本研究分类集数据分布详见表1。

对于卷积神经网络,输入向量的空间维度以及其相对应的神经元数量由全连接层决定。卷积神经网络对应的空间维度随神经网络的输入样本尺寸的不同而变化,当训练样本尺寸不同时,神经网络因空间维度不同而无法训练。在将训练样本输入神经网络训练时,需对样本图像的尺寸属性进行规范化处理。样本数据集图像尺寸不定,在训练前需要将样本数据集重采样为长宽各224个像元的标准化图像(图1)适应神经网络训练。

1.2 AlexNet网络结构

AlexNet神经网络模型是一种典型的卷积神经网络模型,该模型由AlexKrizhevsky在2012年的ILSVRC比赛中首次提出,在比赛中,该模型的top5预测的错误率为16.4%,远超第2名获得冠军。AlexNet神经网络模型由8个网络层、5个卷积层及3个全连接层组成,设计为双路网络结构以便于使用2块GPU进行神经网络训练,其激活函数与池化方法分别为ReLu和MaxPooling。数据参数量约为240 MB。同当时的各种神经网络模型相比,AlexNet模型具有以下优势[18-20]。

(1)使用ReLU函数作为神经模型的激活函数。对比被替代的Sigmoid函数,ReLU函数在进行更深层神经网络的分类效率具有较大的提升,同时在增加网络深度时一定程度上改进了梯度弥散的问题。

(2)通过随机忽略神经元的方式避免训练中的过拟合问题。在全连接层中增加Dropout忽略(失活)部分神经源,强制网络学习多个独立且各不相同的子网络,在模型训练中,设置Dropout参数值为1,则全部神经元都参与训练。

(3)采用重叠的最大池化方法。在卷积神经网络的池化层,以重叠的最大池化(overlapping max-pooling)方法代替此前各类卷积神经网络模型普遍采用的一般平均池化(general mean-pooling)方法,以得到两点改进:提升特征丰富性、避免池化模糊问题。

(4)采用局部响应归一化方法。在卷积神经网络中,应用局部响应归一化方法(local response normalization,LRN),在神经网络训练中对局部的神经元活动设置响应的竞争机制,在LRN中,响应较大的值相对更大,抑制响应较小的神经元,提升模型泛化效果。

(5)多GPU训练,并使用CUDA环境加速神经网络的训练,可使用双GPU训练神经网络。

(6)通过数据增量减少过拟合。可以通过对图像进行旋转、翻转、裁剪等变换,增加训练数据的多样性,提高模型的泛化能力。

AlexNet网络的结构如图2所示。输入信息格式为3波段的224×224大小的灰度图像数据,由5个卷积层和3个全连接层组成,卷积层卷积核尺寸分别为11×11、5×5、3×3、3×3、3×3。在第1、第2、第5卷积层后设置最大池化层,窗口尺寸为3×3,步长为2。

1.3 AlexNet算法改进

1.3.1 卷积层(Conv)的改进

使用更小尺寸的卷积核,目的是提升提取深层次图像特征的效率,增加图像识别的非线性特征,提升分类的可判别性,并使模型具备隐式的正则化特点。本研究构建模型将经典AlexNet模型原有的11×11大卷积核的卷积层调整为2层,分别具有5×5和3×3尺寸的卷积核,将原模型5×5尺寸卷积核的卷积层调整为2个3×3尺寸卷积核的卷积层,调整后全模型仅有5×5和3×3 2种规格的卷积层,且较原模型有更深的卷积层深度[21-23]。

1.3.2 LRN和全连接层的改进

删除LRN,并删除一个全连接层,目的是减少神经网络的参数,提升神经网络训练速度,平衡识别的准确性和效率。LRN的计算量较大,来源于设置LRN层参数交叉验证,删除LRN计算过程能够使模型易于并行化,大大减少计算资源的消耗[24-27]。AlexNet全连接层参数占整个神经网络参数的96.2%,通过减少全连接层层数是现下提升模型训练速度的主流做法。调整后的AlexNet神经网络模型如图3所示。

1.3.3 激活函数

RReLU(randomized ReLU) 是一种近年来提出的用于神经网络模型的激活函数,是对ReLU的一种改进形式。与ReLU不同的是,RReLU在负数区域不是直接设置为0, 而是随机选择一个较小的斜率来缓解神经元的死亡问题[28-33]。

具体来说,RReLU定义为

其中,ai是一个从均匀分布U(l,u)中随机采样得到的常数,l和u是2个预先设定的超参数,通常分别设置为较小的值,如0.1和0.3。RReLU的主要作用是避免神经元的死亡问题,并提高模型的鲁棒性。由于每个神经元在训练时使用不同的斜率,因此可以增加模型的多样性,从而降低过拟合的风险。同时,RReLU的非线性程度比LeakyReLU更强,因此可以提高模型的表达能力。需要注意的是,由于RReLU中的随机性质,其在测试时需要使用相同的随机数生成方式来保持一致。通常可以在训练时将随机数保存下来,然后在测试时使用相同的随机数。此外,由于RReLU引入了额外的超参数,因此需要对其进行调参,以获得最佳的性能。

2 研究内容

2.1 数据预处理

AlexNet是一种经典的深度学习卷积神经网络模型,用于图像分类。对于模型的训練数据预处理,需要进行以下几个步骤。

(1)图像的缩放和裁剪:AlexNet模型使用的输入图像大小为224×224,因此需要将训练数据中的所有图像都缩放到这个大小。同时,也可以对图像进行裁剪,以去除不必要的部分。

(2)数据增扩:为使模型具有更强的泛化能力,通常需要对训练数据进行数据增强操作扩大数据集的数量,如随机旋转、随机裁剪、随机翻转等。

(3)像素值归一化:将图像的像素值归一化到[0,1]之间,可以加速训练收敛并提高模型的准确率。

(4)数据集划分:通常需要将数据集划分为训练集、验证集和测试集,用于模型的训练、调参和测试。

2.2 试验设计

2.2.1 试验环境

于2021年12月至2022年3月进行分批训练,试验地点位于广东省农业科学院农业经济与农村发展研究所试验室中。计算机硬件配置为i9-10900K CPU,GPU为NVIDIA GeForce RTX 3090,专用GPU内存为24 GB。操作系统为Windows 10(64位),使用Python编程语言,采用Anaconda 3环境管理终端及PyCharm集成开发环境,深度学习框架tensorflow-gpu版本为2.4.0。

2.2.2 模型参数

考虑计算机自身的性能和训练效果,将迭代次数(epoch)设置为150次,批次(batch)大小设置为25以及Dropout大小设置为0.5等。具体的参数设置如表2所示。

2.2.3 模型构建

按上面所描述的改进方案,试验中的改进AlexNet(AlexNet-enhanced)模型由7个卷积层和2个全连接层组成,最后的全连接层的输出数量为13(分类目标数量)。采用SoftMax计算损失数并采用categorical_crossentropy损失函数,激活函数R ReLU。在全连接层前设置正则化的Dropout层,设置Dropout参数为0.5,即每个epoch随机失活50%的神经元,在一定程度上预防模型过拟合的发生。本研究构建的神经网络流程见图4。

2.2.4 神经网络训练

模型训练的具体流程如下:

(1)害虫数据集读取;

(2)害虫数据集随机打乱;

(3)神经网络模型实例化,向模型输入图片属性信息及害虫种类数量等信息;

(4)设置模型参数,如优化方法、学习率等;

(5)设置神经网络模型的损失函数,设置损失函数为categorical_crossentropy,标注网络评价指标为accuracy;

(6)设置神经网络模型的回调函数(callbacks);

(7)保存模型和权重参数。

2.3 试验结果

本研究同时采用AlexNet、VGG-16、LeNet的原型网络作为对比试验模型进行训练,与改进AlexNet(AlexNet-enhanced)模型的分类效果进行比较,分析4种模型的性能差异。3种模型的结构特征见表3所示。

2.3.1 训练结果

使用LeNet、VGG-16、经典AlexNet模型和改进AlexNet模型等4种模型在水稻害虫数据集上训练150个epoch,对比训练效果差异。除了LeNet模型收敛较慢,其他3种模型的在收敛速度及最高最低值上相差不大。改进后的AlexNet模型因为扩展了网络层数,导致相比于原始AlexNet神经网络训练时间明显增长,但相比传统AlexNet网络的训练准确率与验证准确率都又明显的提升(表4)。

2.3.2 混淆矩阵

图5为相同验证集上4种网络模型验证得到的混淆矩阵。a~d分别为改进AlexNet模型(AlexNet-enhanced)、经典AlexNet、VGG-16、LeNet等模型的混淆矩阵。由图5可知,AlexNet-enhanced模型的准确性相对其他模型由显著提升,几种模型对稻飞虱的幼虫及害虫的识别相对其他几种害虫效果较差。

2.3.3 准确性

对照组试验的识别结果如表5所示,在150次迭代的神经网络模型测试中,4种模型均具备优秀的识别率,对各类样本的识别率均超过了90%,AlexNet-enhanced和VGG-16等2种模型的准确率表现更加优秀,验证准确率均超过96%,但经过优化的AlexNet-enhanced模型通过删除LRN层和一个全连接层,优化了网络层数和训练时间复杂度,VGG-16则因更复杂的网络导致训练难度和时间复杂度提升。

3 结果与分析

3.1 通过较高迭代次数的神经网络模型训练可以有效提升模型精度

本研究通过150次模型迭代,4种模型都具备优秀的模型精度,除LeNet模型收敛速度较慢外,其他3种模型均可以在30次epoch左右的训练后快速收敛,训练准确率分别为99.90%(AlexNet-enhanced)、99.23%(经典AlexNet)、99.94%(VGG-16)、98.70%(LeNet),達到预期的模型训练效果,验证准确率分别为96.17%(AlexNet-enhanced)、94.92%(经典AlexNet)、96.72%(VGG-16)、93.97%(LeNet)。各种类虫害的验证精确率、召回率、F1分数见表6。

3.2 识别准确率受虫害采样体积影响较大

对比各个模型的识别结果,可发现对各类型害虫的成虫识别率均明显高于幼虫,在害虫的采样过程中,同焦距相机拍摄过程中幼虫的成像面积往往明显小于成虫,影响模型的特征提取,呈现出各模型幼虫低于成虫识别率的情况。稻飞虱是各种害虫中识别率最低的害虫,4种模型对稻飞虱幼虫的识别率均低于总识别率2.7%以上,差值分别为2.75%(AlexNet-enhanced)、2.79%(经典AlexNet)、2.78%(VGG-16)、3.39%(LeNet),幼虫与成虫识别率差值对比具体情况如表7所示,可见在具体业务应用过程中,采样摄像头的即时调整是害虫模型识别的重要研究命题。

3.3 改进AlexNet模型(AlexNet-enhanced)具备较好的综合识别效果

通过对比试验结果可知,改进后的AlexNet模型(AlexNet-enhanced)对多种害虫的识别能力较经典AlexNet模型提升明显,高迭代次数下总识别准确率高1.25百分点,对各种类的害虫识别准确率也有明显的提升,除稻飞虱幼虫外,模型的验证准确率也都可以保持在95%以上, 好于经典AlexNet模型。在3种对比试验模型中,效果最好的模型是VGG-16模型,其神经网络的总层数比AlexNet-enhanced模型多60%,卷积层数多62.5,模型的总训练时长长40%,在算力资源需求显著低于VGG-16模型的前提下AlexNet-enhanced获得了相当的训练效果。

4 结论与讨论

4.1 结论

本研究通过对经典的深度学习模型AlexNet进行提升模型深度和优化模型结构的改进,构建一套用于岭南水稻害虫识别的AlexNet-enhanced模型,通过对6种害虫的成虫及幼虫和健康水稻的数据进行训练和测试,并分析识别结果。通过对识别结果的分析,可得出以下结论:(1)改进的AlexNet模型(AlexNet-enhanced)对比传统的AlexNet模型在害虫识别这一领域上效果提升显著,其总体识别准确度为96.17%,同时对比具有更深网络深度的神经网络模型(VGG-16),在不损失过多识别精度的情况下对计算机资源的使用更少、训练更快。(2)神经网络模型的训练受特征采样条件约束较强,表现在对特征较少的幼虫分类结果会差于成虫,体积小的害虫分类结果差于体积大的害虫,这对大田害虫图像数据采集设备的研发具有参考意义。(3)本研究除对比试验中使用LeNet模型在训练中在50个 epoch的训练下表现出模型无法收敛的问题,其他3种模型均能在训练中表现出良好的收敛性能,现阶段通过神经网络学习方法解决害虫识别问题,提升模型训练的迭代次数和增加训练样本数量仍然是提升模型准确性的主要手段。本研究的结果表明,改进的AlexNet模型对南方水稻害虫的识别有不错的应用效果,可以作为大田间水稻害虫智能识别的有效解决方案。

4.2 讨论

本研究的创新性集中于通过对传统模型的改造适应南方水稻害虫识别这一具有重要实践意义的问题的研究,对传统模型的改进具有较强的针对性,表现在通过改进传统模型(经典AlexNet模型)深度不足的问题,同时在不消耗过多计算机算力资源的情况下逼近更新的神经网络模型(VGG-16)的识别效率,在理论和思路上具备在实际生产应用上的条件。但在研究中仍然暴露了一些问题:(1)模型的训练受样本特征约束较强,泛化能力不足,在幼虫和稻飞虱等害虫的识别率上有待提升,VGG-16 模型在此领域显著优于改进后的AlexNet模型(AlexNet-enhanced);(2)样本获取方式单一,缺乏复杂情境下的水稻害虫数据参与训练,在投入实际应用前需经过更广泛的数据采集应用于模型训练,同时也需要对生产中的数据采集设备进行针对性的改进,如提高设备像素、提升设备的自动追焦和变焦能力。

参考文献:

[1]方福平,程式华. 水稻科技与产业发展[J]. 农学学报,2018,8(1):92-98.

[2]赵正洪,戴 力,黄见良,等. 长江中游稻区水稻产业发展现状、问题与建议[J]. 中国水稻科学,2019,33(6):553-564.

[3]徐春春,纪 龙,陈中督,等. 2020年我国水稻产业形势分析及2021年展望[J]. 中国稻米,2021,27(2):1-4.

[4]王 丰,柳武革,刘迪林,等. 广东优质稻发展及稻米品牌建设与展望[J]. 中国稻米,2021,27(4):107-116.

[5]杨普云,任彬元. 促进农作物病虫害绿色防控技术推广应用:2011至2017年全国农作物重大病虫害防控技术方案要点评述[J]. 植物保护,2018,44(1):6-8.

[6]全国农业技术推广服务中心. 植物保护统计技术与方法[M]. 北京:中国农业科学技术出版社,2013.

[7]梁万杰,曹宏鑫. 基于卷积神经网络的水稻虫害识别[J]. 江苏农业科学,2017,45(20):241-243,253.

[8]Huo M Y,Tan J. Overview:research progress on pest and disease identification[C]//Lu Y,Vincent N,Yuen P C,et al. International Conference on Pattern Recognition and Artificial Intelligence.Cham:Springer,2020:404-415.

[9]Ayan E,Erbay H,Varn F. Crop pest classification with a genetic algorithm-based weighted ensemble of deep convolutional neural networks[J]. Computers and Electronics in Agriculture,2020,179:105809.

[10]Thenmozhi K,Srinivasulu Reddy U. Crop pest classification based on deep convolutional neural network and transfer learning[J]. Computers and Electronics in Agriculture,2019,164:104906.

[11]傅隆生,宋珍珍,Zhang X,等. 深度学习方法在农业信息中的研究进展与应用现状[J]. 中国农业大学学报,2020,25(2):105-120.

[12]翁 杨,曾 睿,吴陈铭,等. 基于深度学习的农业植物表型研究综述[J]. 中国科学(生命科学),2019,49(6):698-716.

[13]张善文,邵 彧,齐国红,等. 基于多尺度注意力卷积网络的作物害虫检测[J]. 江苏农业学报,2021,37(3):579-588.

[14]龙满生,欧阳春娟,刘 欢,等. 基于卷积神经网络与迁移学习的油茶病害图像识别[J]. 农业工程学报,2018,34(18):194-201. [HJ2mm]

[15]薛 勇,王立扬,张 瑜,等. 基于GoogLeNet深度迁移学习的苹果缺陷检测方法[J]. 农业机械学报,2020,51(7):30-35.

[16]张建华,孔繁涛,吴建寨,等. 基于改进VGG卷积神经网络的棉花病害识别模型[J]. 中国农业大学学报,2018,23(11):161-171.

[17]孙 红,李 松,李民赞,等. 农业信息成像感知与深度学习应用研究进展[J]. 农业机械学报,2020,51(5):1-17.

[18]段仲静,李少波,胡建军,等. 深度学习目标检测方法及其主流框架综述[J]. 激光与光电子学进展,2020,57(12):59-74.

[19]李炳臻,刘 克,顾佼佼,等. 卷积神经网络研究综述[J]. 计算机时代,2021(4):8-12,17.

[20]严春满,王 铖. 卷积神经网络模型发展及应用[J]. 计算机科学与探索,2021,15(1):27-46.

[21]王旭东,邵惠鹤. RBF神经网络理论及其在控制中的应用[J]. 信息与控制,1997,26(4):272-284.

[22]李国和,乔英汉,吴卫江,等. 深度学习及其在计算机视觉领域中的应用[J]. 计算机应用研究,2019,36(12):3521-3529,3564.

[23]朱虎明,李 佩,焦李成,等. 深度神經网络并行化研究综述[J]. 计算机学报,2018,41(8):1861-1881.

[24]杨观赐,杨 静,李少波,等. 基于Dopout与ADAM优化器的改进CNN算法[J]. 华中科技大学学报(自然科学版),2018,46(7):122-127.

[25]冉 鹏,王 灵,李 昕,等. 改进Softmax分类器的深度卷积神经网络及其在人脸识别中的应用[J]. 上海大学学报(自然科学版),2018,24(3):352-366.

[26]王功鹏,段 萌,牛常勇. 基于卷积神经网络的随机梯度下降算法[J]. 计算机工程与设计,2018,39(2):441-445,462.

[27]黄 毅,段修生,孙世宇,等. 基于改进sigmoid激活函数的深度神经网络训练算法研究[J]. 计算机测量与控制,2017,25(2):126-129.

[28]刘小文,郭大波,李 聪. 卷积神经网络中激活函数的一种改进[J]. 测试技术学报,2019,33(2):121-125.

[29]王红霞,周家奇,辜承昊,等. 用于图像分类的卷积神经网络中激活函数的设计[J]. 浙江大学学报(工学版),2019,53(7):1363-1373.

[30]田 娟,李英祥,李彤岩. 激活函数在卷积神经网络中的对比研究[J]. 计算机系统应用,2018,27(7):43-49.

[31]蒋昂波,王维维. ReLU激活函数优化研究[J]. 传感器与微系统,2018,37(2):50-52.

[32]王双印,滕国文. 卷积神经网络中ReLU激活函数优化设计[J]. 信息通信,2018,31(1):42-43.

[33]曲之琳,胡晓飞. 基于改进激活函数的卷积神经网络研究[J]. 计算机技术与发展,2017,27(12):77-80.

猜你喜欢

深度学习
从合坐走向合学:浅议新学习模式的构建
面向大数据远程开放实验平台构建研究
基于自动智能分类器的图书馆乱架图书检测
搭建深度学习的三级阶梯
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
利用网络技术促进学生深度学习的几大策略
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究