APP下载

基于图像处理的农作物病虫害分类算法的研究

2021-02-22谢建梅

吉林农业科技学院学报 2021年6期
关键词:特征向量准确率农作物

谢建梅

(闽北职业技术学院信息系,南平 353000)

农作物病虫害是造成作物减产最主要的因素,及时识别农作物病虫害是保证农作物正常生长的必要措施。目前人工识别作为主要的检测方式,受经验影响较大,存在漏检、误差等问题[1]。近年来图像识别技术迅速发展,较为成熟的包括神经网络、决策树以及支持向量机的分类算法[2]。Singh等[3]应用优化粒子群对神经网络算法进行阈值优化后,实现对柑橘叶片病虫害分类识别。Zhou等[4]将迁移学习与浅口神经网络相结合,用于苹果虫害的特征识别,有效提升了虫害叶片细节的特征识别。但上述研究存在研究环境相对简单,均在室内或相对单一的背景下,并不普遍适用于复杂的田间环境。基于此,本文探讨了复杂背景的农作物病虫害的识别和分类,采用图像处理技术,提出改进神经网络算法用于农作物病虫害的识别,采用Inception模型改善神经网络的计算性能,引入迁移模型提升算法的学习能力,在此基础上提出了应用神经网络迁移技术实现病虫害的分类识别。对比试验表明,本文提出的算法与经典分类算法相比,识别准确率提升12%左右,可以有效提升农作物病虫害的识别效率,满足生产实际的需要。

1 相关技术论述

1.1 卷积神经网络

卷积神经网络由输入层、隐含层以及输出层三层结构组成,由人体的神经网络启发形成。不同网络层以堆叠的形式构成了整体的网络架构,具体结构如图1所示[5]。卷积神经网络的核心为隐藏层和输入层。而隐藏层的结构更为复杂,包括卷积层、池化层和采样层三部分。核心原理是使用卷积和池化操作,构建有监督学习式的训练网,具体算法为:

(1)

式(1)中,s(i,j)代表用于标识训练样本特征的特征向量矩阵,训练样本预处理矩阵使用M×N标识,wm,n代表二维预处理矩阵相对应为M×N维卷积核矩阵,wb标识了神经网络单元的偏移向量。训练过程中神经元损失采用损失熵的方法计算,具体算法为:

(2)

式(2)中,L代表神经元损失,x代表输入样本数据,a代表训练结果,y代表特征向量值,n代表全部训练样本的个数。

1.2 Inception模型

Inception模型重点对神经网络的隐藏层进行预处理,包括对多层卷积层以及多层池化层堆积处理。其可以组合各种类型的卷积及池化操作,从而获得相同像素的不同特征样图,并使用激励函数对不同的特征样图按照通道进行同类划分和叠加[6-8]。考虑到多种类卷积操作产生的性能下降,该模式增加了瓶颈层设计,以减少计算的层级提高效率。Inception模型的典型优势是对于神经网络内部进行充分挖掘和计算资源的应用,实现了网络层级和神经元增加,但是计算资源耗费量不增加[9]。目前该模式已经升级到第三版,在原有版本的基础上计算速度增加、表征性的瓶颈降低。本文使用第三版进行神经网络结构优化。

1.3 迁移学习

迁移学习是指在确定输入源和输入任务、输出数据和输出任务的约束下,充分学习输入源到输入任务的过程,进一步改善输出数据到输出目标的效率和性能,迁移学习的前提是输入和输出的环节各不相同[10]。迁移学习的原理是根据既定的知识规则模型,获得对位置的模型学习和认知,提升模型学习效率。目前,常用的迁移学习主要有实例法、特征集法、共享参数法、知识图谱法[11]。

2 图像处理的农作物病虫害分类算法及实例

2.1 基于Inception模型的迁移学习

基于迁移学习及Inception模型对于神经网络不同角度的改善,本文提出了将迁移模型与Inception融合,进行农作物病虫害的分类,本文以白菜病虫害为研究对象,使用农业数据集IrnageNet[12]。通过大量的训练得到Inception的元模型,提炼训练成功模型的各类参数,标记Inception模型中瓶颈层的特征向量点为分类特征项,在此基础上将提取的Inception特征向量作为全连接层,构建新的神经网络,进行模型的迁移学习,高效准确识别农作物病虫害的分类。具体的执行流程如图2所示。执行步骤包括:

Step1:使用数据集ImageNet生成Inception的输入训练模型,提炼各个参数,神经网络的瓶颈层参数设置为Inception的训练参数。

Step2:将经过图像分割预处理后的白菜病虫害图片作为神经网络的输入层,计算特征项量集合,作为瓶颈层的特征向量。

Step3:依据不同的特征向量分类存储,避免迭代计算过程中出现大量重复计算。

Step4:根据Step获得新的全连接层,通过神经网络分类算法进行病虫害的分类识别。

本文算法中的分类器采用改进的SoftMax分类器,在原有的分类器的基础上引入Logistics回归模型的原理,将原有SoftMax的二分类模块扩展到多分类,建立一种实现多分类的有向监督的回归模型。

首先,定义包含m个已经分类识别的样本,组织一个全新的训练样本集合,

{(xi,yi),.....,(xm,ym)}

(3)

公式(3)中,设定训练样本的向量分布在0-1之间,其计算函数为:

(4)

对于训练模型的参数θ,通过公式(4)计算其最小代价值。

(5)

针对每个测试样本输入集x,通过公式(5)估算该测试样本对应全部类别的概率值p(y=j|x)。对应k个估计的概率值对应输出k维概率向量,其对应的假设函数为:

(6)

2.2 算法实例

本试验选取了Cabage dataset数据集,选择其中白菜病虫害数据50个分类共计10 000张图像,按照4∶1的比率划分了训练集和测试集。通过多次反复试验测试发现,本文的模型在训练大量数据样本的过程中非常耗费资源,其使用时间较长,基于此,本文采用创新分组、迭代试验的方式开展测试。并选取了原始的基于神经网络图像识别算法[13-14]、支持向量机分类[15-16]模型作为比对试验。

3 结果与分析

由表1可知,相同的数据集对于两个经典算法分类的准确率低于90%,对比而言,卷积神经网络算法要优于支持向量机,而本文对于卷积网络模型进行了迁移学习、Inception模型、改进分类器等关键的优化后,分类准确率提升12%。在执行性能上,每一类识别的平均时间为71~76 s,对比原始算法,本文的执行性能有明显提升,这是因为引入的迁移算法在图像预处理阶段降低了神经网络的特征向量维度,后续的构建及分类过程性能得以大幅提升。

表1 不同算法结果对比

为了进一步比较本文提出算法的有效性,从ImageNet数据集中选择了向日葵、马铃薯、黄瓜病虫害的图像数据库中9 000张样图,平均分为3组,每组按照2∶1的比率划分训练集与测试集,共计完成3组比对试验,获得试验准确率对比如图3所示。由图3可知,第一组为向日葵病虫害,第二组为马铃薯病虫害,第三组为黄瓜病虫害,对比试验显示,本文提出的基于图像处理的病虫害算法在对向日葵与黄瓜等大叶片类农作物的分类准确率均在90%以上,对比小叶片类农作物的病虫害识别准确率更高。同样,本文改进算法对比原始算法以及支持向量机算法的识别准确率有明显的优越性。

表2 本文改进算法应用不同数据结果对比

由图4可知,当迭代次达到4万次时,本文改进算法的收敛速度下降50%,总损失仅为1 000,对比原始算法性能突出。第三方面,关于本文改进算法的鲁棒性比对试验如表2所示,本文的模型在农作物数据集Cabage dataset的准确率为98%,比其他数据集提高2~6个百分点,更适合于复杂环境的分类识别。

4 结论与讨论

本文提出改进的卷积神经网络图像的识别算法,结合卷积神经网络具有的共享权值、可以自学习提取分类特征、完成网络训练的优势,在模型训练阶段通过归纳迁移算法构建模型网络及共享特征参数,图像分类过程中使用交叉熵损失函数提升模型的泛化性以及分类的准确率。结果表明,本文提出的算法在模型训练上速度更快,对于不同的数据集平均识别准确率达到96.2%,对于不同数据集的泛化能力较强,优势明显。另外,由于本文提出的归纳迁移算法需要反复迭代造成性能有所下降,后续需要进一步研究改进。

猜你喜欢

特征向量准确率农作物
高温干旱持续 农作物亟须“防护伞”
俄发现保护农作物新方法
夏季农作物如何防热害
克罗内克积的特征向量
厉害了!农作物“喝”上环保酵素
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
飞行控制系统设计的特征结构配置法