一种基于卷积神经网络的小麦病害识别方法
2018-03-29张航程清武英洁王亚新张承明殷复伟
张航 程清 武英洁 王亚新 张承明 殷复伟
摘要:针对准确识别小麦常见病害的需要,提出了一种基于卷积神经网络的小麦病害识别方法。该方法首先以小麦病害图片资料为基础,利用中值滤波法、直方图阈值法等对图像进行去背景、去噪、病斑分割等预处理形成样本库,然后利用卷积神经网络构建一个具有五层结构的深度学习模型进行样本学习,并利用随机梯度下降法进行学习过程控制,最后以获取的特征集对小麦图片进行病害识别,并形成一个在线识别系统。在泰安市4样点的试验结果表明,利用该方法可以有效实现对小麦常见病害——纹枯病、条锈病、叶锈病、秆锈病、赤霉病和白粉病的识别,综合识别率可达99%以上,可以应用于实际生产管理。
关键词:小麦病害;卷积神经网络;在线识别;病害识别
中图分类号:S512.1:S127文献标识号:A文章编号:1001-4942(2018)03-0137-05
Abstract Based on the needs of identifying wheats common diseases accurately, a wheat disease recognition method based on convolutional neural network was put forward in this study. This method was based on the wheat disease image data, firstly it formed a sample database after a series of pre-treatments including removing background, denoising, segmentation of lesion with median filter and histogram thresholding method; then it built a five-layer-structure model of deep learning sample for learning using convolutional neural network, and using stochastic gradient descent method to control learning process; finally, it identified the wheats pictures with obtained feature set, and formed an online identification system. The experimental results in Taian showed that this method could effectively identify the common diseases of wheat, and the comprehensive recognition rate reached more than 99%, which could be applied to the actual production management.
Keywords Wheat disease; Convolutional Neural Network; Online identification; Disease identification
小麥是我国的主要粮食作物,每年播种面积都在3亿公顷左右,占全国粮食作物总面积的20%~27%。利用高新技术手段,保证小麦高产稳产,对于保障我国粮食供应、社会安定、经济发展具有重要作用。小麦主要病害有38种左右[1],常年发生面积约7 000万公顷,造成小麦产量损失高达30亿千克[2]。因此,有效改进小麦病害的防治措施,对于提高小麦产量和质量具有重要意义。
传统农业生产中,目视诊断是小麦病害的常用识别方法,在小麦生产管理中发挥了重要作用。但目视诊断结果与诊断者的知识背景、诊断经验具有非常大的关系,而实际生产中,往往有经验的诊断人员较少,导致病害不能得到及时诊断。近年来,随着图像处理技术的发展,利用该技术进行小麦病虫害病理特征的自动提取以及在线实时智能识别,成为一个新的研究热点。由于病害种类及特征繁多,传统的图像处理技术在病害的识别精度和效率方面还有很大提升空间[3-5]。
随着神经网络的发展,研究者已成功将神经网络应用于图像模式识别和降维处理[6 ,7]。在此基础上,有研究者综合利用图像处理和神经网络技术进行小麦病害识别研究,取得了较大的进展。如:余秀丽等利用支持向量机对3种小麦叶部常见病害进行识别[8];李冠林等[9]利用 K-means 硬聚类算法,使用优选的26个特征参数有效地对小麦条锈病和叶锈病图像进行了识别。但以上研究仅针对2~3种病害进行识别,对于多种复杂病害难以达到理想的识别效果。
2017年,山东省小麦种植面积达380多万公顷,是全国第二大小麦产地,其中泰安市种植面积为16.9万公顷,在山东小麦生产中占有重要地位。但纹枯、条锈、叶锈、秆锈等病害在当地普遍且严重发生,常年受病害面积约4万公顷,造成小麦产量损失达170万千克,严重影响其小麦产量和品质。本研究针对准确识别小麦常见病害的需要,提出一种基于卷积神经网络的小麦病害识别方法,并形成在线识别系统,通过对泰安市岱岳区四个镇的6种小麦病害进行识别验证,识别精度高且快速,对有效识别农作物病害、提高粮食产量和品质具有重要意义。
1 研究区概况及数据来源
岱岳区隶属山东省泰安市,位于泰安市中部偏北,北纬35°52′~36°28′、东经116°50′~117°29′。属于暖温带半湿润大陆性季风气候,年均光照时间2 634.5 h,年均降水量727.4 mm,适合小麦生长。2016年岱岳区小麦播种面积2.34万公顷,产量15 795万千克。
本研究选取岱岳区夏张、满庄、良庄和大汶口4个镇作为样本采集地,采样点分布见图1。选择光照良好的天气,使用相机拍摄得到640×480分辨率的小麦病害清晰照片。图2、图3分别为小麦白粉病、条锈病样本。
2 研究方法
2.1 基于卷积神经网络的小麦病害识别总体流程
本研究以研究区小麦病害图片资料为基础,利用卷积神经网络,构建针对小麦病害识别的深度学习模型,并形成在线识别系统,实现对小麦重要病害的快速识别。该方法的总体流程如图4所示。
2.2 图像预处理
为尽可能减少天气、光线以及杂草等对病害图像样本的影响,需选取光照条件好的时刻拍摄分辨率为640×480的清晰图像样本,并使用中值滤波法[10]去噪、直方图阈值法去除背景及进行图像分割,标记病理区域,形成样本集,以此作为模型的输入对模型进行训练。
图像预处理方法如下:
(1)去噪。首先采用全局阈值法实现噪声的初步标识,然后根据噪声的孤立性、非同时性等特点,通过考查噪声点邻域内的拓扑结构,剔除误判点,最后对拓扑矩阵中所有标记的噪声点进行中值滤波,得到去噪后的图像。
(2)图像分割。采用直方图阈值法,首先建立图像灰度直方图,然后计算背景和目标的出现概率,最后计算两个区域的类间方差,实现阈值分割。
(3)标记病理区域,形成样本集。
2.3 模型建立与学习
卷积神经网络(convolutional neural networks,CNN)是一种以卷积运算为基础的深度神经网络,卷积运算可以减少深层网络占用资源及网络的参数个数,能够较有效地解决过拟合问题[11-13]。
在CNN的一个卷积层中,通常包含若干个特征图(feature map),每个特征图由一些矩形排列的神经元组成,同一特征图的神经元共享权值,即所谓的卷积核。卷积核一般以随机小数矩阵的形式初始化,在网络的训练过程中卷积核将学习得到合理的权值[14]。卷积核有效减少了网络各层之间的连接,同时又降低了过拟合的风险。子采样,也叫做池化(pooling),通常有均值子采样(mean pooling)和最大值子采样(max pooling)两种形式[15]。子采样可以看作一种特殊的卷积过程。卷积和子采样大大简化了模型复杂度,减少了模型参数。
本研究提出的方法是以卷积神经网络为基础,对预处理得到的样本病理区域作标记,建立网络结构,初始化卷积核及偏置等参数,输入到一个5层的卷积神经网络中,通过梯度下降法控制学习过程,经过40 000次迭代训练,得到训练模型,用于识别。对于识别度不高的目标物体,再找相似样本,重复训练。网络结构如下:
输入层:分辨率为480×640的图片。
第一层卷积层:7×7的卷积核,得到64个特征图。
第一层下采样层:2×2的核,得到64个特征图。
第二层卷积层:5×5的卷积核,得到128个特征图。
第二层下采样层:2×2的核,得到128个特征图。
第三层卷积层:5×5的卷积核,得到512个特征图。
第三层下采样层:2×2的核,得到512个特征图。
第四层卷积层:3×3的卷积核,得到1 024个特征图。
第五层卷积层:3×3的卷积核,该层与上一层连接没有经过下采样层,得到2 048个特征图。
第五层下采样层:2×2的核,得到2 048个特征图。
全连接层:4 096维,将第五层下采样层的输出连接成为一个一维向量,作为该层的输入。
Softmax层:输出为1 000维,输出是图片属于每个类别的概率,这一层即可用于对图像中小麦病害进行判断。
在一个卷积层,上一层的特征图被一个可学习的卷积核进行卷积,然后通过一个激活函数,就可以得到输出特征图。每一个输出特征图可能是组合卷积多个输入特征图的值,卷积公式如下:
2.4 识别实现
模型训练完成后,得到的特征集即可用于识别病害。为了更好地应用于生产实际,本研究开发了视频识别和图片识别两种方式。在视频识别方式中,可以利用摄像头采集图像进行实时识别;在图片识别方式中,可以对不同途径获取的照片进行识别,可用于远程诊断。
3 试验验证
选取800幅小麦病害图像,其中500幅为训练样本,300幅为测试样本,采用本研究提出的方法进行识别,测试集识别分类结果如表1所示。可以看出,条锈病、葉锈病、赤霉病和白粉病识别准确率达到 100%,主要是因为这四种病害的颜色、纹理特征较为明显,易于正确识别。而纹枯病和秆锈病的形状、颜色和纹理特征不明显,在实际生成过程中不易完全区分,出现了极少数错误,识别准确率均为98%。与传统的识别方法相比,基于卷积神经网络的小麦病害识别整体准确率达99.3%,能获得理想的分类效果,为小麦叶部常见病害的快速准确诊断提供了有效的分析手段。
4 结论
将计算机技术应用于农作物病害诊断,可以快速准确地识别出病害信息,不仅能够降低病害带来的经济损失,而且可以解放劳动力,提高农作物产量和质量。本研究提出了一种基于卷积神经网络的小麦病害识别方法,该方法首先建立了一种基于卷积神经网络的能够识别小麦病害的网络结构,然后对样本图像进行预处理,并采用梯度下降法控制卷积神经网络的学习过程,得到最优的权值参数;完成网络训练后,以普通图像作为输入,即可得出病害识别分类结果。选取泰安市岱岳区4个镇的300幅小麦病害图片进行测试,总体识别率达99.3%,与传统的人工识别方法及前馈神经网络等算法相比,该方法能够快速、准确地识别出小麦的病害信息,有效提高识别精度,可以用于实际生产,并对其它农作物病害识别诊断具有借鉴意义。
参 考 文 献:
[1] 中国农业科学院植物保护研究所. 中国农作物病虫害(上册)[M]. 第2版. 北京:中国农业出版社,1995: 351-437.
[2] 陈万权. 图说小麦病虫草鼠害防治关键技术[M]. 北京: 中国农业出版社, 2012.
[3] 王美丽, 牛晓静, 张宏鸣, 等. 小麦叶部常见病害特征提取及识别技术研究[J]. 计算机工程与应用,2014, 50(7):154-157.
[4] Pujari J D, Yakkundimath R, Byadgi A S. Classification of fungal disease symptoms affected on cereals using color texture features [J]. International Journal of Signal Processing,2013, 6(6): 321-330.
[5] Sannakki S S, Rajpurohit V S, Nargund V B, et al. Leaf disease grading by machine vision and fuzzy logic [J]. Int. J. Comp. Tech. Appl., 2011, 2(5): 1709-1716.
[6] 赵春江. 农业智能系统[M]. 北京: 科学出版社, 2009.
[7] Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks [J].Science, 2006, 313(5786):504-507.
[8] 余秀麗, 徐超, 王丹, 等. 基于SVM的小麦叶部病害识别方法研究[J]. 农机化研究, 2014, 36(11):151-155.
[9] 李冠林, 马占鸿, 王海光. 基于支持向量机的小麦条锈病和叶锈病图像识别[J]. 中国农业大学学报,2012,17(2):72-79.
[10]李文杰, 姚建刚,毛李帆, 等. 基于中值滤波法及小波自适应扩散法的绝缘子红外热像去噪[J]. 电网技术, 2010, 34(8): 160-164.
[11]常亮, 邓小明, 周明全, 等. 图像理解中的卷积神经网络[J/OL]. 自动化学报, 2016, 42(9):1300-1312.
[12]Bouvrie J. Notes on convolutional neural networks [R]. MIT CBCL Tech. Report, Cambridge, MA, 2006.
[13]周飞燕,金林鹏,董军. 卷积神经网络研究综述[J/OL].计算机学报,2017,40(6):1229-1251.
[14]Ijjina E P, Chalavadi K M. Human action recognition using genetic algorithms and convolutional neural networks [J]. Pattern Recognition, 2016, 59: 199-212.
[15]Tomè D, Monti F, Baroffio L, et al. Deep convolutional neural networks for pedestrian detection [J]. Signal Processing: Image Communication, 2016, 47: 482-489 .