基于卷积神经网络的杂草快速识别研究
2019-08-27张有春
摘要 图像识别是除草机器人的一项基础关键研究。为了能提高农作物和杂草的识别率以及便于识别物特征的提取,提出了基于卷积神经网络的识别方法。以农田中的杂草和农作物为试验对象设计了网络结构。该网络结构的参数较少,准确率达到了92.08%,且处理每张图片的时间仅为0.82 ms。
关键词 除草;卷积神经网络;快速;图像识别
中图分类号 S126文献标识码 A
文章编号 0517-6611(2019)14-0242-03
doi:10.3969/j.issn.0517-6611.2019.14.071
开放科学(资源服务)标识码(OSID):
Abstract Image recognition is the basic and key research of weeding robot.In order to improve the recognition rate of crops and weeds and facilitate the extraction of recognition features,we proposed a recognition method based on convolutional neural network.The network structure was designed with weeds and crops as experimental objects.The network structure had fewer parameters with its accuracy reaching 92.08%,and the processing time of each picture was only 0.82 ms.
Key words Weeding;Convolutional neural network;Fast;Image identification
作者简介 张有春(1997—),男,云南大理人,从事计算机图像识别研究。
收稿日期 2018-12-25;修回日期 2019-02-18
除草是培养栽培植物必不可少的过程,目前除草工作已经摒弃了传统人工除草的方式,较为广泛使用的是化学除草。该方法可节省劳动力,降低除草成本,提高劳动生产力;但其弊端也是显而易见的,有时候会引起药害,甚至污染环境,破坏生态平衡。智能除草有利于生态环境保护且先进高效[1],这也是被广泛研究的原因,如何快速有效地识别作物与杂草是除草机器人研究的关键技术。
如今,随着机器学习领域中深度学习的崛起,基于人工神经网络的各种识别方法被广泛用于各个领域[2],深度学习模拟人脑进行分析,通过组合低层次特征形成更加抽象的高层次特征[3]。它通过提取农作物与杂草特征,以数据形式在预先设计好的模型中进行训练得到新的模型,从而实现农作物与杂草的识别。该方法准确率较高,且由于模型的特殊性包含参数较多,对于识别有很好的通用性。鉴于此,基于卷积神经网络的识别方法,笔者进一步研究了杂草图像快速识别。
1 卷积神经网络
卷积神经网络(convolutional neural networks,CNN)是一种有别于一般神经网络的新型网络,涉及图像识别、自然语言处理等领域,其研究趋势和发展前景较好。卷积神经网络由输入层、卷积层、池化层、激活函数、全连接层、输出层组成[4]。卷积层用于提取輸入数据的特征,由许多卷积核组成,卷积核像一个筛子筛选有用的信息,而筛选的过程即为卷积运算过程;池化层在不破坏数据主要特征的情况下,减少训练数据中一些无关紧要的参数,在一定程度上能防止过拟合,更方便优化;激活函数是为了增加网络的表达能力,即非线性因素;全连接层则是把之前的局部特征全部组合在一起,从而实现对识别物的分类。
以经典模型LeNet-5为例,以野外采集的杂草图像为输入数据,计算机理解为若干向量矩阵(图1)。C1为卷积层,C1卷积之后通过激活函数得到S2,S2为池化层通过池化操作得到C3,C3也是卷积层,C3和S4通过和C1、S2相同操作后得到C5,进一步得到F6全连接层,F6中每个神经元与C5进行全连接。
2 网络结构设计
使用卷积神经网络算法进行识别研究的关键在于神经网络结构设计的合理性,好的网络结构往往是集性能和计算效率于一身。网络结构的结果好坏和学习效率与参数有密切关系,而卷积核大小直接影响参数的多少,设计时避免出现AlexNet[5]中11×11大小的卷积核,用较小尺寸的卷积核代替。斩获2014 ILSVRC挑战赛冠军的网络结构GoogLeNet[6],一共有22层使用的卷积核大小,最大为5×5,不同尺寸卷积核搭配使用,达到减少参数的效果,从而提高了计算效率。参数的数量减少到AlexNet的1/12,但是其性能却优于AlexNet很多。受GoogLeNet启发,减少卷积核大小的同时适当增加网络的深度。
该研究以LeNet-5网络模型为基础改进卷积神经网络结构(图2),该网络的核心在于3个卷积层和3个池化层交替使用不同尺寸的卷积核,这有利于特征的提取,同时可减少处理时间。其中,C1使用5×5大小的卷积核,C2和C3都使用3×3大小的卷积核,由于图片信息量过大的因素,该研究选定池化操作为最大池化方法,池化层均采用2×2尺寸规格。每个卷积操作之后加入ReLu激活函数,引入非线性因素。图片的输入尺寸为56×56,网络结构可大致标记C52×52—P26×26—C24×24—P12×12—C10×10—P5×5,C表示卷积层,P表示池化层,字母后的数字表示特征图的大小。经过3次卷积操作和3次池化操作,进入全连接层F1,F1有84个节点,在进入F2全连接层之前再次使用ReLu函数激活,F2有10个节点,最后一层为输出层,输出样本的分类结果。
3 样本采集与试验处理
为了研究基于卷积神经网络的杂草识别方法,试验选取大白菜(图3a)及其伴生杂草作为实验对象,杂草样本主要是三叶草(图3b)和鼠曲(图3c)2种。使用手机在农作物田中采集图片最大分辨率为3 120×4 160,考虑到农作物和杂草的全局性采用垂直拍摄作为图片采集方式。为了适应不同环境下的杂草识别,分别从强光、一般、弱光3种不同光线强度进行图片采集,每个类别采集60张图片。
理论上可以直接把处理很少或未经处理的图片直接输入卷积神经网络中,但实际上为了避免计算量大、学习效率低下等问题的出现以及提高神经网络的鲁棒性和识别率,往往都会对采集到的图片进行预处理。因此,该研究对采集得到的图片进行预处理,预处理过程一般包括压缩图片、降低分辨率、灰度化、二值化和滤波等操作[7]。由于在采集样本时拍摄高度和范围不一致,为了符合实验需求将图片按1∶1比例裁剪后,统一分辨率为56×56;图像灰度化使用加权平均法,灰度化后的图片会存在一些噪声,从而会影响图像的识别,使用中值滤波法去除噪声后进行二值化处理,整个过程均借助MATLAB编程实现,处理结果如图4所示。为了减少过拟合,得到较稳定的网络结构,卷积神经网络训练时需要大量的数据,但是由于采集图片数量不是很多,所以对每张图片预处理之后进行各方位90°翻转,以此来增加样本数量。最后把经过预处理的图片做成样本集,一共有720张图片,其中每一类数量为240张。
4 样本采集与试验结果
神经网络的框架搭建和训练在Python的工具包-PyTorch环境下进行,整个试验过程使用的设备是msi游戏笔记本,其参数为:Intel(R) Core(TM)i7-7700HQ CPU@2.80GHZ,CUDA为8.0版本。在训练之前将样本集分为6份,按5∶1比例分为训练集和测试集,训练集中大白菜、鼠曲、三叶草各有200张,各类图集余下的40张则为测试集。网络迭代次数设定为60次,学习效率0.001,训练时随机不重复地从训练集中抽取数据,输入到神经网络中后,得到其均方差曲线(图5),曲线图表明训练次数至30次后误差速率下降比较平稳,继续训练曲线平稳过度趋于一条水平线,训练次数达到42次时误差最小,为0.280。
为了实时得到网络训练后的正确率和最佳迭代次数,每训练1次网络之后进行网络测试,得到其正确率曲线如图6所示。图6表明训练22次后,正确率高于80%,最高的识别率在迭代次数为45次时,达到91.82%,之后正确率基本保持在90.00%左右。
把该网络与众多学者研究使用的杂草识别方法进行比较,结果如表1所示。从表1可以看出,网络在识别率上并不弱于前2种方法,由于不需要人为提取特征,因此省去很多工作,此外每张图片平均0.82 ms的处理时间也具有优越性;基于立体视觉进行识别的方法虽然识别率较高,但对技术、设备的要求相对也较高。该研究使用的网络结构在运用于实际生产中时,并不需要对所有杂草进行识别,换种思路只需要识别出农作物便可以除草,所以实际效果更好。
5 结语
针对农作物中杂草的识别问题,该研究在基于卷积神经网络的识别方法的基础上构建了一个卷积神经网络框架,该网络识别杂草的正确率达92.08%,与其他方法相比,不仅在正确率上有所提高,每幅图0.82 ms处理时间也优于其他几种方式。有别于传统方法,该方法不需要人为提取特征,因此可以减少特征提取过程中的许多复杂运算,此外还有良好的泛化性,是一种较理想的田间杂草识别方法。
虽然使用卷积网络神经进行杂草识别试验取得不错的效果,但是也存在一些不足之处:
①试验的数据量并不是很充足,数据量的多少对网络结构的稳定性和准确性起着关键作用,因此下一步打算采集更多的数据进行试验;②卷积神经网络的设计结构不同,相应的效果也有所区别,因此下一步打算尝试构建更优的网络结构。
参考文献
[1] 邢占强.智能化除草机器人技术发展现状及趋势展望[J].农业科技与装备,2015(5):37-38.
[2] 郭丽丽,丁世飞.深度学习研究进展[J].计算机科学,2015,42(5):28-33.
[3] 周月鵬,卢喜利.深度学习技术在智慧校园建设中的应用研究[J].微型电脑应用,2018,34(12):131-133,143.
[4] 李宗辰.基于卷积神经网络的文献分析[D].长春:长春工业大学,2017:16-20.
[5] 周曼,刘志勇,陈梦迟,等.基于AlexNet的迁移学习在流程工业图像识别中的应用[J].工业控制计算机,2018,31(11):80-82.
[6] 王天兴.基于GoogLeNet网络结构的改进算法研究[D].杭州:杭州电子科技大学,2018:18-20.
[7] 杨建姣.基于BP神经网络的田间杂草识别技术的研究[D].长春:吉林农业大学,2017:7-18.
[8] 乔永亮,何东健,赵川源,等.基于多光谱图像和SVM的玉米田间杂草识别[J].农机化研究,2013,35(8):30-34.
[9] 吴兰兰,刘剑英,文友先,等.基于支持向量机的玉米田间杂草识别方法[J].农业机械学报,2009,40(1):162-166.
[10] 王璨,李志伟.利用融合高度与单目图像特征的支持向量机模型识别杂草[J].农业工程学报,2016,32(15):165-174.