机器学习算法在农业机器视觉系统中的应用
2020-07-20赵献立王志明
赵献立 王志明
摘要:主要通过介绍机器视觉技术在农业中的发展狀况,然后阐述机器视觉系统的组成和工作原理,并基于当前机器视觉研究在农业中的应用,总结近几年使用农业机器视觉研究中用到的机器学习技术,包括有监督学习、无监督学习、人工神经网络,详细讨论这些技术的原理、优劣以及在农业领域中的应用,最后讨论机器视觉技术面临的问题和挑战,以及未来应用场景与发展方向。
关键词:农业;机器视觉;机器学习算法;监督机器学习;无监督机器学习;人工神经网络
机器视觉技术是通过模拟人的视觉功能,利用光学设备采集客观事物的图像并获得图像信息,最终用于实际的检测、测量和控制[1]。该技术具有可靠性高、速度快、功能多等特点,被广泛应用于工业、农业、制造业、交通业等领域[2]。
目前来说,在农业上主要着力于解决如何合理使用农业资源、降低农业生产成本,改善农业生态条件、提高农作物的质量等问题[3],而机器视觉技术以其高效、无损伤的特点被广泛应用于农产品的质量分级和检测、农田病虫草害的控制、农业自动采摘系统、农作物生长过程检测、农业机械导航等领域[4- 9]。而在农业生产应用中,采用机器视觉技术能够有效合理地利用农业资源,降低成本以及提高农作物的产量和质量。
伴随着计算机软硬件、图像采集装置、图像处理技术的发展,机器视觉技术在农业的应用领域将会不断拓展。目前,欧美日等国家已将机器视觉系统应用到农业的各个领域,大幅提高了生产效率、节约了劳动成本[10]。相比较而言,国内的相关研究大多处于试验阶段,但也取得了一定的研究成果。目前我国正处于由农业机械化到“智慧农业”的关键期,机器视觉技术在推动农业产业升级和农业现代化过程中会发挥重要作用。
1 机器视觉系统
机器视觉就是利用相机等图像采集装置来代替人眼对目标进行识别、跟踪、测量,然后进行各种运算,获取目标特征,得到能够观察到或者仪器能够检测到的图像,输出信号并控制末端机构输出。一个典型的机器视觉系统包括光源、镜头、工业相机(CCD、CMOS相机)、图像处理单元、图像处理软件、监视器、通讯/输入输出单元等[11](图1)。
由图2可知,机器视觉系统在工作时,通过图像摄取装置(工业相机等)获得被摄取目标的图像,传送给专用的图像处理系统进行处理,这个过程包括图像的预处理(图像去噪、图像对比增强、图像分割等操作)、图像分割(图像阈值分割、图像区域分割、图像梯度分割等)、提取特征(提取出物体的尺寸、形状、纹理、颜色等信息),然后通过机器学习算法进行统计运算,根据运算得到的判别结果来进一步控制现场的设备动作。
机器视觉系统是一门比较综合的学科,综合了光学、机械、计算机软硬件等方面的技术,而图像处理、模式识别和人工智能等技术的发展,也会推动机器视觉技术的进步。
2 机器学习技术
使用机器学习技术对图像进行分析与理解是研究热点[12],机器学习就是通过输入一定量的数据,通过一定的逻辑规则,在给定的判断准则下,来实现对数据的分析预测功能。对于机器视觉系统来说,输入的数据是图片。并按照输入时是否对数据添加一定的标签,机器学习可以分为监督学习、非监督学习等,在机器学习算法中均有一定的应用。
典型的机器学习算法首先需要一定的训练样本集,往往是提取图像的特征,然后通过机器学习算法进行训练得到训练模型,不同的算法会有不同的训练精度,而在预测的过程中,新的样本通过使用已知的模型,会得到预测的结果。机器学习的算法过程如图3所示。
2.1 监督机器学习
监督机器学习算法是利用带标签的样本来构建模型,以此来预测未知样本的类别。该学习算法从分析一个已识别的训练数据集开始,生成一个推断函数来预测所需的输出值。该模型经过训练,可以为任何新的样本提供精确的、预期的输出,同时能发现错误,进而调整模型。
2.1.1 朴素贝叶斯算法 朴素贝叶斯(naive bayesian,简称NB)算法是一种生成概率模型,基于预测变量和特征之间的条件独立性假设,给定的训练数据集,基于特征条件独立假设学习输入/输出的联合概率密度,然后基于此模型,对给定的输入,利用贝叶斯定理求出后验概率最大的输出。
朴素贝叶斯算法多用于分类分级的研究中,在实际应用中,会与其他分类算法对比使用。王永波等在对鸢尾花数据进行分类研究中指出,对花的花儿长度、花儿宽度、花瓣长度和花瓣宽度等4个特征进行建模,其中使用人工神经网络、朴素贝叶斯算法、支持向量机等3种算法,其准确度分别为92.2%、94.1%、98.0%,人工神经网络易出现局部最小化现象,导致分类的准确度降低,而朴素贝叶斯的方法虽然简单,但准确度较高,支持向量机算法由于能够有效克服局部最小化的问题,因而准确度最高[13]。周军等在研究核桃仁的分级中,首先获取颜色和完整度等的特征,得到特征矩阵并进行筛选,最后使用支持向量机、决策树和朴素贝叶斯算法进行分类,得到测试精度分别为80.67%、93.33%、94.67%,而通过使用朴素贝叶斯预测的精度达到97.33%[14]。
朴素贝叶斯算法对小规模的数据表现很好,能够处理多分类的任务,有比较稳定的分类效率,但是朴素贝叶斯假设属性之间是相互独立的,而实际中往往有一定的关联程度的,而且朴素贝叶斯方式需要先验概率,而这也会导致预测的精确度不佳[15]。
2.1.2 K近邻算法 K近邻法(K-nearest neighbor,简称K-NN)是一种分类和回归的方法,在使用时,输入实例的特征向量,也即是对应的特征的点集,通过k值的选择、距离的度量和分类的规则来输出的是实例的类别,然后如果有新的实例产生,则会根据训练的模型选择最近的实例集所在的类,从而完成预测。
Kurtulmu等在使用机器学习算法对油菜籽进行分类的研究中,分别使用灰度共生矩阵(GLCM)、灰色线性回归模型(GLRM)和局部二值模式(local binary pattern,简称LBP)的方式提取的14、11、59个纹理特征作为描述符,并使用K-NN算法进行分类,结果表明,k=3时K-NN算法的分类精度最高,达到97.8%[16]。Li等对自然环境下蓝莓的生长阶段图像进行识别,首先构建图像像素的数据集,然后获得图像的红、蓝、色调3个颜色分量,通过K近邻(K-NN)和朴素贝叶斯分类器对蓝莓的成熟阶段进行识别分类,结果表明,使用K-NN分类的精度最高达到98%[17]。在研究对不同类型的香菇自动分类检测时,夏青采用K-NN的方式,使用香菇的纹理特征作为参数,对香菇类型自动分选,试验中的模型的分选准确度在91%以上[18]。
2.3.2 卷积神经网络 卷积神经网络(convolutional neural networks,简称CNN)是一类包含卷积计算的具有深度结构的前馈神经网络,对于神经网络中的神经元,只与部分邻层的神经元连接。一个卷积层中,卷积神经网络的基本结构包括2层,分别是卷积层、池化层[32-33]。通过卷积和池化把局部特征结合成全局特征,并与全连接层相连,最后进行分类和预测。卷积神经网络结构如图5所示。卷积神经网络的发展很快,并且有很多成员,比如AlexNet、GoogleLeNet、VGGNet、ResNet等,随着卷积神经网络的发展,大大推动了机器视觉的发展[34]。目前,卷积神经网络的预测准确度已经很高,但由于卷积神经网络有很高的深度,运算速度上有待提升,在应用中更多的是希望速度和准确度上均有提高。
在农业应用上,卷积神经网络主要应用在病虫害检测、分类分级、导航定位上,如Ramcharan等利用坦桑尼亚田间木薯病害图像数据集,应用转移学习训练深层卷积神经网络,识别木薯的3种病害和2类害虫危害。训练好的模型获得的褐斑病、木薯褐条病、木薯花叶病检测精度分别为98%、98%、96%,对红螨害的检测精度为96%,绿螨害的检测精度为95%, 测试集总准确率为93%[35]。孙俊等使用AlexNet改进的卷积神经网络算法,得到8种改进模型,训练识别14种植物共计26种病虫害,选择最优模型。所使用的模型与原来相比精简了运行所需要的内存,同时提高了运行的泛化能力,测试准确度达到99.56%,具有很好的适应性和鲁棒性,能够对多种植物的多种病害进行识别[36]。杨洋等在对玉米根茎进行精准定位和识别研究中,通过履带自走式热雾机获取图像,构成训练样本,使用神经网络训练,在试验中能够取得较好的规划路径和定位精度[37]。
神经网络具有很强的并行计算能力,与人脑类似,人工神经网络具有自学习和自组织能力,在神经网络中,神经元部分消失在整个神经网络系统仍能够进行工作,因此神经网络具有很强的容错能力。但神经网络要求比较多的样本进行训练,而且训练结果会有时间过长、过度拟合的问题,因此也具有一定的局限性。
3 总结和展望
机器学习技术在农业机器视觉中具有重要的作用,目前已經应用到农产品质量检测和分级、杂草和植物病虫害检测、土壤分析等方面,预计未来机器视觉会在农业领域得到越来越广泛的应用。但也存在一些问题和挑战,一是在农业领域的大规模数据集亟须构建,目前的研究成果多是依赖研究者自身采集数据集,得到的结果没有可比性。二是在面对不同的环境,如何提高机器视觉系统的鲁棒性,也是面临的挑战。比如,在不同的光照条件、不同的背景条件、不同作物的不同生长阶段、不同的天气条件等给机器视觉的研究带来难题。
未来的农业机器视觉发展主要体现在:一是农业机器视觉系统会体现在整合在人工智能、机器人、传感器、物联网中的一部分,能够展示农作物的生长信息情况,并能够提前预测。二是嵌入式机器视觉具有易使用、易维护、易安装的特点,且具有低功耗的优势,会结合机器学习和深度学习方法,在对图像的定位和处理方向上得到长足发展,同时在农业机械装备中得到普及。
参考文献:
[1]陈兵旗,吴召恒,李红业,等. 机器视觉技术的农业应用研究进展[J]. 科技导报,2018,36(11):54-65.
[2]周 航,杜志龙,武占元,等. 机器视觉技术在现代农业装备领域的应用进展[J]. 中国农机化学报,2017,38(11):86-92.
[3]付玉志. 基于ZigBee技术的智慧农业实时采集和远程控制系统[D]. 杭州:浙江大学,2015.
[4]刁智华,王会丹,魏 伟. 机器视觉在农业生产中的应用研究[J]. 农机化研究,2014,36(03):206-211.
[5]王福娟. 机器视觉技术在农产品分级分选中的应用[J]. 农机化研究,2011,33(5):249-252.
[6]曹乐平. 基于机器视觉的植物病虫害实时识别方法[J]. 中国农学通报,2015,31(20):244-249.
[7]陈 军,张继耀,张 欣. 基于机器视觉的草莓自动采摘机的设计[J]. 农机化研究,2020,42(2):141-145.
[8]杨 斯,黄铝文,张 馨. 机器视觉在设施育苗作物生长监测中的研究与应用[J]. 江苏农业科学,2019,47(6):179-187.
[9]曹 倩,王 库,杨永辉,等. 基于TMS320DM642的农业机器人视觉导航路径检测[J]. 农业机械学报,2009,40(7):171-175.
[10]郑文钟. 国内外智能化农业机械装备发展现状[J]. 现代农机,2015(6):4-8.
[11]姚 缀,吕建秋,向 诚,等. 计算机视觉在农产品外部品质检测中的应用研究[J]. 食品工业科技,2019,40(14):363-368.
[12]许宪东,王亚东,运海红. 统计学习在图像分类中的应用研究综述[J]. 黑龙江科技信息,2012(32):108.
[13]王永波,邝炳洽. 基于机器学习的花卉分类算法研究[J]. 现代计算机,2013(13):21-24.
[14]周 军,蔡 建,郭俊先,等. 基于机器视觉的核桃仁特征提取与分级方法研究[J]. 江苏农业科学,2018,46(11):175-179.
[15]丁 月,汪学明. 基于改进特征加权的朴素贝叶斯分类算法[J]. 计算机应用研究,2019,36(12):3597-3600,3627.
[16]Kurtulmu F,nal H. Discriminating rapeseed varieties using computer vision and machine learning[J]. Expert Systems with Applications,2015,42(4):1880-1891.
[17]Li H,Lee W S,Wang K. Identifying blueberry fruit of different growth stages using natural outdoor color images[J]. Compute Electron Agriculture,2014,106:91-101.
[18]夏 青. 基于图像处理的干香菇分级方法研究[D]. 武汉:华中农业大学,2014.
[19]徐 奂. 基于支持向量机的开放式作物模型(SBOCM)研究[D]. 杭州:浙江大学,2012.
[20]Mokhtar U,Ali M A S,Hassanien A E,et al. Tomato leaves diseases detection approach based on Support Vector Machines[C]. Computer Engineering Conference,2016:246-250.
[21]羅匡男,彭 琳,齐伟恒. 基于机器视觉的三七叶片病斑识别[J]. 江苏农业科学,2017,45(24):209-212.
[22]刘永娟. 基于计算机视觉技术的玉米发育期识别研究[D]. 无锡:江南大学,2017.
[23]Zhang S W,Wu X W,You Z H,et al. Leaf image based cucumber disease recognition using sparse representation classification[J]. Compute Electron Agriculture,2017,134:135-141.
[24]欧垚江. 基于高斯混合模型的图像分割的研究[D]. 北京:北京交通大学,2015.
[25]程相康,朱宏擎. 一种基于高斯混合模型的快速水平集图像分割方法[J]. 华东理工大学学报(自然科学版),2015,41(6):808-814.
[26]董 腾. 基于机器视觉的水果分拣系统的研究[D]. 聊城:聊城大学,2018.
[27]田 杰,韩 冬,胡秋霞,等. 基于PCA和高斯混合模型的小麦病害彩色图像分割[J]. 农业机械学报,2014,45(7):267-271.
[28]郑 春,张继山. 基于神经网络的机器视觉图像识别算法应用[J]. 哈尔滨师范大学自然科学学报,2018,34(4):41-45.
[29]梁培生,孙 辉,张国政,等. 基于主成分分析和BP神经网络的蚕蛹分类方法[J]. 江苏农业科学,2016,44(10):428-430,582.
[30]黄喜梅. 基于机器视觉技术的小麦叶片含水量无损检测研究[D]. 泰安:山东农业大学,2018.
[31]谭穗妍,马 旭,吴露露,等. 基于机器视觉和BP神经网络的超级杂交稻穴播量检测[J]. 农业工程学报,2014,30(21):201-208.
[32]牛亚茜,冀小平. 基于卷积神经网络的图像检索算法研究[J]. 计算机工程与应用,2019,55(18):201-206.
[33]赵 轶,刘堂友. 基于卷积神经网络的田间杂草识别方法研究[J]. 计算机仿真,2019,36(4):440-444.
[34]李国和,乔英汉,吴卫江,等. 深度学习及其在计算机视觉领域中的应用[J]. 计算机应用研究,2019,36(12):3521-3529,3564.
[35]Ramcharan A,Baranowski K,Mccloskey P,et al. Deep learning for image-based cassava disease detection[J]. Frontiers in Plant Science,2017,8:1852.
[36]孙 俊,谭文军,毛罕平,等. 基于改进卷积神经网络的多种植物叶片病害识别[J]. 农业工程学报,2017,33(19):209-215.
[37]杨 洋,张亚兰,苗 伟,等. 基于卷积神经网络的玉米根茎精确识别与定位研究[J]. 农业机械学报,2018,49(10):46-53.伏文卓,魏 鑫,高艳明. 新型保温被结构温室冬季环境性能测试评价[J]. 江苏农业科学,2020,48(12):231-237.