高光谱图像在农作物病害检测识别中的研究进展
2022-05-13胡政张艳尚静张楷文
胡政 张艳 尚静 张楷文
摘要:农作物病害无损检测是保证作物产量和质量的关键环节,起到及时发现病害、指导农药的使用、减少经济损失等作用。本文介绍了高光谱成像技术用于农作物病害检测的原理;从支持向量机、偏最小二乘回归、深度学习识别算法方面综述了2017—2021年高光谱成像技术在农作物病害检测中的国内外研究进展;分析了作物病害高光谱图像识别算法的原理和分类流程,对3种深度学习算法:[深度置信网络(DBN)、基于自编码网络(AE)的栈式自编码网络(SAE)、卷积神经网络(CNN)]在农作物病虫害高光谱图像识别方面的应用进行优缺点对比;对常见深度学习分类指标计算过程和原理进行说明;指出高光谱检测识别农作物病害中面临的问题:异物同谱、数据预处理特征提取过程繁杂、数据量小且训练数据不平衡,并针对这些问题给出未来的研究方向。
关键词:高光谱成像;病害无损检测;深度学习;图像识别
中图分类号:S127;TP391.41 文献标志码: A
文章编号:1002-1302(2022)08-0049-06
近年来,由于我国农作物病害严重、受害面积广、粮食损失比重大,且防治挽回损失效果不理想[1],因此对农作物进行病害检测在农作物病害防治过程中显得极为重要。传统的农作物病害诊断方法有2种:一是病害症状观察法,结合病原菌形态特征及过往经验进行识别,但主观性强,对农作物病害专家依赖性较大;二是酶联免疫法,可灵敏地检测农作物中病毒蛋白含量,但价格高,在农作物细菌和真菌病害检测方面应用较少。随着精细化农业的兴起,成像技术为农作物病害识别提供了新的思路,并成为替代传统检测方法的重要技术手段[2]。高光谱成像技术[3]在农作物病害识别过程中相对于传统识别技术具有无损性、及时性、高准确性、环保等优势,能检测出农作物感染病害早期时的内在生理信息的变化,包括蛋白质、酶类抗氧化指标、氨基酸类等,与其他成像技术如机器视觉技术[4]、红外热成像技术[5]等相比,对早期农作物病害识别具有更高的灵敏性。本文主要介绍高光谱成像技术为代表的检测技术和以深度学习为代表的高光谱图像识别算法在农作物病害无损检测中的研究进展。
1 高光谱成像技术用于农作物病害检测的原理
农作物受到病害胁迫时,内部的生理活动与外部物理结构会发生变化,同时其光谱特征也发生相应的改变,这种改变间接反映出农作物在病害胁迫下的生理特性,因此可根据光谱的变化来监测作物的早期病害情况(图1)[6]。
光的波长跨越范围很广,人的肉眼只能看到400~700 nm波长,该波段可反映出作物的表型特征,如枯黄、损伤等;低于400 nm的是紫外光,高于700 nm的叫红外光,这些都是人眼无法直接观测到的波段,这些波段往往能够反映出作物更深层次的内在生理特征,如作物的蛋白、水分含量、叶肉细胞变化等。高光谱成像技术通常将可见光到近红外光波段(400~1 000 nm)分为几十甚至上百个相邻窄波段,并在每个窄波段分别进行成像。图像信息反映出农作物的外部特征,光谱曲线反映出农作物内部生理结构与化学成分信息,因此高光谱图像的信息量十分丰富,近年来,该技术在粮食作物、经济作物、蔬菜作物及果类等方面得到广泛应用[7-10]。
2 农作物早期病害高光谱图像识别的研究
图像的识别,是指提取图像特征作为目标,建立分类器,达到识别目标的过程[11]。稳定、快速、高准确率的识别算法一直都是研究者的追求目标。识别有基于形状、纹理、统计等,根据识别数量的不同,有二分类器和多分类器,其中多分类器是二分类器的组合。对国内外文献分析,发现在农作物病害的高光谱图像识别中常用的分类方法有支持向量机[12]、偏最小二乘法回归[13]、深度学习[14]。
2.1 支持向量机
支持向量机(SVM)是一类按监督学习方式对数据进行二分类的广义线性分类器,通过将输入空间样本映射到另一高维特征空间解决线性不可分问题,被广泛用于作物病害高光谱数据的识别中。褚璇利用高光谱成像技术对单种霉菌和混合菌以单点或倾注接种方式在不同类型培养基中和玉米粒上生长1~6 d,并拍摄其高光谱图像,以连续投影(SPA)挑选特征波长结合SVM建模,判别准确率达99.5%以上[15]。Baek等利用高光谱成像对细菌性穗枯病(BG)感染的变色病态水稻种子进行检测,建立了支持向量机(SVM)、线性和二次判别分析(LDA和QDA)模型,结果表明,当仅使用2个或3个特征波長时,所有分类方法对样本测试集和验证集都达到了90%以上的分类准确率[16]。Bohnenkamp等利用地面车辆和无人机2个测量平台,采用支持向量机(SVM)判别模型对小麦黄锈病的高光谱图像进行识别,基于地面车辆和无人机测量平台所得高光谱图片的识别准确率最高分别可达92.3%和83.0%[17]。蒋锦琳以不同感病程度辣椒作为检测样本,基于高光谱成像技术采用SVM分别基于全谱、特征波长和特征植被指数来建立稳健的辣椒疫病三级感病程度分级模型,其中,特征波长与特征植被指数所建立的三级感病程度分级模型准确率达到99.75%[18]。刘爽以小麦赤霉病籽粒高光谱信息提取技术及识别模型的研究为切入点,利用SVM模型和SVM散射校正模型二次分类的方法将测试集在SPA特征空间中的分类精度提升至88.98%,研究结果表明利用高光谱成像技术结合数据处理算法可实现小麦赤霉病籽粒的原位快速可视化识别,有助于提高小麦赤霉病的检测效率、数量及降低漏检率[19]。在农作物病害高光谱图片识别中,SVM有坚实的理论基础和较强的推广能力,针对非线性、小样本和高维模式等问题具有独特的优势,并结合相应的预处理和特征提取方法能达到一个较高的识别率。
2.2 偏最小二乘回归
偏最小二乘回归(PLSR)是一种统计学方法,通过将预测变量和观测变量投影到一个新空间,来寻找一个线性回归模型,能够建立光谱信息与成分之间的对应关系,是目前植物病害近红外高光谱图像识别应用最多的建模方法[20],程帆等应用可见/近红外高光谱对细菌性角斑病早期胁迫下的黄瓜叶片中所含过氧化物酶(POD)活性进行检测,并建立过氧化物酶活性值的偏最小二乘回归(PLSR)预测模型,最终得到预测集相关系数为0.816,预测均方根误差为11.235,研究结果表明,高光谱结合化学计量学方法可以实现细菌性角斑病早期胁迫下黄瓜叶片中过氧化物酶活性的测定[21]。偏最小二乘判别分析(PLS-DA)是基于偏最小二乘回归分析的判别分析方法,判别分析是一种通过观察或测量得到的变量值,去判别研究对象怎样分类的统计分析方法。Gold等利用高光谱成像技术对马铃薯晚疫病和早疫病的症前特征进行检测识别,采用偏最小二乘判别分析(PLS-DA)建立分类模型,试验结果表明,在出现明显病症前的2~4 d,高光谱测量可以检测并区分马铃薯的晚疫病和早疫病,准确率均在80%以上[22]。Pérez-Roncal等采用高光谱成像技术(900~1 700 nm光谱范围)对黑葡萄白粉病进行检测,建立平滑(SM)、标准正态变量(SNV)和均值居中(MC)预处理组合的偏最小二乘判别分析(PLS-DA)模型获得了最佳的识别率,交叉验证模型准确率为85.33%,结果表明高光谱成像技术结合化学计量学可用于黑葡萄白粉病的检测[23]。
2.3 基于深度学习的农作物病害高光谱图像识别方法
深度学习起源于神经网络,是人工智能的一个分支,对比传统深层神经网络,它具有更多隐藏层,将特征提取与分类放到一个结构中,利用深层次非线性学习模型对复杂函数逼近,自动从样本集中进行特征逐层提取,学习数据集本质特征,得到最优识别模型[24]。利用深度学习强大的图像分类能力能从高维、信息量巨大的农作物高光谱图像中自动提取出有利于提高分类准确度的特征,极大地提高了识别的精确性与鲁棒性,识别流程见图2。
目前,在高光谱农作物病害图像识别领域的深度学习主要有3种模型:深度置信网络(DBN)、基于自编码网络(AE)的栈式自编码网络(SAE)、卷积神经网络(CNN)[25]。3种深度学习模型在农作物高光谱图像识别中的优缺点见表1。
CNN在图像分类、场景分割、目标检测等方面有着非常多的应用,并取得非常显著的成果,与SAE及DBN相比,CNN是目前在高光谱图像分类领域里应用最多的深度学习模型,具体有visual geometry group network(VGGNet)、residual neural network(ResNet)、Google neural network(GoogleNet)、LeCun neural network (LeNet)等结构模型[26-29],处理流程见图3。
CNN网络的处理目的是找到损失函数值最小参数,其中随机梯度下降法是处理的核心操作,运算时沿梯度的方向更新参数,并重复这个步骤,直到找出损失函数值最小参数[30]。基于CNN的高光谱作物病害的图像分类方法主要可以分为2类[31]:基于谱特征的分类方法、基于图像特征的分类方法。
2.3.1 基于谱特征的分类方法
高光谱图像的光谱信息十分丰富,能够从每一个像素提取出1条由谱信息组成的一维向量,利用该一维向量进行图像的分类即为基于谱特征的分类。王建涛等以柑橘正常叶片、煤烟病叶片、溃疡病叶片、红蜘蛛叶片、草甘膦病叶片为研究样本,采集400~1 000 nm的128个波段的高光谱图像,并进行灰板校正的预处理;提取感兴趣区域的光谱信息,输入由输入层、卷积层、池化层、全连接层和输出层组成的VGG16 卷积神经网络,每个卷积层加入激活函数 ReLU以增强网络的非线性,模型中的池化层采用的是最大池化,能够实现特征降维、光滑数据;全连接层拥有512个神经元,输出层个数是5个,用以识别柑橘正常叶片和其他4种柑橘病叶片,试验结果表明,在学习率为0.001和迭代次数为1 000次时,算法平均准确率为98.75%[26]。
从高光谱图像提取到的光谱由于谱间相关性强、冗余大等特点,直接输入卷积神经网络得到的识别速度和效果不理想,通常会对原始光谱做一些平滑、去噪处理,以及特征波段的提取,具体算法有多元散射校正、正态变换、微分平滑等,基于谱特征分类的深度学习网络模型具有网络简单、计算量小等优点,但容易发生过拟合,需要根据实际的需要对模型作出调整。
2.3.2 基于图像特征的分类方法
光谱的每一个波段都对应着1张灰度图,反映出农作物病害在不同波段的空间信息。利用这些二维灰度图像的分类为基于图像特征的分类。黄双萍等以1 467株田间采集的水稻穗株为试验对象,采用Gaia Field-F-V10便携式户外高光谱成像仪在自然光照条件下拍摄水稻穗株高光谱图像,利用GoogLeNet建立的深度卷积模型,采用随机梯度下降算法(SGD)优化GoogLeNet模型[28],具体流程见图4。
GoogLeNet是一个深度卷积神经网络模型,需要大量数据和标定监督机制进行模型训练。由于原始穗株高光谱数据采集过程耗时,耗力且高成本,原始数据采集不足,训练数据不平衡(正负训练样本比约为8)。黄双萍等提出了2种数据增强策略:第1种是依据高光谱成像仪具有超高光谱维度上的分辨率特性,随机扔弃波段图像和随机平移平均高光谱图像亮度[28]。随机扔弃波段的数据增强策略是从高光谱图像260个波段中随机扔弃1个波段信息,再计算平均谱图像;第2种是随机平移平均光谱图像亮度,便携户外高光谱仪采集水稻穗株高光谱图像在动态变化的自然光条件下进行,使平均谱图像呈现明显亮度差异,为增强GoogLeNet模型对光照变化的适应性,随机平移光谱图像亮度增强数据,增加数据在光照亮度维方面的多样性,可以增加成倍训练数据量,增加样本多样性,提升模型泛化能力。结果表明,利用GoogLeNet建立的深度卷积模型,可以很好地实现水稻穗瘟病害的精准检测,克服室外自然光条件下利用光谱图像进行病害预测面临的困难,将该类研究往实际生产应用推进一大步。
由于谱间相关性强、冗余大等特点,对应得到的灰度图同样也有着这些特点,直接输入卷积神经网络会使得识别速度和效果不理想,通常会对图片做一些降噪、壓缩、减少相关性等处理,具体处理有主成分分析、最小噪声分离、波段比计算等,深度学习模型擅长处理二维图片,具有较强的鲁棒性,能提取图片的深层、稳定、内在的特征,现实生活中也有着大量的成熟算法和经验可以借鉴,基于图片特征分类的深度学习网络模型能够得到一个相对较高的识别率,但由于高光谱图像的数据有限往往容易发生过拟合。
2.4 模型的评估与性能度量
通常通过试验测试来评估识别模型的性能,因此将数据集化分为测试集和训练集,常见的划分方法有留出法[32]、交叉验证法[33]。留出法和交叉验证法都是保留一部分样本用于测试,因此会导致训练样本不足,虽然交叉验证法影响训练样本较少,但计算的复杂度太高。
深度学习在农作物病害图像识别与分类中均表现出良好的性能、识别快、鲁棒性好、泛化能力强[34]。为评价深度学习模型在高光谱图像上的识别效果通常会采用评价指标:准确率(Acc)、召回率(R)、平均正确率(MAP)、均方误差(RMSE) 、平均绝对误差(MAE)、F1值等[35-40],具体见表2。
準确率和召回率是相对矛盾的性能度量,通常准确率高那召回率就低;而召回率高则准确率就低,但在一些简单的任务中召回率和准确率都能达到一个较高的值。在一些任务中,对准确率和召回率的重视程度不同,通过F1值能够表现出针对准确率或召回率不一样偏重。
3 存在的问题与展望
通过总结分析当前的作物病害高光谱检测技术及发展现状,可以发现,虽然在作物的病害种类识别、作物病害的程度分级、作物病害的早期检测已经取得了很好的效果[41],但仍然面临着问题,主要有异物同谱现象(不同的作物病害在光谱上的表征相同);高光谱数据量大、相关性强等,要结合繁杂的数据预处理和特征提取才能有个较高的识别;高光谱数据采集过程耗时耗力且成本高导致原始数据采集不足,训练数据不平衡。
结合以上问题未来在农作物病害无损检测和识别可以从以下几点继续深入研究:
(1)针对异物同谱的问题,未来可以从提高高光谱检测技术的光谱维度上的分辨率,以期在更高的精度下找出光谱数据间的差异。
(2)深度学习算法结构简单,能够自动提取所需要的特征进行并行运算实现高效的分类,未来可以深入研究适合作物病害高光谱识别的深度学习算法,寻找合适的超参数、网络结构和层次、优化算法等。
(3)深度学习算法需要大量的学习样本,一方面可以结合高光谱图像的数据量大、波段多的特点随机波段图片组合形成大量样本;另一方面可以改进算法,多种算法结合以少量学习样本得到一个较高的识别准确率,如结合迁移学习的应用。
参考文献:
[1]刘万才,刘振东,黄 冲,等. 近10年农作物主要病虫害发生危害情况的统计和分析[J]. 植物保护,2016,42(5):1-9.
[2]Khan S,Tufail M,Khan M T,et al. Deep learning-based identification system of weeds and crops in strawberry and pea fields for a precision agriculture sprayer[J]. Precision Agriculture,2021,22(6):1711-1727.
[3]张德荣,方 慧,何 勇.可见/近红外光谱图像在作物病害检测中的应用[J]. 光谱学与光谱分析,2019,39(6):1748-1756.
[4]党满意,孟庆魁,谷 芳,等. 基于机器视觉的马铃薯晚疫病快速识别[J]. 农业工程学报,2020,36(2):193-200.
[5]杨成娅,张 艳,赵明珠,等. 基于红外热像的农作物早期病害检测识别技术的研究进展[J]. 激光杂志,2020,41(6):1-4.
[6]张 初.基于光谱与光谱成像技术的油菜病害检测机理与方法研究[D]. 杭州:浙江大学,2016.
[7]韩 雨,刘焕军,张新乐,等. 基于冠层光谱的水稻穗颈瘟病害程度预测模型[J]. 光谱学与光谱分析,2021,41(4):1220-1226.
[8]Riefolo C,Antelmi I,Castrignanò A,et al. Assessment of the hyperspectral data analysis as a tool to diagnose Xylella fastidiosa in the asymptomatic leaves of olive plants[J]. Plants,2021,10(4):683.
[9]Manganiello G,Nicastro N,Caputo M,et al. Functional hyperspectral imaging by high-related vegetation indices to track the wide-spectrum Trichoderma biocontrol activity against soil-borne diseases of baby-leaf vegetables[J]. Frontiers in Plant Science,2021,12:630059.
[10]Bendel N,Backhaus A,Kicherer A,et al. Detection of two different grapevine yellows in Vitis vinifera using hyperspectral imaging[J]. Remote Sensing,2020,12(24):4151.
[11]宫 铭. 计算机图像识别技术的应用及细节问题阐述与分析[J]. 信息与电脑(理论版),2019(1):7-8.
[12]Zhao J L,Fang Y,Chu G M,et al. Identification of leaf-scale wheat powdery mildew (Blumeria graminis f. sp. tritici) combining hyperspectral imaging and an SVM classifier[J]. Plants,2020,9(8):936.
[13]Garriga M,Romero-Bravo S,Estrada F,et al. Estimating carbon isotope discrimination and grain yield of bread wheat grown under water-limited and full irrigation conditions by hyperspectral canopy reflectance and multilinear regression analysis[J]. International Journal of Remote Sensing,2021,42(8):2848-2871.
[14]Yang W,Nigon T,Hao Z Y,et al. Estimation of corn yield based on hyperspectral imagery and convolutional neural network[J]. Computers and Electronics in Agriculture,2021,184:106092.
[15]褚 璇. 谷物霉菌的高光谱成像辨识方法和霉变玉米籽粒检测方法研究[D]. 北京:中国农业大学,2018.
[16]Baek I,Kim M,Cho B K,et al. Selection of optimal hyperspectral wavebands for detection of discolored,diseased rice seeds[J]. Applied Sciences,2019,9(5):1027.
[17]Bohnenkamp D,Behmann J,Mahlein A K. In-field detection of yellow rust in wheat on the ground canopy and UAV scale[J]. Remote Sensing,2019,11(21):2495.
[18]蔣锦琳. 基于高光谱成像技术的辣椒疫病和品质分析研究[D]. 杭州:浙江大学,2019.
[19]刘 爽. 小麦赤霉病高光谱信息多循环提取及组合式识别研究[D]. 北京:中国科学院大学,2019.
[20]Zeng W Z,Zhang D Y,Fang Y H,et al. Comparison of partial least square regression,support vector machine,and deep-learning techniques for estimating soil salinity from hyperspectral data[J]. Journal of Applied Remote Sensing,2018,12:022204.
[21]程 帆,赵艳茹,余克强,等. 基于高光谱技术的病害早期胁迫下黄瓜叶片中过氧化物酶活性的研究[J]. 光谱学与光谱分析,2017,37(6):1861-1865.
[22]Gold K M,Townsend P A,Chlus A,et al. Hyperspectral measurements enable pre-symptomatic detection and differentiation of contrasting physiological effects of late blight and early blight in potato[J]. Remote Sensing,2020,12(2):286.
[23]Pérez-Roncal C,López-Maestresalas A,Lopez-Molina C,et al. Hyperspectral imaging to assess the presence of powdery mildew (Erysiphe necator) in cv. carignan noir grapevine bunches[J]. Agronomy,2020,10(1):88.
[24]段艳杰,吕宜生,张 杰,等. 深度学习在控制领域的研究现状与展望[J]. 自动化学报,2016,42(5):643-654.
[25]周 峰. 基于深度学习的光谱图像分类方法研究[D]. 南京:南京信息工程大学,2021.
[26]王建涛,吴叶兰,廖 禺,等. 基于卷积神经网络的柑橘病叶高光谱分类[J]. 信息技术与信息化,2020(3):84-87.
[27]桂江生,吴子娴,李 凯. 基于卷积神经网络模型的大豆花叶病初期高光谱检测[J]. 浙江大学学报(农业与生命科学版),2019,45(2):256-262.
[28]黄双萍,孙 超,齐 龙,等. 基于深度卷积神经网络的水稻穗瘟病检测方法[J]. 农业工程学报,2017,33(20):169-176.
[29]金 秀,卢 杰,傅运之,等. 基于深度卷积神经网络的小麦赤霉病高光谱病症点分类方法[J]. 浙江农业学报,2019,31(2):315-325.
[30]Kutluk S,Kayabol K,Akan A. A new CNN training approach with application to hyperspectral image classification[J]. Digital Signal Processing,2021,113:103016.
[31]Nguyen C,Sagan V,Maimaitiyiming M,et al. Early detection of plant viral disease using hyperspectral imaging and deep learning[J]. Sensors,2021,21(3):742.
[32]王国伟,刘嘉欣. 基于卷积神经网络的玉米病害识别方法研究[J]. 中国农机化学报,2021,42(2):139-145.
[33]樊湘鹏,周建平,许 燕,等. 数据集对基于深度学习的作物病害识别有效性影响[J]. 中国农机化学报,2021,42(1):192-200.
[34]李建华,郝 炘,牛明雷,等. 基于卷积神经网络的农作物病害识别[J]. 中国农业信息,2019,31(3):39-47.
[35]孙 俊,谭文军,毛罕平,等. 基于改进卷积神经网络的多种植物叶片病害识别[J]. 农业工程学报,2017,33(19):209-215.
[36]郑二功,田迎芳,陈 涛. 基于深度学习的无人机影像玉米倒伏区域提取[J]. 河南农业科学,2018,47(8):155-160.
[37]张善文,张传雷,丁 军. 基于改进深度置信网络的大棚冬枣病虫害预测模型[J]. 农业工程学报,2017,33(19):202-208.
[38]周翔宇,程 勇,王 军. 基于改进深度信念网络的农业温室温度预测方法[J]. 计算机应用,2019,39(4):1053-1058.
[39]谭建灿,毛克彪,左志远,等. 基于卷积神经网络和AMSR2微波遥感的土壤水分反演研究[J]. 高技术通讯,2018,28(5):399-408.
[40]戴泽翰,郑 正,黄莉舒,等. 基于深度卷积神经网络的柑橘黄龙病症状识别[J]. 华南农业大学学报,2020,41(4):111-119.
[41]Lowe A,Harrison N,French A P.Hyperspectral image analysis techniques for the detection and classification of the early onset of plant disease and stress[J]. Plant Methods,2017,13:80.