利用图像识别技术计算薇甘菊锈病的相对病斑面积
2021-03-16任行海王福宽钱万强万方浩
任行海, 刘 博, 乔 曦, 王福宽, 钱万强, 万方浩*, 刘 怀
1西南大学植物保护学院,重庆 400715; 2中国农业科学院基因组研究所,广东 深圳 518120; 3广西大学机械工程学院,广西 南宁530003
薇甘菊MikaniamicranthaH.B.K.是世界最有害100种外来入侵生物之一,同时也是我国重点管控的重要农林入侵物种(Dayetal.,2016),列入国家重点管理外来入侵物种名录。薇甘菊柄锈菌PucciniaspegazziniiDe Toni是生活在薇甘菊上的一种生活周期短、寄主专一性强的病原真菌,为一种防控薇甘菊的潜在生防真菌(Dayetal.,2013; Day & Riding,2019)。准确评价薇甘菊柄锈菌对薇甘菊的危害程度对致病性机制的研究、防控技术的开发等都具有十分重要的科学意义。
相对病斑面积(relative lesiona area, RLA)是评价病害严重程度的客观指标,同时也是评价生防真菌防治效果的客观指标,能反映生防真菌对靶标生物的侵染力。
相对病斑面积的计算方法有多种,传统的方法有公式计算法、工具法和软件法(陈冬梅等,2019),目前大多采用的是图像识别技术。公式计算方法以病斑的最大长度和最大宽度(两者呈直角)或以病斑的直径计算(崔华威等2009;李海春等,2005;李丽梅等,2020);传统使用的工具有已知每格面积的纱网、有机玻璃制成的标准尺、坐标纸、游标卡尺等(李丽梅等,2020);使用的软件主要是Chalkiness 1.0、Photoshop、AutoCAD(崔华威等,2009; 吴尧和吴双清,2014; 郑燕和吴为人,2008),但是这些方法存在许多问题,特别是网格法、坐标法在计算面积时存在误差,在样本量多时,统计效率低,同时操作者容易产生疲劳,造成误差(胡维炜等,2016)。
自从图像识别技术被提出以来,该方法已经被应用于多个领域,如医学病理切片识别、制造业中金属与合金鉴定和产品缺点识别、农业病虫害与杂草识别、建筑质量检测、植物物种鉴定以及果园中冻伤检测,甚至被警察用于找寻大麻的种植地(Daoudetal.,2019; Gaoetal.,2019; Islam & Kim,2019; Meyeretal.,2004; Narla & Rao,2020; Pereiraetal.,2020; Taraschi & Florindo,2020)。图像识别技术被用于计算病斑面积以来,国内外许多学者利用图像识别技术开展对植物病害的研究。陈冬梅等(2019)基于自适应模糊阈值法计算茶炭疽病的病斑面积,准确率达90%以上。毛罕平等(2008)提出了一种基于模糊C均值聚类算法(fuzzy c-means, FCM)的自适应分割方法,该方法能够比较准确地分割病斑区域与健康区域,且平均分割误差小于5%。刁智华等(2013b)提出基于颜色和形状特征的分割方法,并应用于分割棉花害螨病斑,结果表明,该计算方法能够有效提取棉花被螨虫危害后的病斑,准确率达94.79%。胡维炜等(2016)通过HSV(Hue, Saturation, Value)、L*a*b*特征空间类聚法逐步分离病斑区域,该方法能够有效分割病斑区域与健康的区域,相对病斑面积计算的准确率达99.5%以上。Chenetal.(2020)在VGGNeT(Visual Geometry Group Network)模型的基础上提出了ING-VGG模型,该模型对水稻病斑识别的平均准确度也达到了92%,为水稻病害的识别与预测提供了一个快速有效的途径。Qianetal.(2020)提出一种基于卷积云神经网络中VGG16的改进模型,对苹果叶片病害进行识别,与VGG16模型相比,精准度提高了6.3%,达到99.1%。与上述方法不同的是,程荣花等(2014)通过HSV颜色分量过滤和中值滤波除噪,得到病斑与整个叶片的像素点数量,通过换算病斑区域的像素点数量和叶片像素点总量,计算出相对病斑面积,效果良好。目前,这些方法还未在识别薇甘菊锈病与计算病斑面积上应用。
基于图像识别技术计算薇甘菊锈病相对病斑面积的核心在于图像的分割,只有准确分割提取出病斑区域与健康区域,计算出的相对病斑面积才会准确。本研究采用超绿算法(excess green, ExG)与超红算法(excess red, ExR)相结合的方法计算薇甘菊锈病的相对病斑面积。超绿算法与超红算法是分离绿色植物与非绿色植物类图像的常用技术,其原理是利用颜色特征因子的不同组合,如超绿算法的组合为2G-R-B、超红算法的组合为2R-G-B(刁智华等,2013a,2013b)。本研究以薇甘菊锈病病斑叶片的彩色数字图片为研究对象,采用ExG+ExR算法与复印称重法、网格法计算相对病斑面积,并以Photoshop手动分割的结果作为真实值,计算精准度,评价各种算法的准确性和实用性。
1 材料与方法
1.1 图像采集
在本研究中,薇甘菊锈病采用自然接种法接种(Ellisonetal.,2008),接种15~17 d待锈色孢子长出后,拍摄感病叶片的照片120幅。拍摄感病叶片时,保持相机与叶片垂直,以A4纸为拍照底板,使叶片与底板紧贴,减少因叶片翘起而产生的阴影,图像包括叶片的完整区域,保证有足够的光照。感病叶片拍照后,将其放进具有扫描功能的复印机(HP LaserJet MFP M227fdw)内,等比例扫描,以PDF文件保存。
1.2 实验方法
1.2.1 复印称重法 参考陶洪斌和林杉(2006)的方法,并稍作修改。将等比例扫描得到的薇甘菊锈病叶片图片打印在A4纸上,按照叶片的形状剪取后放在1/1000电子分析天平(Meilen,MTQ 200)上称重,将病斑剪掉后再次称重,两者的差值就是病斑所占的质量,病斑与叶片的质量之比,就是该叶片中病斑的占比。
RLA= (Ma-Mb)/Ma×100%
其中,Ma是叶片形状A4纸的重量,Mb是减去病斑后的重量。
1.2.2 网格法 根据刘学敏等(1991)的方法,稍作修改,将等比例扫描得到的薇甘菊锈病病叶图片打印在已知面积的网格纸上(0.01 cm2·格-1),数叶片和病斑占的格数,统计叶片、病斑的面积。统计原则:叶片或病斑占满一格按一格计算,多于半格不满一格按半格计算,少于半格不做统计。
RLA=Sb/Sz×100%
其中,Sb是病斑的面积,Sz是叶片面积。
1.2.3 基于图像处理的方法 超绿算法是一种基于RGB颜色空间的阈值分割方法(刁智华等,2013a)。由于该算法对样本中的绿色目标比较敏感,因此常被应用于绿色植物的分割。算法的分割原理是利用超绿因子(2G-B-R)对彩色样本图像进行处理,增加G分量在颜色空间中的比重,从而增强图像中绿色分量与其他分量之间的对比度。之后对处理所得的图像进行阈值分割,即将图像中每个像素的灰度值与选定的阈值T进行对比,大于T的像素被标记为目标,其余像素被标记为背景。算法中阈值T的选取常采用最大类间方差法(OTSU),OTSU是一种无监督无参的分类方法,由于其有稳定有效、自适应强以及计算简单的特性,从而被广泛应用于自动阈值的分割(白元明等,2019),在实际应用中也可采用经验法对分割阈值T进行赋值,以达到最佳分割效果。
超红算法与超绿算法的原理类似,不同的是超红算法的作用是突出图像中的红色分量,可用于叶片病斑的分割(刁智华等,2013b)。采用的超红算法表达式为:
ExR=2.1R-G-B
1.2.4 病情分级 参考商鸿生等(1990)对小麦锈病的等级划分,将薇甘菊有锈病病斑的叶片分为5个等级:1级为冬孢子覆盖度介于0~5%;2级为冬孢子覆盖度介于5%~15%;3级为冬孢子覆盖度介于15%~30%;4级为冬孢子覆盖度介于30%~60%;5级为冬孢子覆盖度介于60%~100%。
1.3 评价方法
相对病斑面积反映了病原真菌或细菌侵染叶片的程度,不仅是定量评估病害程度的指标,也是评估生防菌防控效果的指标。本研究通过图像识别技术实现对RLA的无损测量。为了体现测量方法的准确性,将采用绝对准确率(absolute accuracy, AA)、绝对误差(absolute error, AE)这2个指标评价RLA的准确性。
采用绝对准确率评估病斑面积分割的精度(陈冬梅等,2019),其计算公式为:
Ra=La/Sa×100%
Ri=Li/Si×100%
AA=(1-|Ra-Ri|)×100%
其中,La、Sa是利用Photoshop 2020软件对样本进行人工分割所得的结果作为目标叶片像素点数和病斑的像素点数真实值,即利用Photoshop 2020软件中的快速选择工具将目标叶片与病斑选中,并填充不同的颜色,再利用计数工具统计目标叶片像素点与病斑像素点。
Ra是计算出来的相对病斑面积,作为真实值;Li、Si是利用本研究方法计算出目标叶片和病斑面积的像素点或目标叶片和病斑的面积,Ri是本研究的算法计算出来的相对病斑面积。AA越大,表明计算方法的精度越大,方法的性能越好。
采用绝对误差衡量相对病斑面积计算的准确性(胡维炜等,2016),其计算公式为:
AE=|Ra-Ri|×100%
采用错分率(misclassification error, ME)衡量图像识别技术对病斑区域与健康区域分割的准确度,其计算公式为:
ME= (La-Li)/Sa×100%
2 结果与分析
2.1 背景与病斑分割
为提高叶片病斑的分割精度,先将带有病斑的叶片从图像样本的背景中分割出来,再从叶片上分割出目标病斑。ExG算法、ExR算法分割方法中,ExR算法对绿色特征并不敏感,因此分别采用ExG算法进行叶片背景分割,ExR算法进行病斑分割。
采用ExG算法进行背景分割时,采用OTSU方法计算所得的阈值。采用ExR算法分割病斑时,同样将OTSU方法计算所得的阈值作为初始阈值,在该阈值附近寻找整体最优阈值,最终采用阈值T=0.37。实验发现,由于取样时拍摄背景的光照强度和叶片绿度不同,不同图像的最优阈值有一定的差别。为达到最佳的分割效果,本研究尝试采用多阈值法使不同的图像在整体最优阈值附近(0.29≤T≤0.45)自动选用最优整体阈值进行分割。
由图1可知,ExG算法很好地将叶片从背景中分割出来,虽然分割精度只有97.7%,但不会出现将病斑分割掉的现象。ExG算法的误分情况主要表现在将背景区域识别为叶片,具体结果如图1F所示。对比原图发现,误分区域为叶片边缘的深色阴影区域,大面积的阴影使得聚类算法将部分靠近叶片的背景区域分割为叶片,但整体来说ExG算法分割背景的效果良好。
病斑的分割是在ExG算法分割背景的基础上采用ExR算法,该方法能够准确地将病斑分割出来(图1G~I),分割效果较好。
图1 ExG+ExR算法病斑分割结果
2.2 病斑计算结果
将图像识别技术与传统方法计算叶片相对病斑面积的结果比较,结果可知,与传统方法相比,ExG+ExR算法计算得到的病斑相对面积的绝对准确率的均值为98.19%,高于网格法的96.19%、复印称重法的94.93%(表1)。绝对误差反映了相对病斑面积计算的准确度,绝对误差越小,表明分割的精度越高。ExG+ExR算法绝对误差率的均值小于2%,表明相对病斑面积计算准确度均值超过98%,高于网格法与复印称重法。错分率反映了图像识别技术分割叶片病斑区域与健康区域的准确程度,ExG+ExR算法错分率的均值为1.81%,不高于2%,表明叶片的病斑区域与健康区域的分割准确度平均达到98%以上。由表1可知,3种方法的绝对准确率都会随着病级的增加而下降,绝对误差都会随着病级的增加而增加,但ExG+ExR算法的绝对准确率和绝对误差的变化要小于其他2种方法,绝对准确率都在94%以上。
基于上述实验结果,对于计算薇甘菊锈病相对病斑面积来说,ExG+ExR算法能够有效地分割病斑面积,并计算出相对病斑面积,能够有效地对利用薇甘菊柄锈菌防控薇甘菊的防控效果做出评价。
2.3 执行效率
使用ExG+ExG算法处理一幅4608×3456像素的彩色图像,消耗时间为45.77 s,明显比传统的方法快(表2)。
表1 3种方法对不同病级分割评价指标
表2 不同方法分割病斑消耗时间
3 讨论
本文通过对3种病斑相对面积计算方法(ExG+ExR算法、复印称重法、网格法)进行比较,给予系统、科学的评价。网格法计数格的过程中容易漏数、重复数,并且每个人对不满格的判断不同,这些都会产生较大的人为误差。复印称重法将目标区域剪出的过程中,容易产生误差,最终影响相对病斑面积计算的准确度。此外,人工采集叶片过程中,会对实验样本造成不可恢复性的破坏。与传统方法相比,基于图像识别的ExG+ExR算法在不破坏实验样本的前提下,能够快速、准确地分割病斑,并精准地计算出相对病斑面积,已在多种植物上应用,但超绿算法分割病斑时易将病斑误分为背景。基于卷积云神经网络的病害识别技术(Fangetal.,2020; Qianetal.,2020)、高光谱成像技术(杨嘉瑞,2018)也在病害识别、病级判定与病斑分级方面得到应用,但卷积云神经网络识别植物病害前需要大量的样本进行训练,建立模型的过程需要经过多次过滤,训练十分复杂;高光谱成像技术能够根据成像光谱与病斑面积的关系计算出病斑面积,但高光谱成像系统相关仪器较昂贵,不能普及应用。本文提出的在超绿算法分割背景的前提下采用超红算法分割病斑,则没有上述分割算法的缺点,且成本低,使用性较强。
本研究根据薇甘菊锈病的颜色特征,采用ExG算法有效地将背景分割;采用ExR算法准确地将病斑分割,克服ExG算法分割病斑时将病斑误分为背景的缺点。采用ExG+ExR算法计算薇甘菊锈病的相对病斑面积绝对准确率的均值已经超过98%,为后续评价薇甘菊柄锈菌防控薇甘菊的效果提供了科学依据。
由于本文采用的图像样本背景比较简单且光照差异不大,背景分割过程中会发生误分现象。鉴于本文的分割结果,下一步研究可直接采集自然生长状态下的薇甘菊叶片作为样本,通过拍摄不同角度、不同部位的图像进行测试,同时优化背景分割算法与病斑分割,以使整体的分割算法能够适应复杂的图像背景和更加精准的分割病斑。