基于自适应模糊阈值的茶炭疽病斑面积计算
2019-04-06陈冬梅范姗慧周贤锋张竞成吴开华
陈冬梅,袁 琳,颜 鹏,范姗慧,周贤锋,张竞成,吴开华
(1. 杭州电子科技大学 生命信息与仪器工程学院,浙江 杭州310018;2. 浙江水利水电学院 信息工程与艺术设计学院,浙江 杭州310018;3. 中国农业科学院 茶叶研究所,农业部茶叶质量安全控制重点实验室,浙江 杭州310008)
茶树为多年生木本植物,其叶片含有多种对人体有益的功能成分,如多酚类、茶多糖、茶氨酸,使得茶叶兼具美味和保健的特点[1]。随着茶叶需求量增加,部分茶区茶品种单一,管理粗放,使茶树病害日益严重。其中,茶炭疽病是发病比较普遍的病害之一,在我国各个茶区都有分布,一般南方比北方茶区严重,湿度大、海拔高、云雾多的茶区发生严重[2]。茶炭疽病主要为害当年生成叶,茶炭疽病严重时可导致大量落叶,影响茶树的光合作用,影响茶树的生理代谢,造成茶叶减产和品质下降[3],经济效益损失严重。茶炭疽病是由茶叶炭疽菌属真菌感染引起,变异快,种类多,地理分布和寄主范围又十分广泛。如不能正确判断茶炭疽病病害严重程度,过量、盲目地使用农药,就难以保证作物的无公害、绿色化生产,对出口贸易也造成一定障碍。难以保证既可以有效的施用农药消灭植物病害,提高作物产量,同时又能合理地使用农药,有效减少农药对环境的污染,快速、准确地判断作物受害程度是关键,才能为农业生产者采取有针对性的防治方法,科学系统地治理病害提供技术支撑
测量植物叶片病斑面积的方法有网格法、传统法和软件法等。网格法指用已知每格面积的纱网或标准尺测量病斑面积[4-7],这种方法比较准确,但是不便于大批量操作。传统法是测量出病斑最大长度和最大宽度(两者呈直角),然后用公式计算出相对病斑面积(RLA)[8]。软件法指用Photoshop等软件将病斑部分显示出来,并计算病斑部分的像素数[9]。这种方法虽然精确,但是不具备实时性,且在操作人员的视觉疲劳后病斑测量结果会出现较大差异。在实际生产过程中,对于茶炭疽病的病害严重程度的判断,主要以农业生产者个人经验进行分析和判断,造成病害程度标准含糊不清,严重影响病害判断准确性。近年来,随着信息技术的发展,数码照相机、智能手机、家用计算机等获取图片的设备得到普及,农业工作者很容易得到茶叶的彩色数字图像。利用计算机图像处理技术对茶炭疽病图像进行处理,能够克服人工处理带来的主观性、经验性和效率低等问题,帮助茶树栽培管理的智能化发展。
目前已有一些国内外学者利用计算机图像处理技术对植物病害展开研究。虞佳佳以番茄灰霉病的高光谱图像为研究对象,选择拉普拉斯锐化结合Sobel算子的边缘提取的方法提取目标区域,并且选择高频强调滤波锐化方式在特征融合图像中计算病斑面积[10]。黄帅提出一种基于Markov随机场和K均值聚类的复杂背景下叶部病害图像分割方法,实现复杂背景下的病斑提取,并计算叶片病斑面积[11]。毛罕平等提出了一种自适应分割方法,这种方法基于模糊C均值聚类算法(FCM),并通过有效性验证确定了FCM中的最优聚类数和模糊加权指数,将病斑和非病斑区分割开来[12]。刘小川等在研究植物黑腐病的分割算法中,针对图像模糊阈值分割法存在的窗口宽度自动选取困难的问题,提出了一种直方图变换方法,根据变换后的直方图,再利用自适应模糊阈值分割法对植物黑腐病病斑图像进行分割[13]。张健钦等获得CCD彩色图像,通过灰度变换和阈值分割获得二值图像,用中值滤波去除离散噪声,利用Kirsch边缘算子得到的轮廓,最后借助参考物算法计算出叶片的面积[14]。Barbedo提出一种利用彩色数组图像量化病害的方法,该法对各种场景下的检测结果都提供了准确的估计[15]。Cui D提出一种基于色彩模型的图像处理方法,定义病变指数(LI)为病斑面积与健康叶面积的比值来评估叶片受损程度[16]。然而这些研究内容在茶炭疽病病斑的自动识别与计算的应用还十分有限。
利用计算机图像处理技术处理茶炭疽病病斑图像的核心在于图像分割,只有准确提取目标叶片和病斑面积,计算出的病斑面积才会准确。本文以茶炭疽病病斑叶片彩色数字图像作为研究对象,采用自适应模糊阈值分割和基于颜色通道差值分割两种分割方法对不同病斑级别的图像进行分割,根据像素转换的茶叶病斑区域与目标叶片面积计算相对病斑面积(RLA),并与手动分割的结果进行比较,评价算法的准确性和实用性。
1 材料与方法
1.1 数据采集和预处理
本研究中所使用的茶树炭疽病叶片样本于2017年9月10日取自浙江省金华市武义县中国茶叶研究所实验茶园,茶炭疽病为自然发病。拍摄叶片彩色图像时,相机垂直于病害叶片,叶片尽量紧贴背光板(减少叶片边缘翘起产生的阴影),图像须包含完整的叶片区域,保证光照充足,避免光照不足使叶片区域颜色偏黑,丢失彩色信息。相机设置为手动调节焦距和光圈,自动白平衡,关闭闪光灯以避免出现亮斑。
用数码相机拍摄的茶叶叶片病斑图像因受拍摄环境影响会产生噪声、斑点等不利于图像处理的干扰因素。所以,前期往往需要对图像进行预处理,消除不利干扰,简化数据,恢复图像质量,提高图像分割的速度和准确性,为后期的图像分割和面积计算做好准备。同时,图像的白色背景也不利于后续图像的运算和颜色特征的提取,进行图像分割之前也需要提取叶片区域,去除背景。叶部病害按侵蚀叶面积大小可分为5级,0级(无感染),1级(1%~25%叶感染面积),2级(26%~50%叶感染面积),3级(51%~75%叶感染面积)和4级(76%~100%叶感染面积)。为验证本方法效果,将在 Windows 10、MATLAB 2014b环境下对不同等级的54幅茶炭疽病病斑图像进行验证,其中1级13幅、2级19幅、3级14幅、4级8幅,所选图像均有病斑的图像。以Photoshop手动分割结果作为对照标准。
1.2 图像处理方法
茶叶病斑面积计算关键在于如何准确合理的提取叶片与病斑部分,并依据两者像素计算相对面积。在进行计算时,首先进行颜色空间转换,然后使用自适应模糊阈值方法进行图像分割,并利用中值滤波和最大连通域技术消除部分边缘噪声。为了比较评估结果,对比方法采用传统的颜色通道差值分割。
1.2.1 基于颜色通道差值的分割
颜色通道差值分割方法是按照彩色图像的色彩规则和基本图像运算将叶片病斑区域从叶片图像中间分割出来的算法。该分割算法利用两幅图像像素的不同,将两幅图像直接相减,将相减结果经过处理后二值化,直接作为分割结果输出,最终实现对图像的分割。本文中将图像由RGB色彩空间转换到L* a* b色彩空间。L* a* b色彩空间是一种基于生理特征的颜色系统,是用数字化的方法来描述人的视觉感应。因为明度是单独保存在L通道中的,所以可以在不改变明度的前提下调整色彩。取a、b通道,对两个通道分别进行全局阈值分割,将b通道阈值分割后的图像与a通道阈值分割后的图像做代数运算,得到结果如图1所示。比较原始图像和提取出的病斑图像,可见基于颜色通道差值方法能将病斑从叶片中提取出来,但病斑边缘不清晰。同时,基于颜色通道差值方法还将部分叶片边缘线误分割为病斑。
图 1 基于颜色通道差值方法分割结果Fig. 1 Segmentation results based on the color channel difference method
1.2.2 自适应模糊阈值分割
模糊集合理论由美国加州大学伯克利分校电气工程系的L.A.zadeh教授于1965年创立[17]。在模糊集合概念中,一个元素总是一定程度上属于某一个集合,也可以同时以不同的程度属于不同的集合,这样的集合叫做模糊集。对于人的视觉感知来说,由黑到白的变化是模糊的,这种模糊性也体现在图像中。图像的边缘、区域等也存在着一定的模糊性。叶片的正常区域和病斑区域存在着一个像素过渡带,此过渡带中的像素一定程度上属于正常区域也一定程度上属于病斑区域。选定合适的阈值是阈值分割的关键,模糊阈值法由Pal等于1983年提出[18],通过计算图像的模糊率或模糊熵来选取图像分割的阈值。模糊理论应用于图像分割更加符合图像的特点和人的视觉特性,更加符合事物本身特点。
其中,隶属度函数是模糊理论中最重要的概念,处理模糊问题的首要任务就是确定隶属度函数。隶属度函数是描述一个对象x隶属于集合A的程度的函数,用μA(x)表示,0≤μA(x)≤ 1。
隶属度函数可表示为标准的S型函数,如图2所示。S型函数是一种从0到1的单调递增函数,可由q和∆q两个参数确定。Zadeh定义的标准S型隶属度函数:
其中,q=2∆q,在x=2∆q处,隶属度函数等于0.5。用L(0-255)表示灰度级,令w=2∆q表示隶属函数的窗口宽度,它是隶属函数的模糊区域,q称为拐点或窗口中心。
图2 隶属度函数Fig. 2 subordinating degree function
为了定量分析集合的模糊度,引入模糊率,用γ(x)表示。设图像的X的大小为M×N,有L级灰度{0,1,2,……,L-1}。μ(x)为定义在L上的隶属度函数,图像中灰度为k(k∈[0,L-1])的像素数是h(k),γ(x)的表达式如下:
其中,0<x<L。可见,模糊率γ(x)由图像像素的灰度值和隶属度函数μ(x)决定。
取隶属度函数为S型函数时,隶属度函数的窗宽为w=2∆q,式(4)取最小值时对应的图像灰度值即为分割图像的模糊阈值。求解过程是预先设定窗宽w,通过改变q使得隶属度函数μ(x)在灰度级上滑动,再计算模糊率γ(x),以获得模糊率曲线。该曲线的谷点,即是γ(x)取得最小值时,对应的参数q,就是待分割图像的阈值。由于q在灰度级上是遍历的,可见w决定着分割结果的好坏。w取值越小,μ(x)曲线越陡峭,得到的谷点可能出现振荡,产生假阈值;w取值越大,μ(x)曲线越平坦,可能会平滑掉谷点,造成阈值丢失。根据经验,推荐窗宽为灰度图像双峰间距的0.3~0.5倍。
选定隶属度函数后,阈值完全由给定的窗宽决定,窗宽是通过观察灰度直方图的峰值人为给定的。对已知直方图分布的图像,这种方法总能找到合适的窗宽,但当图像改变时(如图像的目标大小在较宽的范围变化),直方图也随之变化,预选的窗宽可能失效,造成误分割。根据本课题的叶片病斑情况,需要根据待分割的图像自动选取窗宽,因此选择自适应模糊理论来确定阈值,即找到模糊率曲线的谷底,谷底对应的灰度值就是模糊阈值。
自适应模糊阈值选取的原理如下:提前获知图像的像素类别数,设为α,那么图像对应的直方图就有α个峰,α-1个谷点。通过判断模糊率曲线的谷点数量是否等于α-1个,实现模糊阈值分割的窗宽自动选取。具体方法为:(1)设窗宽w的最小值为2;(2)按照设定的窗宽计算模糊率γ(x),获得模糊率曲线;(3)根据模糊率曲线判断谷点数n。如果 n=α-1,则停止,此时对应的窗宽w就是最小窗宽;如果n≠α-1,则w=w+2,返回(2)继续计算。
本文中将图像由RGB色彩空间转换到HSI色彩空间,这是利用HSI色彩空间的两个优点:其一,I分量与图像色彩无关,对彩色图像处理时不需要考虑I分量,只需处理H和S分量;其二,HSI模型完全反映了人感知颜色的基本属性,与人感知颜色的结果一一对应,使用HSI色彩空间能使分割结果更符合人眼对色彩的感知。取H通道,统计H通道直方图,设窗宽w最小值为2,按照上述自适应模糊阈值分割的步骤,计算模糊率,获得模糊率曲线,找到谷点对应的灰度值即为对应的分割阈值。效果如图3所示:比较原始图像和分割后的图像,可见目标病斑区域边界保持良好,边缘清晰,整个目标病斑区域被完整提取出来。
图 3 自适应模糊阈值方法分割结果Fig. 3 The results of the adaptive fuzzy threshold method segmentation
1.3 病斑面积评价指数
相对病斑面积(Relative Lesion Area, RLA)反应了病害侵染植物叶片的程度,是定量评估植物病害程度的指标[19]。通过本课题的图像分割算法可实现RLA的无损测量。本文采用准确率和绝对误差这两个指标反映病斑面积的准确性。采用相对准确率(MA)衡量分割精度[4],相对准确率的计算公式为:
其中La是用Photoshop手动分割出来的目标病斑区域像素数,Li是用算法分割出来的目标病斑区域像素数。MA越小,表明精度越大,方法性能越好。用绝对准确率(AA)检验RLA的准确性,绝对准确率定义为:
其中,Ra是Photoshop手动分割计算出来的RLA,Ri是用算法分割计算出来的RLA,S是整个叶片区域像素数。
2 结果与分析
不同的分割方法具有不同的适用场景,不存在一个分割方法对所有问题通用。本研究需要分割的叶片图像有四个等级(不考虑完全没有被茶炭疽病感染的情况),染病的程度不同造成病斑的大小面积分布均不相同,用到的两种方法在不同等级的叶片上效果不同。因此将采集到的图像在MATLAB下进行分析处理,首先比较了两种方法在不同发病等级的叶片的分割效果,然后分别统计了各个等级叶片的病斑面积计算结果。
2.1 方法对比分析
以下对不同等级叶片两种方法的分割效果作对比分析。各级别图像分割结果如图4所示。比较传统的颜色通道差值方法,可以看出两种方法均可以分割出病斑区域,但是颜色差值方法不能够完整分割出病斑区域,结果中存在不连续的空洞。自适应模糊阈值方法能够得到完整的病斑区域,有效的分离出叶片中的病斑和健康区域,因此该方法能够有效的进行病斑区域的识别与计算。
2.2 病斑计算结果
将两种方法用于计算所有叶片的病斑面积结果在表1中比较。可见两种方法对不同等级的病斑图像效果不同:对于1级病害图像,基于颜色通道方法的分割效果要明显优于自适应模糊阈值分割方法。对于2级病斑图像,因为病斑更明晰,面积增大,颜色也变深,图像自适应模糊阈值方法的准确性增加,颜色通道差值方法与自适应模糊阈值方法效果相当。对于3级病斑图像,病斑颜色由棕变黑,面积变大,与正常绿色叶片部分区别明显,灰度直方图双峰明显,谷底平坦,自适应模糊阈值方法的准确率继续增加。4级病斑图像中,病斑颜色已经非常深,颜色通道差值方法误分割情况增加明显。而且叶片的生理状态比较差,叶片出现卷曲、部分缺失、折叠的情况很多,导致图像中叶片的阴影部分比较大,颜色也比较深,使得图像预处理时已经不能很好地提取目标叶片,导致绝对误差变大。在这一阶段,自适应模糊阈值方法表现比颜色通道差值方法稳定,颜色通道差值方法会出现误分割,部分图像不能提取完整的病斑区域。基于上述实验结果,针对茶炭疽病病斑面积的计算来说,自适应模糊阈值方法能够有效的计算病斑面积。尽管对1级病斑图像的分割效果与颜色通道差值方法相差不大,但是在处理2、3、4级病斑图像时,效果稳定,具有较高的准确度和鲁棒性。
图 4 各级茶炭疽病病斑图像分割结果Fig.4 Image segmentation results of tea anthracnose lesions at various levels
表1 茶炭疽病病斑图像分割准确率Table 1 Image segmentation accuracy of tea anthracnose lesions
3 结论与讨论
本文以茶炭疽病病斑叶片彩色数字图像作为研究对象,采用自适应模糊阈值分割和基于颜色通道差值分割两种分割方法对不同病斑级别的图像进行分割,根据像素转换的茶叶病斑区域与目标叶片的计算相对病斑面积,并与Photoshop手动分割计算的结果进行比较,分析算法的准确性和实用性。根据分析可知,自适应模糊阈值方法在处理图像时效果稳定,具有较高的准确度和鲁棒性。
本文通过研究和实验,较准确地计算了茶炭疽病病斑面积,但仍存在一些问题有待改进。由于自适应模糊阈值方法适用于双峰明显、谷底平坦的图像,对于某些茶炭疽病病斑图像病斑部分较小,双峰不明显,甚至在直方图上呈现单峰,不能准确将病斑从叶片中分割,如何更加准确的选择隶属度函数从而使结果鲁棒性提高还有待研究。同时由于某些图像的病斑部分颜色较深,且有些区域可能有灰尘,呈现黑色或灰色,或因叶片本身状况不佳,出现卷曲、折叠情况,使图像中有大面积阴影或阴影颜色较深,这些情况都使得后期分割效果不佳,需要在前期图像预处理时考虑如何提高图像质量,从而提高本文方法的适用性。近年来,随着人工智能和深度学习的发展,有文章也使用了基于卷积神经网路的方法利用病斑成像来进行病情种类的调查[20],对于不同种类的茶叶病害识别准确率达到了90%。相比于这类机器学习方法,本文的方法不依赖于大量的样品处理和模型训练,其复杂性和成本较低。在后续研究中,我们会考虑如何将传统的图像识别方法和深度学习框架融合,兼顾其成本和准确性,吸收二者的优势,实现叶片病斑的类别和等级检测。