一种基于模糊C均值聚类的多阈值苹果病害图像分割方法
2019-05-16贾庆节齐国红忽晓伟
贾庆节,齐国红,忽晓伟
(郑州大学西亚斯国际学院,河南新郑451150)
0 引 言
苹果一直是人们广为喜爱的食物之一,全国种植面积达8 000余万亩。随着种植面积的日益扩大,苹果生长过程中发生大规模病害的可能性也在增加,如果不能及时发现病害并进行准确诊断和治疗,可能造成严重的经济损失,这就需要对苹果进行实时监测,以便及时发现病害。计算机图像处理技术以及监控技术的发展,使得苹果病害智能检查和诊断成为可能。研究发现[1-3],作物的病害一般都会在叶片上表现出来,不同的病害种类引起的叶部症状也不同[4]。利用现代图像采集技术和图像处理方法对作物叶片病害进行诊断和识别是目前的一个主流研究方向[5-7]。利用计算机图像处理技术处理病害叶片在节约人工成本的同时,极大地提高了经济效益。
阈值分割算法简单、快速、有效,是图像分割的基本技术之一[8-10],如基于 Otsu的图像分割算法[11]、基于局部熵阈值和 Otsu 的分割算法[12]、基于自适应全局阈值融合的分割方法[13]、基于自适应局部阈值的分割方法[14]、基于遗传算法的最大熵阈值的图像分割方法[15]等。单阈值分割算法将图像分为2类之后,对于这2个类内的目标将不再进行区分,而如果在这2个类内继续使用阈值分割,能够将目标更为精确地分割出来,由此,将单阈值算法推广到多阈值。多阈值分割算法有Otsu多阈值快速分割算法[16]、最大熵多阈值算法[17-18]、基于谱聚类的多阈值图像分割算法[19]等。多阈值分割图像时,计算量大,且有冗余的不需要分割的背景信息,如果能直接在类似目标信息的图像上进行多阈值分割,可以提高运算速度和目标的准确性。经过对比分析,发现文献[20]采用的模糊C均值(Fuzzy C-means,FCM)聚类算法具有较强的适应性,可以对图像进行模糊聚类分割,以减少冗余背景信息,非常适合将其应用于多阈值分割。为此,本文提出一种基于FCM的多阈值图像分割算法,用于对苹果病害叶片的分割。本方法首先将采集到的苹果病害叶部的图像进行中值滤波,去除噪声的同时较好地保持病害部位的边缘;然后,利用FCM对苹果病斑图像进行聚类,再通过病斑部位和正常部位的红色信息所占比例的不同,将病斑图像中非病斑像素滤除,根据聚类和非病斑像素滤除的结果,获得分割阈值;最后,利用多阈值算法分割出苹果病斑图像。
1 算法研究
FCM方法根据图像中的像素与c个聚类中心间的加权相似度测度,对目标函数进行迭代最小化计算,以确定像素点属于某个类别的最佳度[21]。设X={x1,x2,…,xn} 为样本集,n为X元素总数目,c为聚类中心数,聚类就是要将x1,x2,…,xn区分为X中的c个子集,要求性质相近或相同的样本最大程度地聚类在同一子集内。那么关于X的一个模糊C划分是一个c×n矩阵U=[uij](0≤uij≤1) ,uij是样本xj对第i类的隶属度,则该矩阵称为模糊聚类矩阵,该矩阵具有以下性质:
则FCM聚类的目标函数如式(2)所示:
其中:
其中,V是c个聚类中心组成的集合,V=[vi];dij为第j个样本到第i类的距离,用来度量数据点与聚类中心有多么相似;m∈(1,+∞)是加权指数,求出式(2)中目标函数Jm(U,V)的最小值,就是要求的最佳的分类效果。
与其它颜色空间模型相比,RGB彩色模型能够更加准确地表现出病斑部位和正常部位的差异。苹果叶片的病害部位和正常部位的颜色差异较大,正常部位的颜色表现为类似红色,病害部位的颜色表现为类似黄色,RGB颜色空间中这2部分最大的差异就是R分量所占的比例不同,病害部位R分量所占的比例是最大的。利用如下算法将病害部位图像中的正常像素滤除。将此方法可解析为如下公式:
其中,I(x,y) 为苹果叶部图像;Igm(x,y) 为病斑部位图像;I(x,y).R、I(x,y).G和I(x,y).B表示原图I(x,y) 中像素点 (x,y) 处的 RGB 的分量值。
通过公式(6)可以将FCM聚类后的病斑部位中非病斑像素点滤除,此后,根据处理后的图像求得分割阈值,利用多阈值算法完成苹果病斑图像的分割。多阈值算法是在单阈值的基础上发展起来的。多阈值分割算法是先将图像划分为多个区域,分别在各个区域求得最佳阈值。如图1所示,如果只考虑局部区域A-B、或B-C、或C-D等等,可以很好地用Otsu法找到(A,B)或(B,C)之间的分割阈值,即局部最佳分割阈值。找到图1中各个局部的最佳阈值,就可以分割开各个独立的波峰,从而实现图像的多阈值分割。
图1 多峰值图像Fig.1 Multi-peak image
假设图像的直方图分割成m类,各类均分割成Ci0,Ci1,文中利用Otsu法求得局部最佳阈值,分割2组的类间方差最大时,即求得最佳分割阈值。图像中存在m个待分割的类,所有类的类间方差定义为:
其中,为所有类的类间方差;ωi和μi分别是第i类的比例和均值;μr是所有类的总均值;最优阈值 (,…,)=arg max。
2 算法验证
在图像采集过程中,不可避免地会受到噪声的干扰,为了后期的图像分割,就需要对图像进行平滑滤波处理以消除图像的干扰信息,保留并增强有用信息,提高后续图像处理的速度和可靠性。常用的去噪方法有平滑滤波、直方图均衡化、均值滤波和中值滤波法等,由于中值滤波在去除噪声的同时可以很好地保留图像的边缘信息,文中选择中值滤波对苹果病害叶部进行滤波处理。
采用本文算法在Matlab编程环境下对3种苹果病害叶片(斑点落叶病、花叶病和褐斑病)进行分割,如图2(a)~(d)所示。通过图像的直方图得到最佳阈值组,其中本文图像的最佳阈值组分别为(50,190,230)、(50,80,112,230)和(78,202)。 为了验证本文算法的有效性,与多阈值分割出来的病斑图像进行比较,如图2(e)所示。
图2 3种苹果病害叶片病斑图像分割结果比较Fig.2 Comparison of image segmentation results of three apple disease leaf algorithm
多阈值算法根据直方图选取最佳阈值,不考虑非病斑像素的干扰。图2(e)是基于多阈值的3种苹果病斑图像的分割结果,可以看出,分割的病斑图像区域不连续,且由于病斑图像和正常部位的颜色像素相近,叶片正常部位和叶脉部位误作为苹果病斑图像分割出来。而本文算法首先使用FCM进行病斑图像的模糊聚类,然后再进行非病斑图像的像素滤除,最后利用多阈值算法进行病斑图像分割。多阈值算法根据图像的峰值信息得到不同区域的最佳阈值,将其应用于病斑图像分割中,从而得到分割较为完整的病斑图像。如图2(d)所示,本文算法分割出来的苹果病斑轮廓清晰,形状较为完整。为了验证本文算法在分割病斑方面的优越性,将以上3种苹果病斑图像手动分割的结果作为正确的分割来计算分割正确率,采用如下公式计算分割的正确率:
其中,TF(True Foreground)是病斑判别正确的像素点数量;TB(True Background)是病斑被判错的像素点数量。统计文中3种苹果病斑图像的分类正确率见表1。
表1 多阈值算法和本文算法的3种苹果病斑图像的分割正确率Tab.1 Multi-threshold algorithm and segmentation accuracy of three apple lesion images in this paper %
从表1可以看出,分别用多阈值算法和本文算法对文中3种苹果病害图像进行分割,单独使用多阈值算法对文中3种苹果病斑图像分割的分割正确率为88.17%,本文算法分割正确率为94.37%。
结合图2和表1的结果可知,相较于多阈值算法,本文算法表现出更好的分割效果。
3 结束语
为了提高苹果病斑图像分割效果,提出一种基于FCM的多阈值苹果病害图像分割方法。通过对3种苹果病害图像进行中值滤波,以去除图像中噪声的干扰,然后利用FCM实现病斑图像的模糊分割,利用病斑部位和正常部位R值不同,滤除非病斑像素。最后利用多阈值算法将3种病斑图像分割出来,由此完成苹果病斑图像的分割。实验结果表明,与多阈值分割算法相比,本文算法比多阈值算法平均正确率高6%,本文算法能够很好地将苹果病斑图像分割出来。
虽然本文算法能够很好地将苹果病斑图像分割出来,但是对于复杂背景下的苹果病斑图像分割,本文算法仍表现出一定的性能局限,因而亟待未来工作的研究改进及优化。下一步拟对复杂背景下的病斑图像进行分割。