APP下载

基于引力核密度聚类算法的作物病害叶片区域的快速检测

2020-08-28刘哲黄文准王利平

关键词:引力直方图像素

刘哲,黄文准,王利平

基于引力核密度聚类算法的作物病害叶片区域的快速检测

刘哲,黄文准,王利平

(西京学院信息工程学院,陕西 西安 710123)

针对作物病害叶片图像的复杂性和模糊性,提出一种基于引力核密度聚类算法的作物叶片病害区域快速检测方法:首先,在RGB颜色空间提取病害叶片图像的R通道值,根据R值的特征直方图特性,运用多项式拟合特征直方图曲线,根据导数性质确定拟合特征直方图曲线的峰值点和峰值区域,确定病害叶片图像聚类数和初始聚类中心;根据初步确定的病变叶片图像的聚类中心,运用引力核密度聚类算法快速完成对病害叶片病斑的分割。试验结果表明,基于引力核密度聚类算法的平均分割精度达80%以上,平均检测时间为4.912 s,优于已有病害区域分割算法K–means和Meanshift的性能。

引力核密度聚类算法;作物病害叶片;图像分割;颜色空间

在运用机器视觉技术对作物叶片病害症状进行自动检测过程中,对病害叶片图像的分割直接影响特征提取的可靠性和病害识别的准确性。近年来,基于统计模式识别、K均值聚类、模糊C均值聚类、Otsu、EM等算法,提出了许多作物病害叶片图像分割方法[1-4]。ZHANG等[5]提出一种基于混合聚类的植物病害叶片图像分割方法:首先通过超像素聚类将整个彩色叶片图像分成若干个紧凑和近似均匀的超像素,提供有用的聚类线索来指导图像分割,从而加快期望最大化(EM)算法的收敛速度,从每个超像素中快速准确地分割出病变像素点。YUAN等[6]提出了一种复杂背景的作物病害叶片分割方法,利用加权帕尔逊窗口可以得到最佳的分割阈值。ARIVAZHAGAN等[7]提出了一种植物叶片病害自动检测与分类的软件解决方案,该方案使用特定的阈值对绿色像素进行掩蔽和去除,在此基础上计算出纹理统计信息,对图像进行有效的分割。GUI等[8]提出了一种基于复杂背景的彩色大豆叶片图像的病害检测系统,该系统根据K 均值算法,结合经验阈值,利用凸点映射从大豆叶片病害图像中分割出显著区域。TAJANE等[9]提出了利用canny边缘检测算子和直方图分析来识别药用植物叶片病害的内容图像库检索方法。该方法首先平滑图像,以消除噪声并找到图像梯度以突出具有高空间导数的区域,随后根据药用植物叶片的边缘特征进行病害检测。TUCKER等[10]重点研究了燕麦和向日葵叶中的病害分类和检测方法,首先用不同的阈值分割被测病害(枯萎病或锈病)的图像,然后使用聚类方法将随后的像素划分到聚类中,以表示病变区域,根据病害的特点将其分为适当的类别。HARSHADKUMAR等[11]通过收集水稻的叶片,制作了一组白色背景的水稻植株叶片图像,首先利用grabcut分割方法从图像中去除背景,然后使用K均值聚类法提取叶片图像中的病害部分。在应用K均值聚类后,利用阈值技术从病斑部分去除一些不必要的绿色区域,最后在病害部位提取88个特征,建立支持向量机(SVM)模型对病变进行分类。HIARY等[12]提出了一种叶病害图像分割算法,该算法首先识别大多数绿色像素,然后根据Otsu分割方法计算的特定阈值来掩蔽这些像素,最后使用红色、绿色和蓝色的零值以及边界上的像素来掩蔽这些像素,以完全删除受感染的群集。KAUR等[13]提出了一种基于彩色图像K–means聚类算法的葡萄病害叶片图像分割方法。YU等[14]提出了一种用于作物病害叶片分割的分水岭算法。CHAUDHARY等[15]提出了一种利用最大期望(EM)处理技术进行病害斑点分割的算法,并比较了CIELAB、HSI和YCbCr颜色空间在病害斑点检测过程中的效果。MOHAN等[16]、QIN等[17]、HERNADES等[18]、ASRAF等[19]在研究病害叶片分割时,进一步运用支持向量机、邻域嵌入等方法研究病害的识别,准确率都达到80%以上。

上述研究运用于作物叶片病害区域图像的检测算法,主要是图像阈值分割算法和图像聚类算法。由于作物病害的致病病原种类不同,会产生形状、颜色、纹理等差异较大的病斑、孔洞等特异性症状,这时用全局阈值分割算法很难将病斑从叶片中分割出来,需要运用多阈值分割算法才能完成,但多阈值的确定往往需要辅以人工参与,这样就使得算法丧失了普适性和智能化。在用图像聚类算法进行叶片病斑分割时,事先需要人工确定类族的个数,这使得算法的适应性比较差,也容易导致分割错误。为了解决上述问题,笔者提出一种基于引力核密度聚类算法的作物叶片病害区域快速检测方法:首先,在RGB颜色空间提取作物病害叶片图像的R通道值,根据R值的特征直方图特性,运用多项式拟合特征直方图曲线,根据导数性质确定拟合特征直方图曲线的峰值点和峰值区域;接着,根据峰值区域和峰值点确定病变叶片图像聚类数和初始聚类中心;根据初步确定的病害叶片图像的聚类中心,运用引力核密度聚类算法完成对病害叶片病斑的快速分割。仿真试验验证结果表明,分割精度平均达80%以上,平均检测时间为4.912 s,从而实现快速精确地对病害叶片区域进行分割。

1 图像的获取与方法

1.1 作物病害叶片图像的获取

a 小麦病害叶片;b 黄瓜病害叶片;c 玉米病害叶片;d 番茄病害叶片。

1.2 病害叶片图像在RGB颜色空间的特性

图1–a,病害区域呈现白色;图1–b,病害区域呈现黄色;图1–c,病害区域呈现红色;图1–d,病害区域呈现紫褐色。

对病害叶片图像病斑进行分割,在RGB空间,通过对病害叶片的R、G、B 3种颜色分量进行统计分析,发现从正常叶片区域过渡到病害区域,红色分量的变化幅度最大。图2中,a1、b1、c1、d1的R、G、B颜色变化曲线分别对应a、b、c、d中所标记行的像素的R、G、B值,标记部分如图2中a、b、c、d所示的白线。由图2知,所标记的行中既包括正常叶片的像素,也包括病害叶片的像素。由三颜色变化曲线可以看出,红色R在正常叶片区域的值较小,而在病害叶片区域的值突然变大,甚至在三颜色中达到最大,所以从正常叶片区域过渡到病害区域,红色变化幅度最大,而绿色和蓝色的变化比较平缓,这说明正常叶片区域像素的红色与病害叶片区域红色的差异性最大,可以作为病害图像分割的依据。

a 标记的小麦病害图像;b 标记的黄瓜病害图像;c 标记的玉米病害图像;d 标记的番茄病害图像;a1 小麦标记区域三颜色变化曲线;b1 黄瓜标记区域三颜色变化曲线;c1 玉米标记区域三颜色变化曲线;d1 番茄标记区域三颜色变化曲线。

1.3 病害叶片图像在Lab颜色空间的特性

在Lab颜色空间中,L代表亮度,a、b代表色度。图3中a、b、c、d分别是图1中所对应原图的Lab颜色空间的病害叶片图,图像中的白线是经过标记的行;a1、b1、c1、d1是对应原图所标记行像素的L、a、b分量变化曲线。由图3知,所标记的行中既包括正常叶片的像素,也包括病害叶片的像素。从a1、b1、c1、d1所显示的L、a、b三分量变化曲线可以看出,亮度L在正常叶片区域的值较小,而在病害叶片区域的值突然变大,甚至在3个分量中达到最大,所以从正常叶片区域过渡到病害区域,亮度L变化幅度最大,而色度a和色度b变化比较平缓,这说明正常叶片区域像素的亮度L与病害叶片区域亮度L的差异最大,可作为病害叶片图像分割的依据。

a 标记的小麦病害图像;b 标记的黄瓜病害图像;c 标记的玉米病害图像;d 标记的番茄病害图像;a1 小麦标记区域三颜色变化曲线;b1 黄瓜标记区域三颜色变化曲线;c1 玉米标记区域三颜色变化曲线;d1番茄标记区域三颜色变化曲线。

1.4 特征直方图

分析作物病害叶片图像特征,发现病害叶片图像的组成有2种模式:第1种,病害叶片图像由病斑和叶片2个区域构成;第2种,病害叶片图像由病斑、叶片和背景3个区域构成。绝大多数病害叶片在直方图上呈现出双峰或三峰的特征,如图4中a1、b1、c1、d1所示的病害叶片红色通道的直方图,其所对应的病害叶片图如图1中的a、b、c、d所示。红色R直方图的不同峰值区域代表病害叶片图像不同区域,峰值区域的峰值点代表在该区域内出现次数最多的像素点。

图4 病害叶片的特征直方图

在式(3)的基础上,分别对{0,1,2,…, a}求偏导数,并等于0,得到:

将式(4)写成矩阵的形式,得到式(5)。

峰值点的寻找通过对多项式(1)求导,令导数等于0,求导结果如式(6)。

在找到特征直方图拟合曲线的所有峰值点后,通过峰值点对应的颜色值,即找到了病害叶片直方图的所有峰值区域,也就大致找到了病害叶片的不同区域。以该区域的峰值点作为初始的聚类中心,对病害叶片进行聚类分割。至此,根据特征直方图的峰值区域和峰值点,可以初步确定病害叶片的聚类数和聚类中心。

1.5 引力核密度聚类算法

1.5.1像素间的引力计算

式中:为万有引力;和为2个物体的质量;为万有引力常数;为物体间的距离。根据万有引力公式,如果一个物体的质量越大,它对别的物体吸引力越大;彼此间的距离越近,吸引力也越大。宇宙中,如果一个星体的质量很大,许多小行星就会以这个星体为中心,围绕它旋转,形成一个星系。基于此,提出引力核密度聚类算法:聚类中心类似于大星体,按照聚类中心对其他像素引力的大小来判断像素的归类。

对于R取值为(=0,1,…,255)的像素,其个数为n,则该像素点的质量为mm=,=0,1,…,255。

为了计算方便,取=1。

1.5.2引力核密度聚类算法

2) 计算每个像素点s到不同I(=1,2,…,)的引力sp;

3) 按照引力sp的大小将像素点s划分到相应的聚类,即选取对像素点引力最大的聚类中心,将像素点划分到该类;

4) 对划分后的聚类,用该类的质心作为新的聚类中心,更新原来的聚类中心;

5) 转到2)反复迭代,直到聚类中心不再发生变化;

6) 算法停止。

2 试验验证

2.1 分割效果

与传统的K–means聚类算法和Meanshift聚类算法相比,引力核密度聚类算法具有一定的自适应性,能够自动选取聚类数目和初始聚类中心,这样就大大加快了算法的收敛速度。

将引力核密度聚类算法、K–means聚类算法和Meanshift聚类算法对病害叶片的病斑分割效果进行对比,结果如图5所示。由图5可以看出,由于引力核密度聚类算法不仅考虑了像素间的颜色信息、空间信息,而且还考虑了像素的数量信息(密度),所以抗噪声性能较好,区域定位效果较好,分割精度较高,能较好地将病斑区域完整分割出来,错分和漏分的情况较少。K–means算法只是单纯考虑像素间颜色的相似性,其颜色相似性通过欧氏距离来计算,而没有考虑像素间的空间关系,所以抗噪性能弱,分割精度较差,容易出现错分的现象,尤其是在聚类数和聚类中心选择不当时,会导致分类错误。K–means算法在分类中容易将非病区域错分成病害区域,分割精度高,但分割区域的边缘会存在很多“毛刺”。Meanshift算法的分类效果完全取决于带宽的选择,如果带宽选择过大,容易出现过分割,带宽选择过小,则容易出现欠分割。

a1、a2、a3分别是引力核密度聚类算法、K–means算法、Meanshift算法的分割结果;b1、b2、b3分别引力核密度聚类算法、K–means算法、Meanshift算法的分割结果;c1、c2、c3分别引力核密度聚类算法、K–means算法、Meanshift算法的分割结果;d1、d2、d3分别引力核密度聚类算法、K–means算法、Meanshift算法的分割结果。

2.2 算法性能

为了对引力核密度聚类算法进行定量分析,选取200张作物病害叶片图像进行综合分析比较。仿真平台为Window 8.1 操作系统, CPU 为2.8 GHZ, 内存16 G, 编程环境MATLABR2017a。从执行时间、迭代次数、分割精度3个性能,对引力核密度聚类、K–means算法和Mean shift算法进行综合定量分析,其比较结果如表1所示。其中,分割精度是指算法分割的病斑区域面积与人工标记病斑区域面积的比值。

表1 算法性能对比

3 结论

为了快速精确地提取出作物病害叶片的病斑图像,提出了一种基于引力核密度聚类算法的作物叶片病害区域快速检测方法。克服了传统K–means聚类算法和Meanshift聚类算法的缺点,能够自动确定聚类中心、聚类数,综合考虑了像素间的颜色信息、空间信息、密度信息,能够自动、快速、准确地完成病害叶片的分割,而且能够得到较高的分割精度。今后将重点研究通过不同颜色空间的信息融合,提出更加有效的病害叶片图像分割算法,为作物病害图像识别提供良好的技术支撑。

[1] REVATHY R,CHENNAKESAVAN S A.Threshold based approach for disease spot detection on plant leaf[J].Trans Eng Sci,2015,3(5):72–75.

[2] LI G L,ZHANG H C.Segmentation of color images of grape disease using K_means clustering algorithm[J].Trans CSAE,2012,26(2):32–37.

[3] BANDI S R,AVAR D,CHINNASAMY A.Performance evaluation of various statistical classifiers in detecting the diseased citrus leaf[J].Int J Eng Sci Technol,2013,5(2):298–307.

[4] Al-TARAWNEH M S.An empirical investigation of olive leaf spot disease using auto-cropping segmentation and fuzzy c-means classification[J].World Appl Sci J,2013,23(9):1207–1211.

[5] ZHANG S W,YOU Z H,WU X W.Plant disease leaf image segmentation based on superpixel clustering and EM algorithm[J].Neural Comput & Applic,2019,31:1225–1232.

[6] YUAN Y,LI M,LIANG Q,et al.Segmentation method for crop disease leaf images with complex background[J]. Trans CSAE,2011,27(2):208–212.

[7] ARIVA,ZHAGAN S,NEWLINn SHEBIAH R,et al. Detection of unhealthy region of plant leaves and classification of plant leaf diseases using texture features[J].Agric Eng Int,2013,15(1):211–217.

[8] GUI J S,HAO L,ZHANG Q,et al.A new method for soybean leaf disease detection based on modified salient regions[J].Int J Multimed Ubiquitous Eng,2015,10(6):45–52.

[9] TAJANE V,JANWE N J.Medicinal plants disease identification using canny edge detection algorithm histogram analysis and CBIR[J].Int J Adv Res Comput Sci Soft Eng,2014,4(6):530–536.

[10] TUCKER C C,CHAKRAK RABORY S.Quantitative assessment of lesion characteristics and disease severity using digital image processing[J].J Phytopathol,2015,145(7):273–278.

[11] HARSHAD KUMAR B.PRAJAPATI.Detection and classification of rice plant diseases[J]. Intelligent Decision Technologies,2017,11(4):357–373.

[12] AL-HIARY H,BANI-AHMAD S,REYALAT M,et al. Fast and accurate detection and classification of plant diseases[J].Int J Comput Appl,2011,17(1):31–38.

[13] KAUR R,KANG S S.An enhancement in classifier support vector machine to improve plant disease detection[C]//IEEE 3rd International Conference on Innovation and Technology in Education (MITE),2015:135–140.

[14] YUGANG R,JIAN Z,MIAO L,et al.Segmentation method for crop disease leaf images based on watershed algorithm[J].J Comput Appl,2012,32(3):752–755.

[15] CHAUDHARY P,CHAUDHARY A K,CHEERAN A N,et al.Color transform based approach for disease spot detection on plant leaf[J].Int J Comput Sci Telecommun,2012,3(6):65–70.

[16] MOHAN K J,BALASUBRAMANIANM,PALANIVEL S. Detection and recognition of diseases from Paddy Plant leaf images[J].Int J Comput Appl,2016,141(12):34–41.

[17] QIN F,LIU D,SUN B,et al.Identification of alfalfa leaf diseases using image recognition technology[J].PLoS ONE,2016,11:e0168274.

[18] HERNANDES D L, RAMOS QUINTANA F, GUERRERO JUK J.Integrating soms and a bayesian classifier for segmenting diseased plants in uncontrolled environments[J].Sci World J,2017,214–219.

[19] ASRAF H M,NOORITAWATI M T,RIZAM M S.A comparative study in kernel-based support vector machine of oil palm leafs nutrient disease[J].Procedia Engineering,2012,41(2):1353–1359.

Rapid detection of diseased leaf area based on gravity kernel density clustering algorithm

LIU Zhe, HUANG Wenzhun, WANG Liping

(Department of Electronic and Information Engineering, Xijing University, Xi’an, Shaanxi 710123, China)

In view of the complexity and fuzziness of the diseased leaf image, a fast detection method of diseased area of plant leaf based on gravitational kernel density clustering algorithm is proposed. Firstly, the R-channel value of the diseased leaf image is extracted in RGB color space. According to the characteristic histogram characteristics of the diseased leaf R value, the characteristic histogram curve is fitted by polynomial. The peak point and the peak area of the fitting characteristic histogram curve are determined according to the derivative property. Then, the clustering number and the initial clustering center of diseased leaf images are determined according to the peak area and the peak point. Secondly, according to the preliminarily determined clustering center of the diseased leaves’ image, the gravitational kernel density clustering algorithm proposed in this paper is used to quickly segment diseased leaves. The experimental results show that the average segmentation precision based on gravity kernel density clustering algorithm is more than 80%, and the average detection time is 4.912 s, which is better than the performance of existing disease region segmentation algorithm K-means and Meanshift.

gravitational kernel density clustering algorithms; crop leaf; image segmentation; color space

TN911.73

A

1007-1032(2020)04-0488-07

10.13331/j.cnki.jhau.2020.04.017

刘哲,黄文准,王利平.基于引力核密度聚类算法的作物病害叶片区域的快速检测[J].湖南农业大学学报(自然科学版),2020,46(4):488–494.

LIU Z, HUANG W Z, WANG L P. Rapid detection of diseased leaf area based on gravity kernel density clustering algorithm[J]. Journal of Hunan Agricultural University(Natural Sciences), 2020, 46(4): 488–494.

http://xb.hunau.edu.cn

2019–11–12

2020–05–15

国家自然科学基金项目(61473237);陕西省科学技术厅重点研发项目(2017ZDXM–NY–088)

刘哲(1972—),男,陕西西安人,博士,教授,主要从事人工智能和智慧农业研究,75741733@qq.com

责任编辑:罗慧敏

英文编辑:吴志立

猜你喜欢

引力直方图像素
统计频率分布直方图的备考全攻略
赵运哲作品
符合差分隐私的流数据统计直方图发布
像素前线之“幻影”2000
“像素”仙人掌
用直方图控制画面影调
引力
感受引力
高像素不是全部
A dew drop