APP下载

基于图像处理的植物叶片病害识别研究

2022-01-26张铄谢裕睿董建娥

现代计算机 2021年34期
关键词:灰度纹理病害

张铄,谢裕睿,董建娥

(西南林业大学大数据与智能工程学院,昆明 650224)

0 引言

在实际生活中,通常植物病害初期的外观人们无法用准确的用数值进行描述,所以分析植物病害时凭借以往经验和知识时常产生偏差。因有多种不同种类的植物病害致病病原物,所以会出现各不相同的病斑纹理,故根据不同病害显示的不同纹理特征,利用计算机图像处理和机器学习识别技术对上述特征进行识别,此类技术是对植物病害进行自动检测和远程诊断的重要手段[1]。

为了准确且快速地识别出植物叶片病害,同时兼顾叶片因素及不同算法的运算时间、识别准确率,本文分别在图像的HSI和Lab颜色空间采用K-means分割算法进行切割,提取出病害图像中共13维的纹理特征作为分类依据,分类器选用SVM将所提取的图像纹理特征数据进行识别。

1 病害图像预处理

1.1 增强对比度

为了突出病害叶片和正常叶片的对比效果,首先需增强原始图像的对比度。按照一定要求,突出某些需要检测的特征同时若原图像不清晰则使图像变清晰,令图像质量提升、充足信息量,改良预读和识别的图像效果[2]。通过增强对比度,病害区域和正常区域可以很容易被区分,对比效果如图1所示。

图1 增强对比度效果

1.2 图像二值化

图像二值化处理的主要目的是将图像中各点的灰度值设为0或255,即令图像整体明显的转化除黑白效果。而特定物体是指全部灰度大于或等于阈值的像素,其灰度值通常被设为255,否则将这些像素点表示灰度值为0的背景或例外的物体区域,排除在物体区域之外[3]。

本文中获得最优阈值的方法为最大类间差分法,最大类间差分法(Otsu)也被称为大津法,其基本概念是选取可把图像分割成两组的最大的某一灰度值处的类间方差,具有很强的自适应性[4]。若将图像的大小设为m×n,最大类间差分法具体算法如下,公式的参数意义如表1所示。

表1 最大类间差分法公式参数的含义

将式(5)代入式(6),得到等价公式:

使用遍历的方式可得的阈值T,即为令类间方差最大的阈值,将图像进行二值化后,病害与正常叶片的颜色不同被区分开来,结果如图2所示。

图2 图像二值化效果

2 病害图像分割

2.1 RGB模式转Lab颜色空间

Lab颜色空间是CIE(国际照明委员会)制定的一种由三个通道组成的色彩模式,其中一个通道是明度(即亮度),记为L,另外两个是色彩通道,用a和b来表示[5]。图3展示某个植物病害叶片于Lab色彩空间中的三个通道处理结果。

图3 植物病害叶片在Lab颜色空间中的处理结果

2.2 K-means算法

K-means是一种基于距离的经典非层次聚类算法,在对误差函数最小化的同时按照预计类数K划分数据,将间距作为对其相似性进行评价的指标,可认为对象之间间距越近,两者之间相似度就越高。通常将特征空间划分K个聚类的方法是K均值法,令x=(x1,x2,…,xn)为n维特征空间中一点,g(x)为x处特征值,则K-means算法的主要步骤有以下4步[6]:

(1)选取数据中K个对象作为初始聚类中心:μ1(1),μ2(1),…,μx。

(2)计算各聚类对象到聚类中心的距离,进行第i次迭代计算时,将每一个特征点归于K类中的某一类,既:x∈Ql(i)。如果:

Ql(i)代表第i次迭代后属于第l类的特征点集合。式(8)的意义即每个特征点均值最靠近它的类。

(3)再次计算每个聚类中心,第i次迭代以后,更新每一个类的均值μl(i+1):

式中,N l是Ql(i)中的特征点个数。

(4)计算标准测度函数,如果达到迭代次数的最大值,立刻停止;否则,继续操作,如果对所有的j=1,2,…,K,有μ1(i+1)=μ1(i),则算法结束;否则,将式(9)进行迭代。

2.3 基于Lab颜色空间的K-means分割

Lab对颜色定位精确、均匀,较RGB等颜色模式更符合于人眼对自然界颜色的感知。利用K-means算法将图像初步分割,单是依据图像的颜色信息,将颜色相近的像素点归为同一簇,无需对图像进行精确地分割[7]。

图4 Lab彩色图分割结果

基于Lab对图像的分割,病斑在图像中被较好地分割出来,为之后提取病斑的特征做好了铺垫。

3 特征提取

本文主要提取分割出的病斑方面的13维特征:对比度、相关性、同质性、平均值、标准差、近似熵、方差、逆差距、偏斜、峰值、平均值、平滑度、能量。

3.1 灰度共生矩阵特征提取

灰度共生矩阵(grey-level co-occurrence ma⁃trix,GLCM)以统计形式表现影像中的局部或整个区域一定间距内两象元或相邻象元呈现某种关系的矩阵,亦可为特定间距内两象元灰度的关系矩阵[8]。该矩阵中的元素值代表灰度级之间联合条件概率密度,即在给定空间距离d和方向时,把i作为灰度始点,灰度级呈现j的概率。

假定有一副图像,大小为m×n,若该图像灰度级为N,那么灰度共生矩阵应具备如下条件:

其中S是图像具有特定位置关系的像素对的集合,Cout表示满足此位置条件,两点的灰度值分别为i、j点的数量。

(1)Correlation(相关性)。

自相关反应了图像纹理的一致性,取值范围应在[-1,1]。灰度一致的图像,相关性为NaN。

(2)Homogeneity(同质性)。

同质性是局部灰度均匀性的一种衡量标准,当其取值较大时,表明图像局部的灰度均匀。

(3)Energy(能量)。

能量表示图像灰度分布是否均匀、纹理粗还是细,取值范围为[0,1],若图像灰度一致,能量为1。

(4)Entropy(近似熵)。

近似熵体现图像纹理的复杂度。

(5)Contrast(对比度)。

对比度反映图像中局部灰度变化总量,值域为[0,(GLC M行数-1)2]。灰度一致的图像,对比度为0。

(6)IDM(逆差距)。

图像纹理同质性由逆差矩体现,即度量图像纹理的局部变化量。

3.2 灰度直方图特征提取

灰度直方图作为图像的重要特征之一,是一种统计特征,表现图像关于灰度级分布的函数[9]。

(1)Mean(平均值)。

纹理的规则度用均值反映,纹理若混乱无序、不便描述,则值较小,反之值较大。

1)Standard-Deviation(标准差)

2)Variance(方差)

如样本值与均值偏差的数值,均可用方差、标准差反映。

3.3 其它特征提取

(1)Smoothness(平滑度)。

其中sum表示图象矩阵的和,平滑度反应一幅图像灰度的均匀性,取值范围为[0,1],代表平滑程度。

(2)RMS(均方根)。

均方根体现已知图像与退化图像二者误差大小。

(3)Skewness(偏斜)。

偏斜反映对图像构成的分布的对称性状况。

(4)Kurtosis(峰值)。

体现图像构成的突兀或平坦分布称为峰值。

4 病害识别

4.1 SVM分类器

对SVM算法常见的解释是寻找一条位于二维空间中可以分开两类的分割线,如图5所示,四条不同颜色的分割线都可以把一类和二类划开,可见有许多函数可以达到分类的要求,必须使用“分类间隔”指标来量化分类效果。

图5 SVM分类原理

由于在现实生活中存在的大多问题都为非线性,若存在一个向量其维数无限增加时就可以将其表示为一个实函数。假设有一样本空间X,此时引入一非线性映射N,把X通过N映射到新的特征空间形成N(x),将可积分函数N(x)乘上一个新的二元函数K(x,y),再作积分形成一个新的函数实现输出,这个变换过程中的二元函数K(x,y)被称为积分变换的核函数[10]。K(x,y)函数是对称连续函数,根据Mercer定理,K(x,y)为Mercer核函数,可将其展开成一致收敛的函数项级数:

上式中λi,φi(x)分别对应核K(x,y)的特征值和特征函数,而λi,φi(x)的数量可以取有限多个或是无限多个。对特征空间做非线性升维映射构造,最终可得到一个关于最优超平面决策函数:

上式中a*i和b*作为两个因子来决定最优划分超平面,所谓支持向量即为最优划分超平面的样本点。从上述式中不难发现当支持向量X i;与其支持的强度a*i和阈值b*全部被确定时,使用核函数进行运算,便能获得原样本空间关于非线性划分的输出,由此可见,在实际计算中使用此种方式时显式表达式并不需完全求出,从而避免了因升维而导致的复杂计算[11]。

4.2 病害识别实验结果

本文对灰疽病、褐斑病、细菌性疫病及链格孢链菌四种植物病害进行识别,采用共437幅健康或病害图片的13维特征作为精确性数据,将提取得到的13维特征作为测试集,放入SVM分类器中开始分类,分类的结果以标签形式显示,再根据标签显示不同疾病,完成对植物叶片病害的识别,平均识别率可达90.67%,测试效果如表2。

表2 植物病害识别测试结果统计

5 结语

有别于传统的病害分析和诊断方法,本文采用图像处理方式和机器学习方法改进对植物病害加以鉴别,实验表明本文方法能够有效判断灰疽病、褐斑病、细菌性疫病及链格孢链菌四种病害,识别结果可为大众提供判断病害的参考。下一步工作是增加可识别病害种类,提高分割与识别的准确度,达到实用需求。

猜你喜欢

灰度纹理病害
基于改进DenseNet的茶叶病害小样本识别方法
早春养羊需防六大病害
基于二值化灰度图像的大豆蛋白液喷雾相对雾化程度的研究
“早春鱼瘟”、黄颡鱼“过春”、病害一线快速精准诊断……实战干货来啦
市政道路桥梁工程常见病害与施工处理技术探讨
天津港智慧工作平台灰度发布系统和流程设计
Arduino小车巡线程序的灰度阈值优化方案
肺纹理增多是病吗?
童梦
TEXTURE ON TEXTURE质地上的纹理