基于不变矩的作物病害识别方法
2014-08-12王旭启张善文王献锋
王旭启+张善文+王献锋
摘要:针对作物病害识别的复杂性,提出一种基于不变矩(invariants moments,IM)算法的病害识别方法。对作物病害叶片图像进行不变矩特征提取,采用最近邻分类器对作物病害叶片进行识别。以芹菜病害叶片为材料,进行病害识别,结果表明,该方法是有效可行的。
关键词:作物病害叶片;特征提取;不变矩;最近邻分类器
中图分类号: TP391.41文献标志码: A文章编号:1002-1302(2014)06-0378-02
收稿日期:2013-10-09
基金项目:国家自然科学基金(编号:61272333);陕西省教育厅自然科学研究项目(编号:2013JK887)。
作者简介:王旭启(1976—),男,河南遂平人,硕士,讲师,从事模式识别研究。E-mail:wjdw716@163.com。作物病害是限制我国农业生产的重要因素。由于作物病害造成的损失巨大,所以作物病害检测一直是农业科技工作者的研究重点。实际生产中,农民及农业科技工作者主要依靠自身经验诊断作物病害,这种诊断方法的识别能力有限,通常在作物病害程度比较重时才能识别,而且费时费力,严重影响作物病害预报准确率。绝大多数作物病害会通过叶子表现出来,因此基于作物叶片症状的作物病害识别方法是研究热点之一。近年来,学者们对作物病害识别及检测方法进行了广泛研究,通过对农作物病害图像进行预处理,提取病害特征参数,使用不同分类器达到智能识别的目的[1-6]。程鹏飞从颜色、纹理两方面人为地选择合适的病害分类特征参数,利用模糊K近邻法建立分类器对植株叶片进行模式识别,但人为选择特征参数会影响植物病害的识别准确度[7]。田有文等探讨利用SVM对黄瓜病害进行分类,提取黄瓜叶片病斑的形状、颜色、质地、发病时期等特征作为特征向量,利用SVM分类器,选取4种常见核函数,以Matlab7.0为平台对10类常见病害进行识别,结果表明,SVM方法在处理小样本问题时具有良好的分类效果[8]。祁广云等应用改进的GA训练BP神经网络实现了大豆叶斑病病斑区域的提取,结果表明,应用该方法识别病斑区域的准确率达90%,克服了彩色直方图熵法分割病斑图像不清晰的弊端[9]。由于病害叶片形状、颜色的复杂性,导致很多作物病害识别方法及技术不能满足自动化作物病害检测系统的需要。本研究提取作物病害叶片的不变矩分类特征,利用最近邻分类器对作物病害进行检测,旨在为作物病害识别提供一种新方法。
1作物病害叶片图像特征提取
不变矩作为复杂图像的分类特征被广泛应用于二维图像识别领域。有学者由二维图像几何矩的非线性组合推导出了7项具有旋转、平移、尺度不变性的不变矩,并且证明了这些矩保留了数据的分类信息[10]。具体算法如下:
对于二维图像f(x,y),其定义域为C,它的p+q级矩定义为:
Mpq=∫Cxpyqf(x,y)ds。(1)
实际应用中人们经常采用离散化形式来近似计算图像的p+q级矩:
Mpq=∑(x,y)∈Cxpyqf(x,y)。(2)
图像的中心距μpq定义为:
μpq=∑(x,y)∈C(x-x)p(y-y)qf(x,y)。(3)
式中,x=M10M00,y=M01M00。
对μpq进行正则化得:
ηpq=μpq/μγ00。(4)
式中,γ=p+q+1为正则化因子,p、q为正整数。
利用ηpq可以计算以下7个不变矩:
Hu1=η20+η02,(5)
Hu2=(η20-η02)2+4η211,(6)
Hu3=(η30-3η12)2+(η03-3η21)2,(7)
Hu4=(η30+η12)2+(η03+η21)2,(8)
Hu5=(η30-3η12)(η30+η12)[(η30+η12)2-3(η03+η21)2]+
(3η21-η03)(η21+η03)[3(η30+η12)2-(η03+η21)2],(9)
Hu6=(η20-η02)[(η30+η12)2-(η03+η21)2]+
4η11(η30+η12)(η03+η21),(10)
Hu7=(3η21-η03)(η30+η12)[(η30+η12)2-3(η03+η21)2]+
(3η12-η30)(η21+η03)[3(η30+η12)2-(η03+η21)2]。(11)
这些不变矩组成的向量[Hu1,Hu2,…,Hu7]对于平移、旋转、比例尺变化具有保持不变的性质,因此可以作为作物病害叶片图像的分类特征,对作物病害叶片进行识别。
2结果与分析
本研究以芹菜病害叶片作为研究对象,针对高发病率且具有显著危害的斑枯病、灰霉病、叶斑病、霜霉病进行病害识别。利用图像采集系统,选择光照强度适中的时间拍摄病害叶片,从发病初期开始直至病情非常严重时期,平均每隔2 d采集1次病叶图像。拍摄前调节相机白平衡,确保拍摄到的作物叶片图像颜色尽量接近叶片本身的颜色。利用Matlab软件中的‘rgb2gray 提取分割后病斑图像每点像素的R、G、B值,将病斑图像转换为灰度图像:
Gray=0.299R+0.587G+0.114B。(12)
采集到芹菜4种病害叶片样本的灰度图像如图1所示。从斑枯病、灰霉病、叶斑病、霜霉病4种病害叶片数据库中各选择100幅叶片。从图2可以看出,同种病害的叶片之间差异很大,利用经典的模式识别方法对芹菜病害叶片进行识别的识别率不高。因此,本研究利用不变矩作为病害的识别特征,对芹菜病害进行识别。
将所有叶片图像划分为训练集与测试集,训练集用于训练最近邻分类器,测试集用于测试算法的性能。本试验从斑枯病、灰霉病、叶斑病、霜霉病每种病害100幅叶片中分别随机分配n幅图像作为训练集,其余作为测试集。首先利用最大方差法[11]对每幅黄瓜病斑叶片进行分割,得到黄瓜叶片的病斑图像。将每幅图像转换成灰度图像Gray,再利用公式(1)至公式(11)计算灰度图像Gray的7个不变矩,由此组成1个特征向量X=[Hu1,Hu2,…,Hu7]。计算每种病害的训练集中病害叶片特征向量的平均值,分别记为Mi(i=1,2,3,4)。对于待分类的叶片图像特征向量X,计算X到每个模式类均值Mi的欧氏距离平方‖X-Mi‖2,然后把X判别至距离最小的类。
‖X-Mi‖2=(X-Mi)T(X-Mi)=XTX-2MTiX+MTiMi。(13)
由于公式(13)的第1项与i无关,所以可以将公式(13)的第1项去掉,整理成1个线性判别函数:
MTiX-12MTiMi=ΔTiA。(14)
式中:Δi=Mi
-12MTiMi,A=X
1。
在识别过程中,要求取ΔTiA最小值对应的下标病害类别,也是本测试样本所属的病害类别。
重复50次上面叶片图像的划分及病害识别试验,记录每次试验中识别率的最大值,再计算50次试验识别率最大值的平均值,作为基于不变矩(invariants moments,IM)算法的识别结果(表1)。为了比较,表1还给出了基于PCA+PNN、神经网络(ANN)、贝叶斯方法(Bayesian)[12]等植物病害识别方法的识别结果。
表1芹菜病害识别结果
识别方法识别率(%)训练样本30个训练样本40个训练样本50个PCA+PNN72.48±2.53 75.30±2.3580.28±2.55ANN70.38±2.43 74.22±2.30 78.97±2.36Bayesian74.41±2.75 79.46±2.3881.27±2.15IM79.14±2.87 81.17±2.7985.50±2.41
由表1可以看出,IM算法的识别率最高,这是由于IM算法的不变矩分类特征具有旋转、平移、尺度不变性,有利于病害分类、识别。所有算法的识别率都随着训练集中样本数的增多而增加,这是由于训练样本越多,得到的识别特征越稳定。试验过程中还发现,本系统对于芹菜病害的识别率不高,这是因为发病初期病斑较小、症状较轻,叶片的完整度与无病害情况相似,发病后期无论哪种病害,叶片都出现大面积干枯、坏死,并且病斑颜色也从最初的绿色逐渐变成灰褐色,甚至出现病叶萎缩,给病害分割带来困难,导致后期特征提取差别不明显。一般情况下可以通过增大训练样本量的方法提高识别精度。
3结论
本研究针对病害叶片图像的复杂性,提出了一种基于不
变矩的病害识别方法。本方法能够得到病害叶片的分类特征,利用最近邻分类器进行病害识别。本方法识别率高,不足之处是不变矩对图像的描述太过笼统,没有反映作物病害叶片的细节,而且计算量较大。所以,笔者下一步研究方向是挖掘简单鲁棒的作物病害叶片分类特征。
参考文献:
[1]Camargo A,Smith J S. An image-processing based algorithm to automatically identify plant disease visual symptoms[J]. Biosystems Engineering,2009,102(1):9-21.
[2]Pydipati R,Burks T F,Lee W S. Statistical and neural network classifiers for citrus disease detection using machine vision[J]. Transactions of the ASAE,2005,48(5):2007-2014.
[3]姜淑华,田有文,孙海波. 农作物病害危害程度自动测定与分级的研究[J]. 农机化研究,2007(5):61-63.
[4]柴阿丽,李宝聚,石延霞,等. 基于计算机视觉技术的番茄叶部病害识别[J]. 园艺学报,2010,37(9):1423-1430.
[5]李波,刘占宇,黄敬峰,等. 基于PCA和PNN的水稻病虫害高光谱识别[J]. 农业工程学报,2009,25(9):143-147.
[6]岑喆鑫,李宝聚,石延霞,等. 基于彩色图像颜色统计特征的黄瓜炭疽病和褐斑病的识别研究[J]. 园艺学报,2007,34(6):1425-1430.
[7]程鹏飞. 植物病害的图像处理及特征值提取方法的研究[D]. 晋中:山西农业大学,2005.
[8]田有文,牛妍. 支持向量机在黄瓜病害识别中的应用研究[J]. 农机化研究,2009(3):36-39.
[9]祁广云,马晓丹,关海鸥. 采用改进遗传算法提取大豆叶片病斑图像[J]. 农业工程学报,2009,25(5):142-145.
[10]吴冬梅,李俊威,刘凌志,等. 基于Zernike不变矩的人形识别研究[J]. 计算机应用与软件,2013,30(8):162-165.
[11]王祥科,郑志强. Otsu多阈值快速分割算法及其在彩色图像中的应用[J]. 计算机应用,2006,26(增刊):14-15.
[12]赵玉霞,王克如,白中英,等. 贝叶斯方法在玉米叶部病害图像识别中的应用[J]. 计算机工程与应用,2007,43(5):193-195.
‖X-Mi‖2=(X-Mi)T(X-Mi)=XTX-2MTiX+MTiMi。(13)
由于公式(13)的第1项与i无关,所以可以将公式(13)的第1项去掉,整理成1个线性判别函数:
MTiX-12MTiMi=ΔTiA。(14)
式中:Δi=Mi
-12MTiMi,A=X
1。
在识别过程中,要求取ΔTiA最小值对应的下标病害类别,也是本测试样本所属的病害类别。
重复50次上面叶片图像的划分及病害识别试验,记录每次试验中识别率的最大值,再计算50次试验识别率最大值的平均值,作为基于不变矩(invariants moments,IM)算法的识别结果(表1)。为了比较,表1还给出了基于PCA+PNN、神经网络(ANN)、贝叶斯方法(Bayesian)[12]等植物病害识别方法的识别结果。
表1芹菜病害识别结果
识别方法识别率(%)训练样本30个训练样本40个训练样本50个PCA+PNN72.48±2.53 75.30±2.3580.28±2.55ANN70.38±2.43 74.22±2.30 78.97±2.36Bayesian74.41±2.75 79.46±2.3881.27±2.15IM79.14±2.87 81.17±2.7985.50±2.41
由表1可以看出,IM算法的识别率最高,这是由于IM算法的不变矩分类特征具有旋转、平移、尺度不变性,有利于病害分类、识别。所有算法的识别率都随着训练集中样本数的增多而增加,这是由于训练样本越多,得到的识别特征越稳定。试验过程中还发现,本系统对于芹菜病害的识别率不高,这是因为发病初期病斑较小、症状较轻,叶片的完整度与无病害情况相似,发病后期无论哪种病害,叶片都出现大面积干枯、坏死,并且病斑颜色也从最初的绿色逐渐变成灰褐色,甚至出现病叶萎缩,给病害分割带来困难,导致后期特征提取差别不明显。一般情况下可以通过增大训练样本量的方法提高识别精度。
3结论
本研究针对病害叶片图像的复杂性,提出了一种基于不
变矩的病害识别方法。本方法能够得到病害叶片的分类特征,利用最近邻分类器进行病害识别。本方法识别率高,不足之处是不变矩对图像的描述太过笼统,没有反映作物病害叶片的细节,而且计算量较大。所以,笔者下一步研究方向是挖掘简单鲁棒的作物病害叶片分类特征。
参考文献:
[1]Camargo A,Smith J S. An image-processing based algorithm to automatically identify plant disease visual symptoms[J]. Biosystems Engineering,2009,102(1):9-21.
[2]Pydipati R,Burks T F,Lee W S. Statistical and neural network classifiers for citrus disease detection using machine vision[J]. Transactions of the ASAE,2005,48(5):2007-2014.
[3]姜淑华,田有文,孙海波. 农作物病害危害程度自动测定与分级的研究[J]. 农机化研究,2007(5):61-63.
[4]柴阿丽,李宝聚,石延霞,等. 基于计算机视觉技术的番茄叶部病害识别[J]. 园艺学报,2010,37(9):1423-1430.
[5]李波,刘占宇,黄敬峰,等. 基于PCA和PNN的水稻病虫害高光谱识别[J]. 农业工程学报,2009,25(9):143-147.
[6]岑喆鑫,李宝聚,石延霞,等. 基于彩色图像颜色统计特征的黄瓜炭疽病和褐斑病的识别研究[J]. 园艺学报,2007,34(6):1425-1430.
[7]程鹏飞. 植物病害的图像处理及特征值提取方法的研究[D]. 晋中:山西农业大学,2005.
[8]田有文,牛妍. 支持向量机在黄瓜病害识别中的应用研究[J]. 农机化研究,2009(3):36-39.
[9]祁广云,马晓丹,关海鸥. 采用改进遗传算法提取大豆叶片病斑图像[J]. 农业工程学报,2009,25(5):142-145.
[10]吴冬梅,李俊威,刘凌志,等. 基于Zernike不变矩的人形识别研究[J]. 计算机应用与软件,2013,30(8):162-165.
[11]王祥科,郑志强. Otsu多阈值快速分割算法及其在彩色图像中的应用[J]. 计算机应用,2006,26(增刊):14-15.
[12]赵玉霞,王克如,白中英,等. 贝叶斯方法在玉米叶部病害图像识别中的应用[J]. 计算机工程与应用,2007,43(5):193-195.
‖X-Mi‖2=(X-Mi)T(X-Mi)=XTX-2MTiX+MTiMi。(13)
由于公式(13)的第1项与i无关,所以可以将公式(13)的第1项去掉,整理成1个线性判别函数:
MTiX-12MTiMi=ΔTiA。(14)
式中:Δi=Mi
-12MTiMi,A=X
1。
在识别过程中,要求取ΔTiA最小值对应的下标病害类别,也是本测试样本所属的病害类别。
重复50次上面叶片图像的划分及病害识别试验,记录每次试验中识别率的最大值,再计算50次试验识别率最大值的平均值,作为基于不变矩(invariants moments,IM)算法的识别结果(表1)。为了比较,表1还给出了基于PCA+PNN、神经网络(ANN)、贝叶斯方法(Bayesian)[12]等植物病害识别方法的识别结果。
表1芹菜病害识别结果
识别方法识别率(%)训练样本30个训练样本40个训练样本50个PCA+PNN72.48±2.53 75.30±2.3580.28±2.55ANN70.38±2.43 74.22±2.30 78.97±2.36Bayesian74.41±2.75 79.46±2.3881.27±2.15IM79.14±2.87 81.17±2.7985.50±2.41
由表1可以看出,IM算法的识别率最高,这是由于IM算法的不变矩分类特征具有旋转、平移、尺度不变性,有利于病害分类、识别。所有算法的识别率都随着训练集中样本数的增多而增加,这是由于训练样本越多,得到的识别特征越稳定。试验过程中还发现,本系统对于芹菜病害的识别率不高,这是因为发病初期病斑较小、症状较轻,叶片的完整度与无病害情况相似,发病后期无论哪种病害,叶片都出现大面积干枯、坏死,并且病斑颜色也从最初的绿色逐渐变成灰褐色,甚至出现病叶萎缩,给病害分割带来困难,导致后期特征提取差别不明显。一般情况下可以通过增大训练样本量的方法提高识别精度。
3结论
本研究针对病害叶片图像的复杂性,提出了一种基于不
变矩的病害识别方法。本方法能够得到病害叶片的分类特征,利用最近邻分类器进行病害识别。本方法识别率高,不足之处是不变矩对图像的描述太过笼统,没有反映作物病害叶片的细节,而且计算量较大。所以,笔者下一步研究方向是挖掘简单鲁棒的作物病害叶片分类特征。
参考文献:
[1]Camargo A,Smith J S. An image-processing based algorithm to automatically identify plant disease visual symptoms[J]. Biosystems Engineering,2009,102(1):9-21.
[2]Pydipati R,Burks T F,Lee W S. Statistical and neural network classifiers for citrus disease detection using machine vision[J]. Transactions of the ASAE,2005,48(5):2007-2014.
[3]姜淑华,田有文,孙海波. 农作物病害危害程度自动测定与分级的研究[J]. 农机化研究,2007(5):61-63.
[4]柴阿丽,李宝聚,石延霞,等. 基于计算机视觉技术的番茄叶部病害识别[J]. 园艺学报,2010,37(9):1423-1430.
[5]李波,刘占宇,黄敬峰,等. 基于PCA和PNN的水稻病虫害高光谱识别[J]. 农业工程学报,2009,25(9):143-147.
[6]岑喆鑫,李宝聚,石延霞,等. 基于彩色图像颜色统计特征的黄瓜炭疽病和褐斑病的识别研究[J]. 园艺学报,2007,34(6):1425-1430.
[7]程鹏飞. 植物病害的图像处理及特征值提取方法的研究[D]. 晋中:山西农业大学,2005.
[8]田有文,牛妍. 支持向量机在黄瓜病害识别中的应用研究[J]. 农机化研究,2009(3):36-39.
[9]祁广云,马晓丹,关海鸥. 采用改进遗传算法提取大豆叶片病斑图像[J]. 农业工程学报,2009,25(5):142-145.
[10]吴冬梅,李俊威,刘凌志,等. 基于Zernike不变矩的人形识别研究[J]. 计算机应用与软件,2013,30(8):162-165.
[11]王祥科,郑志强. Otsu多阈值快速分割算法及其在彩色图像中的应用[J]. 计算机应用,2006,26(增刊):14-15.
[12]赵玉霞,王克如,白中英,等. 贝叶斯方法在玉米叶部病害图像识别中的应用[J]. 计算机工程与应用,2007,43(5):193-195.