基于SVM的高粱叶片病斑图像自动分割提取方法研究
2014-04-29白文斌白帆贺文文王伟仁程彦俊刘璋
白文斌 白帆 贺文文 王伟仁 程彦俊 刘璋
摘要:为实现高粱叶片病斑的自动化无损监测,利用支持向量机(SVM)技术对高粱叶片病斑图像进行自动分割提取研究。结果表明,通过选取RGB、HIS和Lab 3种颜色空间的颜色特征值可以消除对作物病斑拍照时产生的光照、亮度等影响。在MATLAB软件环境下调用LIBSVM软件对病斑图片中的病斑图像像素点和背景图像像素点建立支持向量机分类模型,可以实现对病斑的高效分割和高质量提取。分割提取效果与人眼识别的病斑图像高度吻合。如果利用大量采集的病斑图像进行模型训练,就可以真正实现完全自动化的病斑分割、提取和判别。因此,该研究对建立完全自动化的作物病斑图像识别系统意义重大。
关键词:支持向量机;LIBSVM;高粱;病害;图像分割;自动识别
中图分类号:S431文献标志码:A论文编号:2013-0892
0引言
高粱[Sorghum bicolor (Linn.) Moench]属于禾本科(Gramineae)高粱族(Andropogoneae)高粱属(Sorghum),是世界上最古老的禾谷类作物之一[1]。在高粱的生长过程中会受到各种因素的影响,病害是影响其产量的主要限制因子之一。近年来,高粱病害有逐年加重的趋势,病害严重影响高粱的产量和品质,一般使高粱减产20%~30%,严重时可导致绝产。所以高粱病害的准确识别和及时的智能化防治成为一个亟待解决的问题。在作物病害防治过程中,及时发现并进行科学防治是关键[2]。如何利用计算机视觉技术进行作物叶部病害的定位观测采集图像[3],通过科学算法进行图像的解析、判别是重要的研究内容。在病害图像获取方面,李娇娇等[4]、温长洁等[5]对玉米叶部病斑图像智能处理算法进行了研究,认为病害图像的拍摄质量影响病害特征的提取。在RGB色彩子空间上采用蜂群算法优化神经网络能对玉米常见病害彩色图像进行优化分割,提取出病害侵害的结果。张茂明等[6]对虫害图像背景进行了差分处理,分析出两幅图像之间的差异,判断出是不是相同图像在不同光照下的结果。马彦平等[7]对玉米叶部病害特征进行了提取与识别,认为提取的叶片病害信息越多越全面,病害识别效果就越好。熊俊涛[8]对植物病斑进行了分割,认为阈值分割中的阈值选取对图像分割的影响较大。翟乃强[9]利用颜色信息对图像进行了分割研究,认为利用颜色进行边缘提取所得到的图像比灰度图下使用相同算法保留下更多边缘信息,为科学进行病害边缘分割提供了一种方法。牛力聪等[10]利用MATLAB软件对砾石颗粒圆形度进行了计算,结论是与手工算法相比,提高了工作效率和准确度。笔者借鉴前人的研究方法,前期对获取的高粱叶部病害图像采用MATLAB软件进行了病斑部位的自动分割和提取,发现应用支持向量机并结合多种颜色空间参数可以有效分割和提取叶片病斑图像,理论上对后期自动识别是极其有利的。因此,笔者采用支持向量机技术[11]对高粱叶部病斑进行完全自动化图像分割和提取方法的研究,以期找到一种有效的完全自动和无人为干预的高粱叶部病害病斑图像的自动分割和提取方法,为后续开发高粱叶病病害自动识别系统奠定重要的基础。同时,其也为在别的作物上进行病害识别提供了新的思路借鉴。
1SVM图像分割基本原理
1.1SVM简介
支持向量机(Support Vector Machine,SVM)是Vapnik等[12]在多年研究统计学理论基础上提出的一种用于解决线性不可分这样的分类问题的理论。支持向量机的基本思想是:定义最优线性超平面,并把寻找最优线性超平面的算法归结为求解一个凸规划问题。进而基于Mercer核展开定理,通过构造一个非线性映射φ,把样本空间映射到一个高维乃至无穷维的特征空间,使之在特征空间中可以应用线性学习机的方法解决样本空间中的高度非线性分类和回归等问题[13]。
支持向量机方法是一种具有严密理论基础的计算机学习的新方法,它已经成为计算机学习、模式识别、计算智能、预测预报等领域的热点技术,在国内外受到广泛关注。
1.2LIBSVM简介
研究中使用LIBSVM来实现SVM建模和分类。LIBSVM是台湾大学林智仁等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包[14]。不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进、修改以及在其他操作系统上应用;该软件对SVM所涉及的参数调节相对比较少,提供了很多的默认参数,利用这些默认参数可以解决很多问题;并提供了交互检验(Cross Validation)的功能。该软件包可在http://www.csie.ntu.edu.tw/~cjlin/免费获得。该软件可以解决C-SVM、ν-SVM、ε-SVR和ν-SVR等问题,包括基于一对一算法的多类模式识别问题[15]。
1.3C-支持向量分类
研究中使用LIBSVM软件中的C-SVC方法。C-SVC所使用的公式[16]如下:
假设给定训练向量组xi∈Rn,i=1,…,l,且分属于两类,和一个向量y∈Rl使得满足yi∈{1,-1},那么C-SVC就是来解决如下原始问题的:
subject to,
它的对偶问题就是:
subject to,
其中,e是完全由1组成的向量,C≥0是上界,Q是l×l的正半定矩阵,Qij=yiyjK(xi,xj),且K(xi,xj)=φ(xi)Tφ(xj)是核。在这里,训练向量xi通过函数φ被映射到一个更高的(可能是无穷的)维空间中。这里的决策函数是:
1.4使用LIBSVM软件进行图像分割和提取的方法
应用SVM进行图像分割的实质是要对目标图像像素点和背景图像像素点进行准确分类。因此,首先需要选取代表目标图像和背景图像的像素点颜色值作为特征值,然后利用LIBSVM训练分类模型,然后用训练好的模型对待分割图像的所有像素点进行分类,最后把模型认为的背景图像像素点颜色值设置为黑色就实现了目标图像的分割和提取。技术路线可以概括为:图像获取→图像预处理→选取特征值→训练SVM分类模型→测试分割和提取效果。
2图像分析
2.1图像获取
试验供试图片为使用CANON IXUS 860 CCD数码相机于2010年5月—2013年11月在山西省晋中市榆次区修文镇高粱种植基地拍摄,且尽量保证镜头垂直向下,图像大小为640×480像素,格式为JPG。为获取清晰的病害并消除大田中其他复杂背景的影响,要求须将高粱叶片平整的铺在一块蓝色(单色)纸板上面进行拍摄。图1所示为原始拍到的高粱大斑病叶片图像。
2.2图像预处理
拍摄到的图像如果除了蓝色背景还有别的背景,像图1所示那样在图像的左边有田间土壤的背景,这时需要在图像处理类软件(如Windows自带的画图软件或photoshop软件)中对图像进行截取,只保留有蓝色背景和叶片的图像作为待处理的图像。图2所示为截取后的待分割和提取图像。
2.3选取特征值
颜色是物体外在特征最直观的表现方式之一。早期的图像处理主要是利用灰度图像来表征物体,灰度图像又称单色图像,每个象素只用一个字节来表示,在实际应用过程中通常又将其转化为黑白二值图像进行处理。随着硬件技术与图像处理技术的发展,用于计算机处理、分类识别的颜色空间模型由单色模型发展到RGB、HSI、CMYK和LAB等模型[17],而在图像处理中常用的是RGB、HSI和LAB颜色空间模型。RGB颜色模型是一种基础彩色模型,其值分别是图像红、绿、蓝的亮度值,通过混合RGB 3个通道的数值来产生其他颜色。HSI模型是人眼根据颜色的色调(H)、饱和度(S)和强度(I)对颜色进行区分、编号的颜色模型,它符合人眼对色彩的感觉规律并且能将图像的色彩信息与亮度信息分开,而且分开的各分量相互独立,因此,在HSI颜色空间可以大大简化图像分析和处理的工作量。在图像处理和计算机视觉中大量算法都可以在HSI颜色空间中方便使用。LAB是由国际照明委员会(CIE)提出的,用来描述人眼可见的所有颜色的最完备的色彩模型。其中3个基本坐标中,L表示照度,相当于亮度,A表示从红色至绿色的范围,B表示从蓝色至黄色的范围。使用LAB颜色空间时,光亮度、色调和饱和度都能够独立调整,因此,在不改变整个图像或者亮度的情况下,可以改变整个图像的颜色。HSI与LAB颜色空间都可以由RGB基础彩色空间计算推导出来[18]。
为了消除亮度等对像素点颜色值的影响,笔者采用上述3种颜色空间RGB、HIS和LAB,分别提取单个像素点的RGB红色分量R、绿色分量G、蓝色分量B,HIS颜色空间色调H、亮度I、饱和度S,LAB颜色空间亮度L、A颜色、B颜色共9个颜色特征值作为区分目标图像和背景图像像素点的特征值。
2.4训练SVM模型
要训练模型,先要采集目标图像和背景图像的像素点样本。笔者通过MATLAB软件编制程序来实现样本像素点的采集,如图3所示。然后计算每个像素点对应的9个颜色特征值,并保存为一个m×9的矩阵,m表示像素点个数。
从80张图像中共采集目标图像和背景图像的像素点样本各1820个,得到2个矩阵,维度都是1820×9,一个是变量名为mbyb的目标图像特征值矩阵,另一个是变量名为bjyb的背景图像特征值矩阵。然后构建对应的分类结果向量,用1代表目标图像,0代表背景图像,那么就可以构建出变量名为mblabel所有值为1的1820×1的列向量和变量名为bjlabel所有值为0的1820×1的列向量。然后用这些数据来训练SVM分类模型。MATLAB程序核心代码如下:
TrainData=[bjyb;qjyb];%组成输入特征数据,维度为3640×9
TrainLabel=[bjlabel;mblabel];%组成输出类别标签数据,维度为3640×1
glbhfgModel=libsvmtrain(TrainLabel,TrainData,'-t 1 -d 1');%训练模型
上述训练模型代码语句中的参数'-t 1 -d 1'代表选择的核函数类型为多项式,核函数中的degree设置为1,默认使用C-SVC方法。
2.5测试分割和提取效果
将图2所有像素点的颜色特征值矩阵输入建立好的glbhfgModel模型中,即可算出每个像素点的类别标签。主要用到的matlab核心代码为:
TestLabel=libsvmpredict(zeros(length(TestData),1),TestData, glbhfgModel)
上述代码中TestData代表图像所有像素点的颜色特征值矩阵,TestLabel为计算输出的类别标签向量。
然后将标记为0的像素点RGB颜色值设为(0,0,0),即可得到想要的病斑图像,如图4所示。
通过上述方法,用建立好的SVM模型对10幅图像进行自动分割和提取,结果如图5所示。
从图5可以看出,选用3种颜色空间共9个颜色特征值来对目标图像和背景图像像素点分类,可以有效消除光照、亮度等影响,利用支持向量机进行分割和提取病斑,与人眼识别的病斑图像高度吻合,说明这种方法非常可行有效。
3结论与讨论
病斑图像的分割和提取是高粱病害自动识别工作在获取图像后的第一步,对病害准确及时的识别有非常重要的意义。笔者通过选取3种颜色空间的颜色特征值来消除光照、亮度等拍照时的影响,在MATLAB软件环境下,用LIBSVM软件对原始图像中的病斑图像像素点和背景图像像素点建立支持向量机分类模型,从而实现对病害图像中病斑的分割和提取,分割提取效果与人眼识别的病斑图像高度吻合。且在模型建立好后,对图像进行简单的预处理后,就可以做到真正的自动分割和提取,不需要人为再判断或设置参数,因此不失为一种操作简便,效果明显的病斑图像自动分割提取方法。
虽然图像分割方法很多,常用的有阈值法[19]、区域分割[20]、边缘检测[21]等,但均无法实现全自动,中间或多或少都需要人的判断或参数设置,特别是在多幅图像灰度、形态变化较大的时候,更是没有一种通用的方法可以实现对多个图像的分割。而笔者提出的基于SVM,采用颜色特征值的病斑图像分割方法,只需要简单的前处理,即可实现全自动无人值守的病斑图像分割和提取。而且分割提取速度快、效果显著,与人眼识别的病斑图像高度吻合。完全自动化的图像分割和提取是图像自动识别系统的重要前提,因此笔者研究的完全自动化图像分割和提取方法,有别于传统的作物叶部病害解析、识别技术,对建设作物病斑的自动识别信息系统具有重要意义。本方法要求对叶部病斑的采集时,图像采集框内除了病斑和叶片部位外,不能有别的背景。如果图像中存在非单色和叶片颜色的背景颜色时,分割效果将会受到很大影响。因此,笔者下一步将进一步研究基于田间复杂背景下的目标图像自动分割提取方法。
参考文献
[1] 卢庆善.高粱学[M].北京:中国农业出版社,1999:25-26.
[2] 马德贵,邵陆寿,葛婧,等.水稻稻瘟病及水稻纹枯病病害程度图像检测[J].中国农学通报,2008,24(9):485-489.
[3] 胡炼,罗锡文,曾山,等.基于机器视觉的株间机械除草装置的作物识别与定位方法[J].农业工程学报,2013,29(10):12-18.
[4] 李娇娇.玉米叶部病斑图像智能处理算法的研究与实现[D].北京:北京邮电大学,2010:43-48.
[5] 温长洁,王生生,于合龙,等.基于改进蜂群算法优化神经网络的玉米病害图像分割[J].农业工程学报,2013,29(13):142-149.
[6] 张茂明.粘着式信息素诱捕器捕获小菜蛾试验及图像识别系统的研究[J].中国农学通报,2010,26(23):291-294.
[7] 马彦平,白由路,高祥照,等.基于数字图像的玉米叶面积测量方法研究[J].中国农学通报,2009,25(22):329-334.
[8] 熊俊涛,邹湘军,王红军,等.基于Retinex图像增强的不同光照条件下的成熟荔枝识别[J].农业工程学报,2013,29(12):170-178.
[9] 翟乃强.应用颜色信息的图像分割研究[J].电子设计工程,2012(1):181-183.
[10] 牛立聪,孙香花,左晓宝.基于Matlab图像处理的砂石颗粒圆形度计算方法[J].混凝土,2012(1):10-12.
[11] 陈政文,匡逢春,张学文.基于支持向量机的花生苗期抗旱指标筛选[J].中国农学通报,2013,29(15):31-36.
[12] 吴学明,张怀清,林辉,等.基于支持向量机的北京市湿地变化预测研究[J].中国农学通报,2012,28(14):280-284.
[13] 李俊,陈振德.基于数字图像的番茄黄化曲叶病毒病色彩分析研究[J].中国农学通报,2013,29(31):96-100.
[14] 朱培根,梅卫江,石秀锋等. 基于LibSVM代用燃料有效功率增量预测方法的研究[J]. 石河子大学学报:自然科学版,2012(5):31-36.
[15] 宋振伟,文新亚,张志鹏,等.基于数字图像技术的冬小麦不同施氮和灌溉处理颜色特征分析[J].中国农学通报,2010,26(14):350-355.
[16] 张治中,林智仁.LIBSVM:一种支持向量机的程序库[EB/OL]. http://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf,2013-03-04.
[17] 田杰,胡秋霞,马孝义,等.基于高斯分布改进C-V模型的植物病斑彩色图像分割[J].农业工程学报,2013,29(16):166-173.
[18] 管泽鑫,姚青,杨保军,等.数字图像处理技术在农作物病虫草识别中的应用[J].中国农业科学,2009,42(7):2349-2358.
[19] 陆秀明,黄庆,孙雪晨,等.图像处理技术估测水稻叶面积指数的研究[J].中国农学通报,2011,27(03):65-68.
[20] 王静,张云伟.一种烟叶病害的图像增强处理方法[J].中国农学通报,2011,27(6):469-472.
[21] 赵静,韩甜甜,张鲜鲜,等.应用数码图像技术对梨树叶片营养诊断的初探[J].中国农学通报,2011,27(13):272-276.