一种结合形状与纹理特征的植物叶片分类方法
2014-08-03董红霞郭斯羽
董红霞,郭斯羽
湖南大学 电气与信息工程学院,长沙 410082
一种结合形状与纹理特征的植物叶片分类方法
董红霞,郭斯羽
湖南大学 电气与信息工程学院,长沙 410082
1 引言
植物的识别和分类对于区分植物种类、研究植物间的亲缘关系、阐明植物系统的进化规律具有重要意义[1]。近年来,在基于植物叶片图像的植物分类等方面的研究不断取得进展,包括叶片图像的特征选取、算法性能和分类器设计等。文献[2]基于叶片图像的形状特征如形状特征、偏心率等8项几何特征和7个图像不变矩,利用移动中心超球分类器对叶片进行识别;文献[3]通过提取叶片的曲率特征、方向角等8个相对特征参数,使用BP神经网络进行分类,平均识别率达到87.5%;文献[4]利用人工神经网络对叶脉的边缘梯度、局部对比度和邻域统计特征等邻域特征进行提取,从而进行植物叶片机器识别研究,为进一步的叶片识别打下了良好的基础;文献[5]是将颜色和形状特征相结合识别叶片,为实现茶叶嫩芽的自动采摘提供了一种有效方法;文献[6]在识别植物识别过程中引入分形方法与分形特征,对单株植物的类别和植物群落都有较好的识别。但总体而言,为了在实用中进一步提高工作效率、降低人员的劳动强度等,基于图像的植物叶片自动识别的准确率更有待提升。本文给出了一种利用叶片形状和纹理特征进行识别的方法,能获得更高的识别准确率。
2 图像预处理与分割
将野外采集的叶片通过扫描仪扫描获取数字图像。算法的总体步骤如图1所示。首先在对图像进行预处理后,利用阈值分割来获取叶片的大致区域,然后通过数学形态学处理消除叶柄和叶片上的孔洞等,获得较为干净的叶片区域,并提取形状和纹理特征,最后通过训练好的BP网络分类器完成分类。
图1 叶片图像识别整体流程图
图像在获取过程中会不可避免地受到噪声的污染,为使后续分割处理更为可靠,可以使用低通滤波器对图像进行一定的去噪处理。本文采用高斯低通滤波器[7]平滑图片,高斯低通滤波器的窗口大小选为3×3,在去除噪声的同时避免过度模糊图像。
阈值分割的目的是获取以叶片区域为前景的二值图像,以便于后续的形状特征计算。本文采用大津法[8]进行阈值分割。
尽管在预处理中已经进行了一定的平滑去噪,但是噪声的影响仍然可能造成分割得到的二值图像中出现细小的孔洞或细碎的杂点区域。此外,如叶脉、叶片上的斑点和虫洞等也会产生类似的噪声区域。因此在阈值分割得到的二值图像上,利用适当大小的结构元素来进行数学形态学[9]的开运算和闭运算,以分别消除细碎的杂点区域和细小的孔洞或缝隙。此外,开运算[10]还被用来去除叶片的叶柄部分,以避免叶片特征受到明显影响。如图2所示即为经以上处理后得到的叶片区域。
图2 叶片分割示例
3 叶片特征提取
3.1 形状特征的提取
对于叶片形状特征而言,由于不同种类叶片的大小乃至同种叶片的大小都可能存在着较大的差异,因而如叶片长、宽、面积和周长这样的绝对性形状指标就不适合用作分类依据。在此选用了7项相对几何特征[11]:狭长度、矩形度、球状性、圆形度、偏心率、周长直径比和周长长宽比。
(1)狭长度是叶片长和宽的比值,能够描述叶片是接近圆形还是扁长的:
其中,WMER为叶片的宽,LMER为叶片的长。
(2)矩形度是物体的面积(A)与其最小外接矩形的面积(AMER)之比,反映物体对其外接矩形的充满程度:
其中,A为物体面积即区域中的像素总数,AMER为物体最小外界矩形的面积。
(3)球状性是叶片面积与叶片凸包周长的计算值:
其中,A为叶片面积,PConvex为叶片凸包周长。
(4)圆形度是用来描述物体边界的复杂程度的。最常用的圆形度是周长(P)的平方与面积(A)的比:
其中,面积为A,周长为P。圆形度能够表示叶片形状与圆的相似程度,叶片形状越接近圆形,它的圆形度值也就越小。
(5)偏心率是叶片自身长轴与短轴的比值即纵横轴之比:
其中,MajorAxis和MinorAxis分别是叶片最佳匹配椭圆的长轴和短轴长度。
(6)周长直径比是叶片周长和它的直径的比值[12]:
其中,P为叶片周长,Diameter为叶片直径。
(7)周长长宽比即叶片周长和叶片长宽之和的比值[12]:
其中,P为叶片周长,Lp和Wp分别为叶片的长度和宽度。
3.2 纹理特征
纹理是图像的重要特征,是图像分析中的一个重要指标。纹理是对于图像各像元灰度的空间分布的一种描述,它是纹理基元按某种确定的规律或者某种统计规律排列组成,表现为平滑性、一致性和复杂程度。本文采用纹理描绘子和分形维数来描述叶片纹理特征。
常用的纹理描绘子有均值、标准差、一致性、平滑度、三阶矩和熵等,它们的定义如下所示[13]:
(1)中心矩,描述直方图分布形状的主要方法是通过它的中心矩即均值的矩,它定义为:
其中,zi是表示亮度的一个随机变量,p(z)是一个区域中的灰度级的直方图,l是可能的灰度级,n是矩的阶,m是均值亮度:
(2)标准偏差
的士在路上飞驰起来,竹韵回头看了一眼海力的车,发现他也把车开上了路。回味了一番刚才的情景,越来越感到纳闷。
它是平均对比度的一个度量。
(3)平滑度
平滑度是区域中亮度的相对平滑度度量,对于常亮度区域,R等于0;对于灰度级的值有着较大偏移的区域,R接近于1。
(4)三阶矩
三阶矩是直方图偏斜度的一个度量,若直方图是对称的,则度量为0;若度量为正值,则直方图向右偏斜,若度量为负值,则直方图向左偏斜。(5)一致性
当所有灰度值相等时,该度量最大并从此处开始减小。
(6)熵
熵是随机性的一个度量,它反映了图像具有的信息量,即图像中纹理的复杂程度或非均匀度。若纹理越复杂,熵具有较大值,若图像中纹理越少,灰度越均匀,熵则较小。
分形维数[14]体现了图像表面不规则程度和自相似程度,它可以反映图像的纹理复杂程度。
本文采用的分形维数估算方法是基于盒计数的,它通过使用覆盖图像表面所需要的最小盒子数Nr作为对该表面的一个度量。先将一幅M×M大小的图像分割成 l×l的子块(1<l≤M/2,l为整数)。用 (x,y,z)表示原图像,其中 x,y表示像素的横纵坐标,z为图像在(x,y)位置处的灰度值。X,Y平面被分割成许多l×l的网格。每个网格是一列高为h,体积为l×l×h的盒子。设在第(m,n)网格中图像灰度的最小值和最大值分别落在第k和第 f个盒子中,则
是覆盖第(m,n)网格中的图像所需的盒子数,可求出覆盖整个图像所需的盒子数Nr:
最后,选取一组L,计算Nr,通过线性拟合即可求得分形维数D。
4 利用BP网络进行分类
以上共获取了14种叶片特征。这些特征在各自的取值范围上存在较大差异,因此,对各项特征进行了归一化处理,使其取值在[0,1]的区间内。归一化后的特征构成的特征向量作为输入被送入BP神经网络[15]。
网络包含一个隐含层,隐含层节点[16]数量为15个。实验中有6类不同植物的叶片,因此,BP网络的输出神经元相应设定为6个。隐含层和输出层的传递函数均为正切S型函数:
其中,n为输入矩阵的列向量。
在确定样本的分类时,根据输出值最大的输出神经元的序号来给出分类结果,即如果第i个输出神经元的输出是所有6个输出中最大者,则将输入分类为第i类。
5 实验结果及分析
实验选取杨树叶片、银杏叶片、枫叶、莲叶、棉花叶、小麦叶共6种形状和纹理不相同的叶片,每种叶片50幅,共300个样本。在训练BP网络时,随机选取其中的200个样本作为训练样本,而剩余的100个样本作为测试样本。作为对比,选择了文献[2]和文献[12]的方法一同进行了实验,其中文献[2]仅使用了叶片形状特征,而文献[12]仅使用了纹理及分形特征。训练和测试的结果如表1所示。
表1 分类实验结果 (%)
本文通过单独采用叶片形状特征、纹理和分形维数特征,以及将这三种特征相结合,分别测试叶片的识别率。从表中可以看出,文献[2]中仅使用叶片形状特征识别率为71.8%,文献[12]将叶片纹理描绘子和分形维数相结合后的叶片的识别率达到92.2%。当本文把叶片形状特征以及纹理和分形特征结合用于识别时,识别率比仅使用叶片和分形维数纹理特征的识别率要高近7%,叶片识别率明显提高,得到了满意的识别效果。
图3 用来测试分类器性能的6种植物叶片
6 结束语
本文结合叶片形状特征以及纹理描绘子和分形特征来进行叶片的分类识别,分类器选用了BP前馈神经网络。在实际图像上进行的实验中,对杨树、银杏、枫叶、莲叶、棉花叶、小麦叶等6种植物叶片的识别率达到了98.4%,表明所用的特征及分类方法具有有效性。今后的研究重点将在于将以上分类方法推广应用于种类更为丰富的叶片分类上,并对特征进行优化筛选。
[1]黄志开.彩色图像特征提取与植物分类研[D].合肥:中国科学技术大学,2006.
[2]王晓峰,黄德双,杜吉祥,等.叶片图像特征提取与识别技术的研究[J].计算机工程与应用,2006,42(3):190-193.
[3]侯铜,姚立红,阚江明.基于叶片外形特征的植物识别研究[J].湖南农业科学,2009(4):123-125.
[4]傅弘,池哲儒,常杰.基于人工神经网络的叶脉信息提取—植物活体机器识别研究[J].植物学,2004,21(4):429-436.
[5]杨福增,田艳娜,杨青.基于颜色和形状特征的茶叶嫩芽识别方法[J].农业机械学报,2009(z1).
[6]杨辉军,陈立伟.基于分形特征的植物识别[J].计算机工程与设计,2010,31(24):5321-5327.
[7]高远.基于核方法的人脸识别[D].北京:北京工业大学,2010.
[8]陈宁宁.几种图像阈值分割算法的实现与比较[J].电脑知识与技术,2011,13(7):3109-3111.
[9]范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007:82-85.
[10]于晓静.基于图像处理的浮游生物统计软件的设计与实现[D].辽宁大连:大连海洋大学,2007.
[11]黄林,贺鹏,王经民.基于概率神经网络和分形的植物叶片机器识别研究[J].西北农林科技大学学报:自然科学版,2008,36(9):212-218.
[12]Wu S G,Bao F S,Xu E Y,et al.A leaf recognition algorithm for plant classification using probabilistic neural network[C]//IEEE International Symposium on Signal Processing and Information Technology,2007:11-16.
[13]Gonzalez R C,Woods R E.Digital image processing[M]. 2版.北京:电子工业出版社,2002:350-351.
[14]孙博玲.分形维数及其测量方法[J].东北林业大学学报,2004,32(3):116-119.
[15]葛哲学,孙志强.神经网络理论与MATLAB R2007实现[M].北京:电子工业出版社,2007:280-286.
[16]褚辉,赖惠成.一种改进的BP神经网络算法及应用[J].计算机仿真,2007,24(4):75-76.
DONG Hongxia,GUO Siyu
School of Electrical and Information Engineering,Hunan University,Changsha 410082,China
Recognition of plants based on plant leaves is of important aid for biological and ecological sciences.An algorithm for leaf classification based on shape and texture features is presented.Following the preprocessing of image denoising,the leaf region is obtained through segmentation and mathematical morphological operations.Shape features are extracted from the segmented binary region image,and texture features are extracted from the gray-scale image.A BP forward neural network with the features as inputs is adopted for classification.Experimental results on real-world images show that higher classification accuracy can be achieved by the proposed method compared with existing algorithms.
leaf classification;shape feature;texture;Back Propagation(BP)neural network
根据植物叶片识别植物种类对于生物科学与生态科学具有重要的辅助作用。针对叶片分类,提出了一种基于形状与纹理特征的分类算法。在进行了去噪等预处理后,通过阈值分割和数学形态学方法获取叶片区域;在分割得到的二值区域图像上提取了形状特征,在灰度图像上提取了纹理特征;在所得特征的基础上,利用BP网络对叶片进行分类。在实际图片上的实验结果表明,相比于已有算法,该方法可以达到更高的正确分类率。
叶片分类;形状特征;纹理;反向传播(BP)神经网络
A
TP391.4
10.3778/j.issn.1002-8331.1301-0138
DONG Hongxia,GUO Siyu.Plant leaf classification method combining shape and texture features.Computer Engineering and Applications,2014,50(23):185-188.
湖南大学青年教师成长计划基金(No.531107040050)。
董红霞(1987—),女,硕士研究生,主要研究方向为植物叶片图像处理与识别;郭斯羽(1975—),男,博士,副教授,主要研究方向为智能测控技术、电测技术、信息处理等。E-mail:dhxdonghongxia@163.com
2013-01-14
2013-03-19
1002-8331(2014)23-0185-04
CNKI网络优先出版:2013-04-08,http://www.cnki.net/kcms/detail/11.2127.TP.20130408.1646.009.html