APP下载

基于小波灰度共生矩阵的植物分类研究

2012-05-04颜永丰

计算机工程与设计 2012年12期
关键词:子带小波纹理

张 航,颜永丰

(西北农林科技大学 信息工程学院,陕西 咸阳712100)

0 引 言

植物的分类研究对于区分植物种类、探索植物间的亲缘关系、阐明植物系统的进化规律具有重要意义[1],计算机辅助植物分类可以极大地提高植物分类与管理效率。

在基于叶子特征的植物图像分类识别领域,早期的研究主要采用叶子的形状特征作为分类特征集合,后来的研究表明,由于纹理特征反映了图像的灰度统计信息、空间分布信息以及结构信息[2],能够更加有效地描述图像的特征。

常见的纹理特征提取方法主要有灰度共生矩阵、小波特征、Gabor滤波器特征、局部二值模式 (local binary pattern,LBP)、随机场模型、分形维数等等[3-7]。传统纹理分析方法主要问题在于不能从多尺度有效描述纹理特征,目前在诸多领域得到广泛应用的小波理论为时频多尺度分析提供了精确统一的框架,解决了传统纹理分析方法的瓶颈。小波变换提供了一种在不同尺度上图像纹理细节分析的工具,能够更加准确地进行图像纹理分类。但是由于传统的塔式小波分解仅利用了图像低频子带的信息,然而高频子带包含了图像的边缘,轮廓和部分纹理信息,这导致纹理分类效果往往不够理想[7]。

为了克服小波变换的这一缺陷,增强算法的适应能力和鲁棒性,可以通过引入灰度共生矩阵的方法来解决这一问题,灰度共生矩阵利用了图像中像素相对位置的空间信息更加准确地描述图像的纹理,具有较强的适应能力和鲁棒性[3],可以用来统计各子带小波系数的低频和高频信息。

本研究将小波变换和灰度共生矩阵结合起来,在不同尺度上分别对图像高频子带和低频子带进行灰度值统计分析,得到小波灰度统计特征,并结合形状特征形成混合特征向量对植物进行分类,克服了塔式小波分解丢失高频信息的缺陷,通过对植物叶片分类实验,证明该方法具有很强的分类能力。

1 图像预处理

图像预处理主要有如下步骤:

(1)在计算图像特征之前,首先要对图像进行尺度缩放处理以减少计算量,并且对图像进行N级塔式小波分解要求图像的基础长度和宽度必须能被2的N次方整除,综合考虑计算机性能等影响,对其进行规范化处理,使其尺寸变成128×128。

(2)在计算纹理特征时需要将RGB图像转化为灰度图像。而计算形状特征时,可以通过阈值分割的方法转化为二值图像,阈值的求取采用了颜色直方图双峰法来确定。

(3)由于获取的图像表面常常有小孔,边缘区域有一些毛刺,可以通过形态学开运算去除边缘毛刺,闭运算修复小孔等缺陷。

(4)在获取图像过程中,不可避免地要产生噪声,因而需要先对图像进行平滑处理来消除噪声干扰,本研究采用高斯滤波对图像进行平滑处理。平滑处理导致图像边缘模糊,为了减少这种影响,需要对图像进行锐化处理。该研究采用了拉普拉斯运算扩展模板对图像进行锐化处理,以增强图像的显示效果 (预处理过程如图1所示)。

图1 图像预处理

2 特征向量生成

2.1 图像二维小波分解

图像通常表示为和位置相关的二维f (x,y)系统,x,y代表图像的行列坐标,则f (x,y)表示原始图像。对于f(x,y)进行二维离散小波变换,需要分别对行和列进行一维离散小波变换。一维离散小波变换通过对母小波的尺度因子和平移因子离散化得到。母小波的表示如下

式中:a——尺度因子,b——平移因子。通过对尺度因子和平移因子的离散化得到一维离散小波。令a=a-j0原字符串,b=kb0a-j0原字符串,通常a0=2,b0=1,则一维离散小波变换表示如下

将一维DWT扩展到二维,需要定义一个尺度和平移基函数,如式 (3)和式 (4)所示

图像f (x,y)的二维小波变换可以写成如下形式

其中j0是任意开始的尺度,(x,y)为可分离的尺度函数,ψ(x,y)为可分离的方向敏感的小波函数。定义了图像f (x,y)在尺度j0上的近似。Wψ定义了图像f(x,y)在尺度j≥j0(j=0,1,2)上 H,V,D 方向上的细节,分别代表水平、垂直和对角方向。

图2显示了图像的小波分解步骤。

图2 图像的小波分解步骤图示

其中,2↓1和1↓2分别表示对列和行像素集合进行下采样。第一行表示经过两次低通得到的图像的低频信息。第二行表示先低通再高通得到了水平方向的小波图像。第三行代表先高通再低通得到垂直方向小波图像,第四行代表经过两次高通之后得到对角方向的小波图像。

2.2 小波灰度共生矩阵

在对图像进行三层小波分解之后,获取10个子带的系数矩阵,然后对各子带小波系数构建灰度共生矩阵,然后采用Harlick提出的特征对系数矩阵进行计算。包括对比度、能量、熵、一致性、均值、方差、集群荫、集群突出和最大概率等统计特征组成特征向量,具体公式参见文献 [8]。

2.3 形状特征

由于植物叶片在不同情况下发育状况的差异性比较大,并且随着季节变化,周长、面积,纵轴长、横轴长等常用的绝对值特征就不太适合作为分类依据,在文献 [9]中对于绝对值特征和相对值特征的实验分析表明,绝对值特征不具有稳定性,采用绝对值特征分类识别率较低。因此,本研究采用了文献 [10]计算的相对值作为几何特征,其中主要包括:纵横轴比、形状因子、偏心率、矩形度、面积凹凸比、周长凹凸比,这些几何特征具有平移旋转和尺度不变性。

2.4 特征降维

由于分类特征过多,而同时特征子集可能具有较高的相关性,使得特征空间存在冗余变量,造成了特征计算和分类时间过长,并且会冗余特征会干扰分类精度,影响了分类的准确率和效率。所以,需要对特征进行维数约减,以达到最高的识别率。

该研究采用多类LDA来对由小波灰度共生矩阵特征和形状特征组成的特征集合进行降维,产生最优特征子集。

首先需要计算类内散布矩阵Sw和类间散布矩阵Sb,设一共有c类公式定义如下:

类内散布矩阵 (within-class scatter matrix)

其中μi是第i类样本的均值,Sw代表同一样本相聚的程度。式 (7)表示类内各个样本和所属类别之间的协方差矩阵之和,从总体上反映类内各个样本与类之间的离散度。

类间散布矩阵 (between-class scatter matrix)

其中μi是第i类样本的均值,μ是所有样本的均值,Ni是第i类样本的数目。该矩阵表示是该类与样本总体之间的关系,式 (8)表示各类样本与总体的协方差矩阵的总和,从宏观上反映了各类和总体之间的离散度。

为了使投影空间最具有可分性,需要满足Sb/Sw最大化。对Sb/Sw矩阵进行变换,求取特征值和特征向量,查找特征值中非零元素的下标和值,并进行排序。选取最大的l个特征值对应的特征向量作为列向量构成变换矩阵。

3 分类器

SVM分类器的主要思想是:建立一个最优决策超平面,使得该平面两侧距平面最近的两类样本之间的距离最大化,从而达到最好的分类效果[11]。

实验采用了台湾林智仁开发的libsvm软件进行实验,核函数选取径向基函数。由于支持向量机是为了解决两类问题设计的,因而对于多分类问题,需要将二类分类方法扩展到多类问题。在扩展算法中,由于One-against-One算法已经被证明是贝叶斯最优的,训练时间相对One-against-All算法较短,克服了后者每次必须处理全部样本以及样本不均衡的缺点,测试精度和训练精度都明显高于后者,适合于解决多类问题,所以分类器采用one-against-one算法。

4 实验分析

本研究选取了两组样本集对特征向量分类能力进行测试,一组是包含常见的23种植物的叶片,该样本集一共包含1363片叶子,其中819片被用来作为训练样本,其余的544片叶子作为测试样本,另一组包含了28种植物的叶片,一共包含1563片叶子,其中1001片作为训练样本,562片作为测试样本。

根据文献 [12]对于小波基函数选取的分析,我们采用了常见的db2,sym4,bior4.4进行比较,这些小波基函数具有正交性、双正交性、紧支性以及对称性 (近似对称性)。

首先需要对实验数据进行降维预处理,去除冗余数据,提高分类速度,该研究采用LDA降维方式对特征集合进行约减。

实验一:低频子带与低、高频子带特征分类能力比较1

该实验中,采用样本1进行分类测试,对比只采用低频子带统计的特征和采用全部子带统计的特征的分类精确率,并分别采用不同的小波基函数来排除干扰因素,实验结果如图3所示。

图3 样本1低频系数与全部系数识别率比较

实验表明,只采用低频子带信息的统计特征对图像进行分类的精确性明显低于采用低、高频子带统计特征,表明高频子带包含了部分分类信息。

实验二:低频子带与低、高频子带特征分类能力比较2

为了验证这一结论,实验二中采用样本2进行分类测试,实验结果如图4所示。

通过实验结果分析发现,实验二和实验一的结果是一致的,低频子带统计特征的分类能力相对较差。

实验一和实验二表明,与仅使用低频子带信息相比,通过引入灰度共生矩阵分别对不同频率子带进行统计的特征向量具有更强的分类能力。下面我们以sym4小波为例,结合形状特征和其它特征相比较,验证多尺度分析在纹理特征表示上的性能。

图4 样本2低频系数与全部系数识别率比较

实验三:不同特征分类性能比较1

该实验中,选取样本1进行分类测试,分别比较小波灰度共生矩阵特征、LBP特征以及Gabor滤波器特征的分类能力,测试结过见表1。

表1 不同特征的分类能力比较

实验表明,与LBP特征和Gabor小波特征相比,小波灰度共生矩阵在植物叶子图像上具有更好的纹理描述能力,分类性能最好。

实验四:不同特征分类性能比较2

该实验中,选取样本2进行分类测试,结果见表2。

表2 不同特征向量分类性能

实验表明,在不同的数据集下,该研究选用的方法识别率变化较小,仍然保持最高的识别率,分类性能优良,证明了多尺度分析在纹理分析上具有良好的特征表达能力。

实验五:不同分类器下特征向量的分类能力比较

该实验选取了概率神经网络 (probabilistic neural network,PNN)和K最近邻 (K nearest neighbor,KNN)分类器对比分析小波灰度共生矩阵统计特征和形状特征组成的混合特征的分类能力,对于KNN和PNN分类方法,首先对特征集合使用线性判别式分析降维,分别计算他们的识别率。

不同分类器的分类能力比较见表3。

表3 不同分类器的分类能力比较

实验结果表明,在不同的分类器下该特征集合仍然具有很好的分类能力,具有较强的健壮性。图5和图6显示了在不同特征维度下分类器的识别能力。

通过实验发现,当特征维度在15到20之间,识别率最为稳定,保持在90%以上。

研究表明,与LBP、Gabor滤波器等常见的纹理特征相比,在基于叶子纹理信息的植物种类分类应用中,将小波的多分辨分析与利用像素相对位置的空间信息的灰度共生矩阵结合起来的小波灰度共生矩阵能够有效地表达叶子图像信息,克服了仅利用低频信息造成的识别率较低的问题,同时具有较强的适应能力和鲁棒性。实验对比分析表明了小波灰度共生矩阵在植物分类应用中具有良好的性能,同时表明多尺度分析在纹理分析中具有很好的特征表达能力。

5 结束语

本文采用了小波灰度公式矩阵纹理特征作为主要特征,同时包括了具有旋转平移和尺度不变的形状特征组成特征集合,再经过降维处理之后组成优化的特征子集,并依此对植物种类进行分类,并通过实验证明了该方法在分类能力和健壮性方面的优良性能。同时对不同的小波和其它纹理特征进行了比较,证明了该方法具有更好的分类能力。在后续的工作中,将重点研究灰度共生矩阵统计特征,通过计算更少的特征实现更加准确的分类,提高特征集合的分类效率。

[1]WANG Lu,ZHANG Lei.Computer-aided plant species identification based on LVQ neural network [J].Journal of Jilin U-niversity(Science Edition),2007,45 (3):421-426 (in Chinese). [王路,张蕾.基于LVQ神经网络的植物种类识别[J].吉林大学学报 (理学版),2007,45 (3):421-426.]

[2]SU Jie,WANG Bingqin,GUO Li.Textural feature extraction and classification study research of digital image [J].Electronic Measurement Technology,2008,31 (5):52-55 (in Chinese).[苏杰,王丙勤,郭立.数字图像的纹理特征提取与分类研究 [J].电子测量技术,2008,31 (5):52-55]

[3]LONG Haixiang,GAO Xin.SVM classification of SAR images based on texture and internal edge [J].Application Research of Computers,2011,28 (9):3551-3553 (in Chinese). [龙海翔,高鑫.基于纹理和边缘的SAR图像SVM分类 [J].计算机应用研究,2011,28 (9):3551-3553.]

[4]ZHANG Lei.The research of computer-aided plant species identification based on leaf feature [D].Jilin:Northeast Normal University,2007(in Chinese).[张蕾.基于叶片特征的计算机自动植物种类识别研究 [D].吉林:东北师范大学,2007.]

[5]ZHANG Gang,MA Zongmin.An approach of using Gabor wavelets for texture feature extraction [J].Journal of Image and Graphics,2010,15 (2):247-254 (in Chinese). [张刚,马宗民.一种采用Gabor小波的纹理特征提取方法 [J].中国图形图像学报,2010,15 (2):247-254.]

[6]LIANG Peng,HE Junshi,LI Shaofa.Classification algorithm based on multi-scales LBP pyramid feature [J].Computer Engineering,2011,37 (8):166-168 (in Chinese). [梁鹏,何俊诗,黎绍发.基于多尺度LBP金字塔特征的分类算法 [J].计算机工程,2011,37 (8):166-168.]

[7]LIU Li,KUANG Gangyao.Overview of image textural feature extraction methods [J].Journal of Image and Graphics,2009,14 (4):622-635 (in Chinese).[刘丽,匡纲要.图像纹理特征提取方法综述 [J].中国图形图像学报,2009,14 (4):622-635.]

[8]Arivazhagan S,Ganesan L,Subash Kumar T G.Texture classification using riglet transform [J].Pattern Recognition Letters,2006,27 (16):1875-1883.

[9]HE Peng.Research of machine recognition for broad-leaved trees based on leaves’synthetic features [D].Xianyang:Northwest Agricultural and Forestry University,2008 (in Chinese). [贺鹏.基于叶片综合特征的阔叶树机器识别研究[D].咸阳:西北农林科技大学,2008.]

[10]WANG Xiaofeng,HUANG Deshuang,DU Jixiang,et al.Feature extraction and recognition for leaf images [J].Computer Engineering and Applications,2006,42 (3):190-193(in Chinese).[王晓峰,黄德双,杜吉祥,等.叶片图像特征提取与识别技术的研究 [J].计算机工程与应用,2006,42 (3):190-193.]

[11]XIE Fei,CHEN Leiting,QIU Hang.Research of image classification method based on texture feature extraction and system to achieve [J].Application Research of Computers,2009,26 (7):2767-2770 (in Chinese). [谢菲,陈雷霆,邱航.基于纹理特征提取的图像分类方法研究及系统实现[J].计算机应用研究,2009,26 (7):2767-2770.]

[12]ZHOU Haixia.Application research of wavelet transformation in image compression [D].Xi’an:Chang’an University,2008(in Chinese).[周海霞.小波变换在静态图像压缩中的应用 [D].西安:长安大学,2008.]

猜你喜欢

子带小波纹理
基于多小波变换和奇异值分解的声发射信号降噪方法
超高分辨率星载SAR系统多子带信号处理技术研究
一种基于奇偶判断WPT的多音干扰抑制方法*
构造Daubechies小波的一些注记
基于BM3D的复杂纹理区域图像去噪
子带编码在图像压缩编码中的应用
基于MATLAB的小波降噪研究
使用纹理叠加添加艺术画特效
高分辨率机载SAR多子带合成误差补偿方法
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断