多特征融合的纹理图像分类研究
2018-01-11龙力
龙力
摘要:为了提升纹理图像分类准确度,从图像单一特征出发,例如LBP特征、灰度共生矩阵特征、Gabor特征。首先对图像进行预处理,提取特征,运用机器学习方法进行分类,验证特征与分类器的有效性。再通过参数调整,最大程度上提高各方法在各特征基础上的准确率。单一特征包含图像某方面信息的侧重性,各特征有不同的关注点。为了克服特征的局限性,增加分类特征包含图像信息的全面性,提出一种特征融合的方法。在提取的纹理图像单一特征基础上,给各个特征设置相应权重,进行融合再分类。在brodatz纹理库图像上进行实验,得到由融合机制进行分类的准确度优于单一特征分类的结果。
关键词:纹理图像;特征提取;图像分类;特征融合
中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2017)11-0109-04
面对爆炸式增长的海量图像数据,急需寻找一种方法,使计算机能够自动识别,分析,理解图像,满足检索图像的需求。而图像分类技术便是解决这个问题的一个重要方法,能够自动识别图像的内容,构建出与人类视觉系统相似的图像信息表达。纹理图像分类即根据图像信息中的特征,将不同纹理区域予以分开,提取感兴趣区域的一种图像处理方法,一直是科研人员研究的核心问题。纹理图像分类主要包括三个步骤:预处理、特征提取、分类方法的选择。预处理是为了消除无关因素的影响,例如噪声、冗余信息等。特征提取是分类的重要环节,优秀的特征需要具有良好的鲁棒性,稳定性和泛化能力,分类方法则一般采用有监督的学习方法。
由于各种特征关注点的局限性,虽然运用单一特征进行分类,能取得较好的效果。但考虑到图像特征的多样性,能否从特征组合上提高分类的准确度是一个值得研究的问题。因此本文提出了一种特征融合策略,即在单个特征基础上对其进行加权组合,使得融合生成的特征向量在构成上以主要特征为核心,增加新的元素,去对纹理图像进行分类。在brodatz纹理库图像上进行实验,验证策略有效性。
1 纹理图像特征提取方法
1.1 局部二值模式
局部二值模式是一种常用的基于直方图的纹理分析方法,其关注点为图像局部特征,是对图像局部区域内像素灰度值与中心像素灰度值关系的反映,将不同的局部区域直方图作为描述图像的特征。LBP算子最早是定义在3×3的窗口内,以窗口中心像素灰度值为阈值,将相邻的8个像素的灰度值与其进行比较,若大于,则该邻点位置记为1,否则为0,如此以来便可产生8个二进制数,将其转化为十进制就是描述该局部区的LBP值。
LBP算子的数学表达式:
2 特征向量提取算法步骤
2.1 LBP特征向量提取
(1)确定半径与取样点数,对于每个像素,以该像素为中心,在半径为R的邻域均匀选择N个点,如该点恰好落在某像素,取该像素值为该点取值,否则以线性插值的方法作为该点值。(2)将取样点分别与中心元素作比较,若大于中心元素,记为1,否则为0。所有取样点经过比较,会得到一个N位二进制数,将其转为十进制数,得到LBP值。(3)将得到的窗口中心像素点的LBP值赋给该中心点,作为该中心点的像素值。(4)统计邻域灰度直方图,形成256维的特征向量。
3 实验结果与分析
3.1 实验图像与特征组合分析
实验图像来源于两部分,一部分为其他文献所采用的brodatz纹理图像库中典型纹理图像,另一部分从brodatz紋理图像库随机选择两种图像进行合并。
实验一共采用9张图像,如图2所示。
首先对图像进行预处理,即对图像进行灰度化处理,并对边缘进行填充,可以采用0像素(黑色像素)或反射像素(图像内部像素对称翻转)进行填充。之后随机从两类图像中选取1000个像素点,以该像素为中心,选取9×9的邻域进行特征提取,作为训练样本,另取5000个像素点,作为测试集。将训练样本与测试样本进行归一化,如公式(4)所示:
3.2 单个特征对纹理图像分类的作用
模型训练方法分别选用K近邻算法(KNN)和支持向量机(SVM)。由于参数的选择与准确率相关性较大,因此进行网格搜索参数,每隔一定距离选取一个参数进行训练,计算测试集准确率,选取令测试集准确率最高的参数最为最终选取参数。分类模型构造完成,对待分类图像进行预处理之后开始进行预测。依次对其像素进行遍历,以每个像素为中心,选取9×9的邻域,提取特征进行预测。图3所示分别为三种特征进行预测的待分类图像,其中样本为图2(5)。
实验图像在三种基础特征上,测试集上的准确率结果见表2。
图4直观的反应了各个特征准确率情况。
从图4可以看出:
(1)整体上,SVM分类方法图较KNN方法相比,准确率较高。SVM有一个训练过程,先在训练样本上训练一个模型,产生最优分类平面,再对样本进行预测,考虑了训练样本的概率分布情况。而KNN方法沒有训练过程,只根据训练数据与待分类数据之间的距离度量来进行分类,若训练样本特征维度较高,KNN效果较差,波动也较大。(2)在三种特征中,GLCM特征与Gabor特征较LBP特征相比,效果较好。LBP特征是通过像素与其相邻像素进行比较,以直方图的形式表现的图像特征。而图像直方图则需要较多的像素点才能体现图像包含的信息,因此邻域较小的情况下,其准确率较低。(3)Gabor特征是在不同频率与幅值变换上得到的局部图像像素均值,而纹理特征,通常与频率有关,因此Gabor特征较适合于纹理表示与判别,准确率较高。GLCM特征是计算灰度共生矩阵包含的信息所得出的,能反映出图象灰度关于方向、相邻间隔、变化幅度的综合信息,对于较小的邻域,其包含的信息较多,也能取得较好的效果。(4)对图像像素进行分类时,若邻域选择较小,则GLCM与Gabor特征较LBP表现好。endprint
3.3 多特征加權组合分析结果
在特征融合时,为了消除各特征之间的量纲影响,首先对三个不同的特征向量进行归一化,归一化的方法采用公式(4),使所有特征取值范围都处于之间。
图像在进行分类时,各个特征包含图像的信息有不同的侧重点,在进行融合时,进行权重设置,分别使LBP:GLCM:Gabor比例依次为1:1:8、1:8:1、8:1:1和1:1:1。得到的实验结果如表3所示。
图5为各种权重比例下融合特征准确率,其结果用虚线表示。
可以看出,在对特征设置不同权重进行融合后,一些权重情况下,融合特征分类准确率比单一特征高。特征融合存在一个权重的关键点,不同的权重对准确率有不同的影响,另外分类方法也影响这特征融合的准确率。图像的不同特征都包含着不同的信息,对特征进行加权组合,伴随着信息的损失与增加。不同的特征也具有不同的侧重点。对于图2(1)、2(4)、2(6),图像明暗变化突出,纹理方向也明显不同,若提高GLCM特征所占权重,并加入一些与GLCM包含不同信息的特征,必将提高其准确率。对于图2(7)、2(8)、2(9),图像成团状分布,将其在不同的频率下进行Gabor变换,得到图像能量能有较好的区分度。剩下的三种图像,LBP特征效果较好,提高其权重势必也能提高其分类效果,但这也与分类方法有关。
对于KNN分类方法,当将LBP:GLCM:Gabor = 8:1:1时,此时分类准确率极大的降低,原因在于LBP特征维度较高,而KNN属于距离度量分类器,当对三种特征设定权值进行融合,若LBP特征向量中非零元素较多,与权重相乘后,极大减小了LBP特征的距离信息,而增加的信息较小,产生了距离错乱的问题。相反,将其他两种特征作为主要特征时,其附加的信息对最终分类起到了积极作用。而SVM方法,特征融合之后准确率都维持在较高水平,其考虑到主要特征的同时,改变最优分类平面去适应新增加的特征分量。
因此在进行纹理图像分类时,当单一特征分类效果并不是很理想时,可以对图像不同特征设置相应权重进行融合。图像的不同特征包含着图像的不同信息,有不同的侧重点。融合意味着新信息的加入,设定相应的权值,使融合特征在保持主要特征的基础上加入新的元素,再结合恰当的分类方法,准确率将会提升。
4 结论与展望
纹理图像分类中,一般都是提取单一特征进行分类。本文在单个特征进行图像分类的基础上,研究特征组合在不同机器学习分类方法上对图像分类准确度的影响。通过对不同的特征设置权重,按照主次进行融合,在一些权重比例组合下,得到的准确率高于以往用单一特征进行分类的准确率。不同特征有不同关注点,融合增加了图像的信息表达。分类器的选择同样重要,若主要特征维度较高,此时应当选择鲁棒性强的分类器,否则新向量的并入反而会降低准确率。本文只选取了三种典型图像特征,数量有待增加,另外对于分类方法的组合方式,权重设置更加多样化,邻域大小的确定这也是进一步研究的方向。
参考文献
[1]Haralick R M, Shanmugam K, Dinstein I. Textural features for image classification[J]. Systems Man & Cybernetics IEEE Transactions on, 1973,smc-3(6): 610-621.
[2]Lu D, Weng Q. A survey of image classification methods and techniques for improving classification performance[J]. Taylor & Francis, Inc. 2007.
[3]Vega-Rodriguez M A. Review: feature extraction and image processing[J]. Computer Journal, 2004, 44(2): 595-599.
[4]Lin Y, Lv F, Zhu S, et al. Large-scale image classification: fast feature extraction and SVM training. IEEE Conference on computer Vision and Pattern Recognition[J]. IEEE Computer Society, 2011: 1689-1696.
[5]陈荣,曹永锋,孙洪.基于主动学习和半监督学习的多类图图像分类[J].自动化学,2011,37(8):954-962.
[6]Wang G D, Zhang P L, Ren G Q, et al. Texture feature extraction method fused with LBP and GLCM[J]. Computer Engineering,2012,38(11): 199-201.
[7]Ojala T, Harwood I. A Comparative Study of texture measures with classification based on feature distributions[J]. Pattern Recognition, 1996,29(1): 51-59.
[8]Feichtinger H G, Luef F. Gabor Analysis and Algorithms[J]. Applied & Numerical Harmonic Analysis, 1998,1: 123-170.
Abstract:In order to improve the classification accuracy of texture images, based on the single feature of images, such as lbp, gray co-occurrence matrix and gabor feature. Firstly, images are preprocessed, then features are extracted and texture images are classified by machine learning method, at last verify the validity of the features and classifiers. Through adjusting parameters, improve the accuracy in the maximum extent by each method on each feature. The Single feature contains particular information of image, which has different concerns from others. A strategy based on Multi-feature Fusion is proposed, which overcome the limitations of features and increase the comprehensiveness in images information of the features used on classification. On the basis of extracting the single feature of texture images, the corresponding weights are set for each feature, and then images are classified by fusion feature. Experiments are conducted on the Brodatz texture image. The experimental results show the classification accuracy by feature fusion is better than results on single feature.
Key Words:texture images; features extraction; images Classification; feature fusionendprint