LBP—自适应增强模型的木材纹理分类

2015-07-22向东陈宇陈广胜

哈尔滨理工大学学报 2015年2期

向+东++陈+宇++陈广胜

摘要：针对传统木材纹理分类的准确率低且难度大的问题，依据LBP（局部二值）算子和AD-ABOOST（自适应增强）算法理论，提出了LBP-ADABOOST模型对木材纹理进行识别分类，通过均匀旋转不变特性与原始LBP算子相融合，提取纹理的特征值，结合自适应增强算法，从而训练得到每类纹理所对应的分类器模型参数，构造分类器，实现对木材纹理准确高效分类，实验结果表明相比于BP神经网络，SVM支持向量机等分类算法，该模型的实验结果误差率为4%左右，准确率高，实用性强，

关键词：木材纹理分类；LBP算子；ADABOOST算法；分类器

DOI：IO.15938/j.jhust.2015.02.011

中图分类号：TP391.4

文献标志码：A

文章编号：1007-2683（2015）02-0057-06

0 引言

木材纹理分类是木材优化利用过程的重要部分，木材纹理结构精细复杂、无规律的天然属性，使得纹理分类一直是木材学的前沿课题.针对不同的研究，国内外学者提出了不同的特征提取及纹理分类算法，非负矩阵分解，灰度共生矩阵法，马尔可夫随机场，尺度不变特征变换法等存特征提取方面取得了一定的突破，而常用的分类算法有BP神经网络，SVM支持向量机，决策树，极限学习机等.大多纹理分类模型基于以上算法的结合，且取得了一定的成果，此外，我国对于木材纹理分类的研究起步较晚，初期主要是对国外的经验总结，优化传统的分类算法，现阶段我国的纹理分类技术发展较好，但也存在一定缺陷，主要由于实际应用的训练样本在个体之间存在着差异，导致分类算法对分类结果的差异性较大.如何提高木材纹理分类的准确性至关重要，也将是本文的重点.

近些年，一种简单高效的纹理特征分析方法——局部二值模式（logical binary pattern，LBP）成为了众多学者研究的对象，在描述、提取局部纹理特征方面取得了很好的效果.此外，Adaboost自适应增强算法是通过训练样本特征得到弱分类器，对弱分类器的线性组合得到最终的强分类器，进行分类学习，其在机器学习和数据挖掘方面应用较广.基于以上表述，本文采用LBP与ADABOOST的融合尝试进行木材纹理分类，且这种分类算法在木材纹理分类方面应用极少.经实验，本文提出的基于LBP-ADABOOST模型的木材纹理分类算法达到预期目的，并且正确率明显高于BP神经网络，SVM支持向量机，不失为木材纹理分类提供一种有效方法.

1 特征提取

局部二值模式（logical binary pattern，LBP）最早是由Ojala等在1996年提出，是一种描述图像局部纹理特征的算子，原始的LBP算子定义为在3×3的窗体内，以窗体中心像素为阈值，与相邻的8个像素的灰度值比较，若周围像素值大于中心像素值，则该像素点的位置被标记为1，反之为0.这样，3×3领域内的8个点可产生8bit的无符号数，即得到该窗体的LBP值，并用这个值来反映该区域的纹理信息，如图l所示：

随着LBP算子在图像中的应用，扩展定义一个半径为R（R>O）的圆形邻域，B（B>O）个邻域像素点均匀分布在圆周上面.设定该邻域中心像素值是C，则C可用该邻域内的B+1个像素的函数来定义，即其中：gc为中心像素值；g0，g1，gb-1为B个邻域像素值.中心像素的坐标是（Xc，Yc），则其邻域坐标（Xi，Yi）为：

当坐标（Xi，Yi）不在中心，通过双线性内插法，将邻域的像素值减去中心的像素值计算得到局部的纹理特征像素值C：

假定在实际情况中中心像素值与邻域像素值的差值g0-gc，gb-1-gc独立于gc，则（3）可表示为：

由于c（g。）代表的是中心点的像素值，与图像的局部纹理特征无必然联系，故可以忽略不计，得到：

上式（5）中的像素差值描述了每个纹理模式，若纹理不受像素值单调变化，只须考虑差值符号即可：

由此可以得到一个B为二进制数，乘以相应的权重2i求和得到LBP特征值：

原始LBP算子是灰度不变的，但不是旋转不变的，图像经过旋转后可得到不同的LBP值.为了便于描述图像信息，针对图像旋转之后还可以得到相同的LBP值，Maenpaa等人提出具有旋转不变的LBP算子（rotation invariant LBP），不断旋转圆形邻域得到LBP值，取其最小的作为邻域的LBP值，表述如下式：其中ROI（x，i）是旋转函数，表示将x的二进制数按位循环右移i次，

但随着邻域采点集数的增加，二进制模式的种类急剧增加，达到2B个，这种数量无论是对纹理特征的提取，纹理的分类都是不利的.针对二进制模式的降维问题，Ojala提出一种均匀模式（uniform pat-tern）.均匀模式即根据编码模式出现频率的高低，在圆形二进制编码中，至多有两个0到1或1到0的变化，表示如下：

上式的结果满足U≤2的模式时称为均匀模式，用LBP表示，通过改进，二进制的模式减少，且不会丢失信息，使得原来2B种减少到B（B-1）+2种，降低了特征矩阵的维数.

基于以上两种性质的优越性，可以将LBP的旋转不变性与均匀模式结合得到更好的效果，称为旋转不变均匀模式用符号LBPriu2表示，定义如下：其中：U（LBPb，r）的计算方法是（10）的表述，该模式下不仪保留了图像的纹理特征，而且邻域二进制编码的种类降到了B+2种，大幅减少了特征总量，本文采用了旋转不变均匀模式LBP算子提取特征值，并对比了几种模式下不同分布情况，如图2所示.可以看出LBP算子在均匀旋转不变模式下的特征维数相对较少，同时保留了图像信息，效果最佳，

2 算法原理

1995年SChapire和Freund提出的Adaboost算法，相对于Boosting算法，其自适应在于：前一个分类器分错的样本会被用来训练下一个分类器.Asaboost算法训练弱分类器的错误率相对较大，但是只要它的分类效果比随机猜测效果要好即可接受，通过对弱分类器的线性组合得到最终的强分类器.同时，Adaboost算法也是一种迭代算法，它允许在每一轮的训练中加入一个新的弱分类器，直到达到某个预定足够小的错误率.每次训练样本都被赋予一个权重，表明它被某个分类器选人训练集的概率，如果某个样本特征已经被准确的分类，那么存构造下一个分类器的时候，它再次被选人训练集的概率会被降低；相反，若没有准确的分类，那么他的权重就会得到提高，选人下一个分类器训练集的慨率增大.通过上述迭代过程，Adaboost算法主要将聚焦那些较“困难”的分类样本上面.