基于PCA特征融合与LDA分类的实木地板纹理判别方法
2014-04-29张怡卓谭菲
张怡卓 谭菲
摘要纹理一致性影响着实木地板档次,针对目前实木地板纹理分类速度慢、精度低的问题,提出一种适合区分直纹、抛物纹、乱纹3类纹理的在线检测方法。方法首先对纹理图像进行缩小,运用视觉心理学的Tamura方法提取粗糙度、对比度、方向度、线性度、规整度、粗略度等6个纹理特征;同时在原图像提取反映图像全局信息的灰度均值、方差、熵等3个统计量;然后,运用主成分分析法(PCA)对3类纹理9个特征进行降维融合操作;最后,采用线性判别分析方法(LDA)构建3类纹理的辨识模型。采用200幅实木地板纹理图像进行实验,当主成分个数为7时,分类正确率稳定达到85%,较传统Tamura方法的83%和全局基本统计量的70%有所提高;特征提取时间为0.554 8 s,比缩小前图像的Tamura特征提取时间55.700 0 s明显减低,而分类正确率没有明显变化。
关键词实木地板;纹理分类;主成分分析;线性分类器;Tamura特征
中图分类号S789文献标识码A文章编号0517-6611(2014)01-00141-03
基金项目林业公益项目(201304510);黑龙江省留学归国基金(LC2011C24);黑龙江省教育厅科学技术研究项目(12523020)。
作者简介张怡卓(1978-),男,湖北乐亭人,副教授,博士,从事模式识别与智能控制研究,Email:nefuzyz@163.com。
收稿日期20131210建筑、家具等行业对实木板材的宏观美学与质量的要求越来越高,木材纹理是反映实木板材宏观美学与质量的一个重要因素。实木地板作为实木板材的一种,纹理是实木地板的一个重要表面属性,是实木地板分选的一个重要指标,所以对实木地板表面纹理分类研究具有重要意义。
木材纹理难以描述,但木材纹理分类得到了国内外专家学者的关注,20世纪80年代开始日本京都大学的增田捻博士对木材的平行、涡滑、放射状条纹等进行了考察和研究,开创了木材纹理研究的先河[1-2]。白雪冰等[3]用灰度共生矩阵对木材纹理分类,证明了用灰度共生矩阵对木材表面纹理分类是可行的,王克奇等[4]应用人工神经网络对采用马尔可夫随机场计算特征的木板表面纹理进行离线分离,具有较高的分类准确率。以上研究多是在离线条件下进行的,目前对在线条件下的木材表面纹理研究较少。设计适应在线条件下的算法时,可在缩小的实木地板纹理图像上,使用Tamura方法提取直纹、抛物线纹、乱纹3类实木板材纹理特征[5], 计算原512×512图像基本统计量特征;运用主成分分析法(PCA)对3类纹理的2类特征进行融合;最后构建线性判别分析方法(LDA)分类器对融合后的特征选取与分类,以选取的7个特征量为输入,以实木地板纹理类型为输出进行在线分选研究。
1纹理描述方法
实木地板纹理作为一种特殊纹的纹理,具有纹理的普遍特性。纹理描述方法有四大类:模型法、结构法、频谱法、统计法。模型法主要通过模型系数来标识纹理特征,模型系数求解难度大;结构法通过描述纹理基元来提取特征,由于木材纹理没有明显的纹理基元,所以结构法并不适用[6];频谱法多用于标准或规则纹理图像,木材纹理图像背景复杂且某一纹理区域内的像素并非处处相似,频谱法并不适用;统计法虽然计算复杂度大、耗时,且与人类视觉模型脱节及缺少对全局信息的利用,难以对纹理不同尺度间像素的遗传或依赖关系描述,但方法简单,容易实现[7]。
Tamura等[8]人提出基于视觉心理学的纹理特征提取方法,即提取粗糙度、对比度、方向度、线性度、规整度、粗略度6个特征描述纹理,克服了基于统计的纹理特征与人类视觉模型脱节的缺点;不足之处是在一定程度上利用了纹理图像全局信息,而且特征提取耗时。在图像特征统计量中,描述纹理的3个基本统计量是灰度均值、方差、熵[9]。这3个特征虽然都是描述纹理全局信息的特征,但不能描述像素间关系。如果将2种方法融合后,可能会优劣互补,更好地描述纹理特征,提高分类准确率。
2 特征提取与特征融合
2.1Tamura纹理特征 Tamura等[8]人从视觉心理学的研究出发,提取6个纹理特征量,分别为粗糙度、对比度、方向度、线性度、规整度、粗略度。这些特征在纹理合成、图像识别中具有很好的应用价值。
2.1.1粗糙度。纹理基元尺寸越大或基元重复次数越小会让人感觉越粗糙。计算如下:
2.1.2对比度。对比度是通过对像素灰度值分布情况的统计得到的。由a4=μ4/σ4来定义,μ4是4次矩,σ2是方差。对比度计算如下式:
2.1.3方向度。方向度是图像的重要特征。有些纹理图像无明显方向性,而有些纹理图像具有较明显的方向性。Tamura用方向度来衡量图像有无明显方向性。计算每个像素点处的梯度向量,该向量的模和方向的计算如公式(5):
2.1.4线性度。线性度计算如下:
其中,PDd是n×n局部方向共生矩阵的距离点。
2.1.5规整度。图像的纹理特征是不规律的,所以采用分区子图像并计算每个子图像的方差。在这里综合分区子图像的4个特性来衡量纹理的规整度。
2.1.6粗略度。Tamura等人根据人类对纹理的视觉感知的心理学的研究,对粗略度定义如下:
2.2图像基本统计量 基本统计量被用于描述纹理图像所含信息量多少,能有效地描述纹理全局特征,其常用的3个特征分别是图像的熵、灰度平均值、灰度方差。
33类纹理LDA分类过程
LDA就是从高维实木地板纹理特征空间里提取出最具有判别能力的低维特征,充分利用训练样本的类别信息。使样本的类间离散度最大和类内离散度最小,即类内离散度矩阵的中的数值要小,而类间离散度矩阵中的数值要大,这可由fisher判别准则判别。
3.2求投影矢量 应用fisher判别准则JF(w)=wTSbwwTSww求取JF(w)取极大值时的投影方向矢量w,此时满足广义特征方程Sbw=λSww。
3.3投影决策分类 将实木地板纹理特征在“3.2”所求投影方向投影矢量上投影便可将高维特征变成一维特征,再由训练样本训练得到阈值,实现决策分类。对3类实木地板纹理分类时,首先对直纹和抛物线纹分类,用直纹与抛物纹分类所识别出的抛物纹样本为训练样本与乱纹训练样本训练来对乱纹分类。分类过程如图1。
在双排LED平行光下,使用Oscar F810C IRF摄像头获取实验图像,在32位PC机中matlabR2008a平台下进行实验,其中PC机处理器为酷睿2双核,主频2.2 GHz。3类实木地板纹理:直纹、抛物线纹、乱纹如图2。实验图像均为512×512像素,90幅纹理图像作为训练样本,其中30幅直纹图像、30幅抛物线纹图像、30幅乱纹图像。以下实验均使用200幅纹理图像作为测试样本,其中70幅直纹图像、60幅抛物线纹图像、70幅乱纹图像。首先,对缩小成65×65像素的灰度图像提取Tamura方法中的6个纹理特征;在原图像上提取能表征图像全局信息的灰度均值、方差、熵3个基本统计量;然后对2类特征用主成分分析法重组融合,采用LDA图23类木材纹理(a.直纹;b.抛物线纹;c.乱纹)分类器分类识别。
4.1基于LDA主成分优选结果与分析对3类实木地板纹理特征融合采用主成分分析法,选择主成分时,主成分所占的信息量直接影响分类结果能否达到在线分选要求,主成分个数没有固定,可以用分类准确率来选择主成分个数。
4.2 训练样本数优选结果与分类 为了找出7个主成分下适合LDA分类器分类的训练样本数,验证训练样本是否合理,将训练样本数逐渐改变进行分类实验,每次实验的各类木材纹理训练样本数均相等。实验结果如图3、4所示。