APP下载

基于I-BGLAM纹理和光谱融合的高光谱显微成像木材树种分类

2021-02-03韩金城王承琨

光谱学与光谱分析 2021年2期
关键词:木材正确率纹理

赵 鹏,韩金城,王承琨

1.东北林业大学信息与计算机工程学院,黑龙江省 哈尔滨市 150040 2.广西科技大学计算机科学与通信工程学院,广西 柳州 545006

引 言

在人们的日常生活中实木木材的应用十分广泛,因此木材具有巨大的利用价值。每种木材的强度、密度和耐用性都不相同,这就导致木材的价格也各不相同,那么正确的区分出不同种类的木材就具有非常重要的意义。在计算机领域中实现树种归类的方法主要有两种:木材微观细胞结构分类和木材表面的宏观特性分类。微观细胞结构识别技术是通过显微镜得到木材的细胞结构图像,然后对得到的图像进行识别分类。任洪娥[1]等提出了三种对木材细胞图像的轮廓提取方法,提取出的细胞特征参数可用于木材树种识别,但是这种技术需要对木材进行切片,使得实验过程比较复杂。宏观特征识别技术是通过木材的纹理、颜色和光谱等特征来识别。Mäenpää[2]等在识别分类木材表面缺陷时使用了颜色特征和纹理特征融合的方法。单纯使用颜色特征也是有一定缺点的如木材表面颜色不均匀或不同木材树种间颜色相似,这就对识别造成了困难。王辉[3]等建立了一种木材纹理和颜色结合的模型用来分类,提取了木材图像的颜色矩和纹理特征并将两者融合用于分类,得到了较高的分类精度,特征融合的方法也为木材树种分类提供了可行的思路。纹理特征提取的传统方法是使用灰度共生矩阵(gray level co-occurrence matrix,GLCM)及其统计量来表示的。白雪冰[4]等使用GLCM提取木材表面的纹理来实现木材缺陷的检测。在我们的实验过程中使用GLCM来提取木材表面纹理特征时发现分类结果并不理想,原因是因为我们的木材宏观解剖图像纹理分布不均匀而且没有很强的纹理,因此,面对弱纹理的图像找到一种强纹理提取器是十分重要的。Qin[5-6]等从GLCM中衍生出了灰度光环矩阵(gray level aura matrix,GLAM)和基本灰度光环矩阵(basic gray level aura matrix,BGLAM)用来提取图像的纹理特征,但是这两种方法只是应用于标准纹理数据库的图像分割和图像合成方面,并没有使用到木材树种识别领域。在此基础上,Zamri[7]等提出了改进的基本灰度光环矩阵(improved-basic gray level aura matrix,I-BGLAM)来提取木材的纹理特征从而实现木材树种的分类,得到了较好的分类效果。

利用光谱特征来实现木材树种分类的方法主要是使用光谱仪采集木材在不同波段的光谱值来进行识别分类的。Ramalho[8]等利用近红外光谱技术以巴西的热带树木为研究对象做了对天然林和人工林的木材样本的区分工作,实验得到的识别准确率较高,表明在进行天然林和人工林的木材样本分类是可行的。郝勇[9]等利用近红外光谱实现了对木材种类的快速、准确的识别,实验中采用了5种方法对光谱进行预处理,这一处理提高了识别精度。Silvana Nisgoski[10]等以6种树种为研究对象,采集了木材表面的近红外光谱,然后使用了二阶导数对全光谱做预处理,把PCA-LDA作为分类方法,实现了对木材树种的快速分类。

高光谱图像包括空间维和光谱维。因此,高光谱图像不仅可以提供对象的纹理信息,还可以提供对象表面的光谱信息。高光谱图像主要被应用于卫星遥感领域,但随着高光谱技术的发展现在也可以应用到样本组织成分检测领域中。例如,Hycza[11]等以波兰东北部森林林分为研究对象,利用AISA(airborne imaging spectrometer for application)拍摄高光谱图像,使用九种分类算法对七种树种进行分类,最后得到了90.3%的正确率,说明丛林的高光谱图像可以实现对森林中的树种精确归类。孙俊[12]等对图像采集系统操作得到特征波长光谱、图像信息和照片信息,并相应地将其与氮值作为相关模型进行识别,实验结果良好,说明高光谱技术可以为作物含氮的快速、无损检测提供标准。Zhao[13]等提出了一种基于木材高光谱图像的硬木树种的识别方法,该方法以木材的高光谱图像为研究对象,获得了样本管孔的外围和中心的光谱特征作为分类的基础,实现了木材树种的分类。

综上所述,为了实现木材树种的精确分类我们可以单独选择提取木材表面的纹理特征作为分类的依据,当然也可以单独利用光谱技术获得木材的光谱特征作为分类依据,但是单独使用某一种特征进行分类并不能得到最高的分类正确率,为了能够提高木材树种的分类精度,我们将纹理和光谱融合送进分类器中进行分类。

本文针对8个木材树种的高光谱图像,利用I-BGLAM提取其空间维的纹理特征以及利用S-G[14]平滑的方法得到光谱特征,然后将上述两种特征融合后送入极限学习机(extreme learning machine,ELM)[15]中进行分类,该方法提高了木材树种的分类精度。

1 数据来源

实验使用了8种纹理清晰的木材作为研究对象,木材的详细资料如表1所示。图像采集的具体流程如下:首先,将这8种木材用圆盘锯切割成2 cm×2 cm×3 cm的小木块,这里值得注意的是切割时要保证木块的横截面处平滑无毛刺。然后,利用显微高光谱成像系统采集木块的高光谱图像。每类木材拍摄60幅高光谱图像,总共得到480幅高光谱图像作为研究样本。其中每类木材随机选取48个样本作为训练集,其他的12个样本作为测试集。这些木材样本均来自不同的树木。这里值得注意的是样本全部取自木材的横截面图像,这是因为木材横截面图像中包含的特征多,木材的弦、径切面的特征相对较少,不利于木材的分类识别,因此,在木材树种识别领域大多是对木材的横截面图像进行研究。

表1 样本木材的详细资料Table 1 Details of the sample wood

接下来是对该高光谱系统及图像采集的描述:该系统是美国SOC公司生产的SOC710VP高光谱成像仪,光谱分辨率为5.2 nm,光谱范围为372.53~1 038.57 nm,共计128个波段。拍摄到的显微高光谱图像尺寸大小为200×200×128,显微镜放大的倍数为45倍。图1是采集到的样本横截面的二维灰度图像。

图1 8种样本木材的二维灰度图像(a):美国红橡;(b):印尼菠萝格;(c):非洲卡斯拉;(d):红花梨;(e):南美柚木;(f):水煮柚;(g):桦木;(h):香樟木Fig.1 Two-dimensional grayscale images of eight sample woods(a):Red oak;(b):Merbau;(c):Talisai;(d):African padauk;(e):Basralocus;(f):Teak;(g):Silky oak;(h):Medang

在使用该便携式高光谱成像仪采集图像时应该保持外界环境例如温度、湿度及样本保存时间等因素尽量恒定,尽量保证每个样本的颜色保持不变,否则,可能会使得可见光波段的光谱图像发生变化,影响后续的特征提取和分类识别精度。

2 研究方法

2.1 图像预处理

在本文的实验中所需要研究的对象是基于二维灰度图像的,而高光谱图像属于高维图像不能直接使用,因此需要对其进行预处理操作。预处理分为两步,第一步是对图像进行降维,这里使用的降维方法是OIF(optimum index factor)[16]。第二步是对降维后的图像进行融合,这里使用的图像融合是NSCT(nonsub sampled contourlet transform)[17]。

下面介绍基于OIF的波段选择方法,OIF主要是将第i个波段的标准差Si和i,j波段之间的相关系数Rij结合起来进行最优波段的选择,如式(1)所示。

(1)

(2)

(3)

(4)

对高频子带使用模值取大的方法求出H′,其中i=1,2,…,m。

(5)

最后根据新的低频分量和新的高频分量利用NSCT逆变换,得到融合后的图像I′。图2给出了图像预处理的流程图。

图2 图像预处理(a):特征波段选择;(b):图像融合Fig.2 Image preprocessing(a):Feature band selection;(b):Image fusion

2.2 基于I-BGLAM纹理特征提取

接下来我们使用I-BGLAM[7]的方法来提取二维灰度图片的纹理特征。该方法本质上是对GLCM的一种改进,其具体步骤如下:首先需要压缩灰度图像的像素值,将一幅图像的灰度级压缩到16个级别即得到的特征向量长为136维,可得到最好的分类效果,具体按式(6)进行处理。其中F(x,y)代表类型为uint8的灰度图像,floor代表向下取整,F′(x,y)为像素值最大为15的灰度图像,图3中给出了降低后的结果。从图3中可以看出即使将灰度值进行压缩依然可以清晰的表示出图像的纹理信息。

图3 像素值压缩结果(a):原始图像;(b):压缩后的图像Fig.3 Pixel value compression results(a):The original image;(b):Compressed image

(6)

接下来按照式(7)的方法计算特征矩阵B,设灰度图像为F(i,j)(i∈{2,3,…,M-1},j∈{2,3,…,N-1}),M与N分别代表灰度图像的长与宽。为防止B的角标无意义,在计算之前需要将F(i,j)的每一个像素值加1避免0的出现,即F(i,j)∈{1,2,…,16}。通过式(7)计算的矩阵B是一个尺寸为16×16的方阵。

(7)

然后将方阵B按式(8)进行计算,这样做的目的在于减少特征向量的维度。

(8)

最后将方阵B′按式(9)进行转换,∪+代表元素串联。转换后的向量x即为特征向量,其长度为136。图4给出了8个树种提取的该特征值,该方法主要应用于普通木材树种的分类识别。

图4 I-BGLAM特征值曲线Fig.4 I-BGLAM characteristic curve

x=∪+B′(i,j)(i∈{1,2,…,16};j∈{i,i+1,…,16})

(9)

2.3 基于光谱特征提取及纹理特征和光谱特征融合

原始光谱图像有128个波段(372.53~1 038.57 nm),图5所示的就是实验中用到的8个木材样本的平均光谱曲线。从曲线走势中可以得出,这8种木材的曲线有明显的可分性,但是在某些波段处也存有一些噪声,因此,为了进一步提高光谱曲线的可分性我们需要对原始光谱数据做平滑处理。

图5 8种木材样本的平均光谱曲线Fig.5 Average spectral curves of 8 wood samples

具体的提取光谱特征的方法如下:假设每幅高光谱图像是N×N×P的三维张量,其中N×N是空间维,是光谱维,首先,将这个三维张量沿着第三维展开得到(N*N)×P表示每个波段对应N*N个像素点,然后对这些像素的值求平均得到1×P的向量,称之为平均光谱,最后,对平均光谱进行S-G平滑处理,得到光谱特征。由于S-G平滑方法比较成熟,这里不对原理进行赘述。本实验中的高光谱数据是200×200×128的三维张量,200×200是每个波段对应的二维图片的大小,即一个波段对应40 000个像素点,每个像素点对应一个光谱值,然后对这些数值取平均则作为该波段的平均光谱特征,这样就得到了1×128的向量作为该高光谱图像的平均光谱。

y=(μ1y1,μ1y2,…,μ1yd1,…,μ2yd2,…,μMdM)T

(10)

其中μk是第k种特征对应的权重。将y送进ELM中就可以得到分类结果。

在本实验中就有两类特征:纹理特征(136维)和光谱特征(128维),即d1=136,d2=128,在融合时设置权重μ1=0.5,μ2=0.5。

至此,本实验所用的全部方法介绍完毕,整个实验的流程图参见图6。

图6 实验过程的流程图Fig.6 Flow chart of the experimental process

3 结果与讨论

3.1 识别正确率分析

实验包括单独使用I-BGLAM提取的纹理特征分类、单独使用光谱维特征分类以及本文提出的使用融合特征分类,本实验使用的分类器为ELM,表2是实验5次的分类结果。

从表2的结果可以看出单独使用I-BGLAM纹理或者单独使用光谱维特征进行分类时,5次中最高的精度分别是88.54%和92.71%,而使用了本文提出的融合方法进行精度最高可达100%。分析本次实验得到的结果,本文在提取纹理特征之前使用了OIF方法对原来的高光谱图像做了波段选择的操作,通过该操作我们获得了该图像具有最大信息量的波段同时也去掉了一些噪声波段,之后在进行图像融合得到用于提取纹理特征的图片,这样的图片主要的纹理特征被保留,噪声被去除,之后对该图片使用强纹理提取器I-BGLAM得到的纹理特征进行分类,但是本实验所用的树种有部分本身的纹理就不清晰,不论使用什么图像处理方法仍然得不到较好的纹理特征,因此单独使用纹理分类的正确率只有88.54%。而在使用光谱特征分类时先是对每个波段所有的像素点的光谱值求平均,之后再进行平滑去除噪声点,但是有些噪声是不可能被去除的,这是由于在采集样本时有的木材表面的粗糙程度或者实验环境中的光照等因素影响,因此单独使用光谱特征的分类结果只有92.71%。为了提高分类正确率,因此利用特征融合的思想将两类特征融合,使两者在分类过程中发挥互补作用,最后成功的将结果提高到了100%。

表2 使用不同特征得到的分类正确率Table 2 Classification accuracy using different features

综上所述,使用单一特征来进行木材树种分类不能得到最佳的分类效果,因此,提出了将两种特征融合,使得两种特征充分发挥各自的优势并且互相补充彼此,以将正确率最大化提高。总结这部分实验结果我们可以知道本文提出将木材的表面纹理特征和木材的光谱特征融合在一起去分类的这种方法是可以极大的提高木材树种的分类正确率。

到目前为止,本实验已经从理论和实验结果两个方面说明了我们提出的模型具有可行性和高正确率。为了更全面地完成本文的研究内容,我们还做几个对比实验,选择的实验方法都是在木材树种识别分类领域具有代表性的,其中包括沿用多年的传统分类模型和近些年有学者提出的新的模型。

3.2 与其他木材树种分类方法作对比

在本节,我们将一起来讨论在使用同样的数据集的前提下本文方法与其他文献的方法的分类正确率。表3给出了具体的实验结果。在表3中列出的本文方法、传统方法GLCM和文献[18]、文献[19]中的主流方法。传统方法是先使用PCA选择图像的第一主成分,然后利用GLCM提取纹理特征来进行分类,这种方法相对比较简单,但是这种方法非常依靠图片纹理的清晰程度,一旦遇到不清晰的纹理那么结果就不会很好。文献[18]中使用了GA(遗传算法)和GA+KDA(遗传算法+核心判别分析)对热带木材树种识别分类,文中使用该方法是为了进行非线性特征选择并减少木材数据库的维数,减少图片的存储空间,增加识别准确率。文献[19]中提出了一种自动木材种类的识别系统,首先使用了模糊预分类器根据木材的孔隙特征对木材进行预划分类,然后提取木材表面的管孔和纹理特征送入SVM中进行最终分类,这种方法降低了处理的复杂性和分类时间,得到了不错的效果。

从表3中的数据可以得出,本文的方法得到的正确率相比于其他方法要高的多。接下来我们将分析一下原因。与GLCM相比,本文在纹理特征的提取过程中使用了强纹理提取器I-BGLAM,它提取出的纹理特征要比GLCM更好,并且本文还融合光谱特征,因此,本文方法得到的分类结果要比GLCM得到的结果好。与文献[18]和文献[19]相比,本文方法得到的结果更胜一筹,究其原因是这两篇文献中原来所用的到实验木材都是热带树种,这些热带树种的木材表面纹理细密且管孔清晰、排列紧密,所以他们的方法在他们的文献中有着不错的表现,但是我们使用的木材大多管孔特征不清晰,因此两篇文献中的方法在本文中表现的并不好。

表3 本文与其他方法的最高分类正确率Table 3 The highest classification accuracy rate of this article and other methods

4 结 论

以8种木材的高光谱图像为研究对象,提出了一种基于I-BGLAM纹理特征和光谱特征融合的木材树种分类方法。首先,该模型使用了I-BGLAM获取了降维后的木材图像的纹理信息,并做实验验证了只使用纹理特征进行木材树种识别时的准确率。然后,提取高光谱图像中的近红外波段的光谱特征,将其与纹理特征融合并进行实验,得到了融合特征进行木材树种分类时的分类正确率。最后,将本文提出的木材树种分类方法与本领域内的主流的分类方法进行对比,得到了以下几点结论:

(1) 使用了I-BGLAM获得了降维后的木材图像的纹理信息,经实验验证,该方式与传统的方式如GLCM相比得到的准确率更高,说明该模型在提取纹理方面更新颖更具有优势。

(2) 提出了将光谱特征与纹理特征融合的木材树种分类方法,该方法充分利用了高光谱图像的“图谱合一”的特点。经实验验证,将融合后的特征送入分类器后进行分类,分类结果要比单独使用一种特征进行分类更好,说明使用融合特征进行分类是可行的方法。

(3) 与其他主流方法进行对比。从木材树种的分类正确率来看,本文提出的方法的分类正确率最高可达100%,与主流的木材树种分类方法相比具有更好的分类效果。

综上所述,提出的新的纹理特征和光谱特征融合模型在木材树种分类领域具有一定的研究意义和利用价值。

猜你喜欢

木材正确率纹理
橘子皮用来开发透明木材
数字说
门诊分诊服务态度与正确率对护患关系的影响
木材在未来建筑设计中的应用分析
基于BM3D的复杂纹理区域图像去噪
使用纹理叠加添加艺术画特效
TEXTURE ON TEXTURE质地上的纹理
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意