基于高光谱成像技术的红酸枝木材种类识别
2016-06-30倪茜茜祁亨年汪杭军浙江农林大学信息工程学院浙江临安1100浙江农林大学浙江省林业智能监测与信息技术研究重点实验室浙江临安1100浙江农林大学暨阳学院浙江诸暨11800
倪茜茜,祁亨年,周 竹,汪杭军(1.浙江农林大学 信息工程学院,浙江 临安1100;2.浙江农林大学 浙江省林业智能监测与信息技术研究重点实验室,浙江 临安1100;.浙江农林大学 暨阳学院,浙江 诸暨11800)
基于高光谱成像技术的红酸枝木材种类识别
倪茜茜1,2,祁亨年1,2,周竹1,2,汪杭军3
(1.浙江农林大学 信息工程学院,浙江 临安311300;2.浙江农林大学 浙江省林业智能监测与信息技术研究重点实验室,浙江 临安311300;3.浙江农林大学 暨阳学院,浙江 诸暨311800)
摘要:为了实现市场上常见红酸枝类Dalbergia spp.木材的快速无损识别,利用高光谱成像技术对不同红酸枝木材进行种类识别研究。以交趾黄檀Dalbergia cochinchinensis,巴里黄檀Dalbergia bariensis,奥氏黄檀Dalbergia oliveri和微凹黄檀Dalbergia retusa为研究对象,采集高光谱图像并提取感兴趣区域内的反射光谱,采用Savitsky-Golay (SG)平滑算法、标准正态变量变换(SNV)和多元散射校正(MSC)对955~1 642 nm波段光谱进行预处理,并通过主成分分析法(PCA),回归系数法(RC)以及连续投影法(SPA)选择特征波长,分别建立了偏最小二乘判别分析(PLSDA)和极限学习机(ELM)判别分析模型。研究结果表明:经SG和MSC光谱预处理,采用SPA选择的特征波长建立的ELM模型性能最优,建模集和预测集的识别率均为100.0%。这为红酸枝木材种类的快速无损识别提供了新的方法。图5表4参17
关键词:木材科学与技术;高光谱成像;特征波长;红酸枝木材;无损判别
浙江农林大学学报,2016,33(3):489-494
Journal of ZheJiang A&F University
红酸枝类Dalbergia spp.木材拥有温润的质地和细腻的纹理,打磨成家具后,经久耐用,不易腐朽。相比黄花梨Beniodendron minus木和紫檀Ptericarpus spp.木,红酸枝木的市场价格能被更多人接受,极具投资和收藏价值[1]。红酸枝木在国家标准GB/T 18107-2000《红木》中共有7种,不同的种类价格和性能均相去甚远。例如,交趾黄檀Dalbergia cochinchinensis,又称“老红木”“大红酸枝”等,是红酸枝木中的上品,比同类红酸枝木价格高出很多。因此,有些不法商贩用价格便宜的奥氏黄檀Dalbergia oliveri或其他红酸枝木假冒交趾黄檀,引发的消费纠纷此起彼伏。所以,对红酸枝木的种类进行识别,有助于规范红酸枝的市场秩序和保护消费者的利益。目前,孙书冬等[2]对交趾黄檀,巴里黄檀Dalbergia bariensis,奥氏黄檀和微凹黄檀Dalbergia retusa的宏观与微观解剖特征进行研究,实现4种红酸枝木材的识别。伏建国等[3]对7种黄檀属Dalbergia木材和降香黄檀Dalbergia odorifera的DNA进行提取和纯化,通过碱基位点差异区分8种红木。张蓉等[4]对8种酸枝类木材的材色进行量化,可用于识别上述树种。这些方法都为不同红酸枝木材的识别提供了可能的途径。但同时以上方法都存在一些不足之处,如费时、耗力、成本较高,或是破坏木材无法做到无损检测。因此,研究一种能对红酸枝木种类进行快速无损识别的方法具有实用价值和科学意义。高光谱成像技术是近年来研究较为广泛的无损检测技术[5-7]。它可以同时获取被测对象的图像及光谱信息,由于图像数据能反映被测物外部特征、表面缺陷等,而光谱数据可对其物理结构及化学性质进行分析,因此高光谱成像技术是图像技术与光谱技术的完美结合[8]。目前,尚未有运用高光谱成像技术对红酸枝类木材品种的识别研究。因为本试验所选波段(900~1 700 nm)红酸枝木材的高光谱图像分辨率不高,其中包含的能区分红酸枝木材的纹理特征信息很少。所以,本研究的目的在于利用高光谱成像技术提取样本中感兴趣区域(region of interest,ROI)的全光谱信息以及通过挑选特征波长,结合多种化学计量学方法建立判别模型,实现对红酸枝木材的种类识别。
1 材料与方法
1.1材料
本试验研究对象为市场上常见的4种红酸枝木材(表1),分别是交趾黄檀、巴里黄檀、奥氏黄檀和微凹黄檀,样本来源于广州渔珠木材市场,均为35.00 mm×27.50 mm× 14.50 mm的实木木块,各获取木材9块·种-1。实验所选取的4种红酸枝木材同属黄檀属,材色相近、纹理和构造特征相似,肉眼不易区分。
表1 实验所选红酸枝木材信息Table 1 Information of red rosewood in the experiment
1.2高光谱图像采集
试验用红酸枝木材高光谱图像采集系统如图1所示。该系统主要包括:成像光谱仪(N17E-QE,Spectral Imaging Ltd.,芬兰),IRCP0076型电控移位平台、成像镜头OLES22(Specim,Spectral Imaging Ltd.,Oulu,芬兰)、2个150 W的光纤卤素灯、暗箱和计算机等。光谱分辨率为5 nm,采集的高光谱图像分辨率为320× 256。高光谱图像采集的光谱范围是874~1 734 nm共256个波段。为了得到清晰、不失真的图像需要对相机的曝光时间、物镜之间的距离以及电控移位平台的移动速度进行调试。试验采集的是试样的反射高光谱图像,成像系统的相关参数设置如下:曝光时间设置为4 ms,物镜之间的距离为12 cm,平台的移动速度为18 mm·s-1。本研究采用的高光谱数据分析软件是ENV I4.6(ITT,美国),MATLAB R2009a(The Math Works,美国)和Unscrambler 10.1(CAMO Process AS,挪威)。
图1 高光谱图像采集系统Figure 1 Hyperspectral imaging system
光源强度在不同波段下分布不均匀,光源分布较弱的波段所含噪声较大,对红酸枝木的高光谱图像采集时要进行图像校正。扫描白色标准校正板获得白板校正图像IW,盖上镜头后扫描得到黑板校正图像IB,采集得到的红酸枝木原始图像为IO,按照图像校正公式R=(IO-IB)/(IW-IB),得到校正后的图像R。依次从每块红酸枝木材高光谱图像中手动选取大小同为30×30像素点的感兴趣区域各4个,4种红酸枝木均获得36个感兴趣区域计为36个样本,共计144个样本。将所有红酸枝木材样本按照Kennard-Stone算法[9]以2:1的比例分成建模集和预测集,其中建模集样本为96个,预测集样本为48个。
1.3光谱预处理
为挖掘所选波段中有效的光谱信息和去除由试验环境引起的噪声,本研究采用Savitsky-Golay平滑算法(SG),标准正态变量变换(standard normal variate,SNV)和多元散射校正(multiplicative scatter correction, MSC)对感兴趣区域光谱进行预处理。其中SG平滑算法是消减噪声最常用的一种方法[10],SNV与MSC可以校正样本间由颗粒散射带来的误差[11]。
1.4特征波长选取
红酸枝木样本光谱变量矩阵庞大,为了减少模型输入变量和缩短分析计算时间,需要从全波段提取出对建模最有效的波长,往往是与试样化学成分有关的特征变量。由于每种木材的木质素、纤维素等含量有区别,导致不同种类的红酸枝木材对光谱的吸收程度不同,这是区分4种木材的一个重要方面。本研究采用主成分分析法[12](principal component analysis,PCA),回归系数法[13](regression coefficient,RC)和连续投影法[14](successive projections algorithm,SPA)选择特征波长。
1.5判别分析方法
通过对红酸枝木材的全部光谱数据以及经过特征波长选择后的光谱数据分别建立偏最小二乘判别分析[15](partial least square-discriminant analysis,PLS-DA)和极限学习机[16](extreme learning machine,ELM)判别分析模型。本研究采用识别率作为模型评价标准即样本品种识别正确个数占总样本数的百分比。
2 结果与分析
2.1红酸枝木材光谱特征
由于受外部环境和仪器本身性能等因素的影响,光谱前后端含有大量噪声,经预试验研究采用25~229波段的光谱信息,光谱分析范围是955~1 642 nm。4种红酸枝木材的平均光谱曲线趋势相近,但反射率存在差异。如图2,波长均在1 106 nm和1 308 nm处有较高的光谱反射率,纤维素的C—H二级倍频伸缩位于1 214 nm[17],纤维素的O—H一级倍频伸缩位于1 476 nm,4种红酸枝木材在这2个波长附近都出现了明显的吸收峰。此外,巴里黄檀与奥氏黄檀的光谱有部分重叠,相似度很高。
2.2特征波长的选取
2.2.1主成分分析主成分分析是通过线性变换从多个变量中选取较少个数重要变量的过程。根据PCA分析得到的各波长平均权重系数绝对值的大小来选取特征波长,以经MSC预处理后光谱的PCA特征波长选择为例, PC1(73.00%),PC2(25.00%)和PC3(1.00%)的累积方差贡献率达到了99.00%。一些平均系数绝对值大的点所对应的波长在PC1和PC2中是相同的,如图3所示,故从PC1和PC2中挑选了1 103,1 143(与木质素的C—H二级倍频伸缩振动有关),1 193(与木质素的C—H二级倍频伸缩振动有关),1 307,1 394和1 479 nm(与纤维素的O—H一级倍频伸缩振动有关)6条特征波长。
2.2.2回归系数法回归系数法是基于PLS-DA建模分析过程中得到的。回归系数绝对值越大说明对所建模型性能影响也越大,故根据每个波长点所对应的回归系数绝对值的大小来选择特征波长。由图4可见:对经MSC预处理后的光谱利用回归系数法挑选的特征波长为1 127,1 147,1 177,1 366(与纤维素的C—H一级倍频伸缩和C—H弯曲振动的合频有关),1 417(与木质素的C—H一级倍频伸缩和C—H弯曲振动的合频有关),1 453,1 619和1 632 nm(与纤维素的O—H一级倍频伸缩振动有关)。
2.2.3连续投影法连续投影法是从光谱矩阵中找出冗余信息最少的变量组,使组内变量间的共线性达到最小。对经过MSC预处理的光谱数据利用SPA进行特征波长选择如图5所示。设定特征波长变量个数为5~30,当提取8个变量时,模型的RMSE值达到最优为0.377 5,所对应的波长依次为1 123,1 224(与纤维素的C—H二级倍频伸缩振动有关),1 284,1 362,1 423,1 433,1 565和1 605 nm。经过不同特征波长选择算法统计出的特征波长的个数如表2所示,通过PCA算法选取的特征波长的个数要少于RC算法和SPA算法。
图2 原始数据平均光谱Figure 2 Mean spectra from raw data
图3 经MSC预处理后的PCA特征波长选取Figure 3 Effective wavelength selected by PCA from MSC spectral preprocessed
图4 经MSC预处理后的RC特征波长选取Figure 4 Effective wavelength selected by RC from MSC spectral preprocessed
图5 经MSC预处理后的SPA特征波长选取Figure 5 Effective wavelength selected by SPA from MSCspectral preprocessed
表2 经不同算法选取的特征波长个数Table 2 Number of effective wavelengths selected by different methods
2.3基于全部光谱数据的红酸枝木材品种识别
对未经预处理和经过3种方法预处理后的光谱分别建立PLS-DA和ELM模型。PLS-DA算法是通过计算光谱信息矩阵与类别信息矩阵的相关关系建立回归模型,模型的隐含变量数(latent variables, LVs)为5,阈值为0.5,若回归模型得到的预测值与真实值之差的绝对值小于阈值则判断正确,反之则判断错误。ELM模型具有学习速度快,泛化性能好等特点,隐含层激励函数为‘sigmoid’,将隐含层神经元个数设置为20,模型的预测性能最佳。2种模型的判别分析结果如表3所示。
由表3可知:ELM的整体识别效果要好于PLS-DA模型,经过预处理的识别效果要好于未经预处理的数据模型,所有判别模型的识别正确率均高于85.00%。其中,经MSC预处理后的建模集识别正确率达到100.00%,预测集的识别正确率也达到97.92%,取得最优识别效果。通过判别模型的分析比较,说明基于全部光谱的红酸枝木材的种类识别是可行的。
2.4基于特征波长的红酸枝木材种类识别
基于特征波长建立的判别分析模型的分析结果如表4所示。
表3 基于全光谱数据不同模型的判别结果Table 3 Identified results of different discriminant models based on full spectra preprocessed
表4 基于特征波长建立的不同模型的识别率Table 4 Identification rates of different discriminant models based on different wavelengths selection methods
从表4可知:运用SPA提取的基于SG和MSC预处理光谱的特征波长建立的ELM模型均取得了最优识别效果,建模集和预测集都取得了100.00%的识别率。运用PCA挑选的基于MSC预处理光谱的特征波长建立的PLS-DA模型取得了最差的识别效果,建模集的识别率仅为64.58%,预测集的识别率为70.83%。因为经MSC预处理的光谱只运用PCA提取的前2个主成份,所以在进行PLS-DA建模时效果较差。相比较PCA,RC和SPA这3种特征波长选择算法建立的识别模型可知,运用SPA算法的识别正确率最高。此外,在相同光谱预处理方法的前提下,运用同一种特征波长挑选方法建立的模型,ELM模型的识别正确率要高于PLS-DA模型,可能是因为ELM不需要调整网络的输入权值和隐元的偏置,容易获得全局最优解。
3 结论
本研究利用高光谱成像技术结合不同的光谱预处理方法和特征波长选择方法建立了不同的判别分析模型,实现了对4种红酸枝木材的种类识别。通过比较发现,基于全部光谱以及采用PCA,RC和SPA方法分别提取的特征光谱建立的判别模型,ELM模型的识别正确率均高于PLS-DA建立的模型,而经SPA提取的特征波长建立的模型识别效果最优。其中,SG-SPA-ELM模型、MSC-SPA-ELM模型的建模集和预测集的识别率都达到100.00%。以特征波长建立的判别模型,相比全光谱而言,缩小了变量数又取得了较好的识别效果,具有一定的优势。本研究的初步结果表明,基于高光谱成像技术结合判别分析模型,对交趾黄檀、巴里黄檀、奥氏黄檀和微凹黄檀等种类识别提供了一定的参考依据。
4 参考文献
[1]陈居静. 6种酸枝类木材结构特征及相关属性的研究[D].福州:福建农林大学,2013. CHEN Jujing. Study on Structure Characteristics and Conrrelative Properties of Six Kinds of Dalbergia spp. Wood [D]. Fuzhou:Fujian Agriculture and Forestry University, 2013.
[2]孙书冬,周旭,罗炘,等. 4种红酸枝木类树种的鉴别[J].林产工业,2012,39(3):50 - 53. SUN Shudong, ZHOU Xu, LUO Xin, et al. Identification of four kinds of Dalbergia[J]. China For Prod Ind, 2012, 39 (3):50 - 53.
[3]伏建国,刘金良,杨晓军,等.进口黄檀属木材DNA提取与分子鉴定方法初步研究[J].浙江农林大学学报,2013,30(4):627 - 632. FU Jianguo, LIU Jinliang, YANG Xiaojun, et al. DNA extraction and molecular identification of imported Dalbergia wood[J]. J ZheJiang A & F Univ, 2013, 30(4):627 - 632.
[4]张蓉,徐魁梧,张杰.基于量化可见光特征的酸枝木类木材树种识别[J].林业科技开发,2013,27(3):96 -99. ZHANG Rong, XU Kuiwu, ZHANG Jie, et al. Identification of rosewood based on visible spectrum characteristics [J]. China For Sci Technol, 2013, 27(3):96 - 99.
[5]周竹,李小昱,陶海龙,等.基于高光谱成像技术的马铃薯外部缺陷检测[J].农业工程学报,2012,28(21):221 - 228. ZHOU Zhu, LI Xiaoyu, TAO Hailong, et al. Detection of potato external defects based on hyperspectral imaging technology[J]. Trans Chin Soc Agric Eng, 2012, 28(21):221 - 228.
[6]WU Di, SHI Hui, HE Yong, et al. Potential of hyperspectral imaging and multivariate analysis for rapid and non-invasive detection of gelatin adulteration in prawn[J]. J Food Eng, 2013, 119(3):680 - 686.
[7]LEIVA-VALENZUELA G A, LU Renfu, AGUILERA J M. Assessment of internal quality of blueberries using hyperspectral transmittance and reflectance images with whole spectra or selected wavelengths[J]. Innov Food Sci Emerg, 2014, 24:2 - 13.
[8]周竹,方益明,尹建新,等.高光谱成像技术及其在木材无损检测中的研究进展[J].浙江农林大学学报,2015,32(3):458 - 466. ZHOU Zhu, FANG Yiming, YIN Jianxin, et al. Review of nondestructive detection of wood and wood products based on hyperspectral imaging technology[J]. J ZheJiang A & F Univ, 2015, 32(3):458 - 466.
[9]KENNARD R W, STONE L A. Computer aided design of experiments[J]. Technometrics, 1969, 11(1):137 - 148.
[10]马世榜,徐杨,汤修映,等.利用可见近红外光谱多指标综合预测生鲜牛肉储存期[J].光谱学与光谱分析,2012,32(12):3242 - 3246. MA Shibang, XU Yang, TANG Xiuying, et al. Prediction of storage time of fresh beef with multi-index using visible and near-infrared spectroscopy[J]. Spectrosc Spectral Anal, 2012, 32(12):3242 - 3246.
[11]汤修映,牛力钊,徐杨,等.基于可见/近红外光谱技术的牛肉含水率无损检测[J].农业工程学报,2013,29 (11):248 - 254. TANG Xiuying, NIU Lizhao, XU Yang, et al. Nondestructive determination of water content in beef using visible/ near-infrared spectroscopy[J]. Trans Chin Soc Agric Eng, 2013, 29(11):248 - 254.
[12]LIU Dan, PU Houbin, SUN Dawen, et al. Combination of spectra and texture data of hyperspectral imaging for prediction of pH in salted meat[J]. Food Chem, 2014, 160:330 - 337.
[13]WANG Lu, LIU Dan, PU Houbing, et al. Use of hyperspectral imaging to discriminant the variety and quality of rice [J]. Food Anal Methods, 2015, 8(2):515 - 523.
[14]XIE Chuangqi, WANG Qiaonan, HE Yong. Identification of different varieties of sesame oil using near-infrared hyperspectral imaging and chemometrics algorithms[J]. PloS0ne, 2014, 9(5):e98522. doi:10.1371/journal.pone. 0098522.
[15]ZHAO Fang, ZHAO Yu, MAO Wenhua, et al. Geographic classification of chinese grape wines by near-infrared reflectance spectroscopy[J]. J Donghua Univ, 2012, 29(1):40 - 45.
[16]郭文川,王铭海,谷静思,等.近红外光谱结合极限学习机识别储藏期的损伤猕猴桃[J].光学精密工程,2013,21(10):2720 - 2727. GUO Wenchuan, WANG Minghai, GU Jingsi, et al. Identification of bruised kiwifruits during storage by near infrared spectroscopy and extreme learning machine[J]. 0pt Precs Eng, 2013, 21(10):2720 - 2727.
[17]SCHWANNINGER M, RODRIGUES J C, FACKLER K. A review of band assignments in near infrared spectra of wood and wood Components[J]. J Near Infrared Spectrosc, 2011, 19(5):287 - 308.
Identifying Dalbergia spp. wood with hyperspectral imaging technology
NI Qianqian1,2,QI Hengnian1,2,ZHOU Zhu1,2,WANG Hangjun3
(1. School of Information Engineering, Zhejiang A & F University, Lin’an 311300, Zhejiang, China;2. Zhejiang Provincial Key Laboratory of Forestry Intelligent Monitoring and Information Technology Research, Zhejiang A & F University, Lin’an 311300, Zhejiang, China;3. Jiyang College, Zhejiang A & F University, Zhuji 311800, Zhejiang, China)
Abstract:To rapidly and nondestructively identify common Dalbergia spp. of wood on the market, wood from Dalbergia spp.(D. cochinchinensis, D. bariensis, D. oliveri, and D. retusa)was identified using hyperspectral imaging technology. The hyperspectral images were collected and the reflectance spectral from the region of interest were extracted from the images. Wavelengths from 955 to 1 642 nm were preprocessed by Savitsky-Golay smoothing(SG), standard normal variate(SNV), and Multiplicative Scatter Correction(MSC). Then, a partial least square-discriminant analysis(PLS-DA)and an extreme learning machine(ELM)were used to build discriminant models based on selected sensitive wavelengths using principal component analysis(PCA), regression coefficient(RC), and successive projections algorithm(SPA)from the preprocessed spectra. Results showed that for selected sensitive wavelengths using SPA from SG and MSC preprocessed spectra, ELM models obtained the best classification accuracy(100.0%)for both the calibration set and the prediction set. Thus, this study provided a new method to identify Dalbergia spp. wood rapidly and nondestructively.[Ch, 5 fig. 4 tab. 17 ref.]
Key Words:wood science and technology;hyperspectral imaging;wavelength selection;Dalbergia spp. wood;non-destructive identification
中图分类号:S781.1
文献标志码:A
文章编号:2095-0756(2016)03-0489-06
doi:10.11833/j.issn.2095-0756.2016.03.017
收稿日期:2015-05-27;修回日期:2015-08-31
基金项目:浙江省自然科学基金资助项目(LQ13F050006, Y14C130046);浙江农林大学科研发展基金资助项目(2013FR059;2012FR085)
作者简介:倪茜茜,从事图像处理与模式识别研究。E-mail:351147005@qq.com。通信作者:汪杭军,教授,博士,从事模式识别、机器视觉、智能检测等研究。E-mail:whj@zafu.edu.cn