火炬松木材基本密度和纤维长度近红外模型的建立与应用
2018-12-14蒋开彬何紫迪黄少伟
蒋开彬, 牛 品, 王 博, 林 艳, 何紫迪, 黄少伟
(广东省森林植物种质创新与利用重点实验室/华南农业大学林学与风景园林学院,广东 广州 510642)
火炬松木材的基本密度是反映其性能的关键指标,可估计木材的质量,判断木材的工艺性质和物理力学性质.火炬松木材的纤维长度是分析火炬松木材材性的主要参数之一,同时也是反映木材利用价值的指标.研究火炬松木材基本密度和纤维长度不仅对新品种的培育、人工林的定向培育具有指导意义,而且有助于今后火炬松大面积推广及改善其木材的材性.但是常规测定木材基本密度与纤维长度的方法比较繁琐,大规模检测火炬松育种群体和子代测定林不仅工作量巨大,而且会破坏树木,而近红外预测这种无损快速检测技术就可以解决这些问题.
近红外光谱技术具有分析速度快、效率高、成本低、重现性好,以及便于实现在线分析、无损分析等特点[1-2],不仅可以检测谷物的品质[3],测定鸡蛋、蔬菜和水果的品质[4-7],还可以测定废水生化需氧量[8].依据木材近红外光谱包含的化学组分,可通过化学计量学分析,建立样品的散射、漫反射和特殊反射等信息与木材性质之间的数学关系,从而可以预测未知木材样品的性质[9].近红外光谱技术在林业上也有许多应用,比如测定蓝桉、火炬松和鹅掌楸的基本密度[10-12],以及测定木质素含量[13]、阔叶材纤维长度[14]、木材密度[15]、木材强度[16]、含水率[17]等.本研究基于近红外光谱技术,探索一种快速测定木材基本密度和纤维长度的方法.
1 材料与方法
1.1 供试材料
用于建立模型的材料取自广东乐昌龙山林场.在15年生火炬松人工林中,选取生长旺盛、胸径16 cm以上、干型较通直的单株,用喷漆做标记.在树木胸径高度处用直径为12 mm的生长锥,从西北到东南方向(平行地面,尽量避开树结疤),穿透树干,钻取全木芯.将木芯放入密封袋,于4 ℃冰箱保存.其中72个样品作为预测集,建立近红外预测模型;21个样品作为验证集,对建立的火炬松木材基本密度的近红外模型进行验证;20个样品作为验证集,对建立的火炬松木材纤维长度的近红外模型进行验证.用于预测的火炬松群体取自广东英德林业科学研究所(264个样本).
1.2 基本密度和纤维长度的真实测定
采用排水法[18]测定72+21个火炬松样品的木材密度.截取样品的相应部位,切成火柴杆大小放入试管,经过水蒸排气后,用30%(体积分数)硝酸和适量氯酸钾加热到60 ℃,浸泡直至木材细胞分离.用解剖针挑出少许纤维稀释并放在载玻片上,于显微镜下观察、拍照.采用木材分析软件测出纤维长度.在93个样品中,每个样品测50根纤维长度,取平均值作为该单株的木材纤维长度.
1.3 近红外光谱的采集、处理和模型的建立
采用瑞典Perter公司的DA7200型连续固定光栅分析仪和改进的样品杯进行光谱收集.在对样品进行扫描之前,为了减少温度对样品的影响,先将样品放置24 h,并且预热30 min,待光源稳定后开始采集光谱.采集光谱的波段为650~950 nm,分辨率为5 nm.采用Umscrambler软件,采用标准化处理法、标准正态变量转换法(standard normal variate transformation, SNV)、平滑算法(savitzky-golay smoothing, SG)、乘积分散校正法(multiple scatter correction, MSC)与一阶导数(first-order derivative, 1st Der)处理,对光谱进行预处理并建立模型.
1.4 模型的验证
将真实测定的基本密度值和纤维长度值分别与用模型预测出来的基本密度值和纤维长度值进行比较,以相关系数(R)和验证集预测标准偏差(SEP)作为主要参数对模型进行评价.验证集的SEP越小,则模型拟合、预测效果越好.
2 结果与分析
2.1 木材基本密度和纤维长度实测值的数据特征
用排水法测定72个火炬松样品的基本密度;并且应用纤维离析、显微制片、显微观察测定其纤维长度.72个火炬松样品的基本密度最大值为0.472 5 g·cm-3,最小值为0.372 8 g·cm-3,平均值为0.425 0 g·cm-3,变动系数为5.402 3;纤维长度最大值为3.527 8 mm,最小值为2.501 4 mm,平均值为3.088 1 mm,变动系数为6.087 8.为了了解72个火炬松样品的代表性,对基本密度和纤维长度数据采用SAS软件进行正态性检验分析[19],结果如表1所示.由表1可知,火炬松木材基本密度数据的偏度为0.014 5,峰度为-0.526 8.虽然峰度有倾斜性,但在正态检验中,prob
2.2 不同光谱处理方法的比较
分别用MSC、标准化处理法、SNV、SG以及1st Der,对采集的光谱进行处理,得到火炬松木材基本密度和纤维长度相应的模型参数(表2、3).从表2可看出,标准化处理法、1st Der+MSC和1st Der+SG+MSC的模型校正相关系数(RC)都小于0.95,并且主成分较多,处理不理想,可以舍弃;SNV和1st Der+标准化处理法的交互验证相关系数(RCV)小于0.85,偏低,可以舍弃.MSC、SG、1st Der+SNV、1st Der+SG、1st Der+SNV+MSC和1st Der+SG+SNV的RC值都大于0.95,且RCV都大于0.85.考虑到RC起着主导作用,RC、RCV越大,模型越好;校正标准偏差(RC(MSE)、交叉验证标准偏差(RCV(MSE)越小,模型越好;RC与RCV值越接近,模型越好.在这些处理中,1st Der+SG+SNV的RC和RCV都最大,RC(MSE)与RCV(MSE)最小,而且RC与RCV的差值也是最小的,因此1st Der+SG+SNV的光谱处理方法对于火炬松木材基本密度建模,效果最佳.同样,从表3可以看出, 1st Der+SG+SNV处理对火炬松木材纤维长度建模效果最佳.
表1 火炬松木材基本密度与纤维长度样本的正态性检验1)Table 1 Normality test of basic density and fiber length of loblolly pine samples
1)0
表2 不同光谱处理方法得到的火炬松木材基本密度预测模型的参数Table 2 Parameters of loblolly basic density prediction model using different processing methods
2.3 火炬松木材基本密度与纤维长度近红外模型的建立
应用Umscrambler软件,采用一阶导数、平滑算法、归一化法相结合的方法对光谱进行处理,并且用偏最小二乘法的回归分析和完全交互验证法建立校正模型与内部交叉验证模型.从表4可知,主成分数为11时,基本密度模型的RC为0.970 0,RC(MSE)为0.003 8 g·cm-3,RCV为0.897 2,RCV(MSE)为0.007 2 g·cm-3;纤维长度模型的RC为0.966 4,RC(MSE)为0.032 4 mm,RCV为0.878 2,RCV(MSE)为0.062 2 mm.两模型的RC和RCV均比较高,校正相关系数标准偏差和交叉验证得到的预测标准偏差都比较低,表明建立的模型较好.
2.4 近红外模型的验证与评价
采用验证集样品对已经建立的火炬松木材基本密度和纤维长度2个近红外模型进行验证和评价,并采用R和SEP对模型的预测精度进行评价(表5).在基本密度模型中,预测值与实测值的R为0.85,SEP为0.033 g·cm-3,符合标准方法的误差要求,说明模型的质量比较好.在纤维长度模型中,预测值与实测值的R为0.88,SEP为0.216 mm,说明模型质量良好.
2.5 近红外模型的应用
用得到的木材基本密度预测模型和纤维长度预测模型对264个火炬松子代测定林样本进行预测,得到264个火炬松子代测定林样本的木材基本密度和纤维长度.从图1、2可以看出预测数据总体上呈正态分布,符合数据的分布特征,说明预测模型在实际遗传测定中可用,且结果可靠.
表3 不同光谱处理方法得到的火炬松木材纤维长度预测模型的参数Table 3 Parameters of loblolly fiber length prediction model using different processing methods
表4 火炬松木材基本密度和纤维长度近红外模型的主要参数Table 4 Parameters of NIR prediction model for loblolly basic density and fiber length
表5 外部样品对木材基本密度和纤维长度近红外模型的验证参数Table 5 Validation parameters for basic density and fiber length prediction model with external samples
图1 264个样本基本密度预测值的直方图与正态分布曲线Fig.1 Normal distribution curve and histogram of predicted basic density of 264 genetic test samples
图2 264个样本纤维长度预测值的直方图与正态分布曲线Fig.2 Normal distribution curve and histogram of predicted fiber length of 264 genetic test samples
3 讨论
通过1st Der、SNV和SG对光谱进行预处理,并用偏最小二乘法回归分析建立了火炬松木材基本密度和纤维长度2个预测模型,用外部样品对建立的模型进行了验证和评价,并加以应用.结果表明,火炬松木材基本密度模型的RC及RCV分别为0.970 0和0.897 2,模型外部验证的预测值与实测值的R为0.85,SEP为0.033 g·cm-3;火炬松木材纤维长度模型的RC及RCV分别为0.966 4和0.878 2,模型外部验证的预测值与实测值的R为0.88,SEP为0.216 mm.卢万鸿等[20]建立的桉树木材密度和纤维长度近红外校正模型的RC分别为0.950和0.965;李耀翔等[21]建立落叶松木材密度近红外校正模型的RC及RCV分别为0.964和0.918,SEP为0.021 g·cm-3;李耀翔等[22]建立榆树基本密度的RC及RCV别为0.899 6和0.866 2.本研究中木材基本密度和纤维长度模型的RC及RCV与以上研究结果差别不大.同时应用预测模型对子代测定样本进行预测,结果数据呈正态分布,符合数据的分布特征,说明预测模型在实际遗传测定中可用.因此,利用近红外光谱技术能够快速、无损、省时省力、比较准确地预测火炬松木材的基本密度和纤维长度.