APP下载

基于傅里叶红外光谱预测翅荚木顺纹抗压强度

2022-08-26陈博文金咏琪颛孙浩林金国

西南林业大学学报 2022年4期
关键词:波长预处理光谱

陈博文 胡 娟 金咏琪 郑 安 颛孙浩 林金国 关 鑫

(1. 福建农林大学材料工程学院,福建 福州 350108;2. 江西财经大学软件与物联网工程学院,江西 南昌 330013)

翅荚木(Zenia insignis)作为速生树种,其适应性强,易于繁殖且生长周期短[1],在一定程度上能够缓解我国木材资源短缺问题[2−3],若结合木材材性与红外光谱技术(IR)建立无损预测,不仅可以为翅荚木培育和科学加工提供基础数据,最大限度地利用翅荚木,也能为调整森林培育和遗传改良措施提供参考,使人工林培育具有针对性。

IR是一种非破坏性测试技术,在竹木材领域,许多学者已经在预测竹木材的三大素、密度、抗压强度、抗弯强度和抗弯弹性模量等[4−8]取得了不错的成绩。在光谱预测木材力学性质方面,采用的预测模型多为线性模型,比如主成分回归(PCR)模型、偏最小二乘(PLS)模型等,其中PLS 模型预测结果较为精确[9−10]。在光谱分析法方面,主要集中在光谱数据预处理法、异常样本剔除及特征波长提取等方面[11−17]。相比于近红外,傅里叶红外光谱拥有更广的波长范围[18],大量的数据建立的模型具有更高的可信度。综合来看,红外光谱结合化学计量学的分析方法,在预测木材的力学性质上,具有无损、高效的特点,拥有广阔的应用前景。

本研究以常见的人工木种翅荚木的150个样品为研究对象,使用傅里叶红外光谱仪采集所有样品的光谱数据,按国标测定其顺纹抗压强度。经数据集预处理后,使用连续投影算法(SPA)选择波长组合,建立PLS回归模型用于预测未知样品的顺纹抗压强度,为翅荚木的生产开发提供科学依据。

1 材料与方法

1.1 样品制备

选用生长环境相似、立地环境相同的福建龙岩市10年生的翅荚木人工林原木10组,平均树高为19.8 m,平均枝下高为10.6 m。自样木胸高处向上2.0 m长的木段作为试材,放置在室内阴凉通风处,气干至木材含水率达到福建省福州市木材平均含水率,约15%[19]。在翅荚木试材中随机选取加工150组的样品,偏差控制在0 mm,并将每份样品剩料磨粉、过筛,选取目的木粉,供后续红外光谱采集。

1.2 顺纹抗压强度测量

严格按照GB/T 1935—2009[20]测定翅荚木的顺纹抗压强度测量。

1.3 样品光谱的采集

光谱仪器采用VERTEX 70v高端研究级红外光谱仪(布鲁克公司,德国)。由于布鲁克DigiTect专利技术能将检测器自带的电子前置信号放大器和数模转换器相互结合,所以采集结果能够较大限度地避外界模拟信号对光谱的干扰,确保了出色的信噪比。

仪器的测试条件为:光通量15000,光谱范围 400~4 000 cm−1,样品扫描次数为 64次,同时对比空白KBr片64次的背景扫描。每个样品制成压3次片并取平均值作为光谱结果。

1.4 光谱数据预处理

为减少光谱数据中异常样本对建模结果的影响,将采用蒙特卡罗交叉验证方法(MCCV)[21]将样本数据集随机划分为校正集与预测集,并对未参与构建模型的样本进行预测误差计算,在几千次随机采样后,最后得到预测误差的分布,并将超出均值的3倍的数据视为异常样本,最后进行剔除。采用MCCV验证方法不但可以检验样本光谱数据的异常点、参考数据异常点,而且还能检验共同的异常点。

在剔除异常数据后,利用蒙特卡洛随机抽样的方式,将剔除异常值后的光谱数据按2∶1分为样本集和预测集。并在建模前,对红外光谱进行预处理,预处理的方法为:多元散射校正(MSC) 、标准正态变化(SNV)以及一阶导数(1stD)对光谱进行预处理,并根据建模的结果,选择最优预处理方法。

1.5 模型建立

对预处理后的光谱数据,虽然已经进行了修正,但是直接采用4000~400 cm−1全光谱数据进行模型的建立会导致工作量较大、计算复杂。因此可以采用SPA算法[22−23]。SPA算法是一种使矢量空间共线性最小化的前向变量选择算法,该算法可以选取最少的冗余度和最小共线性的有效波长,该算法随机选取1个波长,并且循环计算其他未选入波长上的投影,把投影向量最大的波长放入波长组合中,使得每1个新选入的光谱波长,都与前一个线性关系最小。

最后,利用SPA算法提取样本集光谱上几个特征波长,并根据PLS原理建立预测模型,将预测组的光谱数据带入模型进行模型精度检验,其中对所建模型的质量采用决定系数(R2)、预测绝对误差,预测标准偏差(RESEP)来评价。其中R2越靠近1,模型拟合性越好,预测绝对误差与预测标准误差越小,模型预测精度越高。

2 结果与分析

2.1 基础数据的采集分析

对150组样本进行处理,其中测量翅荚木样本顺纹抗压强度与试件的厚度与宽度,如表1所示。

对150组样本进行红外采集,采集的原始红外光谱数据结果如图1所示。不同顺纹抗压强度的样品光谱图在特定的波段有所不同,即3342 cm−1的O-H伸缩振动吸收峰、2885 cm−1的甲基、亚甲基和次甲基的C-H伸缩振动吸收峰以及1033 cm−1处芳香环的C-H伸缩振动吸收峰。但是总体光谱趋势是一致的,因此必需借助化学计量学的方法才能从光谱中提取定性和定量分析信息。

图1 不同抗压强度试样(a)与全部试样(b)的傅里叶红外光谱图Fig. 1 Fourier infrared spectra of samples with different compressive strength(a) and all samples(b)

2.2 顺纹抗压强度数据预处理

采用蒙特卡罗的异常样本识别方法,经过10000次的循环随机采样计算后,计算的样本预测残差的均值与方差如图2所示,设置平均值3倍的标准差作为参考依据。

图2 基于样本预测误差分布Fig. 2 Based on sample prediction error distribution

从图2可以看出有6个数据属于异常数据,在剔除异常数据后,将144组数据按2∶1的比例随机分为97组样本集与47组预测集。

2.3 光谱图像预处理

在红外光谱采集到的光谱信息中,除了所需的基本样品特性,还经常掺杂着的无关信息和噪声,因此利用MSC、 SNV、1stD对红外光谱进行预处理。首先对预处理后的光谱数据利用PLS选取主因子的数量,如图3所示。然后建立预测模型,结果如表2所示。

表2 不同预处理方式建模结果Table 2 Modeling results of different preprocessing methods

图3 根据PRESS选择主因子数Fig. 3 Select the number of major factors according to PRESS

与原始光谱数据相比,进行预处理不仅在一定程度上降低模型复杂度,而且能提升模型的预测精度,其中MSC预处理方式表现最佳。因为MSC算法是基于统计的方法修正光谱散射,既不会造成过度修正,也不需要依赖经验选择合适的段间距。因此在后续的处理中,将采用MSC作为预处理手段,其中MSC处理的光谱结果如图4所示。

图4 MSC处理后的光谱图Fig. 4 Spectral image after MSC processing

2.4 波长的选择

由于光谱仪器的影响,在某些波段下的光谱质量较差,并且这些波段会引起模型的不稳定,但选择有效的光谱波长能够减少波长变量的个数简化模型,提高计算速度,更主要的是由于不相关的变量剔除,可以得到预测性强的、稳定性好的预测模型。

对原光谱数据进行MSC预处理后,利用SPA算法,选取含有最少冗余度和最小共线性的波长。最后利用PLS算法建立翅荚木光谱预测模型。并计算相关系数R2与SEP对模型进行评价。

图5表示的是经过MSC预处理后,所选特征波长位置示意图,通过SPA算法所选的波数结果分别为410.83、462.91、731.00、771.51、779.22、806.22、827.44、866.02、1110.97、1278.77、1506.36、1543.01、1780.25、2123.57、3288.54、3649.22、3716.72、3849.81 cm−1。最后利用PLS建立最终的回归模型。结果如表3所示。

表3 不同处理方式建立的PLS的模型结果Table 3 PLS model results established by different processing methods

图5 SPA特征波数选择示意图Fig. 5 Schematic diagram of SPA characteristic wave number selection

根据图6可知与原始光谱相比,直接利用SPA进行波段选择,在一定程度上能提升模型预测拟合程度,但是预测的精度取没有提升;若先利用MSC预处理,将原光谱的噪声信息去除,再利用SPA算法对预处理光谱进行波段选择,可以显著的提高模型预测的精度,同时能够有效降低均方根误差。

图6 不同处理方法的实际值与预测值散点图Fig. 6 Scatter diagram of actual value and predicted value of different treatment methods

若在原光谱数据的基础上,添加试样宽度与厚度,并利用MCS−SPA进行处理,其预测能力和预测情况见表4及图7。

比较表4与图7,加入其他的关联变量对预测模型的精度有了较大的提升,所以在建立预测模型时,可以加入几个独立变量,来提高模型的预测能力。但是在添加变量时,应当检测变量之间的共线性,防止在添加其他变量后,模型的拟合度与预测精度下降。

图7 添加不同变量的抗压强度实际与预测散点图Fig. 7 Actual and predicted scatter plots of compressive strength with different variables added

表4 添加不同变量建立的PLS对比结果Table 4 Comparison results of PLS established by addingdifferent variables

3 结论

针对人工林翅荚木缺少有效的无损检测手段的问题,本研究重点讨论了利用中红外光谱对人工林翅荚木顺纹抗压强度进行快速检测。结果表明利用中红外无损检测人工林翅荚木的方法是可行的。主要结论如下。

针对傅里叶光谱仪器采集的木粉样品漫反射的光谱数据,对其进行合理有效的预处理手段,如MSC、 1stD等可以有效地的提升预测模型的精度。

在采用SPA算法对预处理后的光谱数据进行波段选择,可以有效的提升模型预测精度,最后预测的R2与SEP分别为0.910 9与0.612 5,能够满足对人工林翅荚木的无损检测的需求。

对比单一的变量,添加其他独立的自变量,如试样的宽度与厚度,可以提高拟合程度,同时的提升模型的预测精度,即降低SEP。但是在添加变量时,应当检测变量之间的共线性,防止在添加其他变量后,模型的拟合度与预测精度下降。

猜你喜欢

波长预处理光谱
基于三维Saab变换的高光谱图像压缩方法
KR预处理工艺参数对脱硫剂分散行为的影响
预处理对医用外科口罩用熔喷布颗粒过滤性能的影响
煤炭矿区耕地土壤有机质无人机高光谱遥感估测
一种波长间隔可调谐的四波长光纤激光器
手术器械预处理在手术室的应用
基于3D-CNN的高光谱遥感图像分类算法
杯中“日出”
污泥预处理及其在硅酸盐制品中的运用