APP下载

实木板材抗弯强度的SWCSS-GFK-SVM数据迁移建模方法

2022-05-06陈金浩蒋大鹏张怡卓王克奇

光谱学与光谱分析 2022年5期
关键词:光谱仪落叶松波段

陈金浩, 蒋大鹏, 张怡卓, 王克奇

东北林业大学机电工程学院, 黑龙江 哈尔滨 150040

引 言

抗弯强度(MOR)是木材重要的力学指标, 影响实木产品的质量与安全性。 近年来, 随着近红外(NIR)光谱分析的广泛应用, 力学性能方面的近红外光谱检测已开展大量研究[1-3]。 但是, 近红外光谱设备的波段精度差异、 元器件间的分散性, 使得光谱模型的通用性有待于提升[4-5]。

光谱模型迁移的相关研究始于上世纪90年代[6], 按照策略的不同可以将相关方法划分为反馈标准化法、 预测值标准化法以及模型系数标准化法[7-8]。 反馈标准化法通过主、 从机的输出反馈, 将从机光谱校正为与主机相似的响应光谱并进行建模, 这类方法包括直接标准化(direct standardization, DS)与分段直接标准化(piece-wise direct standardization, PDS)[9]。 DS方法使用变换矩阵将从机光谱线性变换为主机光谱, 而PDS方法则将从机光谱分割为一个个滑窗, 在每个滑窗中使用DS方法进行变换。 DS与PDS方法均为线性变换方法, 当主从设备差异较大时, 方法适应性较差。 预测值的标准化法通过计算主机和从机预测值之间的线性关系来校正从机预测值, 代表方法为斜率截距校正方法(slope and bias correction, SBC)[10]; 但SBC方法仅通过调整线性模型的截距来缩小主机与从机的差距, 局限性大。 模型系数标准化法通过调整从机模型参数来实现主机与从机模型的一致性[11-12], 校准转移方法还包括一些全局建模等特殊方法, 该类方法以牺牲精度建立起所有仪器条件都适用的模型, 模型预测精度普遍较低[13-15], 代表性的方法为两步偏最小二乘(two step partial least squares)方法[16], 广义最小二乘加权法以及迁移学习(transfer learning)等方法[17]。

近年来, 随着深度学习等技术的逐渐发展, 迁移学习引起了广泛关注[18]。 迁移学习能够将已训练好的模型参数转移到新模型来帮助新模型训练, 并将某个领域或任务上学习到的知识或模式应用到相同领域不同问题中。 Geodesic Flow Kernel(GFK)方法是一种迁移学习方法, 目前主要应用于图像处理领域中[19]。 该方法将源域子空间和目标域子空间嵌入到格拉斯曼流形中, 通过构建测地线核函数, 将主机与从机光谱数据集映射到一个高维流形空间, 实现数据从源域到目标域之间的迁移, 使源域与目标域共享特征。 此外, 在数据迁移中, 波段优选可以通过数据降维提高模型精度。 波段优选方法既要表征待测样本特征, 且不同平台的优选波段偏差不能过大[20]。 稳定一致波长优选方法(screening wavelengths with consistent and stable signals, SWCSS)是由Ni L等人提出的一种光谱波段优选方法[21], 通过计算主机与从机采集的两组光谱差, 优选出具有一致性和稳定性的光谱波段。

以落叶松(Larixgmelinii(Rupr.))板材抗弯强度预测为研究对象, 分别应用One-chip微型集成光纤光谱仪和NIRQuest512光谱仪采集落叶松试材的近红外光谱, 使用预处理与PDS模型迁移方法处理不同光谱仪平台采集的原始光谱后, 将GFK-SVM迁移模型引入近红外校准转移中, 结合SWCSS特征提取方法构建SWCSS-GFK-SVM落叶松板材力学性能检测迁移模型, 解决主机模型与从机的适配问题。

1 实验部分

1.1 材料与仪器

选用落叶松作为试件。 试件取自黑龙江省伊春市清水河林场, 地理位置东经128°01′, 北纬42°30′, 海拔600~700 m之间, 在林场伐倒样木并标记样木生长方向, 在每株树的胸高往上截取长度为1或2 m的木段, 气干后锯解, 加工成力学实验试件。 按照木材物理力学性质试验方法《GB1927~1943—2009》加工试件, 在温度25 ℃左右, 湿度恒定的条件下, 分别使用One-chip光谱仪与NIRQuest512光谱仪采集试件光谱。 One-chip光谱仪采集光谱数据集设为从机光谱, NIRQuest512光谱仪采集光谱数据集设为主机光谱。 光谱仪主机与从机参数表如表1所示。

表1 光谱仪平台参数对比

参照国家标准《木材抗弯强度试验方法》(GB 1936.1—2009)、 《木材抗弯强度测定方法》(GB 1936.2—2009)中的测试步骤及规范, 加工制备了200组落叶松板材试件样本, 并对板材试件进行编号, 按照编号使用万能力学性能试验机测定落叶松试件无疵试样的抗弯强度, 用两个光谱仪分别采集光谱得到试件的主机光谱以及从机光谱。

1.2 近红外光谱采集

主、 从两个光谱仪采集得到的近红外光谱如图1与图2所示, 由于两个光谱仪波长范围不一致, 且从机光谱仪受杂散光、 光谱背景与基线漂移干扰严重, 所以采用SNV、 SG等预处理方法对光谱进行降噪与去趋势处理[22], 去除基线漂移和背景的干扰, 区分重叠峰, 提高分辨率和灵敏度。 然后, 裁剪从机光谱波长, 实现两个光谱仪波段范围统一。 因为两设备测得的光谱差异大, 直接使用GFK-SVM方法建立的全局模型准确率低, 所以从机光谱经PDS校准后, 再使用GFK-SVM方法构建转移模型, 以提高模型预测精度。

图1 主设备原始光谱

图2 从设备原始光谱

1.3 SWCSS-GFK-SVM方法

设SDPDS为试件主机光谱标准差, SDDSI为主光谱和从光谱之间的偏差, 筛选出SDPDS与SDDSI比值较高的波段。 SDDSI与SDPDS由式(1)与式(2)表示

(1)

(2)

则bj可表示为

bj=SDDSI(j)/SDPDS(j)

(3)

bj理想值为1, 表示从机光谱与主机光谱偏差与主机光谱标准差值相同, 设置合适阈值bj对两组数据集光谱波段进行波段优选。

φ:t∈[0, 1]→φ(t)∈G(d,D)

(4)

式(4)中,φ(0)=XS,φ(1)=XT, 则φ(t)可表示为:φ(t)=XSU1Γ(t)-RSU2Σ(t)。

(5)

(6)

此时从未经降维的原始数据集中取出两个向量xi与xj, GFK内核被定义为

(7)

GFK内核G最终解析式为

(8)

则Γ与Σ的主对角线元素之间满足正弦关系, 第i个元素可用sinθi与cosθi表示,Λ1,Λ2和Λ3均为对角矩阵, 对角元素值为

(9)

(10)

(11)

SWCSS-GFK-SVM核函数由式(12)给出

(12)

(13)

(14)

(15)

综上所述, 使用光谱数据与力学特征数据建立改进GFKSVM迁移模型的流程如图3所示。

图3 SWCSS-GFK-SVM建模流程

2 结果与讨论

图4与图5为经预处理后的落叶松主机光谱和从机光谱。 主机光谱数据集中每个样本的波长范围为900~1 700 nm, 有512个光谱波段数; 从机光谱数据集每个样本的波长范围为900~1 850 nm, 有117个光谱波段。 将从光谱分割为900~1 700 nm, 以保证主机与从机波长范围一致。 图6为分割后的从光谱。

图4 使用S-G与SNV方法处理后的主光谱

图5 使用S-G与SNV方法处理后的从光谱

图6 预处理分割后的从光谱

使用PDS输出的转移矩阵GPDS校正从机光谱数据集。 在应用SWCSS进行波段优选时, 当bj=0.85时, 筛选出14个近红外光谱波段。 以校正后的从机光谱为源域、 主机光谱为目标域, 对GFK-SVM模型中的C与σ参数进行寻优, 寻优方法为网格搜索法, 图7为SVM寻优过程。 当C=820.352 6,σ=0.067 3时, GFK-SVM模型达到最优, 最优值为0.989。

图7 网格搜索方法优化SWCSS-GFK-SVM模型

利用SWCSS-GFK-SVM建立了落叶松近红外光谱校准模型。 为了验证模型的优越性, 分别使用DS方法、 PDS-GFK-SVM以及DS-SWCSS-GFK-SVM进行实验对比。 表2给出了上述5种校准模型的预测结果, 选择相关系数Rc、 均方根误差RMSEC、 预测相关系数Rp、 预测均方根误差RMSEP作为评价指标, 对所建模型结果进行比较分析。

表2 基于不同迁移模型的结果分析

图8—图12分别为上述5种方法建立的校准模型的回归散点图, 图中红色圆圈表示训练集的预测值与实际值之间的拟合散点图, 蓝色星号表示测试集预测值与实际值之间的拟合散点图。 在图8对应的DS-PLS转移模型中, 首先使用DS方法校正从机光谱, 将校正后的光谱输入到以训练好的主机模型中测试预测值与实际值之间的拟合程度; PDS-PLS转移模型构建方法与DS-PLS模型类似, 只是将DS方法变更为PDS方法; 对于图12对应的PDS-GFK-GVM转移模型, 为从机光谱经PDS校正后, 使用GFK-GVM迁移模型基于主机与从机光谱数据建模得到; 图9与图11对应的转移模型则在PDS-GFK-GVM模型基础上添加一步SWCSS特征选取方法。 从5张散点图可得, PDS-SWCSS-GFK-SVM校准模型质量明显优于其他方法。

图8 DS-PLS近红外转移模型

图9 DS-SWCSS-GFK-GVM近红外转移模型

图10 PDS-PLS近红外转移模型

图11 PDS-SWCSS-GFK-GVM近红外转移模型

图12 PDS-GFK-GVM近红外转移模型

实验结果对比表明, PDS采用滑窗技术优化了DS对数据的转移效果, PDS-PLS的预测集的相关系数Rp为0.812, 较DS-PLS的0.793有所提升; GFK-SVM的迁移模型对比PLS模型, 预测集的相关系数Rp从0.812提升到0.829, 均方根误差RMSEP从22.374降低到17.853, 说明GFK-SVM更适应数据迁移场景, 能够基于源域数据集提升所建校准模型的准确率; 使用SWCSS优化GFK-SVM迁移模型, 预测集的相关系数Rp从0.829提升到0.875, RMSEP从17.853降低到11.975, 说明SWCSS特征提取能够根据两组光谱数据集之间的差异与共性, 针对性的进行波段优选。

3 结 论

针对近红外光谱仪采集光谱间的数据差异, 以落叶松的力学性能预测为研究对象, 运用One-chip与NIRQuest512两台近红外光谱仪, 研究了不同类型光谱仪间的模型泛化方法。 实验结果表明GFK-SVM迁移模型构建精确度更高的全局预测模型, 通过对从机光谱向主机光谱的非线性变换, 实现主机模型在从机光谱数据预测的泛化, 并且GFK-SVM迁移模型使用主机与从机光谱两组不同设备光谱共同构建预测模型, 较之PLS预测模型只使用主机近红外光谱建模, GFK-SVM提升了数据集的使用效率; PDS方法可以实现光谱仪光程与波段数统一, 大大提升了GFK-SVM的模型质量; 使用SWCSS方法对GFK-SVM进行改进, 保证特征选择的有效性与稳定性, 为不同设备间的迁移建模提供了一定的科学基础。

猜你喜欢

光谱仪落叶松波段
最佳波段组合的典型地物信息提取
结合三反消像散光学系统的中阶梯光栅光谱仪设计
落叶松病虫害防治措施探讨
山西落叶松杂交良种逾10万亩
落叶松病虫害防治措施探讨
落叶松育苗及田间管理技术探究
分辨率带宽对光栅型光谱仪功率和波长测量的影响
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术