应用近红外光谱分析对竹材力学强度的预测1)
2022-04-27李超陈勋张立新马心雨黄英来
李超 陈勋 张立新 马心雨 黄英来
(东北林业大学,哈尔滨,150040)
竹子(Bambusoideae)是地球上生长最快、用途最广的植物,是一种丰富的可持续资源。竹林约占世界森林总面积的1%,全球共有3 150万hm2的竹林,其中60%集中在中国、印度和巴西等快速发展的国家。我国竹子资源丰富,材质优异,生长快,有显著的经济、生态和社会效益,可以代替木材作为建筑材使用[1]。建筑材的力学强度决定了建筑的承载力和牢固性,所以本试验以展平竹为研究对象展开分析。现有的力学性能检测方法一般是传统的弯曲机械测量法,通过机械弯曲得到评价竹材产品性能最重要的两个力学性能指标——断裂模量(MOR)和弹性模量(MOE)。这种方法虽然准确可靠,但它耗时、具有破坏性,并且造成了材料浪费。因此提出一种可靠、准确和快速的计算机判别竹材力学强度的方法,对竹材的分析有重要的指导意义。
近红外光谱技术(NIR)是现在国际上公认的最有应用价值的分析技术之一,在分析竹材的物理性能方面前途广阔。近红外光谱主要是由于分子振动的非谐振性使分子振动从基态向高能级跃迁时产生的,记录的主要是含氢基团振动的倍频和合频吸收,不同基团或不同化学环境中的近红外吸收波长与强度都有明显差别,所以近红外光谱具有丰富的结构和组成信息[2]。20世纪80年代后,计算机技术飞速发展,使得近红外光谱技术开始慢慢地应用于实际问题中,近红外光谱也可以结合现代计算机技术、光谱分析技术、数理统计以及化学计量学等多个领域,其独特性得到日益广泛的应用。发展到现在,近红外光谱仪器越来越小型化,相关技术越来越成熟,逐渐应用在农业生产、石油化工、食品制药、林业应用等许多方面[3]。例如,李耀翔[4]等利用近红外光谱结合非线性偏最小二乘法对落叶松(Larixgmelinii(Rupr.) Kuzen)密度进行了精准预测;江泽慧[5]等分别对杉木(Cunninghamialanceolata(Lamb.) Hook.)的3个切面采集近红外光谱进行研究,最终得到基于横切面的密度预测精度最高;Tham et al.[6]应用电容法与近红外光谱法对实木的密度和含水量进行了预测;Hwang et al.[7]使用近红外光谱技术对韩国的建筑常用树木松树进行了分类识别。在竹材的研究中,有很多学者采用近红外方法进行分析,孙柏玲等[8]通过不同偏最小二乘法对慈竹(Neosinocalamusaffinis)纤维素结晶度进行建模分析,模型的相关系数达到0.88;Yang et al.[9]建立了偏最小二乘模型对竹子组分中纤维素、木聚糖和木质素进行预测,模型相关系数达到了0.994、0.990和0.996,能够很好地对竹材的不同部位进行区分;刘君良等[10]用反向区间偏最小二乘法优选光谱区间建立了慈竹密度、抗弯强度和顺纹抗拉强度模型,其相关系数分别为0.85、0.88、0.88;莫军前等[11]采集3种不同温度热处理的毛竹试件的近红外光谱,利用偏最小二乘法对竹材进行分类,建立抗弯强度预测模型,其MOR和MOE预测模型的决定系数别分为0.82和0.55。本文对经高温软化后展平的竹板进行了多点、多面的近红外光谱数据采集,使用深度学习和浅层学习模型相结合的方法,对展平竹的力学性能做出预测,由于传统的力学性能检测方法耗时耗力,且具有破坏性,基于近红外光谱建立竹材力学性能预测模型,近红外光谱采集方法简便且快速,能够实现对竹材的力学强度进行无损、快速预测的目的。
深度置信网络(DBN)是一种深度网络模型,与传统神经网络相比,它的优点主要体现在可以通过逐层预训练对网络里每个神经元中参数的初值进行优化,避免了由于随机初始化参数与理想结果偏差过大而导致的局部最优值的风险。输入特征经过多层网络模型的计算进行多次特征变换之后,会得到更加准确的特征。但是在多层神经网络的训练中,模型复杂度高,难以收敛,深度置信网络解决了这一难题,通过逐层预训练避免了对多层神经网络直接进行训练所带来的高复杂度的问题[12]。局部支持回归向量(LSVR)是对每一个测试样本分别构造单独的模型,并且选用不同的局部训练样本构造模型,很好地改善了近红外分析法中模型非线性度不够的缺点,是当前浅层学习中预测能力较为准确的模型[8]。
根据以上背景,本文将深度置信网络与局部支持向量回归相结合,建造DBN_LSVR预测模型,并根据算法原理与实验条件合理的设置整体网络模型的参数,用于竹材力学性能的预测。
1 材料与方法
本文采用的竹材是毛竹(Phyllostachysheterocycla(Carr.) Mitford cv. Pubescens),通过对毛竹进行展平加工得到平直状的竹片,竹片尺寸为长2 m、宽140 mm、厚8 mm,再经过对其表面抛光,得到厚度为6 mm的板材。
1.1 展平竹的制备
由于竹子的结构与木材不同,竹干为空心圆柱形,不能通过锯切直接得到大而平的表面板,要对竹子进行展平加工,加工过程如图1所示,将一定长度范围内的原竹开槽处理后,先对其进行高温软化处理,软化使竹简的展开槽增大并具有了暂时的塑性,然后将竹简在机械压力的作用下展成平直状的竹片。相对于原竹材,竹展平板的静曲强度和弹性模量都有所下降,但展平竹板的力学性能符合质量要求,基本不影响其后续的加工利用[13]。
图1 扁平化竹材生产工艺
本试验采用的展平竹为2 m(长)×140 mm(宽)×8 mm(厚)的板材。因含水率高,需经干燥后再加工。先将展平竹长度切削至1 280 mm,如图2所示。展平竹的硬度较高,不适宜机器直接纵向切削,试验采用刨光机对展平竹2面刨光。刨光后再次进行砂磨,砂磨至厚度为6 mm。此时红色消去,竹节仍旧清晰可见。从切削好的试件中选出500个样本作为试验样本。由于试验材料是展平竹板,厚度小,竹板在受力过程中主要是切向平面受力,纵向平面对竹材的力学性能影响小,因此在展平竹板的力学性能研究中,只考虑展平竹板切向平面的力学性能。
图2 展平竹板材
1.2 展平竹的数据采集
试验选用美国Ocean Optical公司生产的光谱仪收集近红外光谱。光谱仪配有光纤探针,其波长范围为900~1 700 nm,分辨率为3.0 nm。通过直径约5 mm的光纤探针获得实验所用展平竹的NIR光谱。在环境温度、湿度相对稳定的条件下采集光谱数据。测定固体样品的NIR光谱时,一般要测定样品不同面的光谱以减少测定误差并获得可靠的信息,有时可以进行光谱的重复测定以提高光谱图的信噪比,信噪比就是光谱数据中信号与噪声的比例,信噪比越大,光谱数据的噪声越小。
SPEC View 7.1用于收集和记录光谱,在实验中采集竹材切向采集面的红外光谱数据,对于每个扫描点,收集30次扫描并将其平均为单个光谱。如图3所示,采集样本切向采集面上的8个光谱,这样的8个光谱作为这一样本的光谱数据,在竹材力学性能的预测模型中作为影响因子使用。近红外光谱的测量过程如图4所示。
图3 探头光谱采集点示意图
图4 近红外光谱测量过程
由于光谱数据除了纯光谱之外还包含基线漂移、噪声等信号,与此同时存在着因样本自身因素以及环境等因素带来的谱线偏移,采集到的光谱数据需要经过处理之后才能使用[14]。在近红外光谱数据的处理中,采用了Savitzky-Golay平滑滤波的方法,核心思想是通过k阶多项式拟合某个长度窗口中的数据点,然后得到拟合结果在离散化之后,S-G滤波实际上是移动窗口的加权平均算法,但其加权系数不是简单的常数窗口,而是通过滑动窗口中给定高阶多项式的最小二乘拟合[15]。
1.3 展平竹力学数据的采集
弹性模量(MOE)与静曲强度(也叫断裂模量MOR)是两种典型的力学性能常量,它们可以有效反应木材的力学性能。
本次试验采用万能试验机,对单元材料试验样本分别进行4点弯曲试验,采集其MOR、MOE分别记录。竹材力学性能参数如表1所示,500个样本的力学性能的数据统计:弹性模量均值5 424 MPa、弹性模量最大值9 462 MPa、弹性模量最小值3 704.17 MPa、断裂模量均值82.48 MPa、断裂模量最大值132.15 MPa、断裂模量最小值26.44 MPa。
表1 试件力学性能参数
1.4 构建DBN_LSVR力学性能预测模型
深度学习在回归预测领域的研究相比于分类问题研究较少,当前主流的深度学习回归预测,其隐藏层层数一般设置2到3层。原因主要有两个,一是如果模型的层数增多,模型内部和模型外部设置的参数也会增多,所需的数据量将会变多。二是当构建大多数结构化的数据集时,已经预先进行了特征的选择,所以不需要使用层数很多的模型对特征进行高度抽象。本文中单一板材近红外光谱和力学性能数据量较少,因此综合考虑,只选取了有两个隐藏层的深度置信网络学习特征。
本文的模型采用的深度置信网络是由多个受限玻尔兹曼机层和一层BP神经网络构成的一种深度网络模型[16]。使用多个隐藏层的网络模型能够对输入特征进行多次特征变换,得到更有效的特征[17],逐层预训练有效地避免了对多层神经网络直接进行训练所带来的高复杂度的问题,深度置信网络结构如图5所示。
基于DBN_LSVR的单一板材的MOR与MOE预测过程如下:
(1)近红外光谱预处理。将近红外光谱数据进行归一化与去噪处理。
(2)设置DBN输入层节点个数即影响因子数为16,输出节点个数设置为2,隐藏层设置为2层,每层节点个数为8个。
(3)逐层预训练。使用训练集的数据对DBN的两个RBM逐个进行无监督学习,让每个RBM的参数达到局部最优。
(4)有监督微调。将输出层与训练完成的两个RBM组成一个4层的BP神经网络,对其进行有监督训练,并将误差逐层反向传播,调整各层参数,直至收敛。
(5)提取出第二个隐藏层的特征。训练好的DBN对数据集的影响因子进行特征学习,令最后一个隐藏层的数据为得到的新特征。
(6)构建预测模型。使用新特征和LSVR构建竹材力学性能预测模型,对预测集进行预测。
流程如图6所示。
v0为输入数据,V0为输入层,H为隐藏层,W为两层之间的连接权重,Y为输出层,y为输出值,BP为深度置信网络中的BP神经网络,RBM1为深度置信网络中的RBM模型,n为网络中的总层数。
图6 DBN-LSVR预测流程图
1.5 模型评价指标
为了检验预测模型对竹材力学性能预测能力以及模型的泛化能力,本文使用已经构建的预测模型对预测集样本进行预测。使用平均绝对误差(EMA)、均方根误差(ERMS)作为发生程度的评价指标,表达公式如下所示:
为验证DBN_LSVR预测模型的预测效果,将DBN_LSVR预测模型与DBN、LSVR、BP3种预测模型的预测效果进行对比,根据模型的预测值和真实值,分别计算几种模型的平均绝对误差和均方根误差,比较模型平均绝对误差和均方根误差的大小来检验模型的力学性能预测能力。
2 结果与分析
2.1 试验数据的预处理
鉴于试验数据采集过程中存在系统噪声和测量噪声,而噪声的存在不利于后续数据分析,因此本文采用Savitzky-Golay平滑滤波对光谱数据的测量值进行滤波。如图7所示,给出了一个竹材样本取的3个点的波长—吸光度曲线,当波长范围在1 400~1 700 nm时,由于近红外光谱受到噪声干扰,光谱信号强度出现严重的“毛刺”现象。利用Matlab的sgolayfilt函数,设置多项式阶次为3,窗口框长度为7,在相同波长范围下、同一竹材经S-G滤波处理后得到的近红外光谱曲线如图8所示,相较于滤波前,近红外光谱的轮廓更加清晰,吸收峰更加明显,这有利于后续预测模型的分析。
图7 原始光谱图
将每个竹材的8个光谱数据堆叠成高维矩阵作为数据集的原始数据部分,将对应力学数据作为数据集的标签,进而组成竹材的近红外光谱数据集。本文采集了500组近红外光谱数据,随机抽取330个样本组成训练集,170个样本组成测试集。
2.2 模型结果预测
使用DBN_LSVR预测模型对单一板材的MOR与MOE进行预测,将预测值与真实值进行对比,绘制出真实值曲线和预测值曲线,比较两条曲线的拟合效果,试验结果如图9所示。
图8 预处理后的光谱
图9 模型预测值与真实值对比
从图9可以看出,对于测试集样本,DBN_LSVR预测值与实际值拟合较好,预测值曲线与真实值曲线拟合较好,可以较为有效地对展平竹的力学性能进行预测。
为了进一步验证DBN_LSVR对竹材的MOR与MOE的预测能力,将该预测方法的预测结果与DBN、LSVR、BP等模型进行对比试验,使用均方根误差、平均绝对误差对各个模型的预测能力进行评价(表2和表3)。
表2 平竹MOR预测误差
表3 平竹MOE预测误差
根据表2、表3可以看出,通过预测模型误差的对比,DBN_LSVR模型的平均绝对误差和均方根误差明显小于其他几种模型的预测误差,DBN-LSVR模型的预测效果较好,这说明构建深度学习建立预测模型的预测效果较好,模型的预测数据较为准确,对特征进行学习可以有效地降低预测误差。DBN_LSVR是所有模型中预测误差最低的,因为该模型使用DBN进行特征的自动提取,学习到的新特征优于原特征,并使用新特征在LSVR进行建模,充分发挥LSVR的优势,提高预测准确率。
计算预测模型的相关系数,MOR和MOE预测模型的相关系数分别为0.85和0.80,预测效果较好,模型的预测值与真实值吻合较好,由此可知,利用该预测模型可以预测单一板材的MOR、MOE。
3 结语
针对现有主流竹材力学性能弯曲机械测量检测方法耗时、且具有破坏性的问题,本文提出了一种基于近红外光谱的DBN_LSVR竹材力学强度无损预测方法。
首先,对竹材进行展平加工获得展平竹,并对每个展平竹进行8点红外光谱数据采集和弹性模量、断裂模量测试。其次,针对实验过程中系统噪声和测量噪声扰动严重的问题,对红外光谱数据进行Savitzky-Golay平滑滤波,并以滤波后红外光谱数据作为主体,弹性模量和断裂模量作为标签,构建近红外光谱竹材力学性能数据集。最后,在上述数据集的基础上,分别构建DBN_LSVR深层神经网络进行弹性模量、断裂模量性能预测。选用DBN的原因是其多隐藏层可以对特征进行更好的学习,选用LSVR的原因是其泛化能力强,从而进行更精准的预测。
基于DBN_LSVR的深层神经网络模型对竹材MOR和MOE的均方根预测误差分别为716.23、17.54,平均绝对预测误差分别为524.40、16.82;MOR和MOE预测模型的相关系数分别为0.85和0.80。实验结果表明DBN_LSVR预测模型相较于单独使用DBN、LSVR、BP神经网络,预测效果更优,可有效预测竹材的力学性能。本文提出的预测方法在不对竹材造成破坏的基础上,缩短了判别竹材物理性能的时间和成本,为竹材力学性能的理论分析提供了技术支持。