基于近红外光谱技术的杉木总酚含量模型构建与应用
2022-10-11程琳黄开勇蓝肖陈代喜李魁鹏莫宗恒王斌赖苑修
程琳,黄开勇,蓝肖,陈代喜,李魁鹏,莫宗恒,王斌,赖苑修
(1广西林业科学研究院广西优良用材林资源培育重点实验室,广西南宁 530002;2国家林业局中南速生材繁育实验室,广西南宁530002;3广西大学林学院,广西南宁 530004;4融安县西山林场,广西柳州 546000)
0 引言
【研究意义】近红外光谱(Near-infrared reflectance spectroscopy,NIRS)作为一种简单快速分析技术,可根据特征峰吸收强度比值算出成分含量,实现快速检测化学成分;该技术具有适用范围广、分析快捷,且检测过程无污染等优点。杉木()是我国南方重要的用材林树种之一,具有材性优良、生长迅速的优点,是优质建筑材、装饰用材和纸浆用材(程琳等,2020),具有很高经济和生态效益。植物多酚是天然抗氧化剂的主要来源之一,对缓解植物衰老等具有重要意义(张艳军等,2013)。木材基本密度是衡量木材材质的重要指标,也是估测木材强度的最佳指标(李魁鹏等,2017;郑会全等,2020);晚材率是针叶林特有的材性指标,对评定木材材质有着重要的意义(符韵林等,2005)。随着经济社会日益发展和人民生活水平不断提高,社会对木材材质的要求也在不断提高;总酚含量与影响木材品质的腐朽有着密切相关性,总酚含量越高,木材抗腐朽能力越强(刘欣等,2009)。然而,采用传统化学测定法检测总酚的方法耗时、操作复杂,且需要熟练实验人员进行分析,很难满足林木育种中对大量木样的快速分析。因此,通过近红外光谱技术建立杉木木材总酚含量模型,对实现木材无损检测及木材腐朽预测、提高木材利用率,进而加快木材性状改良进程,具有十分重要意义。【前人研究进展】国外早在20世纪80年代便开始近红外光谱技术的应用研究,我国于20世纪90年代引入该技术(宋岩,2009),目前,近红外光谱技术已在食品(严丽霞等,2017)、农业(黎新荣,2019)等诸多行业得到广泛应用。相关研究者已通过近红外光谱技术完成了对软枣猕猴桃()总酚(付饶等,2013)及石榴(L.)果皮多酚(王琼等,2017)的分析与检测,效果良好。20世纪90年代,国外已将近红外光谱技术应用于木材检测方面,较多用于木材木质素含量测定及物理力学性质间相关性分析(Hoffmeyer and Pedersen,1995)。Hodge和Woodbridge(2004)利用近红外光谱技术对不同生长地区松科(Pinaceae)树种木质素含量进行了预测,采用物种或区域组合进行模型校正,均能得到较好预测模型。我国近红外光谱技术从2006年开始应用于木材化学性能预测(贾茹等,2021)。黄安民等(2007)对表面不同粗糙程度的杉木进行气干密度的近红外光谱检测,木材密度预测效果良好。除了木材密度,木材结晶度也是木材品质的重要指标之一,胡梦霄等(2017)首次建立了杉木木材结晶度的近红外模型,模型校正和预测模型相关系数分别为0.9875和0.9213,预测效果较好。目前杉木总酚研究主要集中在林地土壤(林开敏等,2012)、种子(李佳等,2018)及苗木(魏国余等,2018)等方面。【本研究切入点】采用近红外光谱技术对其木材的研究多集中在木材加工、物理性能及木质素等化学组成方面(王超和余养伦,2021),而关于杉木木材总酚含量建模尚未见报道。【拟解决的关键问题】以杉木为试验材料,在国内首次建立快速检测杉木总酚含量的近红外预测模型,通过一阶导数、标准正态变量转换等方法对杉木木样近红外光谱进行预处理,再利用偏最小二乘法(PLS)和交叉验证等方法完成构建,通过近红外光谱模型可实现在研究和生产中对木材进行预测。
1 材料与方法
1.1 试验地概况
研究地位于广西融安县国家杉木良种基地(东经109°23′,北纬25°20′),海拔200~800 m,地貌以中、低山地为主。地处杉木适生区,属温润亚热带季风气候,年平均气温19.0℃,年均降雨量1942.5 mm。
1.2 试验材料
木样取自广西融安县国家杉木良种基地10年生杉木试验林,于2020年2月对杉木试验林随机选择健康、干型通直的平均木进行木材采样。试验前,样品储存于-20℃冰箱。试验试剂:无水乙醇、Folin-Ciocalteu酚试剂、邻苯二酚(分析纯)、无水碳酸钠(分析纯),均由sigma生物试剂公司提供。仪器和设备:MPA傅立叶变换光谱仪(德国Bruker公司);TU-1810紫外—可见分光光度计(北京普析通用仪器有限责任公司);国华HH-8数显循环恒温水浴锅(常州国华电器有限公司);PX224ZH型电子分析天平(奥豪斯仪器有限公司)。
1.3 试验方法
试验共设114株样木。每株样木于胸高1.3 m处同向取4个木样,其中,1个用于总酚含量化学值测定,1个用于近红外模型建立,余下2个分别用于木材基本密度和晚材率的检测,共计456个木材样品。采集木样后,进行分装和标记。木样带回实验室后,随即进行总酚含量和近红外光谱测定试验。使用K-S检验法对数据进行正态性检验,根据李魁鹏等(2017)、苏丽华(2020)的方法进行木材基本密度及晚材率的测定。
1.3.1 总酚含量化学值测定参考许海棠等(2017)、马若克等(2018)的方法,采用福林酚比色法测定总酚含量,选择邻苯二酚为标准物质绘制标准曲线(图1),用以测定杉木木样的总酚含量(mg/g),标准曲线为=-0.3694+0.9420,=0.9996。
1.3.2 近红外光谱测定首先,将除杂后的木样置于近红外光谱扫描操作台进行扫描前,对扫描仪进行30 min预热;然后,试验在静态下对木样进行扫描,近红外光谱采集参数设置为扫描谱区波段范围为4000~12000 cm(厘米波数),样品扫描时间为64 s,每个样品重复扫描3次;最后,取平均值作为样品的光谱。
图1 邻苯二酚总酚含量校准曲线Fig.1 Calibration curve of total phenol content of catechol
1.3.3 模型构建与优化 取101个样品组成校正集,运用OPUS 7.0进行原始近红外光谱预处理,包括17点平滑处理、多元散射校正、一阶导数、二阶导数、矢量归一化、一阶导数+多元散射校正等。PLS在近红外光谱分析中效果最好、使用频率最高,因此,本研究选择PLS进行数据定性和定量分析。
利用PLS建立近红外光谱校正模型,以校正集决定系数()、验证集决定系数()、校正均方根误差(Root mean square error of estimation,RMSEE)、交叉验证均方根误差(Root mean square error of cross validation,RMSECV)、预测均方根误差(Root mean square error of prediction,RMSEP)和相对标准偏差(RPD)作为评价指标来验证模型建立的预测性能。其中,越大,RMSECV越小,说明模型稳定性和精度越理想;越接近1,RMSEP越小,RPD>2时,说明模型的预测效果越好。
1.3.4 模型的外部验证选取13个样品作为验证集,利用建立的近红外方法对总酚含量进行分析预测,记录近红外光谱的预测值,通过样品化学值与预测值对模型进行外部检验。采用内部交叉验证剔除奇异点。
1.4 统计分析
使用Origin 8.0作图。采用Excel 2007进行数据汇总处理,以SPSS 19.0进行数据检验分析。
2 结果与分析
2.1 杉木木样总酚含量的测定结果
由图2可知,采用化学方法测定114个杉木木样的总酚含量,平均值为4.05 mg/g,最大值和最小值分别为7.21和2.00 mg/g,标准差为1.33 mg/g,变异系数为32.74%。对数据进行K-S正态性检验,显著性检验=0.000<0.05,表明数据正态分布不显著。其中,实测值中有46.5%的杉木木样的总酚含量处于区间3.00~4.00 mg/g,14.0%的杉木总酚含量处于区间2.00~3.00 mg/g,15.8%的杉木总酚含量处于区间4.00~5.00 mg/g(图2)。说明所选木样的总酚含量虽然不满足正态分布,但数据分布范围广,数据差异性大,具有较好的代表性,可满足近红外光谱模型的构建。
根据114个木样中总酚含量的化学值,随机选取101个木样作为校正集,用于模型的建立和交叉验证。其余13个木样作为验证集,用于模型构建后的外部验证。从表1可看出,杉木总酚含量校正集均值为4.04 mg/g,最大值和最小值分别为7.21和2.00 mg/g,标准差和变异系数分别是1.33 mg/g和33.01%;杉木总酚含量验证集均值为4.16 mg/g,最大值和最小值分别为6.50和2.18 mg/g,标准差和变异系数分别是1.27 mg/g和30.59%。
2.2 杉木木样近红外光谱图特征
木材化学组成成分复杂,不易从近红外光谱中提取单一组分的特征吸收带,因此需要利用样品信息较强的范围光谱。114个杉木木材近红外光谱图表明不同样品近红外光谱趋势一致,但各样品的吸收强度有所差异(图3)。近红外吸收带相对较宽,在不同波长具有不同的吸收特点,高波长(低波数)处近红外光谱分辨力比低波长好。因此,光谱区间选择从4000.0 cm开始;总酚在近红外区有较强吸收,各木样的近红外光谱图趋势变化不大,杉木木材在4605.5~4242.9 cm、6102.1~5446.4 cm和9403.9~7498.4 cm3个波段内吸收峰较强。
图2 114个杉木样品总酚含量(化学测定)频率图Fig.2 Frequency diagram of total phenols content(chemical determination)of 114 Chinese fir samples
表1 杉木木样总酚含量情况统计Table 1 Statistics of total phenols content in Chinese fir wood samples
2.3 杉木木材总酚近红外模型的建立
采用标准正态变量转换法(Standard normal variate transformation,SNV)和一阶导数(First derivative)等方法,对杉木木样近红外光谱检测值进行预处理。通过优化,使模型的>0.75、RPD>2.0,得到理想的定标结果时即当做预选模型。经过光谱预处理,杉木木样中总酚含量最佳预处理方法为一阶导数+SNV,光谱波段范围为9403.9~7498.4 cm、6102.1~5446.4 cm和4605.5~4242.9 cm。
利用PLS和交互验证建立校正模型和交叉检验模型。其中,校正模型中,校正均方根误差(RMSEE)、校正集决定系数()和相对标准偏差(RPD)分别为0.448、0.8679和2.75;交叉验证模型中,交叉验证均方根方差(RMSECV)、交叉验证决定系数和相对标准偏差(RPD)分别为0.586、0.7549和2.02(表2)。杉木木样中总酚含量的交叉验证均方根误差(RMSECV)和预测均方根误差(RMSEP)很小,校正集决定系数()和验证集决定系数()分别为0.8679和0.7549,RPD>2,说明模型具有较好的稳定性和预测效果。
2.4 杉木总酚含量近红外光谱模型的外部验证
图3 114个杉木样品近红外原始光谱Fig.3 Near-infrared original spectra of 114 Chinese fir samples
通过运用OPUS 7.0对外部检测样品的光谱进行分析预测,根据预测值和标准值的相关因子最大或预测值均方根误差(RMSEP)最小的原则选出一个最优模型,即为杉木近红外光谱的快速测定模型。随机抽取13份杉木样品作为验证集,验证的预测值和化学测定值如表3所示,总酚含量预测值范围为2.32~6.45 mg/g,预测值平均值为4.05 mg/g,总酚含量绝对误差范围在0.05~1.19 mg/g,平均绝对误差为0.463 mg/g,预测偏差较小。对杉木木样中总酚含量近红外化学值和实测值进行检验时0.502>0.05,表明用近红外方法检测和化学测定的方法得到的两组数据差异不显著。从图4可看出,决定系数()为0.8041,模型具有较高的可信度;杉木木样总酚含量最优模型预测均方根误差(RMSEP)和相对标准偏差(RPD)分别是0.521和2.16,构建的模型可用于生产中快速预测。
表2 杉木近红外光谱分析模型和模型外部检验参数Table 2 Near-infrared spectral analysis model of Chinese fir and its external test parameters
2.5 杉木总酚含量与木材品质间的相关分析
对114个杉木木样进行材性分析,结果(表4)表明,木材基本密度和晚材率的变异范围分别为0.135~0.477 g/cm和11.842%~80.645%,其变异系数分别是14.251%和33.346%。说明基本密度和晚材率离散程度高,测定数据有效。
如表5所示,对杉木木样基本密度和晚材率进行K-S正态性检验,2个指标的值均小于0.05,正态分布均不显著。杉木木样中基本密度和晚材率的分布范围决定着数据的可行性,范围越广则数值越可靠。其中,80.0%的杉木木样的基本密度处于区间0.3~0.4 g/cm,6.1%的杉木基本密度处于区间0.2~0.3 g/cm,12.3%的杉木基本密度处于区间0.4~0.5 g/cm(图5-A);36.0%的杉木木样的晚材率处于区间30~40%,31.6%的杉木晚材率处于区间20%~30%,15.8%的杉木晚材率处于区间40%~50%(图5-B)。上述结果说明参试数据可靠,可用于下一步相关分析。
表3 杉木总酚含量近红外光谱分析模型外部检测结果比较(mg/g)Table 3 Comparison of external test results of near-infrared spectroscopy model for total phenols content of Chinese fir(mg/g)
对杉木木材总酚含量与木材基本密度、晚材率间的相关性进行分析。总酚与基本密度呈极显著差异(<0.01),与晚材率呈不显著正相关(>0.05)。说明通过总酚来判定木材基本密度、晚材率的方法具有可行性,对杉木良种选育具有重要指导意义。
3 讨论
图4 预测值与实测值相关性Fig.4 Correlation between predicted and measured values
表4 杉木木材基本密度、晚材率的结果统计Table 4 Statistics of basic density and late wood rate of Chinese fir
表5 杉木木样基本密度和晚材率的K-S检验Table 5 K-S test of basic density and late wood rate in Chinese fir wood sample
广西是我国杉木的主产区之一,森林覆盖率为62.3%,占全国第三;现有杉木林面积超145万ha,蓄积量达1.3亿m,在林业发展中占有重要地位(陈代喜等,2015)。进入21世纪后,近红外光谱技术在农林领域发展迅速,不仅涉及玉米(陈建红等,2011)、水稻(梁剑等,2013)、小麦(王赋腾等,2017)等农作物的快速检测,还包括杉木(黄安民和江泽慧,2007)、毛竹(周斌雄,2015)、桉树(朱华等,2020)等林木的化学检测。植物多酚是木材的次生代谢产物,含量仅次于纤维素、半纤维素和木质素,是木材的重要组成成分;植物总酚与树木的生长及化学组分都具有密切联系,并对木材密度、硬度及力学性质等材质指标具有重要的影响(王超和余养伦,2021)。应用近红外光谱技术(NIRS)对杉木木样进行扫描,得到木样中的总酚含量,快速方便,被广泛应用于木材化学成分检测中(贾茹等,2021)。
图5 杉木样品基本密度(A)和晚材率(B)频率Fig.5 Frequency diagram of basic density(A)and percent of late wood(B)of Chinese fir samples
本研究构建的杉木木样近红外光谱模型,预测值与实测值无显著性差异,可用于木材中总酚含量的快速检测和分析。对114个杉木木样进行总酚含量化学测定,总酚含量范围为2.00~7.21 mg/g,标准差为1.33 mg/g,木材总酚化学测定方法与刘欣等(2009)的方法相同,试验结果验证了方法的可行性,也说明杉木木样总酚含量数据可信度高,符合建模需求。木材总酚与基本密度呈显著性相关,使筛选材质优良的杉木良种成为可能,杉木不同用途对总酚含量和基本密度的要求也不同,在生产中可根据需求选择合适的木材加工利用。研究得出建模最佳光谱范围为9403.9~7498.4 cm、6102.1~5446.4 cm及4605.5~4242.9 cm;最佳预处理方法为一阶导数+SNV,与陈建红等(2011)的方法一致,说明该方法的适用性高,可为其他树种总酚含量检测提供参考。
相关研究表明,酿酒葡萄总酚含量的近红外光谱模型中,校正模型和预测模型相关系数分别是0.9017和0.9013,预测均方根误差(RMSEP)是1.6868,预测偏差为2.3080,模型可用于葡萄酒实际生产的总酚检测(罗一甲等,2021);软枣猕猴桃总酚的近红外光谱模型,定标集的交叉验证均方根误差(RMSECV)为11.6734 mg/100 g,相关系数为0.8939;预测集预测均方根误差(RMSEP)为16.7690 mg/100 g,相关系数为0.8627(付饶等,2013)。本研究中近红外光谱模型具有一定的检测效果,预测模型可用于日常检测;但若要求检测高精度的样品,精确检测还有所欠缺,还需要进一步提高模型精度;采用PLS建立模型,校正集决定系数和校正均方根误差(RMSEE)分别为0.8679和0.448,交叉验证集决定系数和交叉验证均方根误差(RMSECV)分别为0.7549和0.586;预测均方根误差(RMSEP)和相对标准偏差(RPD)分别为0.521和2.16,决定系数()为0.8041,预测效果较好。实际生产中,需要进一步扩增模型参试样本数和验证指标,以确保模型的适用性和精确性。
红外光谱检测能降低预测分析成本。对杉木材总酚进行预测,探索木材腐朽过程化学成分的变化,为进一步预防杉木早期腐朽具有重要意义。另外,近红外光谱技术在实际应用中还存在模型预测精度、推广型可行性等问题,下一步还需要对不同种质杉木木材中总酚与木材品质间的相关性进行研究,以提高预测效率与准确性。
4 结论
采用近红外光谱技术检测杉木总酚含量可行,能为木材化学成分快速测定提供一种有效、无损的方法。受拟合规则的影响,构建的模虽然不能用于精确的定量测定,仍可应用于日常科研和生产的检测中,在木材材质预测及良种选育等方面具有广阔的应用前景。