APP下载

近红外光谱技术在烟叶化学分析中的应用*

2019-10-15蒋宏霖刘会杰王学杰贾海江徐雪芹

科技与创新 2019年18期
关键词:总糖预测值烟叶

蒋宏霖,刘会杰,王学杰,贾海江,徐雪芹

近红外光谱技术在烟叶化学分析中的应用*

蒋宏霖,刘会杰,王学杰,贾海江,徐雪芹

(广西中烟工业有限责任公司,广西 南宁 530001)

采用近红外光谱法,对不同地区、不同等级具有代表性的500多个烟叶样品进行扫描,同时应用化学分析仪测定烟叶中的总糖、还原糖、总烟碱、挥发碱、钾含量,应用近红外分析软件QUANT6.5,将光谱与对应的化学成分值相关联,建立近红外模型。结果表明,建立的烟草中总糖、还原糖、总烟碱、挥发碱、钾等化学成分的回归模型线性很好,通过20个未知样品对所建模型的验证,所建指标的实际值和预测值的平均相对偏差均小于5%,表明所建模型可直接应用于烟草中主要化学成分的快速分析。

近红外光谱技术;烟叶化学成分;模型;快速分析

近红外光谱技术作为一种简便、快速、低消耗和无污染的处理技术,具有分析过程高效、绿色、环保的现代分析特征,从而成为近年来发展较快、引人注目的光谱分析技术之一。烟草作为天然植物,含有大量的CH、OH、NH和C=O等官能团,因此可以应用傅里叶变换近红外分析检测技术对其进行分析,减少化学分析所用试剂带来的环境污染。目前,应用傅里叶变换近红外快速测定烟叶中化学成分已成为烟草化学研究的热点之一,如蒋锦锋等[1]应用傅里叶变换近红外光谱法扫描具有代表性的烟草近红外光谱数据, 采用偏最小二乘回归建立了近红外光谱信息与其含量之间的定量校正模型,建立了挥发性酸和挥发性碱的模型;王东丹等[2]应用傅里叶变换近红外漫反射光谱仪,建立了卷烟烟丝总糖和还原糖的近红外定量分析数学模型;覃鑫[3]将近红外光谱分析技术应用于测定卷烟生产在线烟草样本化学成分,建立了烟草总糖、还原糖、总植物碱、氯、总氮5项化学成分的校正模型;陈萍等[4]应用近红外光谱法预测云南香料烟的总糖、还原糖和总氮。程志颖等[5]采用粒子群算法结合支持向量回归法对化学成分进行建模。本研究利用傅里叶变换近红外光谱近红外(NIR)技术,建立烟叶总糖、还原糖、总植物碱、钾和挥发碱进行定量分析模型,旨在实现快速无损检测烟草中主要化学成分。

1 材料与方法

1.1 样品采集

为了使建立的数学模型具有广泛的适用性,本研究样品选取了2015—2018年云南、贵州、广西、湖南等不同产区、不同等级的初烤烟样品共计500多个用于建立模型,选取20个未知样品进行模型外部验证。

1.2 样品制备

将烟叶样品抽梗,用QS-1试样切丝机切丝,于40 ℃下烘干,使样品的水分基本保持一致,再用1095 Cyclotec(XF-98B)型旋风精密粉碎机充分粉碎,过60目筛。

1.3 化学成分分析

建模烟叶样品的化学成分采用Skalar流动分析仪、AA3连续流动分析仪及蒸馏萃取装置进行测定。其中,烟叶总糖、还原糖、总植物碱、钾、挥发碱含量采用流动注射法测定。每个样品以此检测数据作为基础化学值数据与样品的光谱数据对应,采用偏最小二乘法(0PLS1)建立回归模型。

1.4 光谱扫描和数据处理

烟叶样品谱图扫描采用BRUKER公司(德国)生产的MPA型傅里叶近红外光谱仪(带近红外定量分析漫反射镀金大积分球和样品旋转器采样附件)进行,应用Bruker OPUS中定量分析

采用软件QUANT6.5对谱图进行处理,具体操作如下:将烟草粉末装入样品杯,在杯中的高度约为3 cm,将砝码压在样品上10 s后取出,用纱布将杯子底部的石英玻璃擦拭干净,然后将样品杯置于旋转平台上进行NIR扫描。

操作参数为:光谱扫描范围12 000~4 000 cm-1,光谱分辨率8 cm-1,扫描次数64次(约30 s)。

以透过方式采集光谱数据并处理为吸收光谱的一阶微分。在建模过程中,为消除噪声和基线的影响,采用一阶导数9点平滑(Savitzky-Golay)对扫描后的原始光谱进行预处理。有研究表明,误数据误差水平与仪器相关系数及算法有关[6],因此模型建成后应用近红外定量分析软件包(偏最小二乘算法)对模型进行优化。

2 结果与分析

2.1 FT-NIR定量模型的建立

全光谱数据经一阶导数预处理后,输入对应建模样品的总糖、还原糖、总植物碱以及钾等化学测定数据,采用偏最小二乘法和交互验证建立校正模型。采用光谱影响值(Leverage)和化学值误差(Residua1)这2个参数分别剔除光谱和化学值的异常值。经过异常值的剔除进行逐步优化,最后得到总糖、还原糖、总植物碱、挥发碱、钾的回归模型。

2.2 模型的优化

当校正模型的雏形建立后,为确保其实用性,必须对模型进行优化。优化模型是一个重复运算模型的过程,其目的是剔除异常值(Outlier),直到获得最佳数理指标的校正模型。异常值是指远离模型整体的测量数据,对模型的回归分析影响较大,这类数据一般具有较大的杠杆值(Leverage)和残差值,需进行有效剔除。

本研究采用交互验证(Cross-validation)建立校正模型,应用光谱影响值和化学值误差这两个参数分别对异常光谱和化学值进行剔除,并选择与该组分或指标相关的最佳谱区范围、最佳光谱预处理方法和最佳主成分维数。在确定上述参数的同时要对模型进行检验,以确保模型最优。对烟草中的总糖、还原糖、总烟碱等模型进行逐步优化,所得数学模型较为理想,具体模型见图1~图5,各模型具体参数见表1。从图1~图5和表1中可以看出5种化学成分的回归模型均具有较好的相关性,可以进行定量预测。

图1 总糖近红外预测值与化学值的散点图(单位:%)

图2 还原糖近红外预测值与化学值的散点图(单位:%)

图4 钾近红外预测值与化学值的散点图(单位:%)

图5 挥发碱近红外预测值与化学值的散点图(单位:%)

表1 各模型参数

参数Parameters总糖还原糖总植物碱氯钾挥发碱 样品数量467467467213213 主成分数1313141417 决定系数(R2)97.0896.7896.7995.0195.53 内部交叉验证均方差(RMSECV)0.927 00.856 00.129 00.097 20.019 5

2.3 模型检验

为更好地检测模型的预测能力,本研究采用外部验证的方法,选取未参与建模的20个样品,用所建模型预测烟叶样品的总糖、还原糖、总植物碱、挥发碱和钾含量,并与其实测化学值比较,具体分析数据见表2。从表2可以看出,20个样品的上述5种化学成分含量的近红外预测值与实际化学测定值均基本一致,其平均相对偏差分别为2.76%,3.05%,3.91%,4.02%和4.35%,均小于5%,说明所建模型的预测精确性较高。

表2 近红外方法预测值与化学值的比较

编号总糖还原糖总植物碱钾挥发碱 测定值预测值RD/(%)测定值预测值RD/(%)测定值预测值RD/(%)测定值预测值RD/(%)测定值预测值RD/(%) 129.6728.523.9526.6125.593.912.452.411.651.761.770.570.290.283.51 231.9330.793.6428.0627.133.372.722.585.281.621.591.870.310.323.17 327.6828.161.7226.4426.011.642.352.263.902.232.163.190.360.352.82 424.1825.696.0522.4221.265.311.681.796.342.012.125.330.310.296.67 536.3737.523.1132.3430.984.291.621.591.871.891.852.140.380.405.13 627.2828.795.3925.0726.053.833.513.471.152.322.476.260.470.454.35 726.8826.063.1024.3323.682.711.651.713.572.972.834.830.530.513.84 835.9636.050.2531.8232.191.162.302.352.153.263.182.480.370.395.26 930.6031.232.0427.8726.973.283.042.943.341.941.835.840.420.432.85 1025.2726.615.1723.1922.154.593.293.362.112.292.242.210.340.365.71 1131.6132.081.4828.1429.113.381.821.841.091.631.640.610.510.533.84 1233.4833.560.2430.1929.671.741.421.516.142.572.715.300.400.385.13 1327.1627.290.4824.5925.262.693.043.215.442.652.534.630.390.375.26 1430.6931.061.2027.6826.853.042.432.315.061.982.032.490.520.543.77 1523.6423.221.7921.5820.495.084.133.983.702.712.671.490.420.432.35 1629.7929.162.1427.3226.353.611.992.115.952.652.592.290.300.326.49 1727.0227.622.2024.6724.062.503.633.581.391.871.975.210.350.375.56 1832.0532.190.4429.1829.872.342.592.455.562.682.752.580.440.424.65 1924.9123.575.5321.6221.042.722.922.784.912.422.513.650.540.563.64 2030.5831.723.1627.9328.160.823.012.894.071.851.934.230.310.323.17 平均相对偏差2.763.053.914.024.35

2.4 模型的应用与维护

模型应用:应用分析系统的集成软件将建好的校正模型编入分析流程,分析样品时通过分析系统的操作软件调出相应的分析流程,进行扫描光谱、预测,即对未知样品的总糖、还原糖、总植物碱、挥发碱和钾含量进行同时测定,在操作熟练的情况下,每小时可分析60多个样品。

模型维护:采用外部验证法,应用FT-NIR光谱法和化分仪、原子吸收、原子荧光等方法分别测定其相应化学成分的含量,然后进行统计评价,其目的是删除原校正模型中不适应的光谱数据,增加欠缺的光谱数据,优化模型,使模型始终保持良好的适应状态。

3 结论

本研究采用换近红外光谱技术建立的烟叶中总糖、还原糖、总植物碱、挥发碱、钾的预测模型回归系数在95%以上,说明所建模型的预测精确性较高。通过换近红外光谱建立了预测烟叶中总糖、还原糖、总植物碱、挥发碱、钾含量的数学模型,可以实现快速、简便、大批量地分析烟叶中总糖、还原糖、总植物碱、挥发碱、钾量的目的。

模型投入应用后,需每年选取一定量的具有代表性的样品作为独立校验样品,对模型进行适应性校验,以提高模型的预测精度。

[1]蒋锦锋,赵明月.近红外光谱法快速测定烟草中的总挥发酸与总挥发碱[J].烟草科技,2006(3):33-37.

[2]王东丹,秦西云,赵立红,等. 应用近红外光谱技术分析烟丝总糖和还原糖的研究[J].分析试验室,2007,26(5):30-32.

[3]覃鑫.在线近红外光谱(NIR)快速测定烟草化学成分[J].西昌学院学报(自然科学版),2010,24(1):52-54,79.

[4]陈萍,逢涛,吴玉萍,等.近红外光谱法预测云南香料烟中总糖、还原糖和总氮[J].光谱实验室,2012,29(1):95-98.

[5]程志颖,孔浩辉,张俊,等.粒子群算法结合支持向量机回归法用于近红外光谱建模[J].分析测试学报,2010,26(12):1215-1219.

[6]CANDOLFI A,MAESSCHALCK R,JOUAN-RIMBAUD D.The influence of data pre-processing in the pattern recognition of excipients near-infrared spectra[J].J Pharma&Biom Anal,1999(21):115-132.

S572

A

10.15913/j.cnki.kjycx.2019.18.066

2095-6835(2019)18-0153-03

广西壮族自治区科技厅科技攻关项目(编号:桂科AB18229002)

蒋宏霖(1974—),男,本科,研究方向为烟叶化学成分分析研究。

贾海江(1978—),主要从事烟草种植技术和分析研究工作。

〔编辑:王霞〕

猜你喜欢

总糖预测值烟叶
河北烟叶含青率偏高的原因分析及应对措施
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
AI讲座:ML的分类方法
自体荧光内镜对消化道肿瘤诊断临床应用分析
郴州烟叶自动化收购模式探讨
晒烟叶
黄酒中总糖与还原糖含量测定方法比较
烟叶饲喂山羊要小心谨慎
传统客家黄酒的发酵条件优化
避雨栽培对川农泡椒1号品质的影响