近红外光谱分析烟叶中的多酚类物质
2014-08-08吕亚琼张秋菊李祖红闵顺耕
吕亚琼++张秋菊++李祖红++闵顺耕
(1.云南省烟草公司曲靖市公司,曲靖6550001;2. 中国农业大学理学院,北京100193)
[摘要]多酚类物质是烟叶香气产生的重要前体物质。采用近红外光谱结合偏最小二乘算法建立了烟叶中总多酚含量的回归模型。采用建立的模型对检验集进行预测,预测集决定系数R2为0.8671,模型误差SEP为1.4287。结果表明近红外光谱分析技术可以成功应用于烟叶中总多酚含量的检测。此外,为消除烟叶近红外光谱中无效波长变量,采用无消息变量消除算法对所建近红外模型进行优化。结果表明采用该算法后,剩余变量数得到减少,模型维数显著降低,预测性能有所提高。
[关键词]近红外光谱;烟叶;总多酚;偏最小二乘算法;无消息变量消除算法
中图分类号:O657文献标识码:A文章编号:2095-5200(2014)04-063-03
DOI:10.11876/mimt201404020
Determination of polyphenols in tobacco by Near Infrared SpectroscopyLYU Ya-qiong1,ZHANG Qiu-ju1,LI Zu-hong1,MIN Shun-geng2.(1. Yunnan Tobacco Company QuJing Branch, Yunnan 655000, China;2. College of Science, China Agricultural University, Beijing 100193, China)
[Abstract]Polyphenols are important aroma precursors in tobacco. In this paper, near-infrared spectroscopy combined with partial least squares algorithm was used for establishing regression model of total polyphenol content in tobacco. For test set, model R2 is 0.8671, SEP is 1.4287. Results show that near-infrared spectroscopy technology can be successfully applied to the total polyphenol content detection in tobacco. In order to eliminate interference variables in tobacco near infrared spectrum, Uninformative Variables Elimination algorithm was used. Experimental results show that after the algorithm used, remaining number of variables is reduced, modeling dimension is significantly reduced, and prediction performance is improved.
[Key words]Near Infrared Spectroscopy;Tobacco;Total Polyphenol Content;Partial Least Squares Algorithm;Uninformative Variables Elimination Algorithm前言
香味是烟叶品质的重要内容,优质烟叶要求香气充足,香气纯净,香型突出。烟叶的香气状况是由致香成分的含量、组成和相互作用所决定的,而这些致香成分的产生与其前体物质密不可分[1]。从香气前体物质的化学结构出发,可以把致香物质分为酸类、醇类、醛类、酮类、酯类、内酯类、酚类、氮杂环类(吡咯、吡啶、吡嗪)等不同类型[2]。其中多酚类物质是烟叶香气产生的重要前体物质,是对烟气的芳香气味有贡献的一类物质,对卷烟调香具有重要意义,开发一种能够快速检测烟叶中的总多酚含量的分析方法十分必要[3]。
目前对烟叶中多酚类物质的分析方法,主要是液相色谱法[4]。色谱法分析过程操作复杂,所需时间较长,不仅需要消耗大量有机溶剂造成环境污染,还需要受过专业培训的人员在实验室中操作,很难满足工业上烟叶收购和生产一线的现场检测需求。近红外光谱技术作为一种绿色分析技术,具有测试过程简便快速,适合在线检测等优点,已经在食品、医药、农业、石化、烟草等领域得到了非常广泛的应用[5-6]。本研究拟采用烟叶近红外光谱结合偏最小二乘算法对烟草中的总多酚含量建立化学模型。为消除近红外光谱中的干扰信息,本研究还尝试采用无消息变量消除算法(Uninformative Variables Elimination, UVE)作为波长选择方法对所建模型进行精简,以得到预测能力更加稳健,预测精度更高的模型。
1材料与方法
1.1样品制备
200个烟叶样品收集于2009年,由曲靖烟草公司提供。所有样品在40℃烘箱中干燥半小时,粉碎,过60目筛待测。
1.2光谱采集
光谱采集使用的仪器为MATRIX-I型傅里叶变换近红外光谱仪(德国,布鲁克光学公司),测量附件为漫反射积分球和样品旋转器采样附件。光谱扫描范围为4000~10000 cm-1 ,光谱分辨率为4cm-1,重复扫描次数为64次,参比采用仪器内置背景,测量过程中温度、湿度等环境条件尽量保持一致。
1.3化学值测定方法
烟叶样品中多酚类物质总含量由中国农业科学院烟草研究所提供。测定方法为液相色谱法,具体方法参照《YCT 202-2006 烟草及烟草制品 多酚类化合物绿原酸、莨菪亭和芸香苷的测定》。测得的总多酚含量范围为18.03-36.29mg/g。
1.4数据处理与软件
PLS和UVE算法均采用MATLAB软件(Ver.R.2012.a,The Math Work, USA)自行编写实现。各种光谱预处理方法采用The Unscrambler 软件(Ver.9.7, CAMO [Computer Aided Modeling, Trondheim, Norway])完成。
2算法原理
2.1偏最小二乘算法(PLS)
偏最小二乘算法是目前线性多元校正算法中最常用的一种算法。该算法在分解光谱阵X时同时考虑了浓度阵Y的影响,同时对光谱阵和浓度阵进行分解,充分利用了光谱变量和浓度变量之间的线性关系[7]。
2.2无消息变量消除算法(UVE)
无消息变量消除算法[8]是基于PLS回归系数b建立的波长变量选择方法,这种方法将波长回归系数除以回归系数的标准差得到参数作为衡量波长变量重要性的指标。将人为添加的噪声变量的回归系数得到该参数的最大值(通常可以乘上一个系数,0到1之间)作为阈值,样品光谱回归系数计算参数小于该阈值的波长即视为无消息变量,予以消除。
3结论
3.1PLS模型结果
为了检验模型预测效果,采用kennard-stone算法[9]将200个样品划分为校正集和检验集,其中校正集120个样品,检验集80个样品。建模时采用的光谱预处理方法为一阶导数。最优建模维数通过校正集内部交互检验误差最小的原则选取。模型结果详见表1,当全部波长变量参与建模的最佳建模维数为15维,模型的检验集的决定系数R2为0.8671,模型误差SEP为1.4287。结果表明采用近红外光谱结合PLS算法可以成功应用于烟叶样品中总多酚含量的测定。
3.2UVE-PLS模型结果
从表1可知,采用无消息变量消除算法(UVE),剩余的波长变量从原来的1546个降为216个,最佳建模维数也由原来的15维降为8维,说明无消息变量消除算法能大大降低模型复杂性。检验集的决定系数R2为0.8981,模型误差SEP为1.1295。说明模型的预测性能较全谱建模有所提高。由此可知,无消息变量消除算法具有精简近红外模型以及提高模型预测精度的作用,尤其适用于烟草、食品、农业等成分较为复杂体系的近红外建模工作中。
参考文献
[1]宗浩,杨程,陈刚,等. 不同烤烟品种香型风格与多酚类物质含量差异分析[J]. 中国农学通报,2011,27(30):241-245.
[2]周昆,周清明,胡晓兰. 烤烟香气物质研究进展[J].中国烟草科学,2008,29(2):58-61.
[3]朱小茜,徐晓燕,等.多酚类物质对烟草品质的影响[J]. 安徽农业科学,2005,33(8):1910-1911.
[4]刘芳,杨柳,孙林,等. ASE超高效液相色谱法快速测定烟草中的多酚类物质[J]. 中国烟草学报,2008,14(6):1-5.
[5]严衍禄. 近红外光谱分析基础与应用[M]. 北京.中国轻工业出版社.2005.
[6]陆婉珍. 现代近红外光谱分析技术[M]. 北京.中国石化出版社. 2007.
[7]褚小立. 化学计量学方法与分子光谱分析技术[M]. 北京.化学工业出版社.2011:59-61.
[8]Centner V, Massart D L, de Noord O E, et al. Elimination of uninformative variables for multivariate calibration[J]. Analytical Chemistry, 1996, 68(21): 3851-3858.
[9]Kennard, R W, Stone, L A. Computer aided design of experiments[J]. Technometrics,1969, 11(1):137-148.