近红外光谱在烟草相似性分析中的应用
2014-04-04李祖红吕亚琼张秋菊唐果闵顺耕
李祖红 吕亚琼 张秋菊 唐果 闵顺耕
[摘 要] 为研究近红外光谱分析技术在烟草质量相似性评价中的可行性,以云南省曲靖市烟区130个烟叶样品为研究对象,对其近红外光谱进行一阶导数与处理后,通过Matlab分析软件采用主成分分析法对上述烟叶样品进行相似性聚类分析并与烟草常规化学成分系统聚类分析结果进行对比。实验结果表明:近红外光谱分析法可以用于烟草质量相似性分析,且与化学成分分析所得结果基本一致。
[关键词] 近红外光谱;烟草;主成分分析;系统聚类
中图分类号:O657 文献标识码:A 文章编号:2055-5200(2014)02-061-03
前 言
烟草是适应性很强的特种经济作物,从北纬60°到南纬45°的广阔区域内都有烟草种植,但不同生态环境下烟草质量也会存在差异[1]。在烟叶调配中往往由于一些原因(如自然灾害、供应量不足等)原供应地的烟叶无法供应,这不仅影响卷烟的生产还容易造成原料的浪费。如果能采用科学方法找到与原供应地质量相似的烟叶样品就能够保证烟叶原料的正常供应及其质量一致性,提高烟叶的利用率。可见,烟叶质量相似性分析对于卷烟生产有着十分重要的意义。同时,烟叶质量相似性的研究对于烟叶产地区域规划也有着重要参考价值,可以为烟区烟叶质量管理、种植结构调整和发展布局优化提供科学依据和决策支持。
根据化学成分对烟叶质量相似性进行划分是通常采用方法[2-4]。然而,传统化学成分分析方法较为复杂,人力物力消耗大,急需一种快速的替代方法。近红外光谱吸收是对物质中化学成分的客观反映,而且近红外光谱分析法能够快速、无损地对样品进行测量[5-7],十分适合应用于烟草行业。本文采用近红外光谱分析方法对所采集的烤烟样品进行烟叶质量相似性分析,并将分析结果与化学成分聚类结果进行对比。近红外光谱分析方法进一步简化了划分的步骤,不仅能为烤烟质量相似性分析提供科学依据,相比常规化学成分分析也大大节约了相似性分析的成本。
1 实验部分
1.1 仪器和样品
1.1.1 仪器和软件 MATRIX-I傅里叶近红外光谱仪(BRUKER,德国),带有漫反射积分球和样品旋转器采样附件。数据分析和处理分别在SPSS (v20.0, IBM SPSS STATISTICS, USA)和Matlab (v7.11, MathWorks, USA)中进行。
1.1.2 样品制备 实验用130个烟草样品来自云南省曲靖市麒麟、沾益、马龙、会泽、富源、罗平、宣威、师宗、陆良9个县区,等级均为C3F。所有样品在40℃烘箱中干燥半小时,粉碎,过60目筛。
1.2 样品的处理、测定与光谱采集
烟草样品装入样品杯,晃动使样品在样品杯中较为均匀,再用压样器将样品压实,然后置于旋转台上。光谱范围10000~4000 cm?1,分辨率8 cm?1,扫描次数为64次。在所有样品采集过程中控制室温上下浮动不超过±0.5℃。并对烟草样品测量3次取平均光谱用于分析。
1.3 数据处理与建模
系统聚类是一种常用的聚类分析方法[8-10]。在系统聚类法中首先每个样本自成一类,选择距离最小的一对合并成新类,计算新类与其他类的距离,再将距离最小的两类合并成一类,一直重复这个过程直到所有样本都聚为一类为止。系统聚类中评价距离的方式有许多种,本实验中以欧式平方距离作为距离的度量标准,系统聚类方法选择组间连接聚类法。
主成分分析是一种常用的特征提取和数据压缩的方法[11-13],它主要将高维数据投影到较低维空间,同时这些新变量能够尽可能多地反映原料变量信息,且彼此互不相关。采用主成分的得分向量作图可以查看不同类别样品的分类情况,是一种简单有效的聚类方式。
2 结果和讨论
2.1 常规化学成分系统聚类分析
我们采用系统聚类方法对曲靖地区9个县(市)区烟叶样品的四种常规化学成分:总糖、还原糖、烟碱、总氮进行聚类分析。采用SPSS软件对曲靖市2012年130个等级均为C3F的样品进行系统聚类,得到的聚类结果如表1和2所示。
表1 烟草样品常规化学成分含量系统聚类结果
类别
(样本数) 总糖
(%) 还原糖
(%) 总氮
(%) 烟碱
(%)
Ⅰ(80) 26.68-40.92 18.24-27.16 1.13-2.44 1.12-4.40
Ⅱ(39) 33.27-43.47 26.95-34.42 1.17-1.94 1.31-2.85
Ⅲ(11) 14.29-22.46 11.03-17.41 2.00-2.62 1.89-3.82
从表1我们可以看出第Ⅱ类样品(30.96%)糖含量最高、烟碱和总氮含量最低;而第Ⅲ类样品(8.46%)则正好相反,总氮和烟碱含量最高而糖含量最低;第Ⅰ类样品(61.58%)介于Ⅱ、Ⅲ类样品之间,糖含量和烟碱含量居中。
表2 烟草质量相似性区域划分
类 别 样本数 县(市)区、乡(镇)
Ⅰ 80 富源县:后所、大河、营上、富村、竹园、古敢、十八连山、老厂
会泽县:火红、金钟、娜姑、马路、田坝、迤车、纸厂
麒麟区:茨营、三宝
罗平县:罗雄、大水井
宣威县:落水、龙潭、倘塘、双河、阿都
沾益县:白水、炎方、菱角
陆良县:板桥、活水、龙海
马龙县:马过河
师宗县:丹凤、彩云、龙庆、葵山、竹基、雄壁
Ⅱ 39 会泽县:者海
麒麟区:寥廓
马龙县:旧县、大庄、纳章、王家庄、通泉、月望
沾益县:德泽、大坡
陆良县:绍夸
Ⅲ 11 富源县:中安、墨红、黄泥河
师宗县:五龙
麒麟区:东山
从表2看出马龙县的样品基本都集中在第Ⅱ类;其余各县的样品则主要分布于第Ⅰ中,第Ⅲ类样品最少。
2.2 近红外光谱分析
主成分分析前我们对光谱进行一阶导数预处理以消除基线漂移对聚类效果的影响。采用Matlab软件对130个烟叶样品光谱进行主成分分析,选取第1和第5主成分作图,得到的聚类结果如图1所示:
图1 烟草样品主成分得分图
从图1可以看出3类样品除第Ⅰ、Ⅱ类有少量样品重叠外,其余均分类清晰。近红外光谱的分类情况与系统聚类结果基本一致,这在证明了系统聚类类结果可靠性的同时也说明近红外光谱用于烟草质量相似性的可行性。
通过化学成分聚类和近红外光谱主成分分析结果对比可知,曲靖地区大部分地区烟叶质量是相似的。马龙县的烟叶样品较为特殊,含糖量较高、烟碱含量在1.2%~2.3%之间,区别于曲靖地区其他大部地区所产的烟叶。化学成分特征与其相似的烟叶产区分布在是会泽、沾益、麒麟、陆良的部分乡镇。富源、师宗和麒麟部分乡镇的烟叶含糖量较低,烟碱含量也较高,这几个县区的烟叶质量差异较大。
3 结论
本文首先对烟叶样品的常规化学成分含量进行了系统聚类,然后对原始近红外光谱进行一阶导数处理,再结合主成分分析法,对曲靖9个县区的130个烟叶样品的质量相似性进行了聚类分析和结果对比。结果表明:曲靖地区个产烟区的烟叶按质量相似性分类可分为3大类,其中除马龙县烟叶样品质量集中在第Ⅱ类外其他大部分县区的烟叶质量基本属于第Ⅰ类;富源、麒麟、师宗的个别乡镇的烟叶中糖含量较低属于第Ⅲ类。此外,富源、师宗、麒麟、陆良等县区烟叶各乡镇烟叶质量差异较大。此外近红外光谱分析法与化学成分系统聚类结果基本一致,说明了近红外光谱应用于烟叶质量相似性分析具有可行性,这也为烟叶质量相似性快速判定提供了有益的参考。
参 考 文 献
[1] 刘国顺.烟草栽培学[M].北京:中国农业出版社,2003:17.
[2] 许淑红,张楚梦,朱波,等. 攀西烤烟化学成分状况及相似性分[J]. 山西农业科学,2013,1(4):330-332,338.
[3] 王欣,何结望,许自成,等. 西南烟区烤烟质量状况及与巴西烤烟质量的相似性分[J].西南农业学报,2007,20(4):747-751.
[4] 毛友安,刘巍,董道竹,等. 用高效液相色谱法和模式识别技术定量表征烟叶颜色相似性研究[J].分析测试学报,2007,26(4):468-472.
[5] 林葵,陈建红,黄岛平. 近红外快速检测广西产大米中淀粉及直链淀粉成分的研究[J].大众科技,2011,(2):95-96.
[6] 徐宗良,夏元军,巩军. 近红外快速检测奶粉乳清粉成分研究[J].中国乳品工业,2002,(2):40-42.
[7] 张丽娟,吴炜,邱琳,等.近红外光谱快速分析法在坤宝丸检测中的应用[J].现代仪器,2012,18(4):76-79.
[8] 褚小立.化学计量学方法与分子光谱分析技术[M].北京:化学工业出版社,2011:97-98.
[9] 马英丽,赵怀清,王学娅,等.不同产地黄芪的系统聚类分析[J]. 中医药学报:2003,31(2):20-21.
[10] 时有明,刘刚,孙艳琳,等.FTIR光谱结合系统聚类分析鉴别松茸和姬松茸的研究[J].光散射学报,2010,22(2):171-174.
[11] 王丽,何鹰,王颜萍,等.近红外光谱技术结合主成分聚类分析判别海面溢油种类[J].海洋环境科学,2004,23(2): 58-60.
[12] 崔红花,郭娇,高幼衡,等.佛手和属间药用植物的主成分聚类分析及HPLC指纹图谱研究[J].中草药,2010,41(6):978-984.
[13] 李强,周冀衡,解燕,等.曲靖烟区烤烟气候适宜性综合评价和主成分聚类分析[J].福建农林大学学报(自然科学版):2011,40(5):455-460.
沾益县:德泽、大坡
陆良县:绍夸
Ⅲ 11 富源县:中安、墨红、黄泥河
师宗县:五龙
麒麟区:东山
从表2看出马龙县的样品基本都集中在第Ⅱ类;其余各县的样品则主要分布于第Ⅰ中,第Ⅲ类样品最少。
2.2 近红外光谱分析
主成分分析前我们对光谱进行一阶导数预处理以消除基线漂移对聚类效果的影响。采用Matlab软件对130个烟叶样品光谱进行主成分分析,选取第1和第5主成分作图,得到的聚类结果如图1所示:
图1 烟草样品主成分得分图
从图1可以看出3类样品除第Ⅰ、Ⅱ类有少量样品重叠外,其余均分类清晰。近红外光谱的分类情况与系统聚类结果基本一致,这在证明了系统聚类类结果可靠性的同时也说明近红外光谱用于烟草质量相似性的可行性。
通过化学成分聚类和近红外光谱主成分分析结果对比可知,曲靖地区大部分地区烟叶质量是相似的。马龙县的烟叶样品较为特殊,含糖量较高、烟碱含量在1.2%~2.3%之间,区别于曲靖地区其他大部地区所产的烟叶。化学成分特征与其相似的烟叶产区分布在是会泽、沾益、麒麟、陆良的部分乡镇。富源、师宗和麒麟部分乡镇的烟叶含糖量较低,烟碱含量也较高,这几个县区的烟叶质量差异较大。
3 结论
本文首先对烟叶样品的常规化学成分含量进行了系统聚类,然后对原始近红外光谱进行一阶导数处理,再结合主成分分析法,对曲靖9个县区的130个烟叶样品的质量相似性进行了聚类分析和结果对比。结果表明:曲靖地区个产烟区的烟叶按质量相似性分类可分为3大类,其中除马龙县烟叶样品质量集中在第Ⅱ类外其他大部分县区的烟叶质量基本属于第Ⅰ类;富源、麒麟、师宗的个别乡镇的烟叶中糖含量较低属于第Ⅲ类。此外,富源、师宗、麒麟、陆良等县区烟叶各乡镇烟叶质量差异较大。此外近红外光谱分析法与化学成分系统聚类结果基本一致,说明了近红外光谱应用于烟叶质量相似性分析具有可行性,这也为烟叶质量相似性快速判定提供了有益的参考。
参 考 文 献
[1] 刘国顺.烟草栽培学[M].北京:中国农业出版社,2003:17.
[2] 许淑红,张楚梦,朱波,等. 攀西烤烟化学成分状况及相似性分[J]. 山西农业科学,2013,1(4):330-332,338.
[3] 王欣,何结望,许自成,等. 西南烟区烤烟质量状况及与巴西烤烟质量的相似性分[J].西南农业学报,2007,20(4):747-751.
[4] 毛友安,刘巍,董道竹,等. 用高效液相色谱法和模式识别技术定量表征烟叶颜色相似性研究[J].分析测试学报,2007,26(4):468-472.
[5] 林葵,陈建红,黄岛平. 近红外快速检测广西产大米中淀粉及直链淀粉成分的研究[J].大众科技,2011,(2):95-96.
[6] 徐宗良,夏元军,巩军. 近红外快速检测奶粉乳清粉成分研究[J].中国乳品工业,2002,(2):40-42.
[7] 张丽娟,吴炜,邱琳,等.近红外光谱快速分析法在坤宝丸检测中的应用[J].现代仪器,2012,18(4):76-79.
[8] 褚小立.化学计量学方法与分子光谱分析技术[M].北京:化学工业出版社,2011:97-98.
[9] 马英丽,赵怀清,王学娅,等.不同产地黄芪的系统聚类分析[J]. 中医药学报:2003,31(2):20-21.
[10] 时有明,刘刚,孙艳琳,等.FTIR光谱结合系统聚类分析鉴别松茸和姬松茸的研究[J].光散射学报,2010,22(2):171-174.
[11] 王丽,何鹰,王颜萍,等.近红外光谱技术结合主成分聚类分析判别海面溢油种类[J].海洋环境科学,2004,23(2): 58-60.
[12] 崔红花,郭娇,高幼衡,等.佛手和属间药用植物的主成分聚类分析及HPLC指纹图谱研究[J].中草药,2010,41(6):978-984.
[13] 李强,周冀衡,解燕,等.曲靖烟区烤烟气候适宜性综合评价和主成分聚类分析[J].福建农林大学学报(自然科学版):2011,40(5):455-460.
沾益县:德泽、大坡
陆良县:绍夸
Ⅲ 11 富源县:中安、墨红、黄泥河
师宗县:五龙
麒麟区:东山
从表2看出马龙县的样品基本都集中在第Ⅱ类;其余各县的样品则主要分布于第Ⅰ中,第Ⅲ类样品最少。
2.2 近红外光谱分析
主成分分析前我们对光谱进行一阶导数预处理以消除基线漂移对聚类效果的影响。采用Matlab软件对130个烟叶样品光谱进行主成分分析,选取第1和第5主成分作图,得到的聚类结果如图1所示:
图1 烟草样品主成分得分图
从图1可以看出3类样品除第Ⅰ、Ⅱ类有少量样品重叠外,其余均分类清晰。近红外光谱的分类情况与系统聚类结果基本一致,这在证明了系统聚类类结果可靠性的同时也说明近红外光谱用于烟草质量相似性的可行性。
通过化学成分聚类和近红外光谱主成分分析结果对比可知,曲靖地区大部分地区烟叶质量是相似的。马龙县的烟叶样品较为特殊,含糖量较高、烟碱含量在1.2%~2.3%之间,区别于曲靖地区其他大部地区所产的烟叶。化学成分特征与其相似的烟叶产区分布在是会泽、沾益、麒麟、陆良的部分乡镇。富源、师宗和麒麟部分乡镇的烟叶含糖量较低,烟碱含量也较高,这几个县区的烟叶质量差异较大。
3 结论
本文首先对烟叶样品的常规化学成分含量进行了系统聚类,然后对原始近红外光谱进行一阶导数处理,再结合主成分分析法,对曲靖9个县区的130个烟叶样品的质量相似性进行了聚类分析和结果对比。结果表明:曲靖地区个产烟区的烟叶按质量相似性分类可分为3大类,其中除马龙县烟叶样品质量集中在第Ⅱ类外其他大部分县区的烟叶质量基本属于第Ⅰ类;富源、麒麟、师宗的个别乡镇的烟叶中糖含量较低属于第Ⅲ类。此外,富源、师宗、麒麟、陆良等县区烟叶各乡镇烟叶质量差异较大。此外近红外光谱分析法与化学成分系统聚类结果基本一致,说明了近红外光谱应用于烟叶质量相似性分析具有可行性,这也为烟叶质量相似性快速判定提供了有益的参考。
参 考 文 献
[1] 刘国顺.烟草栽培学[M].北京:中国农业出版社,2003:17.
[2] 许淑红,张楚梦,朱波,等. 攀西烤烟化学成分状况及相似性分[J]. 山西农业科学,2013,1(4):330-332,338.
[3] 王欣,何结望,许自成,等. 西南烟区烤烟质量状况及与巴西烤烟质量的相似性分[J].西南农业学报,2007,20(4):747-751.
[4] 毛友安,刘巍,董道竹,等. 用高效液相色谱法和模式识别技术定量表征烟叶颜色相似性研究[J].分析测试学报,2007,26(4):468-472.
[5] 林葵,陈建红,黄岛平. 近红外快速检测广西产大米中淀粉及直链淀粉成分的研究[J].大众科技,2011,(2):95-96.
[6] 徐宗良,夏元军,巩军. 近红外快速检测奶粉乳清粉成分研究[J].中国乳品工业,2002,(2):40-42.
[7] 张丽娟,吴炜,邱琳,等.近红外光谱快速分析法在坤宝丸检测中的应用[J].现代仪器,2012,18(4):76-79.
[8] 褚小立.化学计量学方法与分子光谱分析技术[M].北京:化学工业出版社,2011:97-98.
[9] 马英丽,赵怀清,王学娅,等.不同产地黄芪的系统聚类分析[J]. 中医药学报:2003,31(2):20-21.
[10] 时有明,刘刚,孙艳琳,等.FTIR光谱结合系统聚类分析鉴别松茸和姬松茸的研究[J].光散射学报,2010,22(2):171-174.
[11] 王丽,何鹰,王颜萍,等.近红外光谱技术结合主成分聚类分析判别海面溢油种类[J].海洋环境科学,2004,23(2): 58-60.
[12] 崔红花,郭娇,高幼衡,等.佛手和属间药用植物的主成分聚类分析及HPLC指纹图谱研究[J].中草药,2010,41(6):978-984.
[13] 李强,周冀衡,解燕,等.曲靖烟区烤烟气候适宜性综合评价和主成分聚类分析[J].福建农林大学学报(自然科学版):2011,40(5):455-460.