均值离差平方和在近红外光谱识别灵芝和云芝提取物的应用
2016-07-02戴阳军
卢 艳,王 钧,戴阳军
(1.江苏费森尤斯医药药品有限公司,江苏常熟215533;2.浙江工业大学食品科学系,浙江杭州310014;3.常熟理工学院生物与食品工程学院,江苏常熟215500)
均值离差平方和在近红外光谱识别灵芝和云芝提取物的应用
卢艳1,王钧2,戴阳军3
(1.江苏费森尤斯医药药品有限公司,江苏常熟215533;2.浙江工业大学食品科学系,浙江杭州310014;3.常熟理工学院生物与食品工程学院,江苏常熟215500)
摘要:为实现灵芝提取物和云芝提取物的自动化快速鉴别,利用近红外光谱仪对灵芝提取物和云芝提取物进行近红外光谱分析,根据正确率和均值离差平方和(Average of Sum of Difference Square,ASDS)确定最佳预处理方法,建立距离匹配(Distance Match,DM)判别分析模型.结果表明:在全波长范围内,采用FD和MSC+FD预处理,在建模集中,对样品的识别率达到90.79%,模型预测效果好;在外部验证中,验证的识别率达到100%,具有很强的应用性.上述结果表明:利用近红外光谱和均值离差平方和,得出经过一阶导数处理的光谱,在DM模型对灵芝和云芝提取物分类中是可行的.
关键词:近红外光谱;距离匹配判别分析;均值离差平方和;灵芝和云芝提取物
1 引言
近红外光谱(near infrared spectroscopy, NIR)技术是一项新的无损分析技术,在分析化学领域得到了迅速发展,并在材料科学领域也陆续得到应用.由于近红外光谱是波长在780~2 500 nm范围的电磁波,对植物多糖十分敏感,因此,尝试利用近红外光谱技术对灵芝提取物和云芝提取物识别进行研究[1].许春瑾等利用傅里叶变化近红外光谱技术结合判别分析、聚类分析等方法,建立枸杞子产地判别模型,结果经MSC和SNV处理后,其正确率都达到100%,但是作者并没有针对预处理作进一步分析[2]. Downey等采用可见-近红外光谱技术,对特级初榨橄榄油中掺杂葵花籽油进行识别研究,取得了令人满意的结果[3].荣菡等在原光谱的基础上,利用PLS-模式识别近红外光谱技术快速检测鲜乳和掺假乳,判别准确率就达到100%[4].
灵芝和云芝提取物都含有多糖、萜类等活性物质,在组分、色泽、颗粒等理化性质上很相似,容易混淆,但其临床应用、功能主治等各不相同,这给消费者购买、企业日常监测、行业部门执法监管都带来了难度.目前品种鉴别方法主要有感官鉴别、显微鉴别、物理鉴别(排水法、热重分析法、微量升华法等)、化学鉴别(薄层、光谱、色谱等)等[4-5].但传统的鉴别方法比较繁琐,对样品也会造成污染.
为解决近红外检测和鉴别模型适用性有限的问题,本研究选择不同产地灵芝和云芝的提取物,采用近红外漫反射光谱技术结合距离判别分析,建立灵芝提取物和云芝提取物的判别模型,以期快速,准确识别灵芝和云芝提取物,为食用菌提取物实际生产监管、鉴别提供一种快速鉴别的方法.
2 材料与方法
2.1材料
仪器:称量瓶,傅里叶变换近红外光谱仪,德国光谱仪器公司Bruke Optics,型号:MPA.以仪器内置背景为参比,采集样品的漫反射近红外光谱.波数范围为12 500~4 000 cm-1,波数分辨率为8 cm-1,每个样品扫描16次,取其平均光谱作为该样品的原始光谱.
来自不同产地的灵芝和云芝提取物各96个样品.在外部的验证过程中,样品近似按3:1随机分为建模集和验证集,152个样品用于建模(76个灵芝提取物,76个云芝提取物),40个样品用于模型验证(20个灵芝提取物,20个云芝提取物).
2.2模型以及模型的评价
距离匹配判别法是通过计算1个未知样本的光谱与已知类别样品的平均光谱的距离进行分类的一种方法,通过平均测量距离来确定如何用一种未知材料与两种或两种以上的已知材料进行精确匹配的方法[6-9].
对于建立的识别模型,其判断模型的好坏取决于识别率,但由于样品数量的限制,往往出现几种预处理条件下得到相同识别率的情况.均值离差平方和表示样品散点的分散情况,可以解决样品量少、预测识别率相同时,对于预处理方法同样能够做出最优的选择.
2.3数据处理
本实验采用TQ Analysis 8.6软件进行数据分析.
3 结果与分析
3.1样品近红外光谱采集
通过近红外漫反射分析仪采集灵芝和云芝提取物的全部样品的原始光谱,分别求其平均光谱.灵芝和云芝平均光谱见图1.
由图1可见,两者之间具有一致的吸收峰形,但是两者之间的差异也是比较明显的.整体看来,云芝提取物吸光度明显高于灵芝提取物.在12 000~3 500 cm-1之间两者近红外的光谱差异比较大,这主要是与两种提取物的表面颜色和发色集团的差异有关,在3 500 cm-1以后,两者的光谱重叠严重.因此需要结合化学计量学的方法才能加以分析和利用.
图1 灵芝和云芝提取物的近红外光谱
3.2光谱数据预处理
由于近红外光谱仪所采集的光谱除样品的自身信息外,还包含了其他无关信息和噪声,如电噪声、样品背景和杂散光等.因此在用DM识别模型时,消除光谱数据无关信息,选择噪声的预处理方法变得十分关键和必要.常用的光谱预处理方法有多元散射校正(MSC)、变量标准化(SNV)、一阶导数(FD)、二阶导数(SD)等.不同预处理方法建立识别模型结果如表1所示.经过预处理的光谱的识别率明显要高于原始光谱.但是很明显,经过FD、MSC+FD预处理后,识别模型的正确率(CCr%)达到90.79%,高于其他的预处理方法.
两种不同的预处理的方法,针对本实验样品识别模型的正确率都达到90.79%,模型的效果比较好.所以采用FD,MSC+FD方法适合于灵芝提取物和云芝提取物判别分析模型.
表1 不同光谱预处理对校正模型识别结果的影响(主成分数为10)
图2 灵芝和云芝提取物的判别分析结果
3.3模型的建立
对152个建模集样品(灵芝提取物76个,云芝提取物76个)在12 500~4 000 cm-1波数内采用FD,MSC+ FD光谱预处理方法,图2(a)为原始光谱结合FD预处理方法时,灵芝提取物和云芝提取物判别分析图,图2(b)为原始光谱结合MSC+FD预处理方法时,灵芝提取物和云芝提取物判别分析图.由图2可以看出,3种不同预处理方法最后的识别率是相同的.但是很明显,两种不同预处理方法的散点图的分类是不一样的.
表2 灵芝和云芝提取物的判别分析的均值离差平方和
图2(a)的散点分布的效果明显优于图2(b)的,为了更加量化(a)与(b)的差异,引进了均值离差平方和(ASDS). ASDS值越大,散点的分布就越偏离y=x,即模型针对灵芝和云芝提取物的分离效果就越好.
由表2可知,尽管经过FD,FD+MSC预处理后,灵芝和云芝提取物的识别率是相同的,但是经过FD预处理后样品的ASDA值要明显大于经过FD+MSC预处理的,所以,FD预处理后样品的识别效果明显优于FD+MSC预处理的效果.
3.4模型的验证
根据上述讨论,40个预测样品对DM模型进行验证.由图3可知,无论是灵芝提取物还是云芝提取物,识别率都达到100%.实验表明:在12 500~4 000 cm-1波数范围内,采用FD预处理结合距离匹配判别分析法可以很好地对灵芝和云芝提取物进行识别分类.
图3 灵芝和云芝提取物的验证判别分析结果
4 结论
采用近红外光谱分析技术结合距离匹配判别分析法对灵芝和云芝提取物进行识别分析.在建模集中,在12 500~4 000 cm-1波数范围内,原始光谱结合FD和原始光谱结合FD+MSC预处理后,对样品的识别率都是90.79%.再根据均值离差平方和确定原始光谱结合FD明显优于原始光谱结合FD+MSC预处理,模型的预测效果较好.再根据40个样品的外部验证,其识别率达到100%.表明基于近红外光谱技术结合化学计量学建立的模型可准确识别灵芝和云芝提取物.该结果对其他食用菌提取物的分类应用具有实际意义.
在近红外识别分析中,当样品量比较少时,模型的识别率不能完全代表模型的优劣,但均值离差平方和可以代表样品散点的分散情况,不仅在DM模型的运用,而且在主成分分析和马氏距离识别分析等一些定性分析中可以得到很好的运用.
参考文献:
[1]杨忠,吕斌,黄安民,等.近红外光谱技术快速识别针叶材和阔叶材的研究[J].光谱学与光谱分析,2012,32(7):1785-1789.
[2]CHEN Y, XIE M Y, YAN Y, et al. Discrimination of Ganoderma lucidum according to geographical origin with near infrared diffuse reflectance spectroscopy and pattern recognition techniques[J]. Science Direct, 200835(2):121-130.
[3]荣菡,刘波平,邓泽元,等.基于PLS-模式识别近红外光谱技术快速检测鲜乳和掺假乳[J].食品科学,2008,29(8):492-495.
[4]许春瑾,张睿,于修烛,等.基于近红外光谱的中宁枸杞子判别分析[J].食品科学,2014,35(2):164-167.
[5]DOWNEY G. Food and food authentication by mid-infrared spectroscopy and chemometrics[J]. TrAC Trends in Analytical Chemistry, 1998, 17(7):418-424.
[6]陆婉珍,袁洪福,徐广通.现代近红外光谱分析技术[M].北京:中国石化出版社,2000:165.
[7]王灵灵,黄亚伟,戚淑叶,等.基于主根横断面近红外光谱的西洋参和人参鉴别研究[J].光谱学与光谱分析,2012,32(4):925-929.
[8]刘心如,张利平,王建福,等.可见_近红外漫反射光谱技术对羊毛和羊绒的鉴别研究[J].光谱学与光谱分析,2013,33(8)):2092-2095.
[9]张菊花,朱向荣,李高阳,等.近红外光谱法结合化学计量学方法用于茶油真伪鉴别分析[J].分析化学,2011,39(5):748-751.
Application of Average of Sum of Difference Square in Discrimination of the Extractions of Ganoderma Lucidum and Versicolor Using Near Infrared Reflectance
LU Yan1, WANG Jun2, DAI Yangjun3
(1. Fresenius Medical Products Co., Ltd. Changshu 215533, China;2. Department of Food Science and Technology, Hangzhou 310014, China;3. School of Biology and Food Engineering, Changshu Institute of Technology, Changshu 215500, China)
Abstract:To develop an automatic and quick method to discriminate between the extractions of Ganoderma lucidum and versicolor by near infrared reflectance(NIR)spectroscopy, the optimum pretreatment method was determined by the correct rate and the average of sum of different square value. And the NIR spectral data of the extractions of Ganoderma lucidum and versicolor samples were analyzed with the Distance Match model. The results showed that in the full wavelengths, with the pretreatment of FD, the total correct rate was 90.79%in the calibration set, and that in the validation set, the total correct rate was 100%,which has a good application. In conclusion, according to the pretreatment of FD, it is feasible to apply NIR to discriminate the extractions of Ganoderma lucidum and versicolor.
Key words:Near infrared reflectance(NIR);Distance Match;Average of Sum of Difference Square;the extractions of Ganoderma lucidum and versicolor
中图分类号:O657.33
文献标识码:A
文章编号:1008-2794(2016)02-0110-04
收稿日期:2015-07-11
通信作者:卢艳,化学分析师,硕士,研究方向:药物研发分析,E-mail:wj19890816@163.com.