APP下载

便携式近红外光谱仪快速无损鉴别霍山石斛枫斗和河南石斛枫斗

2017-11-07江明珠韩邦兴贾俊强马永昆

林产化学与工业 2017年5期
关键词:红外光谱仪霍山石斛

江明珠, 韩邦兴, 颜 辉, 贾俊强, 屠 洁, 马永昆

(1.江苏大学 食品与生物工程学院,江苏 镇江 212013; 2.江苏科技大学 生物技术学院, 江苏 镇江 212018; 3.皖西学院 生物与制药工程学院,安徽 六安 237012; 4.中国中医科学院 中药资源中心,北京 100700)

*通讯作者:马永昆,教授,博士,博士生导师,研究领域为食品生物技术。

JIANG Mingzhu

便携式近红外光谱仪快速无损鉴别霍山石斛枫斗和河南石斛枫斗

江明珠1,2, 韩邦兴3,4, 颜 辉2, 贾俊强2, 屠 洁2, 马永昆1*

(1.江苏大学 食品与生物工程学院,江苏 镇江 212013; 2.江苏科技大学 生物技术学院, 江苏 镇江 212018; 3.皖西学院 生物与制药工程学院,安徽 六安 237012; 4.中国中医科学院 中药资源中心,北京 100700)

采用便携式近红外光谱仪采集231个霍山石斛枫斗和河南石斛枫斗样品的近红外光谱,采用一阶导数(1stD)、标准正态变量变换(SNV)、均值中心化(MNCN)、多元散射校正(MSC)、矢量归一化(N)等方法及其组合的9种方法预处理原始光谱,应用偏最小二乘判别分析(PLS-DA)建立快速无损鉴别霍山石斛枫斗和河南石斛枫斗的数据模型,比较不同光谱预处理方法对PLS-DA建立模型的准确率影响,以预测模型的正确率、敏感性、特异性为指标,评价模型的优劣。结果表明:1stD+SNV+MNCN预处理方法的效果最好,模型的准确率最高,在潜在变量是12的情况下,校正集、交互验证集、预测集的准确率都为100%;模型的敏感性、特异性都为100%。

便携式近红外光谱仪;PLS-DA;霍山石斛枫斗;河南石斛枫斗;无损鉴别

石斛为兰科石斛属多年生附生草本植物,在我国一般分布在秦岭以南地区,其中药用石斛约40种[1]。石斛具有滋阴清热、润肺止咳、益胃生津等功效,现代研究表明:石斛具有抗肿瘤、降血糖、抗衰老等作用,对恶性肿瘤、肠道疾病、关节炎等疾病有很好的疗效[2- 3]。霍山石斛又称米斛,主产于安徽省霍山县,是濒临灭绝的珍稀药材,在自然环境中繁殖率低、生长缓慢,随着石斛的市场需求量日益增加,导致其被过度采挖,使野生石斛资源逐年减少,故而,市场上的霍山石斛伪品较多。霍山石斛的常见伪品为河南石斛,从外形和外观上很难辨认,仅能依靠花瓣上是否有黑色斑块来鉴别二者,对于不在花期的石斛则鉴别难度很大[4- 5]。枫斗是采用药用石斛的新鲜茎干边加热边扭成螺旋形或弹簧状后烘干而成的加工品,霍山石斛枫斗和河南石斛枫斗加工成石斛枫斗后就更难区分了。目前鉴别石斛的常用方法有性状鉴别、显微鉴别、光谱鉴别、色谱鉴别以及分子生物学技术鉴别等。性状和显微鉴别较多的依赖于从业人员的经验,主观性较强;分子和色谱等鉴别方法操作复杂,费时费力。近红外光谱分析具有分析速度快、成本低、样品无损等优点[6],但实验室研究型的近红外仪器一般比较大型,不适用于现场的快速检测,便携式近红外光谱仪的出现很好地解决了这一问题。本研究利用便携式近红外光谱仪对霍山石斛枫斗和河南石斛枫斗样品进行光谱采集,运用偏最小二乘判别分析(PLS-DA)建立快速无损鉴别两者的数理模型,并对比了不同光谱预处理方法对模型的影响,以期为石斛枫斗的快速无损鉴别提供新思路。

1 材料与方法

1.1材料

试验用石斛枫斗样品231份,其中霍山石斛(DendrobiumhuoshanenseC. Z. Tang et S. J. Cheng)枫斗123份,河南石斛(D.henanenseJ. L. Lu et L. X. Gao)枫斗为108份,枫斗样品的具体信息见表1。为实现无损检测,所有石斛枫斗样品不做干燥粉碎等处理,保持枫斗的原始加工状态,进行检测。

表1 石斛样品信息Table 1 Information of Dendrobium sample

1.2仪器

基于线性滤光片的MicroNIR1700便携式光谱仪(JDSU公司,USA),见图1。光谱范围为950~1650 nm,光谱采样间隔为12.5 nm,每次光谱采集的积分时间为15 ms,扫描次数为50次,每个石斛枫斗样品采集光谱3次,以3次平均值作为每个样品的原始光谱[7]。

图1 便携式近红外光谱仪Fig.1 Protable MicroNIR1700 spectrometer

1.3光谱采集

将123个霍山石斛枫斗样品和108个河南石斛枫斗样品,2种枫斗各取2/3作为校为预测集,随机选取相应的样本建立校正集、预测集,采用微型近红外光谱仪分别采集石斛枫斗样品杆壁的光谱信号。

1.4光谱预处理

由于石斛枫斗样品的大小、粗细、均匀度、加工工艺等的差异,所采集光谱信号中除样品的待测成分信息外,还可能会包含高频噪声、杂散光、基线漂移、样品背景等,故需对光谱进行预处理,以减弱非目标因素对光谱信息的影响[8- 9]。一阶导数(1stD)处理可以消除光谱的基线漂移,标准正态变换(SNV)和多元散射校正(MSC)可以消除光散射造成的误差,均值中心化(MNCN)可以突显光谱差异,矢量归一化(N)可以减少变量间数值差异过大对建模结果的影响[10- 11]。

为了确定最佳预处理方法,实验比较了9种预处理方法,分别是:1stD,SNV,MNCN,SNV+MNCN,1stD+MNCN,1stD+SNV,1stD+N,1stD+MSC和1stD+SNV+MNCN。

1.5快速分析模型的建立

目前常用的判别分析法主要有:主成分分析法、簇类独立软模式法、支持向量机法、偏最小二乘判别分析(PLS-DA)等。本试验采用的PLS-DA是一种基于PLS回归的判别分析方法,它能够将采集的光谱数据与分类变量建立线性回归模型,利用特定的判别阈值对模型结果进行分析[12- 13],在构造因素时考虑到了辅助矩阵以代码形式提供的类成员信息,因此,PLS-DA法比软独立模式分类法(SIMCA)表现出更高效的鉴别能力,也使得出现错误鉴别的概率降低。模型的分离效果可以用计算结果中两组样品分离的程度来表示,分离程度越大,分类效果越显著[14- 15]。本试验采用留一法(LOO)进行交叉验证确定模型采用的潜在变量。建模过程中,将2个品种石斛枫斗分别赋予数值(虚拟变量)1和2,则霍山石斛枫斗的类别转化为[10],河南石斛枫斗的类别转化为[01],作为光谱数据的参考值,然后进行PLS建模。

本试验采用PLS Toolbox 6.2工具箱在Matlab R2009b上建立PLS-DA模型。

1.6模型评价

PLA-DA模型以预测正确率、特异性和敏感性为评价指标。校正集、交叉验证集和预测集的正确率越高,判别效果越好,同时也需要考虑到模型采用的潜在变量数,潜在变量数越少则模型在后期的应用中越稳健。模型的特异性与敏感性越高,则模型的判别效果也越好[16]。

图2 全部样品原始近红外光谱图Fig.2 Original spectra of all samples

2 结果与分析

2.1原始光谱分析

通过MicroNIR1700采集的231份石斛枫斗样品的近红外光谱的原始光谱图如图2所示。从图2可以看出,两类石斛的特征信息在峰形、峰位和峰强等方面重叠较多,很难直观区分,这是因为这二类石斛样品的组成成分多数相似,但因样品的品种不同,特征化合物会有差异,需要借助化学计量学方法对近红外光谱信号进行分析处理,提取特征信息之后才能显示出这些差异,这才使得近红外技术应用于分类鉴别成为可能[17- 18]。

2.2不同预处理模型正确率结果比较

对光谱进行预处理后提取出光谱的主成分,并采用LOO法进行交叉验证(LOOCV),建立PLS-DA模型对石斛枫斗进行鉴别。不同光谱预处理方法建立模型的判别结果见表2。

表2 不同光谱预处理方法对建模效果的影响Table 2 Effect of different spectral pretreatments methods on modeling

1) 1stD:1阶导数1st derivative; SNV: 标准正态变量变换standard normalized variate; MNCN: 均值中心化 mean center; N:矢量归一化normalize;MSC:多元散射校正multiplicative scatter correction

从表2可以看出,2种石斛的光谱数据经不同光谱预处理方法处理后,采用SNV+MNCN、SNV和MNCN预处理对石斛正确判别率较低,为90%~95%;1stD+SNV+MNCN正确判别率最高:校正集、交互验证集、预测集的正确率都为100%;其余各预处理的正确判别率居中,说明采用1stD+SNV+MNCN 并结合LOOCV交叉验证法所建模型可将2种石斛枫斗完全区分开,此方法应用于霍山石斛枫斗和河南石斛枫斗的判别是可行的。

2.3模型潜在变量的选择及两种石斛鉴别结果分析

提高潜在变量可以提高模型预测结果的正确率,但潜在变量太多可引起过拟合,模型的预测正确率反而下降[19]。图3是最佳分类鉴别效果时的交叉验证图。从图3可以看出:随着潜在变量的增加,预测错误率显著下降,当潜在变量达到12时,错误率为0;潜在变量继续上升时,错误率上升,出现过拟合现象。因此,本试验中潜在变量选取12最适合,交叉验证的正确率最高,校正集和预测集的正确率也最高,都是100%。

图4为判别分析结果,图5为霍山石斛枫斗预测的概率图。

图3PLS-DA模型的交叉验证图

Fig.3CrossvalidationofPLS-DAmodel

图4霍山石斛枫斗的预测分类图

Fig.4PredictionclustersoftheDHSF

图5霍山石斛枫斗的预测概率图

Fig.5PredictionprobabilityoftheDHSF

由图4可见,校正集及预测集中霍山石斛枫斗样本聚集在数值1这一侧,而河南石斛枫斗在校正集和预测集的分类变量聚集在数值0这一侧。靠近分类线的样品数量几乎为0,两类样品得到很好的区分。从图5中可见绝大多数霍山石斛枫斗的预测概率是1,河南石斛枫斗样品的概率为0,概率位于0.5附近的样品为0。根据PLS-DA法的判别准则可知:预测集中所有霍山石斛枫斗样本均被正确判别为霍山石斛枫斗,而河南石斛枫斗样本不具有霍山石斛枫斗的特征,说明PLS-DA判别模型对霍山石斛枫斗样本的判别准确率为100%,预测集错误率为0。

图6 PLS-DA模型的敏感性与特异性Fig.6 Sensitivity and specificity curves of PLS-DA model

敏感性和特异性也是光谱分类研究中极为重要的考察指标[16],2种石斛枫斗PLS-DA模型的敏感性和特异性见图6。图6(a)和图6(c)是预测ROC图,图6(b)和图6(d)是预测响应图。受试者工作特征(ROC)曲线图是反映敏感性和特异性连续变量的综合指标,用构图法揭示敏感性和特异性相互关系的曲线图。在ROC图上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值,ROC曲线越靠近左上角,试验的准确性就越高。最靠近左上角的ROC曲线的点是错误最少的最好阈值,其假阳性和假阴性的总数最少,错判和漏判几率最低。从图6(a)和图6(c)可以看出:霍山石斛枫斗(Y1)、河南石斛枫斗(Y2)的模型阈值错误最少,其假阳性率和假阴性率最低,特异性和敏感性为1,ROC图和预测响应图表达的意思相同,只是方式不同。图6(b)图中x轴是阈值,同时也是预测值,用于对霍山石斛枫斗的判别。随着阈值的增加,特异性增加,对霍山石斛枫斗的判别能力增加,出现假阳性(将河南石斛枫斗错判为霍山石斛枫斗)的可能性下降,在阈值0.5时,特异性最大,为100%(即为1),阈值大于0.5后,特异性一直保持为100%。敏感性在阈值小于等于0.5时为100%(即为1),大于0.5时,由100%开始下降,将会导致假阴性上升(霍山石斛枫斗被漏判为河南石斛枫斗)。因此,需要在特异性和敏感性间找到一个平衡点,最大可能的减少错判(假阴性和假阳性)。由图可知,在阈值取0.5时,特异性和敏感性均为100%,此时,判别能力最强,错判率为0。图6(d)是对河南石斛枫斗的预测响应结果分析,在阈值取0.5时,特异性和敏感性也均为100%,此时,判别能力最强,错判率为0。对于交叉验证集和预测集,敏感性和特异性都是100%。因此,本试验建立的方法在实际应用中将会非常可靠。

3 结 论

本试验运用1stD+SNV+MNCN的方法预处理光谱数据,减少了非目标因素的影响,提高了信噪比;PLS-DA建立的分析模型,不仅对于校正集的154个枫斗样品实现了准确的鉴定,准确率100%,而且对77个外部的未知石斛枫斗样品的判别的准确率也达到了100%,敏感性和特异性也很高,都为100%。由此可见:便携式近红外光谱仪结合化学计量学方法可以精准地挖掘霍山石斛枫斗和河南石斛枫斗在近红外光谱中潜在的化学成分差异信息;可以进行这二种石斛枫斗的评价和鉴别,能实现在目前市场环境下,石斛枫斗的现场、快速、无损鉴别;可以对石斛产业和中药材产业的可持续健康发展提供了有力的技术支撑。

[1]解爱华.不同品种石斛的性状和鉴别[J].湖南中医药导报,2004,10(3):57 - 58.

XIE A H. The character and differentiation between diffrent kinds ofDendrobiumstem[J]. Hunan Guiding Journal of Traditional Chinese Medicine,2004,10(3):57 - 58.

[2]陈晓梅,郭顺星.石斛属植物化学成分和药理作用的研究进展[J].天然产物研究与开发,2001,13(1):70 - 71.

CHEN X M,GUO S X. Advances in the research of constituents and pharmacology ofDendrobium[J].Natural Product Research and Development,2001,13(1):70 - 71.

[3]中华人民共和国药典委员会.中华人民共和国药典:第一部[M].北京:中国医学科学出版社,2010.

The Pharmacopoeia Comittee of People’s Republic of China. Pharmacopoeia of the People’s Republic of China:The First Volume[M]. Beijing:China Medical Science Press,2010.

[4]陈乃东,贾晓玉,程启斌,等. 霍山石斛与河南石斛生药学特征比较研究[J].天然产物研究与开发,2016,28:1060 - 1065.

CHEN N D,JIA X Y,CHENG Q B,et al. Comparative pharmacognostical investigation ofDendrobiumhuoshanenseandDendrobiumhenanense[J]. Natural Product Research and Development,2016,28:1060 - 1065.

[5]陈乃东,陈乃富,王陶陶,等. 组培霍山石斛枫斗、野生霍山石斛及河南石斛多糖及乙醇溶出物动态积累规律研究[J]. 天然产物研究与开发,2015,27(12):2090 - 2094.

CHEN N D,CHEN N F,WANG T T,et al. Accumulation of polysaccharides and ethanol-soluble extract in tissue-cultured and wildDendrobiumhuoshanenseandDendrobiumhenanense[J]. Natural Product Research and Development,2015,27(12):2090 - 2094.

[6]赵海燕,郭波莉,魏益民,等.近红外光谱对小麦产地来源的判别分析[J].中国农业科学,2011,44(7):1451 - 1456.

ZHAO H Y,GUO B l,WEI Y M,et al. Identification of geographical origins of wheat with discriminant analysis by near infrared spectroscopy[J]. Scientia Agricultura Sinica,2011,44(7):1451 - 1456.

[7]丁长春,方向京,赵艳丽,等. 近红外漫反射光谱法快速鉴别石斛属植物[J]. 光谱学与光谱分析,2014,34(1):82 - 86.

DING C C,FANG X J,ZHAO Y L,et al. Rapid identification ofDendrobiumplants based on near infrared diffuse reflection spectroscopy[J]. Spectroscopy and Spectral Analysis,2014,34(1):82 - 86.

[8]颜辉,郭成,第丹丹,等. 应用手持式近红外光谱仪检测桑椹可溶性固形物含量的偏最小二乘回归模型建立[J]. 蚕业科学,2016,42(6):1077 - 1084.

YAN H,GUO C,DI D D,et al. Establishment of partial least square regression model for determination of soluble solid content in mulberry fruit by handheld near infrared spectrometer[J]. Science of Sericulture,2016,42(6):1077 - 1084.

[9]顾玉琦,刘瑞婷,寿国忠,等. 应用近红外光谱技术快速鉴别铁皮石斛的产地[J]. 江苏农业科学,2016,44(5):365 - 368.

GU Y Q,LIU R T,SHOU G Z,et al. Identify the origin of dendrobium candidum with near infrared spectroscopy[J]. Jiangsu Agricultural Sciences,2016,44(5):365 - 368.

[10]张欣,单杨,李水芳. 基于多元散射校正和偏最小二乘(MSC/PLS)的傅里叶变换近红外光谱检测蜂蜜中还原糖[J].食品与机械,2009,25(6):109 - 112.

ZHANG X,SHAN Y,LI S F. Near-infrared determination of reducing sugar content in honey based on multiplicative scatter correction partial least square(MSC/PLS) method[J].Food & Machinery,2009,25(6):109 - 112.

[11]陈全胜,郭志明,赵杰文,等.基于净分析物预处理算法的绿茶中儿茶素的近红外光谱定量分析[J].红外与毫米波学报,2009,28(5):357 - 361.

CHEN Q S,GUO Z M,ZHAO J W,et al. Quantitative analysis of the catechins ofgreen tea with near infrared spectroscopy and net analyze preprocess in algorithm[J].Journal of Infrared and Millimeter Waves,2009,28(5):357 - 361.

[12]杨忠,任海青,江泽慧. PLS-DA法判别分析木材生物腐朽的研究[J]. 光谱学与光谱分析,2008.28(4):793 - 796.

YANG Z,REN H Q,JIANG Z H. Discrimination of wood biological decay by NIR and partial least squares discriminant analysis(PLS-DA)[J]. Spectroscopy and Spectral Analysis,2008.28(4):793 - 796.

[13]傅谊,张拥军,陈华才,等.基于偏最小二乘法的板栗近红外光谱分析模型的建立[J]. 食品科技,2012,37(5):42 - 45.

FU Y,ZHANG Y J,CHEN H C,et al. Establishment of NIR models for components determination in fresh chestnut[J]. Food Science and Technology,2012,37(5):42 - 45.

[14]宁井铭,张正竹,王胜鹏,等. 不同储存年份普洱茶傅里叶变换红外光谱研究[J]. 光谱学与光谱分析,2011,31(9):2390 - 2393.

NING J M,ZHANG Z Z,WANG S P,et al. Study ondifferent storage years of Pu’er tea with Fourier transform infrared spectroscopy[J]. Spectroscopy and Spectral Analysis,2011,31(9):2390 - 2393.

[16]CHEN C W,YAN H,HAN B X. Rapid identification of three varieties ofChrysanthemumwith near infrared spectroscopy[J]. Brazilian Journal of Pharmacognosy,2014,24:33 - 37

[17]陆婉珍,袁洪福,徐广通,等. 现代近红外光谱分析技术[M].2版. 北京:中国石化出版社,2006:30.

LU W Z,YUAN H F,XU G T,et al. Modern Near Infrared Spectroscopy Analysis Technology[M].2nd ed. Beijing:China Petrochemical Press,2006:30.

[18]李晓丽,何勇,裘正军. 一种基于可见-近红外光谱快速鉴别茶叶品种的新方法[J]. 光谱学与光谱分析,2007,27(2):279 - 282.

LI X L,HE Y,QIU Z J. A new method of quickly identifying tea varieties based on visible-near infrared spectroscopy[J]. Spectroscopy and Spectral Analysis,2007,27(2):279 - 282.

[19]陆丹,邓海山,池玉梅,等. 近红外光谱技术鉴别虎掌南星与天南星[J]. 中成药,2011,33(5):841 - 845.

LU D,DENG H S,CHI Y M,et al. Identification of pinelliae rhizoma and arisaematis rhizoma by near-infrared spectroscopy[J]. Chinese Traditional Patent Medicine,2011,33(5):841 - 845.

Rapid and Nondestructive Identification of Dendrobium huoshanense Fengdou and Dendrobium henanense Fengdou by Portable NIR Spectrometer

JIANG Mingzhu1,2, HAN Bangxing3,4, YAN Hui2, JIA Junqiang2, TU Jie2, MA Yongkun1

(1.School of Food and Biological Engineering,Jiangsu University, Zhenjiang 212013, China; 2.School of Biotechnology, JiangsuUniversity of Science and Technology, Zhenjiang 212018, China; 3.School of Biological and PharmaceuticalEngineering,West Anhui University, Lu’an 237012, China; 4.Chinese Traditional Medicine ResourceCenter,China Academy of Chinese Medical Sciences, Beijing 100700, China)

The near infrared spectra of 231 samples ofDendrobiumhuoshanenseandDendrobiumhenanensewere measured by portable near infrared spectroscopy. Nine kinds of preprocessing methods, such as first derivative(1stD), standard normal variate(SNV), mean centering(MNCN), multiplicative signal correction(MSC),normalize(N) and their combination were used to pretreat original spectrometer. The model of identifyingD.huoshanenseandD.henanensewere established with PLS-DA method. Different spectral preprocessing methods were compared with the accuracy of model. The models were also evaluated with the accuracy, sensitivity and specificity of PLS-DA model. The results showed that the 1stD+SNV+MNCN preprocessing method had the best effect, the accuracy of the model was the highest. When the latent variable was 12, the prediction accuracy of calibration set, cross validation set and prediction set were 100%, and 100% specificity and sensitivity rate of PLS-DA model were also obtained. The results indicted that PLS-DA analysis with Near-Infrared can provide a new method for rapid and non-invasive identification ofD.huoshanenseFengdou andD.henanenseFengdou.

portable NIR spectrometer; PLS-DA;DendrobiumhuoshanenseFengdou;DendrobiumhenanenseFengdou; nondestructive identification

2017- 01- 05

科技部中医药行业专项资助(201407003);安徽省石斛产业化开发协同创新计划资助(无编号)

江明珠(1971— ),女,江苏镇江人,博士生,研究方向为食品生物技术;E-maildgjmz@163.com

10.3969/j.issn.0253-2417.2017.05.013

TQ35;S789

A

0253-2417(2017)05- 0101- 06

江明珠,韩邦兴,颜辉,等.便携式近红外光谱仪快速无损鉴别霍山石斛枫斗和河南石斛枫斗[J].林产化学与工业,2017,37(5):101 - 106.

猜你喜欢

红外光谱仪霍山石斛
飞鼠与石斛
35 种石斛兰观赏价值评价
MEMS近红外光谱仪微镜驱动控制系统研发
柱前衍生化HPLC同时测定霍山石斛中13种游离氨基酸含量
霍山石斛内生真菌的分离及其及活性菌株的鉴定
霍山石斛Stagonosporopsis oculihominis内生真菌次生代谢产物分离鉴定
金钗石斛化学成分的研究
显微红外光谱仪不同检测模式的探索
怎样是一株好霍斛
正交设计在观赏石斛种胚离体培养中的应用