不同产地甘草的近红外指纹图谱模式识别鉴别方法
2015-04-26杨天鸣付海燕李鹤东
杨天鸣,张 璐,付海燕,李鹤东,姜 杜,周 蓉
(中南民族大学 药学院,湖北 武汉 430074)
不同产地甘草的近红外指纹图谱模式识别鉴别方法
杨天鸣,张 璐,付海燕*,李鹤东,姜 杜,周 蓉
(中南民族大学 药学院,湖北 武汉 430074)
目的:对四种产地(新疆、内蒙古(家种)、内蒙古(野生)、甘肃)的甘草进行鉴别。方法:利用近红外漫反射(NIRDRS)技术结合欧氏距离判别分析方法(Euclidean distance discriminant analysis)和偏最小二乘判别分析方法(Partial least-squares discriminant analysis,PLSDA)对四种产地(新疆、内蒙古(家种)、内蒙古(野生)、甘肃)的甘草进行鉴别。结果:PLSDA模型对不同产地甘草的训练集和预测集分类正确识别率均为100.0% 。结论:近红外指纹图谱技术结合偏最小二乘判别分析方法为中药材产地的鉴别提供了一种简便、快速、准确的鉴定方法。
甘草;近红外光谱;欧氏距离判别分析;偏最小二乘判别分析;产地
甘草(GlycyrrhizauraiensisFisch)又名甜草根、粉草、灵通、国老,为豆科甘草属多年生草本植物。甘草是临床应用最广泛的中药,以根茎入药,味甘、性平,归心、肺、脾、胃经,具有补脾益气、清热解毒、祛痰止咳、缓急止痛、调和诸药等多种功效。甘草资源主要分布在北纬38°以北的东西走向的带状区域内,通常按照主产区分为东甘草、西甘草和新疆甘草3类,其中分布于内蒙古、宁夏地区的西甘草药材质量最好,甘草酸含量高[1],故以内蒙古、甘肃、宁夏等地为道地产地。目前市面上采购的甘草来源复杂,药材质量参差不齐。因此研究甘草产地快速简便准确的鉴定方法具有重要的实际意义和应用价值。本文将中药近红外指纹图谱技术[2-3]与化学计量学方法结合,对四种产地的甘草进行模式识别(欧氏距离判别分析和偏最小二乘判别分析),实现了不同产地甘草的鉴别分析,现报道如下。
1 材料与仪器
1.1 材料
甘草药材均购买于武汉同仁堂大药房,来源于四个不同产地:新疆、内蒙古(家种)、内蒙古(野生)、甘肃。
1.2 仪器
AntarisⅡ傅里叶变换近红外光谱仪(美国Thermo Nicolet 公司,配有InGaAs检测器和石英样品杯,使用积分球漫反射采样系统和Result软件采集样品光谱); FW100型高速万能中药粉碎机(天津市泰斯特仪器有限公司);200 目标准检验筛,孔径0.074mm(浙江上虞五四纱筛厂)。
2 方法
2.1 样品制备
实验所用药材全部采用中药粉碎机粉碎后过200目标准检验筛,所得细粉置于60℃下真空干燥24h,储存于干燥器内备用。
2.2 近红外指纹图谱采集
取上述甘草样品粉末适量置于石英样品测量杯内,摊平,压实,以空气为空白参比扣除背景(每测定一种甘草粉末,均要以空气为空白参比测试背景),采集光谱图。采集方式:积分球漫反射;扫描次数:32次;分辨率:8cm-1;采集光谱区间:10 000~4 000cm-1;相对湿度:(43.0±2.0)%;温度:(24.0±1.0)℃。每个样品采集100次,共得到400张近红外光谱。随机将400条近红外光谱划分为训练集和预测集,具体划分信息见表1。
表1 样品数据集划分信息 (n)
2.3 光谱数据处理
所采集的光谱数据通过多元散射校正(MSC)或二阶导数(SD)校正进行光谱数据的预处理。欧氏距离判别分析(Euclidean distance discriminant analysis)、偏最小二乘判别分析(Partial least-squares discriminant analysis)程序均在MATLAB环境下自编及运行。
3 结果与讨论
3.1 近红外光谱指纹图谱采集及光谱预处理
在近红外光谱的测试过程中,测试样品颗粒度的均一性、光散射和噪声干扰等因素均会对测试的光吸收度产生影响。因此在建立模型前,对样品近红外光谱进行了多元散射校正(Multiplicative scatter correction)和二阶导数(Second derivative)的光谱预处理。四个产地甘草供试品粉末的近红外光谱如图1所示。
从图1可以看出,样品的原始光谱重叠严重,很难直观地通过光谱的峰强、峰形和峰位来进行分辨鉴别。为建立更为可靠稳定的应用模型,可以对样品原始光谱进行预处理,采用多元散射校正(MSC)的方法可有效减少由于样品固体颗粒度不均匀等物理因素引起的光谱散射影响,二阶导数校正(SD)的预处理方法被用来消除光谱基线漂移和倾斜所产生的差异,从而改善光谱的分辨峰。
图1 四个产地的甘草近红外(NIR)光谱
注:(a)原始光谱;(b)多元散射校正(MSC)光谱;(c)二阶导数(SD)光谱
3.2 甘草产地欧氏距离判别分析
对四种不同产地甘草的400条近红外光谱的原始光谱、MSC光谱和SD光谱建立欧氏距离判别分析模型。图2为欧氏距离判别分析对四种产地甘草的原始光谱(a)、MSC光谱(b)和SD光谱(c)数据的相似度比较结果。
从图2可以看出,欧氏距离判别模型NIR原始光谱的数据处理结果中,新疆和甘肃产地的甘草最为相似,其次是内蒙古(野生)甘草,内蒙古(家种)甘草与其他3种甘草差异最大;NIR多元散射校正光谱的数据处理结果中,新疆和内蒙古(家种)的甘草相似度最高,其次是甘肃甘草,内蒙古(野生)甘草与其他3种甘草差异最大;NIR二阶导数光谱的数据处理结果则表明内蒙古的两种甘草最相似,其次是新疆甘草,甘肃甘草与其他3种甘草差异最大。二阶导数光谱能消除光谱噪声和基线漂移,其判别结果更为合理。
3.3 甘草产地的偏最小二乘判别分析
偏最小二乘判别分析(PLSDA)[4-6]方法分解数据矩阵得到的特征向量与被测组分的性质相关,而不是与数据矩阵中变化最大的变量相关。该方法首先对四种产地的甘草进行虚拟的矩阵编码,通过对用于训练模型的中药材资源进行虚拟编码,每一行代表一个样品,将其虚拟编码为隶属于第k种药性的矢量code=fk,其编码原则为第k个元素为1,其余元素均为0的矢量。由此,可将用于训练PLSDA模型的不同药性药材编码为一个矩阵In×m,该矩阵的行数等于建模所用的药材样本数n,列数等于药材不同产地的种类数m。对In×m的每一列对获得的特征信息矩阵Xn×q进行PLS回归,回归矩阵Bp×m的每一列为PLS的回归系数量,即In×m=Xn×qBq×m。其中,q是近红外光谱指纹信息区间所含的波长数,m是产地种类数,最佳隐变量数由n-重交互验证确定。
图2 四种甘草近红外(NIR)原始光谱(a)、多元散射校正(MSC)光谱(b)和二阶导数(SD)光谱(c)欧氏距离判别分析
采用PLSDA模型可将四个产地的甘草每个样品分别编码为fl(1,0,0,0);f2(0,1,0,0);f3(0,0,1,0);f4(0,0,0,1), PLSDA 使用f1~f4的虚拟码关联整个光谱变量,可获得与被测组分或性质相关的特征数据矩阵。PLSDA模型对原始光谱数据以及经过多元散射校正(MSC)和二阶导数校正(SD)预处理过的光谱数据分别进行5-倍交互验证,每个PLSDA模型最小的模型训练和预测错判数在隐变量取6时获得。图3是隐变量等于6时,PLSDA模型基于近红外原始光谱数据对4种甘草样品中136个训练集样本和264个预测集样品类别的虚拟编码归属图,图中f1~f4分别代表产地为新疆、内蒙古(家种)、内蒙古(野生)、甘肃的甘草样品。
图3 四种来源甘草近红外(NIR)光谱PLSDA模型
续图3 四种来源甘草近红外(NIR)光谱PLSDA模型
注:(a)原始光谱训练集判别结果;(b)原始光谱预测集集判别结果;(c)多元散射校正(MSC)光谱训练集判别结果;(d)多元散射校正(MSC)光谱预测集判别结果;(e)二阶导数(SD)光谱训练集判别结果;(f)二阶导数(SD)光谱预测集判别结果
采用PLSDA方法,在取隐变量为6时,分别基于NIR原始光谱和两种校正光谱获得模型的训练和预测结果,见表2。
由表2可知,基于NIR光谱的原始、MSC、SD光谱的PLSDA模型对不同产地的四种甘草样品的训练和预测结果正确率均为100.0%。结果表明该模式识别方法可以提取出样品中最能代表各类样本分类性质及特征的信息量,消除了一些无关信息变量的干扰,实现了对不同产地的四种甘草的准确判别。
表2 基于NIR光谱PLSDA模型判别分析 (%)
4 结论
采用二阶导数校正甘草的近红外光谱后,欧氏距离判别分析方法能清晰地反映不同来源甘草的相似程度。内蒙古的两种甘草(野生、家种)最为相似,与其接近的是新疆甘草,甘肃甘草与其他3种甘草差异较大。采用偏最小二乘判别分析方法建立的判别模型对训练集已知甘草样本的分类准确率达到100.0%,对预测集未知甘草样本的预测正确率也达到100.0%,表明该模型具有很好的预测性能,可用于甘草药材不同种植产地的分类鉴别。该方法为中药材的产地鉴定、基源判别提供了全面可靠、准确真实、迅速简便的检测手段。
[1] 姚静慧,杨柏灿.从产地及生长环境探析甘草的功能特性[J].中成药,2014,36(9):1941-1944.
[2] 杨天鸣,吴燕,苏蕊,等.中药材及炮制品的近红外指纹图谱模式识别快速鉴别方法[J].化学与生物工程, 2014,31(9):67-70.
[3] 孙丽英,杨天鸣,王云英.不同产地黄柏的近红外指纹图谱鉴别分析[J].计算机与应用化学,2008,25(3):329-332.
[4] MEHMOOD T, LILAND KH, SNIPEN L,et al.A Review of Variable Selection Methods in Partial Least Squares Regression[J].Chemom Intell Lab Syst,2012,118(1):62-69.
[5] RITTHIRUANGDEJ P,KASEMSUMRAN S,SUWONSICHON T, et al. Determination of total nitrogen content, pH, density, refractive index, and brix in Thai fish sauces and their classification by near-infrared spectroscopy with searching combination moving window partial least squares[J].Analyst, 2005,130(10):1439-1445.
[6] LUTZ U, LUTZ R W, LUTZ W K. Metabolic Profiling of Glucuronides in Human Urine by LC-MS/MS and Partial Least-Squares Discriminant Analysis for Classification and Prediction of Gender[J].Analytical Chemistry,2006,78(13):4564-4571.
(责任编辑:尹晨茹)
Rapid Identification of Different Origin of Licorice by Near Infrared Spectroscopy and Pattern Recognition Method
Yang Tianming, Zhang Lu, Fu Haiyan*, Li Hedong, Jiang Du, Zhou Rong
(College of pharmacy, South-Central University for Nationalities, Wuhan 430074, China)
Objective:To indentify Xinjiang, Inner Mongolia (seed), four (wild) in Inner Mongolia, gansu origin of radix glycyrrhizae.Methods:The similarity of four different origin (Sinking, Nei monggol (cultivatted) , Nei monggol (agrestal) and Gansu) of licorice were rapidly calculated by near-infrared diffuse reflectance spectroscopy (NIRDRS) combined with Euclidean distance discriminant analysis and Partial least-squares discriminant analysis (PLSDA). Meanwhile, four different origin of licorice were rapidly identified by NIRDRS coupled with PLSDA.Results:Perfect classification ratio with 100% was obtained for the NIR fingerprint information based on PLSDA model, which indicated that the model had good classification performance.Conclusion:An efficient, nondestructive and accurate detection method was established for identification of origin of Chinese herbs by NIRDRS combined with PLSDA.
Licorice;NIR Spectroscopy;Euclidean Distance Discriminant Analysis;Partial Least-squares Discriminant Analysis;Place of Origin
2015-05-21
国家自然科学基金资助项目(21205145);中央高校基本科研业务费专项资金资助项目(CZZ10005,CZZ12028,CZY13019)
杨天鸣(1962-),男,中南民族大学教授,研究方向为药物分析、化学生物学。
付海燕(1983-),女,中南民族大学副教授,研究方向为药物分析。E-mail:fuhaiyan@mail.scuec.edu.cn
R284.1
A
1673-2197(2015)14-0011-04
10.11954/ytctyy.201514005