基于近红外高光谱技术的冬虫夏草品级快速鉴定
2018-03-19王乾龙汪亚芳安丽灿其美多吉
王乾龙 汪亚芳 安丽灿 其美多吉
【摘要】目的:研究基于近红外高光谱分析方法快速鉴别冬虫夏草品级的可行性。方法:采集西藏那曲、青海玉树和西藏林芝的冬虫夏草各1 0根样品的近红外高光谱(800nm-2500nm)数据,经Savitzky-Colay平滑和二阶导数预处理后进行主成分分析,构建载荷图鉴别模型。结果:对冬虫夏草的近红外光谱进行二阶导数预处理,可以有效减弱近红外光谱鉴别中药材中的吸收峰重叠等影响;构建的主成分分析载荷图模型,鉴别冬虫夏草品级准确率达到100%。结论:经过预处理的冬虫夏草近红外高光谱数据能够构建出冬虫夏草的品级鉴定模型,并成功应用于实践。
【关键词】冬虫夏草;品级鉴定;近红外高光谱;二阶导数;主成分分析
冬虫夏草是麦角菌科真菌冬虫夏草菌(Cordyceps sinensis(Berk.) Sace.)寄生在蝙蝠蛾科昆虫蝙蝠蛾幼虫上的子座与幼虫尸体的复合体[1],与人参、鹿茸并称为补品“三宝”,具有良好的医疗保健作用[2]。我国作为冬虫夏草的主要产地,主要分布在西藏、青海、四川、甘肃、云南等海拔3000到5500米的高山草甸中,其中西藏那曲和青海玉树等产地海拔超过4500米,被誉为优质产区,所产冬虫夏草因其较高品质一直备受广大消费者青睐。
青藏高原虽然是冬虫夏草主产区,但由于生态地理环境的复杂性和多样性,冬虫夏草居群在区域尺度上呈不连续的斑块状分布[3],在西藏自治区内就有那曲、昌都、林芝等产区,区别于不同海拔高度及气候、土壤、坡向等因素[4],从而造成不同产区冬虫夏草的药理药性等品质差异[5]。近年来,随着消费者鉴别冬虫夏草与伪虫草能力日益增强,以及许多利用光谱等高科技手段鉴别真伪冬虫夏草的实例应用技术日趋成熟[6-8],一些不法商家不再使用亚香棒虫草等易于识别的伪虫草来冒充真冬虫夏草,而改用西藏低海拔地区如林芝所产品级较差的冬虫夏草冒充优质产区冬虫夏草,二者形状色泽极为接近,肉眼鉴别极其困难。而优质冬虫夏草主产区青海玉树和西藏那曲等地区每年政策允许的可采挖时间非常短暂,采挖难度逐年递增,近几年产量已经大幅度下滑,但市场需求却与日俱增。因此,对冬虫夏草市场除了快速鉴别真伪之外,如何快速鉴别出不同产区的冬虫夏草品级,己成为目前亟需解决的另一个关键问题,具有净化市场秩序,帮助消费者购买到优品级产品的重要意义。
近年来,光谱分析方法因其能够快速、高效获取被检测样本的化学组分信息,在冬虫夏草的真伪鉴别中发挥了重要作用,许多相关研究已取得成熟进展,光谱技术完全能够应用于冬虫夏草的真伪鉴别。张九凯等[6]利用傅里叶变换红外光谱技术及模式识别方法,将冬虫夏草真伪识别率提高到100%,并找到冬虫夏草在中红外范围的光谱指纹区;陈建波等[1]利用二阶导数处理真偽冬虫夏草的中红外原始光谱,指出光谱特征峰差异,并利用主成分得分图对真伪虫草进行量化区分。王钢力等[2]基于近红外光谱一阶导数方法鉴别区分产自西藏青海和四川不同产地的102个冬虫夏草样品,药材粉末产地判断准确率达100%。然而,与真伪冬虫夏草鉴别相比,不同品级的冬虫夏草因外观极为相似、都是正品但等级有差别,鉴别起来更加困难。近红外高光谱分析技术在冬虫夏草鉴定中的应用极少,主要是因为近红外光谱与中红外相比,吸收峰重叠严重,难以采用常规分析方法[9],必须对原始光谱数据进行合理预处理变换之后,再充分利用数学模型进行分析。因此,如何基于近红外高光谱数据,构建有效普适性强的鉴别模型,鉴别出不同产地不同品级的冬虫夏草,是本研究的关键之处。
本研究针对不同产地不同品级的冬虫夏草样品,在测得的近红外高光谱原始数据基础上,进行多元散射校正及二阶导数高光谱预处理,通过主成分分析构建出样品载荷图,建立冬虫夏草品级鉴定的高光谱分析模型,来实现冬虫夏草不同品级的快速测定。
1 材料与方法
1.1 材料
1.1.1 样品收集与制备
目前共收集到来自西藏那曲、青海玉树、西藏林芝和西藏日喀则正品冬虫夏草各10根共计40根,所有样品形态大小均匀相似。因西藏日喀则吉隆县产冬虫夏草外形颜色与其它产区差异较大,可直接识别出来,因此只选取西藏那曲、青海玉树和西藏林芝三个地区的冬虫夏草共计30根样品做近红外光谱数据测试和数据对比分析,每根样品单独研磨过65目筛,装入12mm直径、5mm高的圆柱形塑料器皿中。所有样品均购自当地正规大型药店。
1.1.2 光谱测定与预处理
冬虫夏草的近红外高光谱测定仪器采用美国ASD公司生产的FieldSpec 4型光谱仪,波长测试范围为3 50nm-2500nm,Inm重采样间隔。光谱数据测试在严格控制光照条件的暗室内进行,冬虫夏草样品在盛放的容器内表面刮平,光源采用实验专用设备50W卤素灯,经反复验证最佳光谱数据采集几何位置设定为:光源与样品容器天顶角300,距容器表面lOcm,光谱仪传感器探头垂直样品上方2cm固定,确保无设备阴影影响光谱测定。
光谱数据的预处理操作包括Savitzky-Golay平滑(七窗口三次多项式),二阶导数(2st derivation)处理。因样品在可见光波段范围光谱曲线无明显差异,采集的数据不仅去除噪声明显的350-399nm和2451-2500nm边缘波段数据,还去除了400-799nm波段数据,保留可见光800-2450nm数据。平滑处理可提高分析信号的信噪比,二阶导数谱的灵敏度较高,可以看到更多的信息。以上所有数据处理在UnscramblerX 10.3软件中完成。
1.2 主成分分析载荷图模型
在近红外高光谱数据分析方法中,主成分分析(principal components analysis,PCA)能够有效简化光谱数据集。近红外光谱中包含有大量冬虫夏草综合性信息,通过一系列的线性变化,对方差较大、信息量多的组分予以保留,从而达到降维的目的。降维之后各组分是原来包含的自变量的线性组合,且各组分之间相互独立[8]。进行主成分分析时,通常保留前几个主成分贡献较大,即累积方差在总方差所占百分比(贡献率)较高的组分。获取基于协方差的高光谱载荷分布图模型,能够清晰客观反应出样本之间的光谱空间信息,有效解决近红外光谱吸光强度低、吸收峰严重重叠等不足之处。
2 结果与讨论
2.1 不同产地冬虫夏草近红外高光谱比较分析
通过测定来自西藏那曲、青海玉树和西藏林芝三个产地各10个、共计30个样本的冬虫夏草800-2450nm近红外高光谱数据,将各产地样本数据取平均,得到三条近红外高光谱原始数据曲线图(图1)。
从图1可以发现,三个产地的冬虫夏草近红外高光谱原始数据曲线走势非常接近,这反映出三个产地冬虫夏草所含成分非常相近。但西藏林芝冬虫夏草的近红外光谱曲线反射率明显低于其它两个产地,并且在2329 nm处(图1中长虚线)无反射峰,而那曲和玉树两个产地样品在此处均有反射峰。林芝地区处于喜马拉雅山脉、年轻唐古拉山脉与横断山脉对接之处,面向印度洋的缺口引入印度洋暖湿气流,属于高原温带湿润半湿润季风气候,平均海拔3000m左右,最低处约为900m,比西藏其它地区要低;那曲、玉树两个地区气候与地貌条件相似,都为高原山地气候,平均海拔为4500m的高海拔地区,常年高寒缺氧,低温冰冻,是高品级冬虫夏草的绝佳产地。
以上对原始数据光谱曲线的差异的分析,仅初步判断出林芝冬虫夏草与那曲玉树产地的区别。为减弱近红外光谱背景复杂、谱峰重叠等限制(进展),看到更多光谱信息(2007),对原始光谱数据进行二阶微分处理(图2)。图2清晰反映出林芝冬虫夏草与那曲、玉树样品在1360nm、1920nm、2095nm和23 58nm的显著差异,可作为鉴别林芝产地的重要特征依據,但那曲与玉树两地样品差异还不能在光谱图及二阶微分图中作明显区分。
2.2 不同品级冬虫夏草的鉴别模型
将所有样品的近红外高光谱原始数据经过Savitzky-Golay平滑(七窗口三次多项式)和二阶导数预处理后,所得数据再进行构建主成分分析载荷图模型(图3)。这比直接基于原始光谱数据主成分分析得到的结果更加准确,因为原始光谱数据中包含有噪声干扰信号、信息严重重叠等缺点。
主成分分析结果为:第一主分(PCl)占82%信息量,第二主分(PC2)占16%信息量,第三主分(PC3)占2%信息量。绘制出主成分分析载荷图(图3),所有样品在载荷图模型中的空间位置清晰展示出来,可以明显看出不同产地的样品主成分信息在载荷图模型中的空间位置具有显著差异,且相同产地样品相对集中。这对于判断未知样品在载荷图中的空间位置信息极为重要,为产地及品级鉴定提供客观清晰的可视化科学依据。
其中,西藏那曲和青海玉树所有20个样品在载荷图模型中的空间位置相对集中,而西藏林芝10个样品的空间位置与其它产地明显相距较远,表明西藏那曲和青海玉树所产冬虫夏草品质相似,西藏林芝所产品质差距较大。这与实际市场需求中对那曲和玉树冬虫夏草有较高需求相一致。
利用主成分分析载荷图模型进行冬虫夏草产地及品级鉴定,只需将未知样品的近红外高光谱数据进行Savitzky-Golay平滑和二阶导数预处理后,再计算其主成分载荷数值,与已有模型进行对比,未知样品落入哪个产区的位置区间内,来判断产地及品级,经测算判断准确率达到100%。在后续研究中,扩大样品的产地规模及样品数量,丰富样品的载荷图模型中空间信息,构建出具有冬虫夏草全面空间信息的载荷图模型,辅助冬虫夏草的快速品级鉴定。
3 结论
本研究基于不同品级冬虫夏草样品的近红外高光谱数据进行预处理和主成分分析载荷模型建立,对冬虫夏草品级鉴定进行可行性研究,结果表明:二阶微分处理能够有效减弱吸收峰重叠严重的问题,为后续主成分分析获取载荷图提供清晰可靠的数据;将未知样本进行主成分分析获得的载荷数据放入模型中,能够快速鉴别出其所在产地,鉴别准确率达100%。因此,通过近红外高光谱分析及主成分分析模型,能够快速准确对冬虫夏草品级进行鉴定。如果能够提高样品数量及扩大采样产地,将在主成分载荷图上更准确标识出不同产区的三维图位置及空间范围,这将是后续研究的重要内容。
参考文献
[1]陈建波,周群,王晓平等.冬虫夏草的红外光谱真伪鉴定[J].光谱学与光谱分析,2012,32 (10):21-22.
[2]王钢力,石岩,魏玉海等.近红外光谱鉴别冬虫夏草道地药材[J].中草药,2006, 37 (10):1569-1571.
[3]周刊社,张建春,黄晓清等.西藏高原冬虫夏草资源适宜性区划分析[J].生态学报,2018,38 (08): 2768-2779.
[4]董应才,罗都强.我国的冬虫夏草研究[J].国土与自然资源研究,1996 (03):47-51.
[5]陈炜.不同产地冬虫夏草药理作用研究[D].武汉:华中科技大学,2016.
[6]张九凯,张小磊,曾文波等.傅里叶变换红外光谱技术鉴别冬虫夏草真伪的研究[J].检验检疫学刊,2015,25 (03):1-7.
[7]孙梅,王睿,陈兴海等.高光谱在冬虫 夏草含量及真伪鉴别中的应用[J].中国现代应用药学,2017,34 (08):1114-
[8]宋文军.野生冬虫夏草红外分析与鉴别[J].天津师范大学学报(自然科学版), 2007, 27 (03):16-18.
[9]陈科力,黄林芳,刘义梅.中药鉴定方法学发展历程[J].中国中药杂志,2014, 39 (07):1203-1208.