APP下载

近红外光谱和模式识别的菊花品种无损鉴别

2022-04-06李嘉仪李脉泉

光谱学与光谱分析 2022年4期
关键词:正确率菊花预处理

李嘉仪,余 梅,李脉泉,郑 郁,李 跑, 3*

1. 湖南农业大学食品科学技术学院,湖南 长沙 410128 2. 湖南师范大学医学院,湖南 长沙 410013 3. 湖南省农业科学院,湖南省农产品加工研究所,湖南 长沙 410125

引 言

菊花为菊科植物菊的干燥头状花序。 滁菊、贡菊、杭菊和亳菊是常见的几类药用菊花品种[1-2]。 不同品种菊花化学组成如萜类、黄酮、有机酸和生物碱等存在一定差异,药理作用和功能也有所差别,但其外观相似度较大,非专业人员仅通过肉眼难以实现对不同品种菊花的准确鉴别分析。

目前用于菊花品种鉴别的方法主要有感官评价法和仪器分析法。 前者通过对外形、气味等进行分析以实现对菊花品种的鉴别,易受主观因素影响,鉴别正确率较低;后者是通过对不同品种菊花的化学组成和含量进行检测以实现鉴别分析。 Wang等[3]通过高效液相色谱-二极管阵列-电喷雾串联质谱对9个产地菊花的主要化学成分进行了表征,实现了菊花产地的准确鉴别分析。 肖作兵等[4]采用气相色谱-质谱/气相色谱-电子鼻对精油特征香气成分的分析实现了不同厂家菊花精油的鉴别。 然而此类方法前处理繁杂、检测成本较高、耗时较长,且对样品具有破坏性,影响了产品的二次销售。 因此,亟需开发一种不同品种菊花无损鉴别新方法。

近红外光谱的波长介于可见光谱和中红外光谱之间,有机物中的含氢基团化学健伸缩振动的倍频及合频信息与这一谱区相关[5]。 然而近红外光谱谱带较宽、吸收峰重叠严重、吸收较弱,信息复杂,需要结合化学计量学方法对其进行解析。 光谱预处理及其组合算法被提出来用于消除光谱中的基线漂移、背景以及噪声干扰[6-8]。 此外,大量模式识别方法被提出来用于挖掘样品的类别信息。 无监督模式识别的主成分分析方法(PCA)[9]以及有监督的软独立模式分类法(SIMCA)[10]和Fisher线性判别分析(FLD)[11]是最常用的模式识别方法。 近红外光谱因具备检测速度快、重现性好、可实现无损检测等优点,近年来在中药品种识别、产地鉴别以及真伪鉴定等领域得到了广泛应用。 Li等[11]利用傅里叶台式近红外光谱仪结合FLD方法实现了不同年份陈皮的准确鉴别分析。 Han等[12]通过傅里叶近红外光谱仪结合偏最小二乘判别分析算法建立了不同品种菊花粉末的鉴别模型。 然而该方法依旧无法实现完整菊花的鉴别分析。 傅里叶台式近红外光谱仪分辨率高、光通量大,但是抗震性差,较难做成便携式仪器,且价格昂贵。 固定光路阵列检测型便携式近红外光谱仪是最常见的便携式近红外仪器,因其价格低、体积小等优点得到了广泛关注,但不同阵列像元间有串扰,仪器的信噪比较差[13]。 李庆等[14]利用云端-互联便携式近红外技术结合化学计量学方法实现了对西红花真伪鉴别和掺伪品掺伪量预测。 然而,菊花不同于其他样品,其物理性状不均匀,且便携式近红外信号中易受到较大背景和噪声的干扰,现阶段尚缺乏菊花品种无损鉴别的研究。

因此,提出了一种基于便携式近红外光谱仪结合化学计量学方法的菊花品种无损鉴别方法。 通过便携式近红外光谱仪采集不同品种菊花完整和粉末状样品的光谱信息,同时考察物理性状对光谱的影响,基于预处理方法以及模式识别方法建立菊花品种的准确鉴别模型。

1 实验部分

1.1 材料

从本地药店购买滁菊、贡菊、杭菊和亳菊干样各30份(直径约为2.5 cm),共计120份完整样品。 同时考察样品物理性状对光谱的影响,对每个品种菊花打粉,各制备30份,共计120份粉末状样品。

1.2 仪器与光谱采集

便携式近红外光谱仪(必达泰克光电科技(上海)有限公司)用于采集不同品种菊花漫反射光谱信息,范围11 100~6 200 cm-1,共采集433个数据点。 将完整样品以及装有粉末样品的石英样品杯直接置于光斑的中心处且完全覆盖光斑,进行光谱采集。 每份样品重复测定3次,取平均值作为该样品的原始光谱。

1.3 光谱数据分析

使用MATLAB R2010b(The Mathworks, Natick, USA)软件对光谱数据进行分析。 120份完整、粉末状样品数据根据Kennard-Stone方法按照7∶3的比例分为84个校正集和36个预测集。 采用去偏移(De-bias)、去趋势(DT)、标准正态变量变换(SNV)、多元散射校正(MSC)、最大最小归一化(Min-Max)、一阶导数(1st)、二阶导数(2nd)和连续小波变换(CWT)等8个光谱预处理对数据进行优化,CWT预处理的小波基为“haar”小波基,小波基的尺度参数为20。 为了消除光谱中的多种干扰,考虑CWT以及1st等求导算法可以有效消除光谱中的背景以及基线漂移干扰,SNV和MSC方法可以消除菊花固体样品带来的光散射干扰,因此采用1st-DT,1st-SNV,1st-MSC,CWT-SNV和CWT-MSC等5种预处理组合对光谱进行优化。 为了实现菊花品种的准确鉴别,采用PCA、SIMCA和FLD方法分别建立鉴别模型。

2 结果与讨论

2.1 不同品种菊花原始光谱特征

图1为不同品种菊花完整和粉末状样品的原始光谱图。 样品的光谱存在相同的变化趋势,完整及粉末状样品的光谱均在8 500 cm-1处出现较为明显的吸收峰,可能是与C—H第三泛频带振动有关,在7 100 cm-1出现的吸收峰与C—H第二泛频带振动相关。 受便携式仪器及样品物理性状的影响,光谱存在明显的噪声干扰。 一方面便携式仪器不同阵列像元间有串扰,仪器的信噪比要差一些,另一方面,菊花样品中水分含量较少,近红外吸收强度较弱,导致噪声非常明显。 图1(a)中完整样品光谱中基线漂移极其严重;由于减少了物理性状的干扰,图1(b)中粉末状样品光谱基线漂移干扰有所缓解。 然而,无论是完整样品还是粉末状样品,均无法从原始光谱中发现不同品种菊花的差异信息。

2.2 基于PCA的菊花品种鉴别分析

为了实现不同品种菊花的鉴别分析,采用PCA方法对光谱数据进行处理。 图2为4个品种菊花完整以及粉末状样品原始光谱的PCA结果,红色、蓝色、紫色和绿色图标分别代表滁菊、贡菊、杭菊和亳菊。 图中不同形状的实心图标代表校正集,空心图标代表预测集。 由于第一主成分(PC1)与第二主成分(PC2)的累计方差贡献率之和大于90%,因此选用PC1及PC2绘制PCA图。 由图2(a)可知,不同品种完整菊花样品的置信椭圆呈现重叠交织状,校正集和预测集鉴别正确率均为8.33%。 由图2(b)可知,由于减少了物理性状的干扰,粉末状样品的鉴别结果优于完整样品的结果,贡菊与杭菊得到了准确鉴别,而亳菊和滁菊的置信椭圆呈现重叠交织状态,校正集鉴别正确率为52.38%,验证集鉴别正确率为61.11%。 此外,无论是完整样品还是粉末状样品,结合预处理的PCA鉴别结果均低于结合原始光谱PCA结果。 仅利用完整及粉末状样品的原始光谱及优化后的光谱无法实现对不同品种菊花的准确鉴别分析。

图2 基于完整样品的(a)及粉末状样品(b)原始光谱的PCA图Fig.2 PCA results of the original spectra of complete (a) and powdered sample (b)

2.3 基于SIMCA的菊花品种鉴别分析

PCA方法仅利用方差信息实现数据的分类,鉴别能力较弱;而SIMCA方法利用先验信息为每一类样品建立独立的PCA模型,从而实现对未知样品的鉴别。 表1为采用SIMCA结合预处理的鉴别结果。 与PCA模型结果相比,SIMCA模型的鉴别正确率得到了明显提高,完整样品原始光谱的鉴别正确率为70%,采用预处理方法优化光谱后,采用1st-MSC组合预处理方法可得到最佳鉴别结果,鉴别正确率为95%。 粉末状样品原始光谱数据的鉴别正确率为92.5%,采用预处理方法优化数据后,其鉴别正确率有所下降,可能原因是预处理方法在扣除干扰信息同时,也扣除了隐藏在光谱中的菊花品种差异信息。

2.4 基于FLD的菊花品种鉴别分析

采用FLD模式识别方法对光谱数据进行处理。 表1为FLD结合预处理方法后的鉴别结果。 FLD模型鉴别结果优于PCA和SIMCA模型结果。 采用完整样品原始光谱数据便可获得87.5%的鉴别正确率。 采用预处理方法优化光谱数据后,采用CWT预处理可获得最佳的鉴别结果,鉴别正确率为97.5%。 在FLD方法的帮助下,粉末状样品采用原始光谱数据便可实现100%的鉴别分析,采用De-bias,DT和1st预处理同样可以获得100%鉴别正确率。 图3为不同品种菊花的FLD结果。 结果表明: 与PCA和SIMCA模型结果相比,FLD方法获得的菊花品种鉴别结果最佳,且当采用合适的预处理和建模方法,完整和粉末状样品鉴别结果较为一致,表明该方法可以实现菊花品种的无损鉴别分析。

表1 不同预处理方法结合SIMCA和FLD方法的鉴别正确率Table 1 Identification accuracies obtained by SIMCA/FLD and pretreatment methods

续表1

图3 完整样品CWT-FLD结果(a),粉末状样品原始光谱FLD结果(b)Fig.3 CWT-FLD result of the complete samples (a), FLD result of original spectra of the powdered samples (b)

3 结 论

基于便携式近红外光谱仪结合化学计量学方法建立了一种菊花品种无损鉴别方法。 结果表明: 与PCA和SIMCA模型结果相比,采用FLD方法可以达到更好的鉴别结果,且当采用合适的预处理和建模方法,完整样品和粉末状样品FLD模型鉴别结果较为一致,完整样品光谱数据经CWT预处理后的鉴别正确率为97.5%,粉末状样品采用原始光谱即可获得100%鉴别正确率。 以上结果表明,便携式近红外光谱仪结合化学计量学方法可以实现菊花品种的无损鉴别分析,为食药同源产品的无损鉴别分析提供了新途径。

猜你喜欢

正确率菊花预处理
求解奇异线性系统的右预处理MINRES 方法
菊花赞
个性化护理干预对提高住院患者留取痰标本正确率的影响
高COD二噻烷生产废水预处理研究
门诊分诊服务态度与正确率对护患关系的影响
我真的很擅长睡觉
雏菊花
赏菊花
基于预处理MUSIC算法的分布式阵列DOA估计
生意