APP下载

傅里叶变换红外光谱和紫外光谱数据融合对牛肝菌种类的鉴别

2018-10-31刘鸿高李杰庆王元忠

食品科学 2018年20期
关键词:牛肝菌种类正确率

姚 森,刘鸿高,李 涛,李杰庆,*,王元忠*

(1.云南农业大学农学与生物技术学院,云南 昆明 650201;2.云南省农业科学院农产品加工研究所,云南 昆明 650221;3.玉溪师范学院资源环境学院,云南 玉溪 653100;4.云南省省级中药原料质量监测技术服务中心,云南 昆明 650200)

云南是我国牛肝菌种类最丰富的地区之一,已知牛肝菌224 种,其中可食用牛肝菌144 种[4]。牛肝菌种类繁多,形态相似,采用传统方法观察鉴别难度大,因误采误食造成中毒事件时有发生[5],目前对快速、有效鉴别牛肝菌种类的研究较少,同时市场上对食用牛肝菌分类模糊,以次充好的现象屡见不鲜。李艳春等[6]研究了市场上4“种”常见牛肝菌的DNA条形码,结果表明4“种”牛肝菌样品代表了12 个物种;Dentinger等[7]对超市购买的中国云南出口美味牛肝菌进行DNA测序分析,发现同一包装袋内15 片牛肝菌中有3 种新牛肝菌物种。现今,市场上的欺诈行为严重威胁消费者健康,损害消费者利益,扰乱食用菌市场。准确鉴别野生牛肝菌是保障消费者安全,维护人民利益,进一步开发利用和加强市场质量监控的重要前提。

目前,食用菌鉴别分类研究主要集中在光谱法和分子生物学方法。Mohaček-Grošev等[8]采集30 个不同属野生菌的红外光谱,对光谱信息进行解析,结果显示不同野生菌样品的红外光谱差异明显,其中1 200~1 000 cm-1的差异可以作为不同属野生菌的特征区。杨天伟等[9]采用紫外光谱(ultraviolet spectroscopy,UV)技术结合主成分分析对不同产地、种类可食用牛肝菌进行研究,结果表明其紫外图谱具有指纹特性,主成分分析显示不同种类牛肝菌对营养成分积累有明显差异,可以用于鉴别不同产地、种类食用牛肝菌。Mello等[10]根据ITS片段设计引物,采用分子生物学方法成功鉴别铜色牛肝菌(Boletus aereus Bull.)和美味牛肝菌(B. edulis Bull.)。单一的光谱法对样品有效信息提取率低,容易受到各个因素(如温度、湿度、CO2浓度、溶剂等)影响;分子生物学方法费用昂贵,操作复杂,不适合推广应用。

数据融合是将多个来源信息加以过滤、优化、整合,得到更加准确、可靠的数据信息,其目的是通过各仪器间协同作用,获得比单一技术更准确的分类结果[11-12],已被广泛应用于食品、饮料的鉴别和质量评价等领域[13-16]。数据融合分为低级融合、中级融合和高级融合,低级数据融合是将不同仪器获得的数据进行简单的串联,形成更全面的数据集[17];中级融合是将不同来源的数据经过特征提取,并对选取特征变量(如主成分)进行整合,去除干扰信息,从而获得更加丰富、系统的数据集[18-19];高级融合为决策级融合,结合两个或两个以上分类模型得出最佳鉴别结果[20]。目前,大多数学者采用低级或中级融合技术,仅10%的研究采用高级融合技术[21]。在本实验中,中级融合分类正确率已经达到100%,因此不对高级融合进行深入的研究分析。

本研究采用傅里叶变换红外光谱(Fourier transform infrared spectroscopy,FTIR)法和UV法,具有花费低、速度快、灵敏度高、可靠性强等优点[22-23]。采用二阶导数(second derivative,2D)、多元散射校正(multiplicative scatter correction,MSC)、数据融合等方法优化样品信息,通过偏最小二乘判别分析(partial least squares discriminant analysis,PLS-DA)和支持向量机(support vector machine,SVM)比较FTIR、UV、低级融合和中级融合技术对不同种牛肝菌的分类效果,快速及有效鉴别野生食用菌,为加强市场监控提供理论基础与科学依据。

1 材料与方法

1.1 材料与试剂

实验所用5 个不同种类牛肝菌(皱盖疣柄牛肝菌、栗色牛肝菌、小美牛肝菌、美味牛肝菌和双色牛肝菌)均采自云南省,共272 份样品,样品详细信息见表1。

表1 牛肝菌样品信息Table 1 Information about boletes samples

KBr 天津市风船化学试剂科技有限公司;氯仿云南杨林工业开发区汕滇药业有限公司。所有化学试剂均为分析纯。

1.2 仪器与设备

Frontier型FTIR仪(配备硫酸三甘肽晶体氘化检测器,扫描范围为4 000~400 cm-1,扫描信号累加16 次,分辨率为4 cm-1) 美国Perkin Elmer公司;UV-2550型紫外-可见分光光度计(扫描范围190~600 nm,狭缝宽度1 nm) 日本岛津公司;SY3200-T型超声波清洗仪(功率150 W,频率55 kHz) 上海声源超声波仪器设备有限公司;YP-2型压片机 上海市山岳科学仪器有限公司;FW-100型高速粉碎机 天津市华鑫仪器厂;80目标准筛盘 浙江上虞市道墟五四仪器厂。

1.3 方法

1.3.1 FTIR采集

田卓听完汇报也很兴奋,鼓励大家再努力一把,争取在两个月之内,就给这个活动画上一个完美的句号。临散会的时候,田卓还专门安排高潮说,高先生,你该提前做新的项目策划了。从田卓的话音里,高潮可以感觉出她对自己的策划能力认可了,心里的兴奋又陡增了几分。

样品采集后清洗干净,50 ℃烘干,粉碎后过80 目标准筛,备用。按1∶100的比例,准确称量(1.5±0.2)mg牛肝菌样品和(150±20)mg溴化钾粉末,放入玛瑙研钵充分混合研磨成细粉,将细粉倒入压制磨具中压制成片。将FTIR仪预热30 min后进行FTIR扫描,样品重复测定2 次,取平均光谱;扫描前使用空白样本扣除CO2和H2O的干扰。

1.3.2 UV采集

称取(0.1±0.002)g牛肝菌样品粉末置于石英比色皿中,加入10 mL氯仿溶剂,超声提取30 min,三层滤纸过滤,取清液备用。紫外-可见分光光度计预热30 min后测定样品UV,重复扫描2 次,取平均光谱,扫描间隔1 nm。

1.4 数据分析

FTIR仪和紫外-可见分光光度计在采集光谱信息时,会夹杂背景噪音、散光等干扰信息。为消除干扰信息,红外原始光谱通过OMNIC 8.0软件进行平均光谱、自动基线校正、平滑、纵坐标归一化等预处理,紫外原始光谱采用UV probe 2.34软件进行平滑等预处理;同时,采用2D+MSC对FTIR和UV分别进行优化处理。

原始光谱经预处理后,选取具有指纹特性的原始光谱数据进行串联,形成一个包含大量变量的独立数据矩阵,完成低级融合。采用SIMCA-P+13.0软件对FTIR和UV数据分别进行PLS-DA,提取主成分并整合,进行中级融合。

SIMCA-P+13.0软件对光谱数据进行2D、MSC优化处理,Origin 8.0软件作图,通过SIMCA-P+13.0软件和MATLAB R2014a软件分别进行PLS-DA和SVM分析,建立判别模型,比较分类结果。

2 结果与分析

2.1 原始FTIR检测结果

釆用OMNIC 8.0软件对272 份牛肝菌FTIR进行平滑、基线校正和纵坐标归一化等预处理。选取牛肝菌FTIR特征吸收峰的集中波段在2 000~400 cm-1内,用于区分牛肝菌种类。如图1所示,不同种类牛肝菌的FTIR较为相似,共有峰波数大致相同,在1 634、1 480、1 400、1 319、1 253、1 078、1 057 cm-1等波数附近有明显吸收峰,但不同种牛肝菌样品吸收峰的强度有差异。1 634 cm-1附近吸收峰为C=O伸缩振动,为蛋白质酰胺I带;1 480 cm-1附近归属为亚甲基的弯曲振动;1 400、1 319、1 253 cm-1等附近为多糖、蛋白质等的C—O—H弯曲振动和亚甲基的变形振动;1 078、1 057 cm-1附近分别为糖类的C—O和C—C伸缩振动;950~710 cm-1波段有多个弱吸收峰,主要为糖类异构体的特征峰[24-25]。

图1 5 种牛肝菌的FTIRFig. 1 IR spectra of fi ve boletus species

2.2 原始紫外图谱分析

在采集样品UV过程中,容易受到溶剂、仪器、环境等干扰,采用UV probe 2.34软件对牛肝菌样品进行平滑等预处理。由于在190~230 nm波长内UV受干扰严重,且400 nm以后无明显特征吸收峰,牛肝菌UV的特征吸收峰集中在230~400 nm波长范围内,因此选取230~400 nm波长范围的171 个变量作为样品信息用于区分牛肝菌种类。如图2所示,在240~400 nm范围内5 种牛肝菌样品光谱图峰形相似度高,在250~350 nm区间有明显的特征吸收峰,274、285、296 nm附近为样品共有峰,表明不同种牛肝菌的化学组分相似;5 种牛肝菌样品的峰强、峰位和峰面积存在差异,尤其在230~240 nm区间差异明显,具有指纹特性,能够作为区分不同种类牛肝菌的依据。

图2 5 种牛肝菌的UVFig. 2 UV spectra of fi ve boletus species

2.3 主成分提取

采用PLS-DA提取主成分,R2Y表示主成分累计贡献率,贡献率越高代表样品信息越多;Q2表示主成分对样品的预测能力,Q2越大表示预测能力越强[26]。如图3所示,当Q2达到最大值时,FTIR前16 个主成分累计贡献率达90.35%,UV前30 个主成分累计贡献率达74.86%,能够代表样品的主要信息。将两种光谱数据的主成分组合在一起,进行中级融合,形成新的数据集为进一步鉴别分析做准备。

图3 PLS-DA提取主成分得分图Fig. 3 Scores plots for principal components extracted by PLS-DA

2.4 PLS-DA结果

PLS-DA是基于偏最小二乘回归的一种有监督的判别分类方法,利用自变量矩阵X和分类变量Y建立回归模型,通过PLS预测未知样品类别的方法[27-28]。采用PLS-DA比较预处理对分类效果的影响。图4显示,经过预处理后FTIR较UV对不同种牛肝菌的区分效果更好;经过预处理后的区分效果优于原始的效果,表明2D和MSC预处理对FTIR和UV的优化效果较好。

图4 不同种牛肝菌PLS-DA得分图Fig. 4 Scores plot for PLS-DA of different species of bolete mushrooms

随机选取90 个样品(约样品量的1/3)作为预测集,其余182 个样品作为训练集。对FTIR、UV、低级融合和中级融合数据分别建立PLS-DA判别模型。如表2所示,FTIR技术与UV技术相比,FTIR判别模型具有更高的准确度,表明FTIR结合PLS-DA建立判别模型对未知样品的分类更加准确。低级数据融合技术对不同种牛肝菌的分类正确率高于UV技术,低于FTIR技术,表明低级融合丰富了光谱数据,同时简单的数据串联将无效信息相互叠加,降低分类正确率。结果与Roussel等[29]的结论一致,受干扰信息影响,不是所有情况下数据融合得到的结果都优于单独仪器。同时,中级数据融合训练集和预测集的正确率分别达到98.90%和95.56%,正确率高于单一光谱技术,分类效果优于低级融合,表明中级融合技术在融合过程中去除了大量干扰信息,能够建立更稳定、可靠的判别模型。

表2 PLS-DA对不同数据集的分类结果Table 2 Results of PLS-DA of different data matrixes

2.5 SVM

SVM是基于统计学习理论的模式识别方法,主要应用于模式识别领域,能够解决小样本、非线性和高维数等问题,有效防止过拟合现象[30-31],该方法已被广泛应用于原材料鉴别、食品分析等方面[32-34]。SVM模型选取训练集和预测集的方法同2.4节,采用网格搜索法筛选建模的最佳参数,基于FTIR、UV、低级融合和中级融合数据分别建立SVM判别模型。如图5所示,UV技术分类错误最多,中级融合全部分类正确,表明中级融合对牛肝菌种类的鉴别效果最佳。

图5 SVM对测试集的实际分类和预测分类图Fig. 5 Plots of actual and predicted categories of test samples by SVM

表3 SVM对不同数据集的分类结果Table 3 Results of SVM of different data matrixes

如表3所示,4 个数据集建模稳定性依次为中级融合>低级融合>FTIR>UV。同时低级融合对样品的预测正确率高于单个技术,表明低级融合数据比单个仪器数据更全面,判别效果更好;中级融合的分类正确率高于低级融合,证明中级融合在整合数据过程中去除了无效信息,避免两种光谱信息的互相干扰,提高分类正确率。该结论与Biancolillo等[19]研究结果相吻合,多种光谱技术对食品进行鉴别分析,低级和中级数据融合区分效果皆高于单一光谱技术,并且中级数据融合优于低级数据融合。比较表2和表3可知,采用中级融合技术建立SVM判别模型,模型稳定、可靠,对不同种牛肝菌鉴别效果最佳。

3 结 论

采用FTIR法和UV法采集云南地区常见牛肝菌物种的光谱信息,选择MSC和2D分别对牛肝菌FTIR和UV进行优化处理。优化后的光谱数据进行PLS-DA,结果显示同种类牛肝菌样品能较好地聚集在一起,部分不同种类牛肝菌样品混在一起,难以区分;表明优化处理对牛肝菌种类区分效果优于原始光谱,且FTIR对不同种牛肝菌的区分效果优于UV。

采用低级和中级数据融合策略对两种光谱数据进行融合,通过PLS-DA和SVM建立分类鉴别模型,并比较FTIR、UV、低级融合和中级融合技术对不同种牛肝菌鉴别效果。结果显示:中级数据融合建立的SVM判别模型预测正确率分别为95.56%和100.00%,高于其他模型,表明中级融合对不同种牛肝菌区分效果最佳,且SVM建立分类模型更稳定、可靠。中级融合技术结合SVM建立鉴别模型,能够准确、有效区分不同种牛肝菌,为快速鉴别野生食用菌提供有效方法,对维护食用菌市场的稳定具有重要意义。

猜你喜欢

牛肝菌种类正确率
云南发现4.2公斤野生牛肝菌
门诊分诊服务态度与正确率对护患关系的影响
种类丰富的酒具
消防车种类知多少
镜头像差的种类
牛肝菌的功效
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意
消防车有哪些种类