APP下载

基于GC-IMS的咖啡风味鉴定分析方法

2021-12-08

分析仪器 2021年6期
关键词:风味准确率咖啡

(1.中国科学院空天信息创新研究院 传感技术国家重点实验室,北京 100190;2.中国科学院大学 电子电气与通信工程学院,北京 100049)

咖啡不仅与可可、茶并称为世界三大饮料,而且咖啡豆含有包括咖啡因及衍生物、葫芦巴碱和绿原酸等在内的上千种物质,能够促进排尿、扩张血管、提高心率、刺激中枢神经系统和呼吸系统,缓解肌肉和大脑疲劳[1,2]。黑咖啡风味偏苦、涩、酸,普通大众的接受程度较低,而在黑咖啡中加入风味调剂品形成的如拿铁、摩卡、卡布奇诺等多种风味咖啡,其口感醇厚、香甜易入口。风味速溶咖啡区别于冲泡方式较为繁复的传统咖啡,以其方便快捷、耐储存、口感多样等优点在全球获得广泛流行。风味咖啡多在黑咖啡中加入植脂末、白砂糖、麦芽糊精、食用香精等物质,共同形成最终咖啡风味,咖啡的品质口感与之息息相关。各国对咖啡品质评价标准不一,美国精品咖啡协会(SCAA)的评定标准主要包括香气、酸度、醇厚度、余韵等指标,但这种评测标准带有个人主观意识,耗时较长,人为干扰因素较多,容易给评价结果带来一些偏差。目前,风味检测主要采用气相色谱、电子鼻以及气相色谱-质谱联用技术等[3-6]。

气相色谱-离子迁移谱(gas chromatography-ion mobility spectroscopy,GC-IMS)是一种高灵敏度、低检测限、操作简单的快速检测技术[7-9],样品不需要复杂的预处理过程,通过顶空进样能够获取样品中的痕量VOCs(低至μg/m^3,甚至ng/m^3级别)信息,利用物质在GC中保留时间和其特征离子在IMS中漂移时间构成的二维谱图信息能够对样品气体成分进行表征,形成特定指纹图谱。目前该技术在咖啡检测方面多集中在生咖啡豆品种、产地风味检测和不同烘焙工艺对咖啡豆风味影响等方面,鲜见于风味咖啡液的检测[10-12]。

由于IMS不能直接识别未知物质,因此常采用主成分分析(PCA)、决策树、支持向量机等分类算法对混合物进行定性分析,并且在疾病筛查[13,14]、食品分类及安全[15,16]等方面有较为广泛的应用。PCA是一种常用的数据降维方法,但在降维的同时也会损失部分信息,造成准确度下降。随机森林算法[17]是以决策树为基学习器的集成学习算法,具有实现简单、准确性高、抗过拟合能力强、抗噪能力强等优点,适合作为基准模型。随机森林模型在训练过程中能够利用全部特征并给出不同特征对识别分类贡献率的信息,进而可以进行特征筛选,有利于进一步探究样本中的特征峰簇信息。

本实验以4种不同风味咖啡为对象,采用GC-IMS技术对咖啡液顶空气进行快速分析,根据其中VOCs的差异建立样本特征矩阵,并利用随机森林等统计学方法实现咖啡风味的快速鉴定。

1 实验

1.1 材料

实验中所使用的4种速溶咖啡粉购自网络,分别为蓝山、卡布奇诺、木糖醇和拿铁4种风味,样品编号及对应名称、风味添加物、共同添加物如表1所示。

1.2 仪器与设备

GC-IMS检测系统结构如图1所示,系统主要由GC与IMS构成。GC部分包括直径0.535mm、长15m、膜厚1.5μm的DB-5气相色谱柱和六通阀以及5mL定量环。定量环和气体导管均为1/16英寸聚四氟乙烯管。IMS为实验室自制,主要由电晕放电电离源、漂移管和外部电路组成。电晕放电电离源由中空的放电针和对电极组成,样品由放电针进入IMS漂移管。漂移管由聚四氟乙烯环和不锈钢环交替堆叠而成,被离子门分为离化区和漂移区,其中漂移区长度为13.65cm,内径3.6cm。漂移管末端的法拉第盘用于接收离子流信号,经放大、AD转化后传输到上位机处理。漂移气体和载气均为洁净空气,由空气源提供。

表1 咖啡样品

1.3 咖啡风味物质测定

取上述咖啡粉2g溶于25℃的50mL水中并密封保存在100mL的样品瓶内,充分混合后,静置20min。

GC-IMS条件:载气流量恒定速率30mL/min,色谱柱恒温40℃;IMS漂移区电场强度363V/cm,漂移管恒温180℃。电晕放电电压9kV,漂移气流量恒定速率1000mL/min。

利用注射器在咖啡液容器中抽取顶空气,加载入仪器中的5mL定量环中,切换六通阀模式,载气推动定量环中样品气进入GC中,不同组分先后流出GC并进入IMS中检测,获得对应谱图。

2 结果与分析

2.1 GC-IMS谱图

实验中获取的谱图噪声对后续特征提取会造成干扰,故首先需对谱图进行去噪平滑、去基线等预处理操作。经预处理后获取的4种咖啡样品谱图如图2所示,其中纵坐标表示物质在GC中的保留时间,横坐标表示离子漂移时间;横坐标8.7ms处为RIP峰(反应离子峰,经归一化处理),类圆形代表挥发性有机物的信号,分布在RIP两侧;颜色表示离子峰的强度,在低浓度范围内颜色越深表示离子峰强度越高,浓度极高时在图上显示为白色。

图1 GC-IMS检测系统结构示意图1.注射器;2.废气排气孔3.六通阀;4.定量环;5.载气;6.气相色谱柱;7.排气孔;8.电晕放电电压源;9.迁移电场电压源;10进样结构;11.离子门;12.法拉第盘;13.漂移气入口;14.信号处理电路;15.洁净空气源;16.上位机

2.2 特征提取

为更加全面对比4种不同咖啡的挥发性成分差异,对每种咖啡分别重复取样15次,获得共60个样本的数据集。在实际检测过程中,咖啡液浓度随时间变化和仪器稳定性等产生的误差使得谱图中特征离子峰位置并不完全固定,而是在一定范围内波动。为确定谱峰所属峰簇,进行样本集谱图数据分析时需进行聚类[18],认为处于同一峰簇的特征离子峰表示同一种离子。从样本集谱图中提取的特征峰聚类结果呈现在图3所示的差分谱图(样品谱图减去空白谱图)中,矩形框内相同颜色点表示同一特征峰簇,经聚类从样本数据集共获取77个特征峰簇。提取各特征峰簇位置(GC保留时间及IMS漂移时间)处样本GC-IMS谱图中特征峰强度信息,组成该样本的特征向量用于样本分类识别。图4为从样本集60个样本提取的特征向量构成的样本特征矩阵,横坐标为特征向量中各特征簇的编号,纵坐标为样本编号。图4每行表示一个样本的特征向量,其中1~15行是咖啡风味A,16~30行是风味B,31~45行是风味C,46~60行是风味D。

图3 样本集特征峰聚类结果

从图4中可以看出:特征峰簇31、32、33峰值比较大;对于峰簇46,风味C、D样本的峰值比风味A、B略小;对于峰簇53,风味B、C样本的峰值略大于风味A、D;对于峰簇64,风味A、B、C样本的峰值较大,风味D样本的峰值较小。虽部分特征峰簇有差异,能够在一定程度上反应不同风味咖啡之间的区别,但还不能直观的区分出咖啡风味。

图4 样本集特征矩阵横坐标:特征峰簇编号,纵坐标:样本编号

2.3 咖啡风味分析

2.3.1基于随机森林区分不同风味咖啡

为进一步实现对不同风味咖啡的分类,利用样本集特征矩阵构建随机森林分类模型,对未知风味咖啡样本进行识别,并利用识别准确率来对模型性能进行评估。为提高模型的泛化能力,用较少的测试数据获取较高的可靠性,采用10折交叉验证方法[19],即将样本等分为10份,轮流将其中9份作为训练集,1份作为测试集,采用10次测试准确率的均值作为模型分类准确率。经测试随机分类模型的准确率为94%,表明该模型具有较好的分类性能,能对大部分样本进行正确分类。

2.3.2特征筛选

随机森林能够根据森林中所有决策树按照某一特征分枝前后基尼指数[20]变化量给出该特征峰簇对分类的重要性得分,该分值越高,表示该特征在随机森林模型中的贡献越大,按照该特征分枝进行分类的效果越好。图5为77个特征峰簇的重要性得分情况。

图5 随机森林输出的谱峰重要性得分

利用重要性得分比较高的特征峰簇peak35、peak37、peak66、peak70、peak73、peak76组成新的特征矩阵放入随机森林模型进行训练,其准确率为94%,与整个样本集的特征矩阵的训练准确率相同,说明这6个特征峰簇是主要风味特征峰簇。表2给出了6个主要风味特征峰簇对应的漂移时间、保留时间和约化迁移率。

图6是不同风味咖啡样本在这6个特征峰簇位置的局部谱图,由图可见peak35、peak37的特征峰强度比其余特征峰强度大;在peak35、peak70和peak73处,风味C、D特征峰强度比风味A更大;在peak76处,风味B、D特征峰强度稍大;在peak66处,风味A、C、D谱图形状较为相似,风味B强度更大。

表2 主要风味特征峰漂移时间与保留时间

这些差异是由不同风味咖啡的风味添加物造成的,在peak70和peak73处,风味C、D谱图信息丰富,而风味A在该处的特征峰强度几乎为0,可能与风味C、D含有的风味添加物食用盐相关;在peak73处,风味C的谱图信息最丰富,有可能与风味C的风味添加物木糖醇相关;在peak76处,相较于风味A、C,风味B、D的峰强度较大,可能与风味添加物白砂糖有关。

2.3.3风味特征峰筛选结果评估

为评估随机森林分类模型性能,对随机森林筛选的6个特征峰簇构成的样本特征矩阵构建支持向量机(Support Vector Machine,SVM)分类模型[21],实现对未知风味咖啡样本的预测,并用准确率来对模型进行评估。经训练后,SVM分类准确率为94%,分类预测性能良好。

图6 不同风味咖啡在特征峰处的局部谱图

从SVM分类结果可知,利用随机森林模型筛选的6个特征峰簇是咖啡风味分类的重要特征,并能够有效地利用筛选后的样本特征矩阵进行训练模型分类,降低了过拟合的可能性,验证了本次实验中随机森林分类模型性能良好。

3 结论

本研究以4种风味咖啡液为检测对象,利用GC-IMS分析了其顶空气中VOCs差异性,根据特征峰信息构建相对应的特征矩阵,利用随机森林实现对不同风味样本的预测,准确率为94%,较好地实现了对咖啡风味的正确分类。支持向量机分类较高的准确率说明随机森林模型性能良好,筛选出的6个特征峰簇是主要风味特征峰簇,可能与风味咖啡的特殊风味添加物有关。该方法能够找出不同物质之间的差异性和造成差异性的主要风味特征峰,对于不易区分的天然物质,利用此分析方法能够快速实现类别区分。此外,该分析方法找出的风味特征峰与相关数据库联用进行定性分析,能够进一步探究不同物质之间的差异性成分。

猜你喜欢

风味准确率咖啡
关于咖啡的9个真相
百年风味“花”开万家
八方风味,美酒润佳肴
风味人间
初尝胆机风味 McGee(美极)HARMONY合并功放/LEGEND2.0音箱
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
咖啡