基于SPME-MS技术识别不同生产工艺和醋龄的镇江香醋
2020-09-01孙宗保闫晓静邹小波李国权王天真梁黎明
孙宗保 闫晓静 刘 源 邹小波* 李国权 周 轩 王天真 梁黎明
(1 江苏大学食品与生物工程学院 江苏镇江212013 2 江苏大学农业工程研究院 江苏镇江212013 3 镇江市食品药品监督检验中心 江苏镇江212000 4 江苏恒顺醋业股份有限公司 江苏镇江212000)
镇江香醋是中国著名的食醋之一, 通过技术革新,将其传统生产工艺逐渐转变成机械化、规模化、智能化和自动化的现代化生产工艺。 2 种生产工艺的主要区别在于食醋生产过程中酒精发酵阶段菌种和发酵方式的不同。 传统镇江香醋生产工艺利用麦曲进行多菌种混合发酵, 麦曲中含有霉菌和酵母菌等, 多菌种的共同作用为镇江香醋的色、香、味、形奠定了较好的基础。用传统工艺生产食醋的效率虽较低,但具有独特风味,深受消费者喜爱,具有较高的市场价值,早在2006年就被首批列入国家非物质文化遗产名录。 现代化镇江香醋生产工艺是在酶制剂作用下经液化、糖化,然后加入纯化的酿酒酵母进行单菌种纯种发酵, 确保了菌种品质,提高了淀粉利用率。在继承传统生产工艺优势的同时,借鉴先进技术,从最初的小批量醋坛发酵变成现在的大批量发酵罐发酵, 提高了生产效率。镇江香醋风味物质形成,不仅与生产工艺有关,而且与后熟陈酿有关。 未经陈酿的香醋,口感与香气较差,随着醋龄增加,形成的酯类物质较多,香醋具有明显的香气[1-2]。
2 种工艺生产以及不同醋龄食醋的风味各具特色。 目前食醋生产工艺与醋龄的标识不规范或存在假冒产品,导致食醋产业竞争秩序混乱。仅用感官评价或者简单的理化试验鉴别, 不仅操作过程费时、费力,而且结果具有较大的主观性和片面性,这给消费者和生产者带来一定的困扰。为维护市场秩序,帮助消费者辨识和选购,急需寻求行之有效的鉴别镇江香醋生产工艺和醋龄的技术,使镇江香醋得到更好的保护、传承和发扬。
固相微萃取质谱技术(Solid phase micro extraction-mass spectrometry, SPME-MS)通过固相微萃取方法萃取样品中的挥发性成分, 采用未涂层熔融石英毛细管柱替代毛细管色谱柱, 将萃取样品的挥发性成分未经色谱分离直接导入质谱仪,短时间内获取所有挥发性成分的质谱信息,并结合化学计量学等数据分析方法对样品定性、定量分析[3-4]。 与气相色谱-质谱(GC-MS)检测技术相比, 不需GC 分离, 具有检测速度快的优点,结合化学计量学方法更能达到快速识别目的[5-7]。 与光谱和嗅觉传感器技术相比, 不易受环境影响。SPME-MS 技术结合化学计量学方法在食品检测领域得到广泛应用[8-9]。 尤其是在食品等级[10-12]、原产地[13]以及原材料[14-15]等的识别方面具有突出优势。 目前SPME-MS 用于香醋工艺及醋龄鉴别尚未见相关报道。 本研究选取不同醋龄的传统工艺生产的镇江香醋(手工醋)与现代化工艺生产的镇江香醋(工业醋)为研究对象,利用线性判别分析(Linear discriminant analysis,LDA)、 支持向量机(Support vector machine,SVM)和反向传播神经网络(Back-propagation neural network,BPANN)3种化学计量学方法鉴别, 同时比较3 种模型的预测效果,选取最佳鉴别模型。
1 材料与方法
1.1 材料与试剂
传统工艺生产的镇江香醋与现代化工艺生产的镇江香醋均由镇江香醋某生产企业提供。 2 种工艺镇江香醋分别选取5 种醋龄:新醋(XC)、半年(BN)、2年(2N)、3年(3N)、4年(4N),每种醋龄各取30 个样本, 获得传统工艺生产的镇江香醋——手工醋(SG)和现代化工艺生产的镇江香醋——工业醋(GY)各150 个样本,共300 个样本。
1.2 仪器与设备
HP6890-5973 气相色谱-质谱联用仪, 美国Agilent 公司;75 μm CAR-PDMS 萃取纤维头,美国Supelco 公司;手动SPME 进样器,美国Supelco公司;15 mL 带硅胶垫的样品瓶, 上海安谱公司;BS224S 电子天平,北京赛多利斯仪器系统有限公司;PC-420 磁力恒温搅拌器, 美国Coing 公司;10 mL、100 μL 移液枪,热电(上海)仪器有限公司。
1.3 方法
1.3.1 SPME 预处理 将8 mL 醋样、2.5 g NaCl、转子放入15 mL 样品瓶中。 磁力恒温搅拌器温度设置为50 ℃,转速250r/min,将样品恒温水浴平衡5 min。 将75 μm CAR-PDMS 萃取头插入样品液面上方1 cm 处,顶空萃取20 min。 萃取完成后将萃取头插入GC-MS 的气相色谱进样口,解吸脱附5 min。 每个醋样平行测定3 次。
1.3.2 色谱条件 色谱柱: 未涂层熔融石英毛细管柱(1 m×0.15 mm i.d.);升温程序:柱温200 ℃,保持6 min;载气(He)流速1.1 mL/min;进样口温度280 ℃;不分流进样。
1.3.3 质谱条件 电离方式EI+; 电子能量70 eV;离子源温度200 ℃;接口温度250 ℃;质量扫描范围m/z 33~400 amu。
1.4 数据处理与分析
通过SPME-MS 技术检测2 种工艺生产的5种醋龄镇江香醋,获得质荷比m/z 33~400 amu 范围的离子丰度值,即质谱数据。对每个样本的3 次平行质谱数据求取平均值作为该样本的质谱数据,按行排列成数据矩阵,并用MATLAB 软件数据分析。
首先利用MATLAB 自带的归一化函数mapminmax 对原始数据归一化预处理,然后利用主成分分析(PCA)对预处理后的数据降维,提取主成分数。 最后选取总样本的2/3 作为训练集,1/3 作为预测集, 利用LDA,SVM,BPANN3 种化学计量学方法建立鉴别模型, 通过比较3 种模型的识别率获得最佳鉴别模型。
2 结果与分析
通过SPME-MS 技术检测2 种工艺生产的5种醋龄镇江香醋,获得质荷比在33~400 amu 范围内的离子丰度值。 通过对平均离子丰度质谱图的直观分析, 发现不同生产工艺和醋龄的镇江香醋样本中既有相似的离子信息也有差异较明显的离子信息。 以手工新醋与工业新醋的平均离子丰度质谱图(图1)为例,首先两者具有相似的变化趋势:质荷比为96 的离子丰度值最高,是糠醛的特征离子; 高质荷比的离子丰度值明显低于低质荷比的离子丰度值,某些甚至趋于0。 其次,某些离子的平均丰度值存在差异, 手工新醋中离子平均丰度值较高的有质荷比为39,69,96,而工业新醋中离子平均丰度值较高的有质荷比为39,55,73,96。 由于通过SPME-MS 技术获取的镇江香醋总离子流图中包含了丰富的离子信息, 仅依靠直观分析质谱图差异难以对镇江香醋的生产工艺和醋龄进行有效鉴别, 因此尝试利用化学计量学方法建立鉴别模型, 实现对不同工艺和醋龄的镇江香醋的准确区分。
图1 手工新醋与工业新醋在m/z 33~400 范围内的离子丰度质谱图Fig.1 The mass spectrum of the traditional and modern Zhenjiang fresh vinegar in the range of m/z 33-400
2.1 主成分分析结果
选用MATLAB 自带的归一化函数mapminmax 对原始数据归一化预处理, 使所有数据处于相同范围内, 变量分布更加均衡。 主成分分析(PCA)通常用于数据可视化的第1 阶段[16],把多个变量化成少数几个主成分, 通常为原始变量的线性组合,可以避免信息重叠、简化数据量,广泛应用于数据分析中。主成分得分图,在一定程度上反映样本的聚类趋势, 各类样本在主成分空间有不同的分布[17-19]。
图2 镇江香醋样本的三维主成分得分图Fig.2 3-Dimension score plot of the Zhenjiang aromatic vinegar in the different ageings after PCA
将每个样本的3 次平行质谱数据求取的平均值作为该样本的质谱数据,按行排列成数据矩阵。经归一化预处理, 使所有数据范围在-1~1 之间。使用PCA 方法对预处理后的数据降维,提取主成分数,便于本研究所用模型的输入。以前3 个主成分为坐标轴, 得到镇江香醋样本的三维主成分得分图(图2),结果发现样本分布在3 个区域,而且不同工艺相同醋龄的样本呈现一定的聚类趋势:手工新醋与工业新醋重叠在一起, 与其它样本明显区分; 半年醋、2年醋和4年醋分布在一个区域, 而工业半年和工业4年醋不仅未出现样本间重叠,而且与该区域内其它香醋样本区分明显;手工3年醋与工业3年醋分布在同一个区域, 没有重叠样本出现,区分效果较好。陈酿时间较短的样本与陈酿时间较长的样本区分较为明显, 陈酿期越接近,品质越接近,分布越集中。 红色标记的样本代表手工醋,蓝色标记的样本代表工业醋,从图2 可以看出手工醋和工业醋样本重叠现象较为严重,难以区分。 需进一步利用LDA,SVM,BPANN方法鉴别工艺、醋龄及不同醋龄的两种工艺醋。
2.2 不同生产工艺镇江香醋的识别结果
BPANN 方法主要特点是信号前向传递,误差反向传播,具有较强的运算能力[20-22]。 SVM 方法是建立一个分类超平面作为决策曲面, 使来自于训练集分布的少量样本接近类之间的边界[18,23]。LDA方法是一种有监督的模式识别方法, 组间距离的长短决定组间差异的大小, 可以实现不同模式的分类[24-25]。
仅识别1.1 节所有样本中镇江香醋的不同生产工艺,不考虑醋龄。 利用SPME-MS 技术获取其质谱数据,运用PCA 方法选取不同主成分数作为输入变量并分别建立LDA,SVM,BPANN 鉴别模型,其中训练集中共有200 个样本(手工醋与工业醋样本各100 个),测试集中共有100 个样本(手工醋与工业醋样本各50 个), 鉴别结果如表1 所示。 当主成分数较低时,LDA 与SVM 模型训练集误判率很高。 随着主成分数增加, 识别率逐渐提高。 当最佳主成分数达到7 时, SVM 模型训练集和测试集的正确率均达到91%。 当最佳主成分数为8 时,LDA 模型的训练集的识别率达到100%,而测试集识别率为98%。 建立BPANN 模型时,优化模型的各个参数,通过比较多次试验结果,最终分别选取目标误差为10-8,学习速率0.1,动量因子0.7, 网络学习次数1 000 次。 鉴别结果如表1所示, 当主成分数为7 时, 训练集识别率达到100%, 测试集识别率99%, 只有一个样本误判。BPANN 模型的鉴别结果较好,可作为有效识别手工醋与工业醋的手段。
表1 LDA,SVM,BPANN 模型在不同主成分数下训练集和测试集的结果Table 1 The discriminating results of LDA, SVM and BPANN model in training set and test set under different principal components
2.3 不同醋龄镇江香醋识别结果
仅识别1.1 节所有样本中不同醋龄的镇江香醋,不考虑生产工艺方式。 利用SPME-MS 技术获取其质谱数据,运用PCA 方法选取不同主成分数作为输入变量并分别建立LDA,SVM,BPANN 识别模型, 其中训练集中共有200 个样本(XC,BN,2N,3N,4N 样本各40 个), 测试集中共有100 个样本(XC,BN,2N,3N,4N 样本各20 个),鉴别结果如表2 所示。 随着主成分数不断增加,3 种判别模型的测试集和训练集的识别率不断上升。 当主成分数为7 时,SVM 模型的训练集和测试集识别率均为90%,BPANN 模型的训练集识别率达100%,而测试集识别率为99%,只有一个样本识别错误。 此时,BPANN 模型中的各个优化参数与2.2 节一致。 当主成分数为9,LDA 模型训练集的识别率达到89.5%, 测试集的识别率达到84%。BPANN 模型的效果最佳。
提取前9 个主成分作为线性判别分析模型输入变量, 得到不同醋龄镇江香醋的线性判别分析二维得分图(图3)。随着醋龄增加,样本在LD1 的方向上从左至右分布,说明未经陈酿(新醋)或陈酿时间较短的醋样(半年醋和2年醋)与陈酿时间较长的醋样(3年醋和4年醋)得到显著区分;而新醋与半年醋因陈酿期接近而无法区分。
图3 不同醋龄镇江香醋的线性判别分析二维得分图Fig.3 The LDA 2-dimensional diagram of Zhenjiang aromatic vinegar with different ages
表2 LDA,SVM,BPANN 在不同主成分数下训练集和测试集的结果Table 2 The discriminating results of LDA, SVM and BPANN in training set and test set under different principal components
2.4 不同醋龄的手工醋与工业醋识别结果
同时识别1.1 节所有镇江香醋样本中的醋龄和生产工艺方式。 利用SPME-MS 技术获取其质谱数据,运用PCA 方法选取不同主成分数作为输入变量并分别建立LDA,SVM,BPANN 识别模型,其中训练集中共有200 个样本(SGXC,GYXC,SGBN,GYBN,SG2N,GY2N,SG3N,GY3N,SG4N,GY4N 样本各20 个), 测试集中共有100 个样本(SGXC,GYXC,SGBN,GYBN,SG2N,GY2N,SG3N,GY3N,SG4N,GY4N 样本各10 个),鉴别结果如表3 所示。 随着主成分因子数不断增加,训练集和测试集的识别率基本呈增加趋势, 当主成分因子数为6,SVM 模型训练集和测试集的识别率分别为96%和95%; 当主成分因子数为7 时,BPANN 模型训练集和测试集的识别率分别达到100%和99%,LDA 模型训练集和测试集的识别率均达到100%。 此时,BPANN 模型中的各个优化参数与2.2 节相同。
提取前7 个主成分作为线性判别分析的模型输入,得到2 种工艺、不同醋龄镇江香醋的线性判别分析二维得分图(图4)。 由图4 可知,红色代表手工醋,基本位于LD2 的负半轴,新醋与半年醋、3年醋与4年醋区分不明显, 而2年醋与其它年份醋得到很好地区分,并且醋龄稍短(新醋、半年)的手工醋与醋龄较长(3年、4年)的手工醋相距较远,因此在LD1 方向上陈酿期从左至右依次增长。蓝色代表工业醋,除工业新醋外均位于LD2 的正半轴,不同醋龄的醋样间无重叠,区分较为明显,而且工业醋的醋龄分布与手工醋分布相似, 说明手工醋与工业醋、 陈酿期较短与较长的醋样之间的品质存在差异。
图4 两种工艺不同醋龄镇江香醋的线性判别二维得分图Fig.4 The LDA 2-dimensional diagram of Zhenjiang vinegar with two brewing process and different agings
表3 LDA,SVM,BPANN 在不同主成分数下训练集和测试集的结果Table 3 The discriminating results of LDA, SVM and BPANN in training set and test set under different principal components
3 结论
本研究采用SPME-MS 技术结合化学计量学方法识别2 种生产工艺生产的5 种醋龄镇江香醋。 利用SPME 技术提取镇江香醋中的挥发性成分,不经色谱分离直接导入质谱仪获取质谱信息。以获取的离子丰度值为变量,利用PCA 方法对数据降维,选取不同主成分数作为输入变量,分别建立LDA,BPANN,SVM 模型,以训练集和测试集的识别率作为衡量模型优劣的指标,主要结论如下:
1)分别区分2 种生产工艺的镇江香醋和5种醋龄镇江香醋,发现BPANN 模型的训练集识别率达到100%, 而测试集识别率为99%, 说明BPANN 模型能有效区分镇江香醋的生产工艺和醋龄,原因可能是采用SPME-MS 技术获取的质谱数据是所有挥发性成分整体作用的结果, 而这种作用与生产工艺或醋龄之间的联系较为复杂,这种复杂的关系更倾向于非线性关系,BPANN 模型的结果优于LDA 和SVM 模型。
2)同时区分镇江香醋的工艺和醋龄, 发现LDA 模型具有优势, 其训练集和测试集的识别率均达到100%。 因LDA 模型考虑了类与类之间的差异,并将差异最大化,故使2 种生产工艺生产的5 种醋龄镇江香醋得以区分。
不同生产工艺和醋龄的镇江香醋风味存在差异,利用SPME-MS 方法结合不同的化学计量学方法可以很好地区分,解决了常规检测方法复杂、耗时等问题,可以达到快速鉴别的目的,使镇江香醋得到更好地保护、传承和发扬。