基于GC-MS 指纹图谱和多元统计学区分四川保宁醋和山西老陈醋的挥发性差异代谢产物
2020-08-26邝格灵宁甜甜赵国忠
邝格灵,李 树,宁甜甜,赵国忠*
(省部共建食品营养与安全国家重点实验室,天津科技大学食品科学与工程学院,天津 300457)
世界大部分国家都将醋作为酸性调味品,醋的生产和消费在中国已有3 000多年的历史,每个地区都有自己的地方醋。山西老陈醋是中国著名的传统食醋之一,由高粱、豌豆、麦麸、谷糠和稻壳经多种真菌和细菌开放式固态发酵而成,已有近3 000年的历史,被选为国家非物质文化遗产[1]。四川保宁醋,起源于1618年的阆中市,是四川最著名的麸皮醋,是以生麦麸、蒸高粱或糯米为主要原料,通过增加中国传统草药,如杜仲、砂仁、甘草等发酵而成[2]。由于原料基础不同、加工工艺不同、参与发酵的优势微生物群落不同,造成它们在品质风格上存在一定差异。醋的香气成分对醋的品质起着至关重要的作用。对醋的香气进行表征和鉴定,将有助于解释不同产品之间的差异[3]。
气相色谱-质谱(gas chromatography-mass spectrometry,GC-MS)联用技术是一种稳健的代谢组学工具[4],是目前应用最广泛的食品挥发物分析技术和方法之一[5]。主成分分析(principal component analysis,PCA)是一种无监督的多元变量统计分析方法,是在多元分析中使用最多的工具[6]。它使用少量的综合变量(主成分)取代原先的复杂多变量,从而能在最大程度保留数据原有信息的情况下,降低数据复杂度,并对数据进行可视化处理[7]。而正交偏最小二乘-判别分析(orthogonal partial least squares-discrimination analysis,OPLS-DA)是一种有监督的多元统计方法,用以加强PCA中已经建立的观察组之间的弱分离,从而更好地区分两组之间的差异[8]。它不仅能实现样品差异的鉴别,还能获得样品差异的特征标记物,有利于对样品不同产地、不同部位、不同加工方式等的快速鉴别[9]。
本研究采集四川保宁醋6 份,山西老陈醋9 份,以此为研究对象,采用GC-MS指纹图谱对其挥发性成分进行分析,并结合PCA和OPLS-DA等多变量统计分析方法探讨对山西老陈醋和四川保宁醋的差异贡献最大的潜在标志物。本实验拟为进一步分析不同食醋的质量和风格特色的形成提供新的思路和方法。
1 材料与方法
1.1 材料与试剂
实验原料购自当地超市及网上专卖店,样品常温保存。S1~S6为四川保宁醋,S7~S15为山西老陈醋。样品信息见表1。
2-辛醇(色谱纯) 美国Alfa Aesar公司;C6~C25正构烷烃 美国AccuStandard公司;其他化学试剂都为国产分析纯。
表1 样品信息Table 1 Information about the vinegar samples used in this study
1.2 仪器与设备
GC-MS联用仪 日本岛津公司;75 μm CAR/PDMS萃取头、顶空瓶 上海安谱实验科技股份有限公司;磁力搅拌器 德国IKA公司;ME3002E电子分析天平美国梅特勒-托利多仪器有限公司。
1.3 方法
1.3.1 样品前处理
用蒸馏水将样品稀释10 倍,吸取6 mL于15 mL顶空瓶中,加入1.5 g氯化钠和30 μL 2-辛醇(0.125 mg/L的2-辛醇-甲醇溶液),并加转子,聚四氟乙烯封口,于50 ℃、600 r/min磁力搅拌器水浴平衡10 min,然后插入75 μm CAR/PDMS萃取头(使用前按说明进行老化)顶空吸附40 min,吸附结束拔出萃取头,迅速插入GC-MS进样口中,于250 ℃解吸5 min,同时启动仪器采集数据。
1.3.2 GC-MS条件
GC条件:Rtx-5MS石英毛细管柱(30 m×0.25 mm,0.25 μm);升温程序:40 ℃保持3 min,以4 ℃/min升温至150 ℃,保持1 min,再以8 ℃/min升温至250 ℃;进样口温度250 ℃;载气为氦气,纯度99.999%,流速1 mL/min;进行方式:手动;进样模式:分流进样,分流比为10∶1。
MS条件:电子电离源;电子能量70 eV;离子源温度200 ℃;传输线温度220 ℃;溶剂延迟时间1.5 min;质量扫描范围m/z35~500;扫描模式为全扫描。
1.4 数据处理
定性和定量分析:采用正构烷烃的标准溶液,利用Rtx-5MS计算每种物质的相对保留指数,并对比文献资料中Rtx-5MS色谱柱下每种物质的相对保留指数,同时结合标准谱库NIST11和Wiley准确鉴定15 个样品的挥发性成分。同时采用内标法进行半定量,得到各组分的相对含量。利用SIMCA-P+14.1软件,采用PCA方法对保宁醋和山西醋的质量稳定性和一致性进行了评价,同时基于OPLS-DA找出潜在标志性差异性化合物。
2 结果与分析
2.1 四川保宁醋和山西老陈醋挥发性风味物质测定结果
表2 样品的挥发性成分及其相对含量Table 2 Types and relative amounts of volatile components of vinegar simples
经SPME-GC-MS分离和鉴定,6 种四川保宁醋分别鉴定出89、86、94、90、98、102 种化合物,其中在6 种保宁醋中均检测到的化合物有26 种,作为四川保宁醋的特征风味物质;9 种山西老陈醋分别鉴定出91、89、106、110、87、71、94、96、86 种化合物,9 种山西老陈醋中8 种以上检测到的物质有27 种,视为山西老陈醋的特征风味物质。将两者各自的特征物质结合在一起,共得到35 种物质,包括醇、醛、酸、酯、酚、酮以及杂环化合物,见表2。序号1~8为四川保宁醋特有特征物质,序号9~25为四川保宁醋和山西醋的共有特征物质,序号26~35为山西醋特征物质。以此为指标通过PCA和OPLS-DA等多元统计学方法分析四川保宁醋和山西老陈醋的挥发性差异代谢产物。
2.2 四川保宁醋和山西老陈醋的代谢组学差异分析
2.2.1 PCA结果
图1 2 种食醋挥发性风味组分PCA的分数散点图Fig. 1 Score scatter plot based on PCA model for volatile flavor components in two vinegars
利用2 种食醋的香气组分的相对含量进行PCA,提取得到2 个主成分,累计贡献率为65.03%,基本可以表征所涉及的化学成分信息。从图1可以看出,在95%置信区间内,2 组样本具有明显的区域分布特征且表现出聚类趋势,但组间样品点比较散。
2.2.2 OPLS-DA结果
图2 2 种食醋挥发性风味组分OPLS-DA得分散点图Fig. 2 Score scatter plot based on OPLS-DA model for volatile flavor components in two vinegars
PCA虽然能反映出四川保宁醋和山西老陈醋的明显差异,但其仅反映了数据的原始状态,忽略了数据间的整体性特征与变化规律,不利于寻找组间差异代谢物[10]。为更好地观察四川保宁醋和山西老陈醋挥发性成分的差异和特征,找到能够标记差异的信号分子,从而筛选出差异形成的潜在标记物,采用有监督的OPLS-DA的模式识别方法对2 种四大名醋样品数据进行了建模分析。OPLS-DA参数R2X描述了X变量中有多少变化可以用所选的组件解释。R2描述了模型的拟合程度。Q2表示X对Y的预测能力,R2和Q2的取值范围为0~1,其中1表示完全适合度和预测能力[11]。由图2可知,2 组样本在OPLS-DA得分图上聚类良好,显著分离(=0.615,R2=0.903,Q2=0.822)。为0.615,表明所选组件可以对数据集中61.5%的变化进行建模,又因为R2和Q2参数数值接近1,所以OP LS-DA模型的可解释度和模型拟合很好。与无监督的PCA得分散点图相比,山西老陈醋和四川保宁醋样本有了最大程度的分离,且降低了样品的组内差异,这样便于更准确地寻找两者的化学差异成分。
2.2.3 OPLS-DA模型评价
OPLS-DA是一种有监督的多元统计方法,有监督的分类模型缺点是可能会出现过拟合现象,即模型可以很好地将样本进行区分,但用来预测新的样本集时却表现很差。因此采用SIMCA-P软件对建立的OPLS-DA模型进行置换检验和交叉验证方差分析验证模型的可靠性。
图3 2 种食醋样品OPLS-DA置换检验结果图Fig. 3 OPLS-DA replacement test results for two vinegars
当原始数据中没有添加额外的数据或噪声,置换检验更有助于进行模型的验证[12]。其通过随机改变分类变量Y的排列顺序,多次建立对应的OPLS-DA模型以获取随机模型的R2和Q2值,在避免检验模型的过拟合以及评估模型的统计显著性上具有重要作用。如图3所示,横坐标表示置换检验的置换保留度(置换保留度等于1处的点即为原模型的R2和Q2值),所有R2点从左到右均低于最右的原始的R2点,所有Q2点均低于右侧的原始Q2点,且点的回归线与横坐标交叉或者小于0,一般认为Q2为负值,这说明统计模型是有效的,没有过拟合[13]。另外,将OPLS-DA模型进行交叉验证方差分析,结果显示P值为9.15×10-4,也小于0.05,具有统计学意义,这进一步表明模型稳定可靠[14]。
2.2.4 潜在差异标志物
为进一步找出对结果分型起贡献作用的变量,得到了OPLS-DA模型的S-plot和VIP图如图4、5所示。S-plot最初是由Wiklund等首次用来鉴定2 个样本之间的化学差异,它显示了代谢物和模型类指定之间的协方差和相关性,是将多元分类模型可视化和解释的工具[15]。因此,S-plot图有助于根据对模型的贡献及其可靠性,能够识别具有统计意义和潜在生物化学意义的代谢物[16]。“S”两端的点表示潜在的化学标记,具有较高的置信度,即对分型贡献较小的变量会聚集在原点附近,而对分型贡献较大的变量则分散在“S”型的两端[17]。变异权重参数值(variable importance in projection,VIP)的大小反映了每个品质成分对模型贡献率的大小,值越大贡献越大[18]。以VIP值大于1为界限进行筛选并结合S-plot图可以看出,糠醛、乙酸乙酯、2,4-二叔丁基酚、醋酸、乙酸苯乙酯和苯乙醇这6 种风味物质是对2 种四大名醋差异贡献最大的潜在标志物。
图4 基于OPLS-DA模型分析的S型载荷图Fig. 4 S-plot based on OPLS-DA model an alysis
图5 基于OPLS-DA模型分析的VIP预测值分布图Fig. 5 Distribution of VIP forecast values based on OPLS-DA model analysis
2.2.5 差异性成分在四川保宁醋和山西老陈醋相对含量分析
对获得的6 个差异性较大的挥发性变量在四川保宁醋和山西老陈醋的相对含量进行热图分析,如图6所示,糠醛、2,4-二叔丁基酚在四川保宁醋中的相对含量比在山西老陈醋中的相对含量高,苯乙醇在四川保宁醋中未检测到或含量很低。而醋酸、乙酸乙酯和乙酸苯乙酯在山西老陈醋中的相对含量远高于其在四川保宁醋中的相对含量。
糠醛又称呋喃甲醛或麸醛,有助于杏仁、烤土豆、面包、烧焦味[19],主要是由戊聚糖分解或酵母发酵所产生[20]。苯乙醇具有蜂蜜香和玫瑰香,是酵母菌的代谢产物,来源于乙醇发酵过程中苯丙氨酸的降解[21]。乙酸乙酯具有果香、酒香,是酵母细胞质中 糖酵解产生的乙醇或乙酸与线粒体呼吸产生的乙酰辅酶A发生酯化反应生成的[22]。乙酸苯乙酯具有蜜甜香,少量产生于乙醇发酵阶段,大量产生于醋酸发酵阶段,由苯乙醇在酯酶的作用下合成[23]。但目前关于2,4-二叔丁基酚的风味及来源还不清楚,发现2,4-二叔丁基酚在酒、醋、茶[24]中被广泛检测到,尤其是药酒、药醋,比如怀山药[25]、葛根酒[26]等。此外,2,4-二叔丁基酚还能在中草药中被检测出,比如沉香[27]、姜黄[28]、香草兰[29]、三角梅[30]等。所以,可以猜测保宁醋中高含量的2,4-二叔丁基酚与加 入的中草药有关。
图6 差异代谢物的热图分析Fig. 6 Heatmap of differen t metabolites
3 结 论
本研究基于GC-MS指纹图谱对6 种四川保宁醋和9 种山西老陈醋挥发性风味物质进行测定,四川保宁醋得到26 种共有物质,山西老陈醋得到27 种共有物质,将两者各自的共有物质结合共得到35 种物质。以这35 种物质为研究对象,结合PCA和OPLS-DA多元数据变量进行统计分析,结果显示:山西老陈醋和四川保宁醋样本在散点图上分离良好;以VIP值大于1为界限进行筛选并结合S-plot图共得到6 种差异代谢物,分别为糠醛、乙酸乙酯、2,4-二叔丁基酚、醋酸、乙酸苯乙酯和苯乙醇;通过热图对差异性代谢物分析,可以发现糠醛、2,4-二叔丁基酚在四川保宁醋中的相对含量比在山西老陈醋中高,而醋酸、乙酸乙酯和乙酸苯乙酯在山西老陈醋中的相对含量远高于其在四川保宁醋中的相对含量,另外,苯乙醇在四川保宁醋中的未检测到或含量很低。这为食醋行业质量评价提供参考数据,为进一步研究和分析不同食醋的质量和风格特色的形成提供了新的思路和方法。