基于UPLC-QTOF-MS结合非靶向代谢组学鉴别3种江西名茶
2022-02-16徐春晖王远兴
徐春晖,王远兴
(南昌大学 食品科学与技术国家重点实验室,江西 南昌 330047)
绿茶属于“非发酵”型茶叶,干燥和蒸制鲜叶使多酚氧化酶失活,因此含有较低的儿茶素氧化水平(<1%),相比红茶和龙井茶(儿茶素氧化水平在5%~16%之间)含有更多的儿茶素[1]。此外富含矿物质、维生素、咖啡因和茶多酚等成分,具有降低心血管疾病风险、抗癌、抗纤维化特性和神经保护能力等健康益处[2--3],是现今世界上最为广泛流行的饮料之一[4]。
狗牯脑、庐山云雾茶和婺源绿茶是江西省的优质名茶,生长地区山高林密、土质肥沃、雨量充沛,生长茶树的芽叶持嫩性强,氨基酸、咖啡碱、芳香物质等含量丰富,制作出的绿茶滋味醇厚鲜爽,汤色碧绿澄明,色泽翠绿光润,受到茶叶爱好者的广泛青睐,现已成为当地地理标志性产品[5]。目前,名优茶价值高,市场占有份额较大,利益丰厚,使得一些不法商家将劣质茶叶贴上名优茶的标签以高价出售从而获取高价利润[6],这不仅造成了茶叶市场的混乱,也对茶农的利益以及名茶的名誉造成了损害[7]。目前茶叶的检测,只针对茶叶的主要成分,如儿茶素或其他元素的检测,这种方法局限性强,不能全面地反映出茶叶中的代谢物情况;或是依赖于品茶师的感官鉴定,这种人为方法主观性较强,不具有说服力,缺乏科学客观的量化依据和精确描述[8]。因此,为保护江西名茶这一宝贵市场,需要对其真实性进行控制,建立一种客观准确的茶叶品质鉴定方法以打击假冒伪劣产品和保证江西名茶的品质意义重大。
非靶向代谢组学是针对生物系统内小分子代谢物(<1 000 Da)全面、系统的定性和定量分析[9],结合多元统计分析技术不仅可以可视化分析样本间的差异,还能寻找潜在差异代谢物[10]。探究不同外界因素影响下代谢物水平的变化,例如茶叶体内代谢物通常会受季节、气候条件、土壤、肥料、遮阳和地理位置等因素影响,从而导致茶叶的质量和市场价值产生差异[11-13]。在过去十几年里,非靶向代谢组学结合各种分析方法评估代谢物水平与外界因素之间的关系,如核磁共振、近红外光谱或基于质谱的平台。与其他代谢组学平台相比,超高效液相色谱-四极杆飞行时间质谱(ultra-high performance liquid chromatography-quadrupole time-of-flight mass spectrometry,UPLC-QTOF-MS)具有明显的优势,分辨率、灵敏度和峰重现性更高,并允许同时对多个化合物进行快速的定性或相对定量分析[14-15]。
本实验在研究狗牯脑、庐山云雾茶和婺源绿茶挥发性成分的基础上[5],使用UPLC-QTOF-MS结合非靶向代谢组学技术对狗牯脑、庐山云雾茶和婺源绿茶的非挥发性代谢物进行全面高覆盖检测分析,探究3种江西名优绿茶间的差异并筛选潜在差异物。构建预测模型对狗牯脑、庐山云雾茶和婺源绿茶品质进行鉴别,为保护这3种江西名茶提供一定理论依据。
1 材料与方法
1.1 材料与试剂
狗牯脑(26个批次)由遂川县汤湖镇遂川之宝生态农业开发有限公司提供;庐山云雾茶(25个批次)产于江西省九江市庐山茶科所茶场;婺源绿茶(25个批次)由婺源县婺康源有限公司提供;市场茶样(22个批次)购于茶叶交易市场和淘宝电商平台。采集时间为2020年5月,所有茶叶样品置于密封袋中并在4 ℃冰箱中保存。
蒸馏水 屈臣氏食品饮料有限公司;乙腈(色谱级) 德国Merck公司;甲酸 美国ROE公司;甲醇(分析纯) 西陇化工股份有限公司。
1.2 仪器与设备
1290 UPLC仪-6538 QTOF-MS仪(配有MassHunter Qualitative Analysis和MassHunter Mass Profiler数据处理软件) 美国安捷伦公司;AL-104电子天平 梅特勒-托利多(上海)有限公司;TDL-5-A离心机 北京东方精华苑科技有限公司;KQ5200E超声波清洗器 昆山市超声仪器有限公司。
1.3 方法
1.3.1 样本制备
将茶叶样本(去除茎干)磨成细粉,过0.425 mm筛。准确称取0.1 g样品于10 mL离心管,加入6 mL体积分数70%甲醇溶液,室温下超声1 h,随后以4 800 r/min离心10 min。取上清液过0.22 μm PTFE滤膜于2 mL棕色螺旋进样瓶中,用于UPLC-QTOF/MS的非靶向代谢组学检测[16]。
从每个样品吸取50 μL混合制成质量控制(quality control,QC)样本。在样品序列分析开始前,将QC样品连续注入10 次以平衡系统,确保所收集数据的可重复性,然后在整个分析过程中定期进行QC样品分析(每隔5个茶叶样本),以监测仪器的稳定性[17]。同时,在QC样本分析后,注入空白样品(甲醇-水(70∶30,V/V)),以减少序列分析过程中的残留效应[18]。
1.3.2 色谱条件
色谱柱:ZORBAX RRHD Eclipse Plus C18柱(2.1 mm×100 mm,1.8 μm);柱温35 ℃;流动相:A为体积分数0.1%甲酸-水溶液,B为体积分数0.1%甲酸-乙腈溶液;流速0.3 mL/min;进样量3 μL;梯度洗脱:0~25 min,98%~75% A、2%~25% B;25~35 min,75%~25% A、25%~75% B;后运行时间2 min。
1.3.3 质谱条件
模式:负离子模式;电子电离:电喷雾电离;干燥气(N2)温度325 ℃;干燥气流速10.0 L/min;雾化器压力40 psig;毛细电压3 500 V;碰撞电压175 V;质量扫描范围m/z50~1 700;二级碰撞能10~50 eV;参比离子:m/z112.985 587、1 033.988 109。
1.4 数据处理
使用Agilent MassHunter Qualitative Analysis B.0 4.00软件将UPLC-QTOF-MS采集的原始数据文件(.d)通过“按分子特征查找化合物”功能进行解卷积,参数如下:峰过滤器-峰高(轮廓和质心质谱图):≥100 counts;离子种类-负离子:-H、+HCOO、+CH3COO;峰高-相对峰高:≥2.5%;质量过滤器:m/z112.985 587、1033.988 109。解卷积后将文件导出转换为.cef文件,导入到MPP(MassHunter Mass Profiler)软件中。MPP作为化学计量学软件,可用于数据对齐、归一化和过滤,以筛选在狗牯脑、庐山云雾茶和婺源绿茶中具有显著差异贡献的特征化合物。随后,将特征化合物进行多元统计分析,包括主成分分析(principal component analysis,PCA)、聚类分析、偏最小二乘判别分析(partial least squares-discriminant analysis,PLS-DA)以及热图分析,这些方法在之前研究中证明是可行的[19]。采用MPP软件进行PCA和PLS-DA,聚类分析和热图分别采用metaboanalyst(https://www.metaboanalyst.ca)和TBtools软件[20]绘制。
特征化合物通过准确质量、二级质谱图、标准品以及代谢组学数据库Massbank(https://massbank.eu/MassBank/)、ChemSpider(http://www.chemspider.com/)、Metlin(http://metlin.scripps.edu)和文献[21-26]鉴定差异代谢物[27-28]。
2 结果与分析
选择狗牯脑、庐山云雾茶和婺源绿茶3种江西名茶作为实验样本,探讨不同江西名茶之间的代谢物差异。为保证茶叶来源的真实性,所有茶叶样本均采集于当地茶园。狗牯脑、庐山云雾茶和婺源绿茶的总离子流图如图1所示。
图1 狗牯脑(A)、庐山云雾茶(B)和婺源绿茶(C)的UPLC-QTOF-MS总离子流色谱图Fig. 1 Total ion current chromatogram of UPLC-QTOF-MS of Gougunao tea (A), Lu Mountain Clouds-Mist tea (B) and Wuyuan green tea (C)
2.1 方法学验证
获得高质量和可靠的数据是非靶向代谢组学研究的主要前提。本研究对样品分析方法的稳定性和数据的可靠性进行监测:从QC样本中随机挑选m/z345.081 54(3.312 min,为保留时间,下同)、195.087 12(9.266 min)、459.092 2(13.107 min)、757.219 86(18.188 min)、922.009 8(23.576 min)、1 274.273 92(32.396 min)6个特征离子,计算离子峰面积和保留时间的相对标准偏差(relative standard deviations,RSD),评估分析方法和仪器的重复性和稳定性。结果显示,保留时间的RSD为0.03%~0.35%,峰面积的RSD为2.90%~6.07%。此结果表明仪器具有很好的稳定性和重复性,所采集的数据可用于进一步研究与分析。本研究认为通过多元数据分析造成的数据误差是由样本本身代谢物差异造成的,而非系统或分析造成的误差。
2.2 数据挖掘与预处理
采用UPLC-QTOF-MS对3种茶叶的代谢物在负离子模式下进行高覆盖检测和分析,共检测到2 994个代谢物。为去除无效且低浓度的代谢物,具体处理参数为:保留时间范围0~35 min;最小绝对丰度为5 000 counts;对齐参数RT Window=0.0%+0.15 min,Mass Window=10×106+2.0 mDa;以所有样品的中位数为基准线。
为获取狗牯脑、庐山云雾茶和婺源绿茶间的差异代谢物,设置以下过滤参数:1)按标志过滤,保留在76个样品中至少在2个样品中出现的代谢物,以此排除“一次命中”的化合物,即该代谢物仅在1个样品中出现,其对于数据统计分析没有实质性意义;2)按频率过滤,保留在所有样品中至少出现80%以上的代谢物;3)按样品变异性过滤,保留变异系数小于25%的代谢物;4)按显著性分析过滤,包括单因素方差分析(analysis of variance,ANOVA)和倍数分析(fold change,FC)。采用ANOVA计算P值,使用Benjamini Hochberg进行多重测试校正,Tukey HSD作为事后检验,以P<0.5为阈值;计算狗牯脑与庐山云雾茶、庐山云雾茶与婺源绿茶或狗牯脑与婺源绿茶(反之亦然)之间的FC值,以FC≥2为阈值[29]。如图2所示,经过以上参数设置进行逐步过滤,原始代谢物的数量明显减少,最终筛选出221个差异代谢物。
图2 采用MPP对狗牯脑、庐山云雾茶和婺源绿茶进行数据过滤得到差异代谢物Fig. 2 Data filtration to identify characteristic differential metabolites among Gougunao tea, Lu Mountain Clouds-Mist tea and Wuyuan green tea by using MPP analysis
为验证最终筛选出的差异代谢物的真实性和避免假阳性,利用递归特征提取[30],从原始数据中自动提取221个差异代谢物。检验核对生成的提取化合物色谱图,发现仅有1个假阳性(2个相同的差异代谢物),将其移除,故最终筛选出220 个差异性代谢物。
2.3 狗牯脑、庐山云雾茶和婺源绿茶的化学计量学分析
2.3.1 PCA
在上述数据预处理后,对220 个差异代谢物进行PCA,对狗牯脑、庐山云雾茶和婺源绿茶的差异情况进行总体概览。从图3可以看出,前2个PC的累计贡献率达80%,这说明前2个PC可以解释80%的全部信息,该PCA可为鉴别3种江西名茶差异提供足够的可信度。3种江西名茶根据类别分别被投影为不同颜色的小球,狗牯脑、庐山云雾茶与婺源绿茶明显聚为3 组,基本得到了有效区分,说明这3种茶叶的代谢物在种类和相对含量上存在明显差异。
图3 狗牯脑、庐山云雾茶和婺源绿茶PCA三维得分图Fig. 3 PCA score plot of Gougunao tea, Lu Mountain Clouds-Mist tea and Wuyuan green tea
2.3.2 聚类分析
根据各组代谢物丰度的相似性对样品进行聚类,聚类分析结果如图4所示,狗牯脑、庐山云雾茶和婺源绿茶三者明显被区分开,这与PCA结果相对应。狗牯脑与庐山云雾茶距离较近,距离婺源绿茶较远,说明狗牯脑与庐山云雾茶的代谢物质相近,与婺源绿茶代谢物质差异较大。在同一大类中,由于茶树品种、气候和加工制作方法等因素的不同又分成了不同小类,代谢物质相近的茶叶在树状图中相距较近,该结果与之前研究狗牯脑、庐山云雾茶和婺源绿茶之间的挥发性成分结果一致[5]。
图4 狗牯脑、庐山云雾茶和婺源绿茶的聚类树状图Fig. 4 Hierarchical cluster analysis of Gougunao tea, Lu Mountain Clouds-Mist tea and Wuyuan green tea
2.3.3 PLS-DA构建分类模型
为证明上述数据提供的判别潜力,利用MPP构建PLS-DA模型,PLS-DA是一种广泛使用的监督模式识别方法,能够验证3种江西名茶分类结果以及预测茶叶的类别。如图5所示,本研究的PLS-DA模型由每个真实的江西名茶构建,3种茶叶具有良好的分类。在预测之前,首先对该模型进行训练,判断模型的准确度,如表1所示,准确度均为100%,说明该模型准确度高,可用于下一步的样本预测[31]。为了证明该模型的预测能力,除用于寻找特征差异物和建立分类模型的76 种江西名茶样品之外,又在当地收集了7 种江西名茶,并另外在市面购买22 种茶叶样品。这29种样本在未告知分类的情况下,导入PLS-DA模型进行预测,模型预测结果与实际样本分类结果一致,准确度为100%。这些结果表明本实验构建的PLS-DA模型具有良好的预测能力,能够对狗牯脑、庐山云雾茶和婺源绿茶进行正确分类,可用于对市面上3种江西名茶进行真伪判别。
表1 使用PLS-DA预测模型的分类结果Table 1 Results of classification using PLS-DA model
图5 狗牯脑、庐山云雾茶与婺源绿茶的PLS-DA得分图Fig. 5 PLS-DA score plot of Gougunao tea, Lu Mountain Clouds-Mist tea and Wuyuan green tea
2.4 狗牯脑、庐山云雾茶和婺源绿茶特征差异代谢物鉴定
QTOF-MS仪中的四极杆和碰撞池以及TOF可以提供精确的二级质谱碎片信息,用于鉴定差异代谢物。例如,在本实验中,基于一级母离子和二级碎片离子信息鉴定m/z441.080 7、保留时间17.899 min的特征差异物。如图6所示,在碰撞能为20 eV的状态下母离子被轰击碎裂为二级碎片,仅有2个片段离子(m/z169.013 7、289.072 9)与母离子具有相同的保留时间和洗脱谱。在分子式估计过程中,根据未知化合物的同位素模式,只使用C(n≤40)、H(n≤100)、N(n≤20)、O(n≤30)、P(n≤15)和S(n≤5),不考虑Br、Cl、I和F,因为这些元素在茶叶化合物中发生的概率相当低。以质量误差(Δm/z≤5×106)为阈值,根据上述设置条件,MassHunter Qualitative Analysis为母离子m/z441.080 7生成56 种潜在分子式,为碎片离子m/z169.013 7、289.072 9分别提供6个和18个潜在分子式。在这两种情况下,Qualitative Analysis软件对生成的分子式进行分数评估(在0~100之间)。分子式的评分根据测量质量与精确质量、同位素丰度与预测丰度的比较,以及同位素间距与预测间距的比较,而不仅仅依赖于精确的质量测量。最终评分从高至低进行排序,得分最高的分子式很有可能是正确的分子式。通过这种方式,最终选定4个候选分子式(分子式评分大于85.0):C22H18O10、C20H16N3O9、C19H10N10O4、C18H14N6O8。使用Metlin等在线数据库对上述候选分子式进行搜索,并与二级碎片离子信息进行比对,发现上述成分只有1 种阳性,即为表儿茶素-3-O-没食子酸酯(C22H18O10),这是一种存在于绿茶中的黄酮类(黄酮-3-醇)物质。碎片离子m/z169.013 7 [M-C15H13O6]和m/z289.072 9 [M-C7H5O5]对应的离子片段分别是去质子化的儿茶素(或表儿茶素)和没食子酸[22]。
图6 表儿茶素-3-O-没食子酸酯的二级质谱图Fig. 6 Secondary mass spectrum of (-)-epicatechin gallate
通过以上鉴定方法,从3种茶叶样品中共鉴定出22 种特征差异代谢物,结果见表2。将相对含量经MPP归一化处理后导入到TBtools软件中,再经过scale处理绘制热图,图7显示了狗牯脑、庐山云雾茶和婺源绿茶中的含量差异。
表2 狗牯脑、庐山云雾茶与婺源绿茶中22 种特征差异代谢物Table 2 Twenty-two characteristic differential metabolites among Gougunao tea, Lu Mountain Clouds-Mist tea and Wuyuan green tea
续表2
图7 狗牯脑、庐山云雾茶与婺源绿茶中22 种特征差异代谢物含量的热图Fig. 7 Heatmap analysis of 22 characteristic differential metabolites among Gougunao tea, Lu Mountain Clouds-Mist tea and Wuyuan green tea
3 结 论
通过UPLC-QTOF-MS建立一种狗牯脑、庐山云雾茶和婺源绿茶品质鉴别的非靶向代谢组学分析方法,结果表明非靶向代谢组学研究在分析茶叶等复杂食品时是一种有价值的工具。使用MassHunter Qualitative Analysis和MPP进行数据挖掘、筛选,最终确定狗牯脑、庐山云雾茶和婺源绿茶中220 个特征差异代谢物,使用这些差异物进行可视化差异分析包括PCA和聚类分析,以及PLS-DA预测模型对3种茶叶依据品质进行分类。该预测模型基于当地广泛收集的真实样本建立,并对市面上的茶叶进行预测,结果表明其总体准确率达到100%,预测准确。该模型可应用于3种江西名茶品质的真伪判别,替代繁琐且主观的感官评价,为打击假冒伪劣产品和保护正宗的江西名茶提供一定的理论依据和指导意义。同时,可见将UPLC-QTOF-MS应用于食品代谢组学的鉴定和其他目的是非常可行的科学方法。