APP下载

基于EGCG,ECG和咖啡碱含量的乌龙茶产地鉴定

2018-06-21曹琼苏欢宛晓春宁井铭

茶叶科学 2018年3期
关键词:咖啡碱乌龙茶儿茶素

曹琼,苏欢,宛晓春,宁井铭

安徽农业大学,茶树生物学与资源利用国家重点实验室,安徽 合肥 230036

乌龙茶属于半发酵茶,由鲜叶经晒青、晾青、做青、杀青、揉捻及干燥等工序加工而成,其生产和加工地区主要集中在闽南、闽北、广东和台湾[1]。除此之外,安徽、浙江、湖北、贵州等省也生产乌龙茶。不同地区的乌龙茶品质特征各异,因此价格也存在差异。近年来,随着乌龙茶产业的迅猛发展,乌龙茶越来越受消费者的喜爱,一方面给茶叶生产商带来了可观的经济效益;另一方面,乌龙茶品种繁多,部分花色品种外形特征相似,从而存在假冒原产地产品现象,给茶叶市场的监管增加难度。因此鉴别乌龙茶的产地,非常有必要。

传统鉴定乌龙茶产地的方法依赖于感官经验,容易受到人为因素及周围环境的影响。由于受到不同地理环境条件、茶树品种、采摘方式及加工工艺的影响,不同产区的乌龙茶在感官品质及理化成分上存在差异[2],这使得利用理化成分来鉴定乌龙茶的产地成为可能。有学者通过对乌龙茶中金属元素及多酚、水浸出物等生化成分进行检测,结合因子分析和判别分析实现了对乌龙茶品质和产地的判定[3]。此外有学者采用 HS-SPME/GC–MS技术结合主成分分析及聚类分析等化学计量学方法来判定乌龙茶的品种[4]。

本研究对茶叶中的儿茶素、咖啡碱、没食子酸和茶氨酸等成分采用 HPLC方法进行检测,并用遗传算法和连续投影算法筛选出特征性的化合物,然后分别结合支持向量机、随机森林和反向传播人工神经网路等机器学习方法建立乌龙茶产地鉴定模型,从而找出一种能够量化判别乌龙茶产地的方法。

1 材料与方法

1.1 材料与仪器

试验样品:本研究共收集乌龙茶样品130个,其中闽南71个,闽北29个,广东15个,台湾 15个。所收集的样品为来自不同企业2015—2017年加工生产的不同等级的乌龙茶样品。将样品研磨成粉,使磨碎样品能完全通过孔径为600 μm的筛,并放置于4℃贮存。

HPLC系统:Waters E2695高效液相色谱仪,2489的紫外可见光检测器和 Waters Empower色谱管理系统;HPLC色谱分析柱:Phenomen 公司 5 µm,Gemini-NX C18,250 mm×4.6 mm色谱柱用于检测儿茶素、没食子酸及咖啡碱;Phenomen公司 4 µm,Synergi Hydro-RP C18,250 mm×4.6 mm色谱柱用于检测茶氨酸;AB104-N型万分之一电子天平,上海精宏实验设备有限公司;DHG-9240A型电热恒温鼓风干燥箱,上海精宏实验设备有限公司;DK-8D型水浴锅,上海一恒科技有限公司;SC-3610型低速离心机,安徽中科中佳科学仪器有限公司。

儿茶素标品:儿茶素(C,纯度≥99%)、表儿茶素(EC,纯度≥99%)、表没食子儿茶素(EGC,纯度≥98%)、表没食子儿茶素没食子酸酯(EGCG,纯度≥99%)、表儿茶素没食子酸酯(ECG,纯度≥98%)、没食子酸(GA,纯度≥99%)、咖啡碱(纯度≥99%)、茶氨酸(纯度100%),均购于美国Sigma公司;色谱级乙腈、甲醇,美国 Tedia公司;EDTA、抗坏血酸均购于上海阿拉丁试剂有限公司。

1.2 实验方法

1.2.1 水分的测定

水分的测定按照国际标准ISO1573:1980中的(103±2)℃恒重法[5]。

1.2.2 儿茶素、没食子酸及咖啡碱的测定

茶叶中儿茶素、没食子酸的测定均按照国际标准ISO 14502—1:2005中的HPLC法进行测量[6]。最终物质含量单位均以干物质质量分数表示(%)。

乌龙茶样品中咖啡碱含量的测定按照国际标准ISO 10727:2002中的HPLC法进行测量[7]。采用Waters E2695高效液相色谱仪,型号为2489的紫外可见光检测器进行测量。

1.2.3 茶氨酸的测定

乌龙茶样品中茶氨酸含量的测定按照国际标准ISO 19563:2017中的HPLC法进行测定[8]。采用Waters E2695高效液相色谱仪,型号为2489的紫外可见光检测器进行测量。

1.2.4 SPSS 21.0软件

用于进行ANOVA分析,比较不同产地乌龙茶样品理化成分的差异;Matlab 2014a用于提取特征化学指标并建立判别模型,验证模型的稳定性。

2 结果与分析

2.1 不同产区乌龙茶理化成分的差异

采用高效液相色谱法对 4个传统产区的130个乌龙茶样品中的多酚、咖啡碱及茶氨酸含量进行检测,并用SPSS 21.0对不同产区乌龙茶的理化成分进行ANOVA分析,结果如表1所示。由表中可知,广东乌龙茶中的没食子酸(GA)、咖啡碱、表没食子儿茶素没食子酸酯(EGCG)、表儿茶素没食子酸酯(ECG)及儿茶素总量等明显高于其他3个产区;而台湾乌龙茶中的表没食子儿茶素(EGC)和儿茶素(C)的含量明显高于其他产区,但咖啡碱和ECG的含量却明显低于闽南、闽北和广东乌龙;4个产区乌龙茶样品的咖啡碱、EGCG和ECG含量存在显著性差异。由于4个产区乌龙茶的这些理化成分含量之间存在差异,因此本研究旨在依据这些化学成分,采用化学计量学的方法建立其产地鉴定模型。

2.2 主要理化成分的主成分分析

针对上述检测的9个理化指标,首先采用主成分分析法提取与乌龙茶产地相关的主成分,其前两个主成分解释了变量总方差的97.35%,其中主成分1(PC1)解释了84.87%,第二主成分(PC2)解释了12.48%。4个产区乌龙茶样品中儿茶素、没食子酸、茶氨酸及咖啡碱等理化成分的主成分得分图如图1所示,可以看出,广东乌龙、台湾乌龙和闽南乌龙可以完全区分开,但闽北乌龙茶的分布与闽南乌龙和台湾乌龙均有重叠。因此采用主成分的聚类结果并不能实现对 4个产区乌龙茶的有效区分。为了实现对4个传统产区乌龙茶的高效判别和鉴定,采用遗传算法和连续投影算法来筛选特征的化学指标,结合支持向量机、反向传播人工神经网络以及随机森林等分类模型,建立一种用少量的理化成分高效鉴定乌龙茶产地的方法。

2.3 特征指标筛选方法及结果

特征指标筛选的目的是减少测量空间的维度,提取相关信息进行模式识别,从而建立乌龙茶产地鉴定模型,来预测乌龙茶的产地。本研究采用遗传算法和连续投影算法来提取特征性的化学指标。

遗传算法(Genetic algorithm)是一类借鉴生物界自然选择和自然遗传机制的随机搜索算法[9-10],模拟自然选择和自然遗传过程中发生的繁殖、交叉和基因突变现象,在每次迭代中都保留一组候选解,并按某种指标从解中选取较优的个体,利用遗传算子(选择、交叉和变异)对这些个体进行组合,产生新一代的候选解,重复此过程,直到满足某种收敛指标为止。在本研究中,经过遗传算法筛选出的化合物如图2所示,分别为咖啡碱、EGCG和ECG。由表1可知,遗传算法筛选出的3种化合物,其4个产区之间的含量均存在显著差异。

表1 不同产区乌龙茶化学成分含量Table 1 Chemical contents of Oolong tea from different geographical origins%

图1 4个产区乌龙茶中理化成分的主成分得分图Fig. 1 PC1 vs. PC2 score plot of four origins of Oolong tea by principal component analysis

连续投影算法(Successive projections algorithm, SPA)是一种前向循环的特征变量提取方法[11],可以通过使矢量空间共线性最小化,消除冗余信息来减少建模的变量,从而提高建模效率[12]。本研究中由连续投影算法筛选出的对乌龙茶产地鉴定起重要作用的化合物如图3所示,分别为EGC、EGCG、ECG和儿茶素总量。结合表1可知,4个产区乌龙茶 EGCG、ECG的含量均存在显著差异,而闽南、闽北及台湾乌龙茶之间EGC的含量差异显著,闽南、闽北及广东乌龙茶之间的儿茶素总量差异显著,这使得用这些指标来建立模型鉴定不同产地的乌龙茶成为可能。

2.4 不同分类模型及其判别结果的比较

支持向量机(Support vector machine,SVM)是由Vapnik等人于70年代提出,是参数空间的一种线性分类器[13]。支持向量机方法通过扩大分类面与训练样本之间的距离来减少判别误差的上确界,进而寻找最优的分类面。近年来,支持向量机在茶叶类别鉴定方面应用广泛[14-15]。本研究中用支持向量机分类模型结合不同化合物筛选结果对 4个产地的乌龙茶进行鉴定,结果如表2所示。由表2可知,没食子酸等 9个原始理化指标结合支持向量机模型可以对闽南、闽北、广东及台湾4个产区的乌龙茶实现最准确的鉴定,训练集的判别率为97.70%,而预测集的判别率为93.02%。

反向传播人工神经网络(Back propagation artificial neural networks, BPNN)是一种非线性的数据分析方法,应用极为广泛[16-17]。BPNN采用输入层、隐含层和输出层3层结构,通过控制节点的权重,使系统误差最小,从而提高判别率。本研究基于儿茶素、没食子酸、咖啡碱和茶氨酸等理化成分,采用BPNN模型判别乌龙茶的产地。该模型结合不同指标的判别结果如表3所示。由表中可知,BPNN模型结合不同理化指标均能实现对乌龙茶产地的高效判定,但遗传算法筛选的指标判别结果最好,且筛选出的化合物种类最少,即基于咖啡碱、EGCG和ECG的遗传算法结合 BPNN模型判别率最高,训练集和预测集的判别率分别为97.13%和98.38%。

随机森林(Random forest, RF)分类器最早是由Leo Breiman和Adele Cutler提出的[18],是一种高效的组合分类法,在许多领域都有广泛的应用,如农业[19]、医学[20]等。随机森林通过构建决策树来建立模型,每一棵决策树之间没有关联,将未知样本输入随机森林时,根据决策树被选择的次数,样本属于被选择最多的一类[21]。本研究中采用随机森林分类算法结合不同的化合物对乌龙茶的产地进行划分。随机森林分类模型的判别结果如表4所示,由表4可知,训练集的判别率均为100%,而原始的9个检测指标及遗传算法筛选的指标,结合随机森林算法,对乌龙茶产地鉴定,预测集的判别率均为 95.34%,但遗传算法筛选的指标少,因此遗传算法结合随机森林模型判别结果最好。

图2 遗传算法筛选化合物结果Fig. 2 Compound selection by genetic algorithm

图3 连续投影算法筛选化合物的结果Fig. 3 Compound selection by successive projections algorithm

表2 支持向量机模型的判别结果Table 2 Discriminant results of support vector machine model%

表3 反向传播神经网络模型的判别结果Table 3 Discriminant results of back propagation artificial neural networks model%

表4 随机森林模型的判别结果Table 4 Discriminant results of random forest model%

3 讨论

本研究依据 ISO标准的检测方法检测了130个乌龙茶样品的多酚、咖啡碱及茶氨酸等理化成分,并用遗传算法和连续投影算法对原始的检测指标进行筛选,筛选出一些特征性的化合物,基于不同的化合物结合 3种经典的分类模型(支持向量机、反向传播人工神经网络和随机森林)对 4个产地的乌龙茶样品进行判别和预测。结果表明,遗传算法筛选出的化合物(咖啡碱、EGCG和 ECG)结合 BPNN模型能够利用较少的理化指标实现对训练集样品和预测集样品的高效判别,且训练集的判别率为 97.13%,预测集的判别率为 98.38%。对于未知产地的乌龙茶样品,用HPLC方法检测其EGCG、ECG和咖啡碱的含量,输入反向传播人工神经网络模型,即可判别出属于 4个传统产区的某个产区,对于 4个传统产区之外的乌龙茶,则需大量样本,检测儿茶素等理化成分,然后依据遗传算法和反向传播人工神经网络模型修订参数,然后判别产地。该鉴定方法相比于传统的感官审评方法,排除了环境等因素的影响,鉴定结果更加稳定和科学;而且该方法只需要EGCG、ECG和咖啡碱3个指标,相比于其他检测方法更加简便。因此该模型可以为乌龙茶产地的量化判别提供理论依据,从而为规范乌龙茶市场作出贡献。

[1] 梅宇, 王智超. 2016年全国乌龙茶产销形势调研报告[J].广东茶业, 2017(Z1): 1-8.

[2] 蔡烈伟, 许勇泉, 周炎花, 等. 不同产区乌龙茶感官品质与茶汤化学成分分析[J]. 福建茶叶, 2016, 38(11): 17-19.

[3] 孙威江, 董青华, 周卫龙, 等. 乌龙茶品质评定与产品判别研究[J]. 茶叶科学, 2011, 31(4): 305-312.

[4] Lin J, Zhang P, Pan Z, et al. Discrimination of Oolong tea(Camellia sinensis) varieties based on feature extraction and selection from aromatic profiles analysed by HS-SPME/GC–MS [J]. Food Chemistry, 2013, 141(1): 259-265.

[5] ISO 1573. Tea-Determination of loss in mass at 103 degrees C [S]. Technical Committee ISO/TC 34: Agricultural Food Products, 1980.

[6] ISO 14502-2. Determination of substances characteristic of green and black tea—Part 2: content of catechins in green tea—Method using high performance liquid chromatography,MOD [S]. Technical Committee ISO/TC 34, Food Products,Subcommittee SC 8, Tea, 2005.

[7] ISO 10727. Tea and instant tea in solid form—Determination of caffeine content—Method using high-performance liquid chromatography [S]. Technical Committee ISO/TC 34, Food Products, Subcommittee SC 8, Tea, 2002.

[8] ISO 19563. Determination of theanine in tea and instant tea in solid form using high performance liquid chromatography[S]. Technical Committee ISO/TC 34, Food Products,Subcommittee SC 8, Tea, 2017.

[9] Wiegand P, Pell R, Comas E. Simultaneous variable selection and outlier detection using a robust genetic algorithm [J]. Chemometrics & Intelligent Laboratory Systems, 2009, 98(2): 108-114.

[10] Leardi R, Seasholtz M B, Pell R J. Variable selection for multivariate calibration using a genetic algorithm: prediction of additive concentrations in polymer films from Fourier transform-infrared spectral data [J]. Analytica Chimica Acta,2002, 461(2): 189-200.

[11] Soares S, Gomes A A. The successive projections algorithm[J]. Trac Trends in Analytical Chemistry, 2013, 42(42):84-97.

[12] 陈斌, 孟祥龙, 王豪. 连续投影算法在近红外光谱校正模型优化中的应用[J]. 分析测试学报, 2007(1): 66-69.

[13] 刘华煜. 基于支持向量机的机器学习研究[D]. 大庆: 大庆石油学院, 2005.

[14] Zhao J, Chen Q, Huang X, et al. Qualitative identification of tea categories by near infrared spectroscopy and support vector machine [J]. Journal of Pharmaceutical and Biomedical Analysis, 2006, 41(4): 1198-1204.

[15] Chen Q, Zhao J, Fang C H, et al. Feasibility study on identification of green, black and Oolong teas using near-infrared reflectance spectroscopy based on support vector machine (SVM) [J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2007, 66(3): 568-574.

[16] 欧文娟, 孟耀勇, 张小燕, 等. 紫外可见吸收光谱结合主成分-反向传播人工神经网络鉴别真假蜂蜜[J]. 分析化学,2011, 39(7): 1104-1108.

[17] 王丽琼, 范琦, 易珍奎, 等. HPLC指纹图谱结合反向传播人工神经网络和判别分析鉴定不同的麻黄药材[J]. 西南师范大学学报(自然科学版), 2012, 37(5): 73-77.

[18] 李欣海. 随机森林模型在分类与回归分析中的应用[J]. 应用昆虫学报, 2013, 50(4): 1190-1197.

[19] 马玥, 姜琦刚, 孟治国, 等. 基于随机森林算法的农耕区土地利用分类研究[J]. 农业机械学报, 2016, 47(1):297-303.

[20] 詹曙, 姚尧, 高贺. 基于随机森林的脑磁共振图像分类[J].电子测量与仪器学报, 2013, 27(11): 1067-1072.

[21] 方匡南, 吴见彬, 朱建平, 等. 随机森林方法研究综述[J].统计与信息论坛, 2011, 26(3): 32-38.

猜你喜欢

咖啡碱乌龙茶儿茶素
安徽农业大学揭示茶树咖啡碱合成调控机制
超高效液相色谱法测定茶叶中的儿茶素
可降解咖啡碱的酵母菌菌种筛选及其培养条件的优化
试论乌龙茶供应链模式的选择机制
茶树体内咖啡碱生物代谢研究进展
自制蜜桃柠檬乌龙茶
每天喝多少绿茶才有健康效应
表没食子儿茶素没食子酸酯对顺铂诱导大鼠肾损伤的改善作用
一测多评法测定心脑健胶囊(片)中6种儿茶素
晚上喝茶头遍要倒掉