APP下载

基于分类回归树CART的湖南黑茶汤色品质的表征研究

2015-03-24李拥军王美玲颜鸿飞白秀芝朱绍华

食品工业科技 2015年5期
关键词:汤色茶类乌龙茶

李拥军,王美玲,颜鸿飞,白秀芝,朱绍华,戴 华

(1. 湖南出入境检验检疫局技术中心,湖南长沙 410004;2. 食品安全科学技术湖南省重点实验室,湖南长沙 410004)



基于分类回归树CART的湖南黑茶汤色品质的表征研究

李拥军1,2,王美玲1,2,颜鸿飞1,白秀芝2,朱绍华1,2,戴 华1

(1. 湖南出入境检验检疫局技术中心,湖南长沙 410004;2. 食品安全科学技术湖南省重点实验室,湖南长沙 410004)

采用色差法分析了红茶、绿茶、乌龙茶及不同产地的黑茶的汤色。根据茶汤色度值筛选出特征变量,建立了湖南黑茶的分类树CART识别模型。结果表明:湖南黑茶与绿茶、乌龙茶和红茶间两两比较,除与乌龙茶Δa*差异不明显外,其他色度值都存在显著差异;对于不同产地的黑茶对比分析,湖南黑茶除与青砖的ΔL*和生普的Δa*差异不大外,与六堡茶、青砖、藏茶、生普和熟普茶的ΔL*、Δa*、Δb*和ΔE*之间有明显差异;采用预测集样本评估模型质量,分类树CART模型对于茶叶类别和产地的识别正确率分别是100%和93.3%。因此,利用茶汤色度值建立起的分类树CART模型,可以得到湖南黑茶很好的分类识别效果。

湖南黑茶,汤色,色度值,分类回归树

茶叶是一种嗜好性的大众饮料,其品质优劣一般由色、香、味、形和叶底五个因子协同作用而成,其中汤色是表征茶叶品质的重要因子之一。汤色评价经典方法是感官评审,但是人的视觉受各种内、外源性因素的影响,从而降低了评定结果的准确性。茶叶汤色仪器评价方法源起70年代日本采用的亨特-Lab表色系的色差法[1]。目前,国际上通用的测色标准是CIE1976-L*a*b*表色系。ΔL*代表明亮度差,其值愈大,汤色愈亮,反之愈暗。Δa*代表红绿色度差,在正值时表示红色程度,在负值时表示绿色程度。Δb*代表黄蓝色度差,在正值时表示黄色程度,在负值时表示蓝色程度。同时由L*、a*、b*产生其它的色度衍生值,如色调彩度Cab、色彩饱和度Sab、色相b/a、色相角Hab和总色差ΔE,这些色度值及其衍生值是L*a*b*表色系表征颜色空间的八个参数,可以反应出不同色彩的细小差别。近年来,一些新的仪器测色技术在茶叶品质鉴定中开始了尝试和发展[2-5]。赖凌凌等测定了39个福建绿茶,探讨了茶汤色度值与汤色的相关性[6]。梁月荣等用光谱分析测定12种浙江名茶的茶汤,研究结果表明在400nm和440nm处的透光率分别与茶汤得分呈显著和极显著的正相关[7]。蔡健荣采用计算机图象处理技术分析了不同品质的茶汤[8]。这些新技术的应用大多是基于采用现代仪器测定得到的表征参数值,再通过模糊分类法、人工神经网络、贝叶斯分类法和支持向量机等数据挖掘方法,建立起评判模型,用于品质鉴定[9-14]。分类回归树CART法是Breiman等人1984年提出的决策树构建算法,如今它在数据统计学上应用进展较快,在医疗判断、气象预测、物流管理及风险投资等领域已有成功的应用。如今食品中CART法在红酒产地溯源等领域有研究,而茶叶领域的应用尚未见文献。

绿茶、红茶和乌龙茶茶汤的仪器评价方法文献介绍较多[15-18],而有关黑茶汤色的分析鲜有报道。本文基于测色技术获取不同茶叶茶汤的CIE1976-L*a*b*表色系色度值,从中提取色度值的特征变量,建立了湖南黑茶分类树CART模型,用于湖南黑茶汤色品质表征和茶叶识别,旨在为湖南黑茶原产地保护、多茶类定量判别和掺假打伪提供技术支撑。

表1 黑茶样本信息Table 1 Sample information of the dark tea

1 材料与方法

1.1 材料与仪器

供试的69份茶叶样本分购自湖南、湖北、四川、广西、云南、福建等地的自制或市售成品茶,其中黑茶54份、红茶5份、绿茶5份和乌龙茶5份,具体样本信息见表1。

实验用水为蒸馏水。

SMY-2000ST测色色差计 北京盛名扬科技开发有限责任公司;ML503电子天平(感量0.1g) 瑞士METTLER TOLEDO公司;评茶专用杯碗;茶匙;计时器。

1.2 实验方法

1.2.1 感官审评方法 称取茶样5g,加入250mL沸腾蒸馏水,按照《茶叶感官审评方法》(GB/T 23776-2009)所规定的方法冲泡[19],由专业审评人员对外形、汤色、香气、滋味和叶底五项因子进行密码审评,并给予评价,评价标准参考GB/T 23776-2009[19]。

1.2.2 色度值测定 称取茶样5g,加入250mL沸腾蒸馏水,冲泡时间为3min,冲泡完成后迅速过滤,测定滤液60℃时的色度值。色差计参数采集前,仪器预热、调零、标准白色板校正。以蒸馏水为对照,先测量蒸馏水的色度值,然后再测量各茶样茶汤的色度值(L*、a*、b*、ΔL*、Δa*、Δb*、ΔE*),每个茶样重复测定2次,取其平均值为测定结果。

1.3 数据处理

实验数据采用Excell软件和Python语言编程进行统计分析。采用Excell的t-检验进行差异显著性分析,表2中数据为平均值±标准偏差。用Python语言编程进行分类回归树CART建模。分类

表2 湖南黑茶与其他茶叶样本茶汤色度值差异Table 2 The difference of chromaticity between Hunan dark tea liquor and the other teas liquor

2 结果与分析

2.1 湖南黑茶与其他不同茶类茶汤色泽的差异

湖南黑茶与其他不同茶类样本的汤色进行对比分析。从表2看出,湖南黑茶汤色的ΔL*、Δb*和ΔE*三个参数与红茶、绿茶和乌龙茶两两间都存在显著差异。明亮度ΔL*值湖南黑茶要低于绿茶和乌龙茶,远高于红茶。黄蓝度Δb*值湖南黑茶要高于乌龙茶和绿茶,乌龙茶和绿茶较接近,而红茶最高。在感官审评上,湖南黑茶汤色橙黄渐红,绿茶汤色绿黄,乌龙茶汤色黄绿,而红茶汤色红浓。这种感官上汤色的变化与它们Δb*值大小趋势是一致的。总色差ΔE*值高低为乌龙茶<绿茶<湖南黑茶<红茶。有研究认为不同茶类间汤色的差异是与各茶类制作工艺不同紧密相关的[9]。红茶全发酵,黑茶和乌龙茶发酵程度次之,而绿茶不发酵。茶叶发酵过程中主一些主要色素物质的变化最终导致茶叶色泽的差异。由此可见,湖南黑茶与绿茶、乌龙茶和红茶的汤色各具特色,差异较为明显。

2.2 湖南黑茶与其他不同产地黑茶茶汤色泽的差异

中国黑茶除了湖南安化盛产外,还有湖北的青砖茶、云南的普洱茶、广西的六堡茶以及四川的藏茶等。基于F-检验方差齐性分析的结果,对于湖南黑茶与其他产地黑茶茶汤色度值的比较,本实验采取t-检验的方差分析策略,结果见表2。不同产地黑茶间,生普的ΔL*值最大,汤色最明亮,其次是湖南黑茶与青砖,而藏茶、六堡茶和熟普偏暗;湖南黑茶除与生普的Δa*差异不显著外,与六堡茶、青砖、藏茶和普洱茶等其他产地黑茶比较,Δa*、Δb*和ΔE*基本达到极显著差异水平;色度衍生值b/a和Hab湖南黑茶与其他产地黑茶差异不大,而Cab和Sab它们二者间差异显著(p<0.05,p<0.01)。聘请5名专业评茶师对实验茶叶样本进行盲样评审,评审结论是湖南黑茶汤色总体以橙黄为主,略带红色,汤色明亮为佳,六堡茶红浓偏暗,青砖黄红,藏茶红黄尚亮,新制生普黄绿亮,而熟普橙红或深红,接近红茶。上述分析表明,湖南黑茶与其他产地黑茶在茶汤色度值上有差异,能反映出湖南黑茶汤色的品质特点,且与感官评审结果基本一致。

2.3 基于茶汤色度值的湖南黑茶分类回归树CART模型的研究

分类回归树CART是一个有监督的学习算法,它根据对训练集数据的运算生成的。本方法用已知茶类的51个茶叶样本作为建立区分不同茶类CART树的训练集,将不同茶类样本划分4个因变量(分类变量)Yi,即黑茶、绿茶、乌龙茶和红茶;用已知产地的39个黑茶样本作为建立区分不同产地CART树的训练集,将不同产地黑茶样本划分6个因变量(分类变量)Yi,即湖南黑茶、湖北青砖茶、云南生普、云南熟普、广西六堡茶以及四川藏茶。ΔL*、Δa*、Δb*、ΔE*、b/a、Cab、Sab、Hab这八个参数反应了每个茶汤色泽在颜色空间上的差异性,我们把它们作为自变量Xi,即X1=ΔL*,X2=Δa*,X3=Δb*,X4=ΔE*,X5=b/a,X6=Cab,X7=Sab,X8=Hab。将数据导入软件,通过程序自动选择变量和确定变量阈值,分别建立起黑茶与其他茶类的茶叶分类(见图1A)和湖南黑茶与其他产地黑茶的茶叶分类(见图1B)的两个CART分类树模型。两个模型均已经过程序自动阈值的剪枝处理,从而避免树过拟合的现象,得到最优二叉树。从CART分类树图1A看出,按照Hab值是否大于或小于等于-0.440为根节点开始分割树,最后生成3个终结点树状分支图。汤色的8个色度值及其衍生值中Hab、ΔL*、Sab和ΔE*对于不同茶类的区分贡献较大。而Δa*、Δb*、b/a 和Cab在模型构建中因影响小被淘汰掉。从CART分类树图1B看出,以Δa*值是否大于或小于等于1.225为根节点开始逐级分割树。汤色的8个特征变量中Δa*、Δb*、ΔL*和Cab对于不同产地的区分贡献较大,而ΔE*、b/a、Hab和Sab在模型构建中因影响小而被忽略。

图1 湖南黑茶CART分类树模型可视化分类图Fig.1 CART model visual classification graphics of Hunan dark tea

对于建立的两个CART树模型,我们分别随机抽样一定量未知样本组成测试集对模型分类性能进行测试评价。首先采用本文介绍的方法测定测试集中各茶样汤色的色度值,并计算出它们相应的色度衍生值。然后采用CART树A模型,将模型各层级节点的特征变量值与各茶样对应的色度值自上而下依次比较,每个节点都一分为二直至将黑茶与其它不同茶类区分开来。最后将区分得到的黑茶样本采用CART树B模型进行二次区分,采用相似的方法对比树模型节点的特征变量值与样本的色度值,从而将湖南黑茶与其他不同产地的黑茶区分开来。验证结果表明:由4个不同茶类共18个茶叶样本组成的不同茶类测试集,CART树A模型能全部正确识别出18个样本中的黑茶、绿茶、乌龙茶和红茶,识别正确率达到100%;由5个不同产地共15个黑茶样本组成的不同产地测试集,CART树B模型能正确识别出其中的7个湖南黑茶,1个误判为湖北青砖茶,识别正确率达到93.3%。

3 结论

3.1 采用CIE l976-L*a*b*表色系的色差法来表征茶叶汤色品质具有良好的真实表达性。有报道分析认为CIE l976L*a*b*表色系是茶叶色泽数量化测定的最佳表色系[1]。在测定干茶或叶底色泽时,由于色差计所测量光区范围很小(一般直径10mm左右),而茶叶外形和叶梗比例都不尽相同,其微区域样本的代表性受到影响。即使将茶叶粉碎,测定结果也只是样本色泽信息的平均理论值,与实际茶叶还是存在一定的差异。而茶汤与干茶或叶底情况不一样,茶叶内含物在水相中分散一致,样本均匀性和代表性很好,所以茶汤的色度值能较真实的反映出茶叶本身的整体品质,具有良好应用。

3.2 本实验结果表明,湖南黑茶与六堡茶、青砖、藏茶、生普和熟普等不同产地的黑茶间及湖南黑茶与绿茶、乌龙茶和红茶等不同茶类间进行对比分析,结果显示在测定的色度值及计算的色度衍生值上都存在着不同的明显差异,且色度值与感官评审结果具有较好的对应性。值得一说的是,色度值仅是将汤色品质数量化,不同类型茶样间色度值的差异仅是茶样汤色的特点表现,其数值高低并不能说明汤色品质的好坏。因为从感官审评的定性描述来看,它们大多汤色品质良好。所以采用色差法得到的色度值可以表征黑茶汤色品质,但直接对应汤色品质的优劣还有待研究商榷。

3.3 逐步判别分析要求原始变量在各组内具有近似正态分布,同时具有相同的协方差矩阵等条件,而实际中很多数据不能满足其算法条件,使其统计结果误差偏大。再者对于二次判别函数和非参数判别分析,由于其计算复杂,使其在应用中受到限制。而分类树CART算法作为数据挖掘中重要的分析方法,由于其算法是非参数,非线性的,加之其判别准则以图形化结果呈现,结果易于表述与解释。同时此法不会比其他复杂方法如判别分析、逻辑回归或线性回归准确性差[20]。本实验表明,分类树CART法用于湖南黑茶的茶类间和产地间的分类识别误判率低,是一种简单实用的产品表征判别新技术。需要注意的是,使用分类回归树CART建模要考虑分类变量间样本数量的平衡性。这是因为模型的评价标准主要是基于整体精度,当训练集样本中各类比例严重失调时,在形成分类规则时自然会“偏袒”训练集中的多数类,而少数类的某些关键特征有可能被忽略,从而造成模型预测小数量样本易失效的情况。

[1]严俊,林刚.测色技术在茶叶色泽及品质评价中的应用研究[J]. 茶业通报,1995(1):7-9.

[2]易克传,岳鹏翔,陈全胜,等.基于聚类分析的计算机视觉对茶叶色泽的识别[J]. 中国茶叶加工,2006(2):39-41.

[3]蒋帆,乔欣,郑华军,等. 基于高光谱分析技术的机炒龙井茶等级识别方法[J]. 农业工程学报,2011,27(7):343-348.

[4]周小芬,叶阳,周竹定,等.基于近红外光谱法的大佛龙井茶品质评价研究[J]. 光谱学与光谱分析,2012,32(11):2971-2975.

[5]陈全胜,赵杰文,蔡健荣,等.支持向量机在机器视觉识别茶叶中的应用[J]. 研究仪器仪表学报,2006,27(12):1704-1706.

[6]赖凌凌,郭雅玲.福建绿茶色度值与茶汤呈色物质的相关性分析[J]. 热带作物学报,2012,33(1):157-161.

[7]梁月荣,罗德尼·毕.名茶茶汤光谱特性初探[J]. 茶叶,1991,17(2):44-46.

[8]蔡健荣.利用计算机视觉定量描述茶叶色泽[J]. 农业机械学报,2000,3(14):67-70.

[9]陆建良,梁月荣,龚淑英,等.茶汤色差与茶叶感官品质相关性研究[J]. 茶叶科学,2002,22(1):57-61.

[10]李洁,齐桂年.利用计算机读取整茶色泽参数的方法研究[J]. 茶叶科学,2007,7(4):328-334.

[11]赖凌凌,郭雅玲.L*a*b*表色系统与绿茶汤色的相关性分析[J]. 热带作物学报,2011,32(6):1172-1175.

[12]王玉霞,徐荣荣,任广鑫,等.绿茶茶汤中主要品质成分近红外定量分析模型的建立[J]. 茶叶科学,2011,31(4):355-361.

[13]蔡健荣,吕强,张海东,等.利用近红外光谱技术识别不同类别的茶叶[J]. 安徽农业科学,2007,35(1):4083-3084.

[14]李晓丽,何勇,裘正军.一种基于可见-近红外光谱快速鉴别茶叶品种的新方法[J]. 光谱学与光谱分析,2007,27(2):279-282.

[15]李立祥,梅玉,常珊,等.绿茶汤色分析[J]. 食品与发酵工业,2005,31(10):123-126.

[16]王同和,周杰,窦立耿,等.绿茶表色及感观审评用色卡方法的研究[J]. 安徽农业大学学报,2006,33(2):261-267.

[17]谭超,刘华戎,龚加顺,等.不同原料对红茶茶膏理化感官及色差的影响[J]. 中国农学通报,2013,29(21):195-199.

[18]董青华,孙威江,张孔碌,等.基于茶汤色差和pH的乌龙茶产品判别[J]. 福建农林大学学报(自然科学版),2012,41(4):470-475.

[19]龚淑英,鲁成银,刘栩,等. GB/T 23776-2009.茶叶感官审评方法[S]. 北京:中国标准出版社,2009,3-5

[20]梁逸曾. 复杂体系仪器分析—白、灰、黑分析体系及其多变量解析方法[M].北京:化学工业出版社,2013:230-233.

Study on characterization of dark tea liquor quality based on CART

LI Yong-jun1,2,WANG Mei-ling1,2,YAN Hong-fei1,BAI Xiu-zhi2,ZHU Shao-hua1,2,DAI Hua1

(1.Inspection and Quarantine Technology Center,Hunan Entry-Exit Inspectionand Quarantine Bureau,Changsha 410004,China;2.Hunan Key Laboratory of Food Safety & Science Technology,Changsha 410004,China)

The chromatic values of Black Tea,Green Tea,Oolong Tea and different origin of Dark tea liquor were analysed. Based on the characteristic variables extracted from the chromaticities,the CART model was established to classify tea area and type. The results were as follows:Comparison difference with green tea,oolong tea and black tea was made. Hunan dark tea and oolong tea in Δa*had no difference,but the other chromaticity values were significantly different among four tpyes of tea. There were significant difference of ΔL*,Δa*,Δb*and ΔE*among Hunan dark tea with Liubao tea,Qing zhuan tea,Tibetan tea,Unzymic Pu-er tea and zymic Pu-er tea,in addition to Qing zhuan tea’s ΔL*and Unzymic Pu-er tea’s Δa*. The prediction set was used for evaluating the model quality.The accuracy of discriminant functions for type and producing area were respectively reached 100% and 93.3%.Therefore,the better effect of classification and recognition could be obtained by used the CART model based on the chromatic values.

Hunan dark tea;tea liquor color;chromaticity;CART

2014-05-29

李拥军(1971-),男,博士,研究员,研究方向:食品安全监测。

国家质检总局科技计划项目( 2012IK160)。

TS272

A

1002-0306(2015)05-0078-05

10.13386/j.issn1002-0306.2015.05.007

猜你喜欢

汤色茶类乌龙茶
茶类植物在园林景观艺术设计中运用
不同茶类加工工艺对福建水仙茶儿茶素组分和生物碱的影响
温度对茶发酵叶色泽及茶色素含量的影响
茶类产品央卫视广告投放分析
乌龙茶秋季采摘时期调节技术研究
每个人心中都有一只燕子
每个人心中都有一只燕子
茶类词汇英译翻译策略及成因
茶饮料汤色稳定性中主成分分析与聚类分析的应用探析
近年乌龙茶做青工艺的发展研究