基于色差系统的宝庆桂丁红茶品质量化评价模型构建
2022-08-03杜邵龙周志梅雷亚兰田容积
杜邵龙,周志梅,雷亚兰,李 瑾,田容积,唐 瀚,
(1.湖南兴盛茶业科技有限公司,湖南邵阳 422900;2.湖南师范大学化学化工学院,湖南长沙 410083;3.邵阳市农业科学研究院,湖南邵阳 422000)
茶叶色泽是茶叶等级划分的主要指标之一,在茶叶感官审评法中外形、汤色和叶底三项审评因子都与颜色有关[1]。茶叶的色泽一直茶叶感官审评的难点之一,其审评结果不仅与审评专业人员主观喜好有关,还受到光线、审评器具等外部环境因素的干扰[2]。为尽可能消除人为因素对茶叶品质分析结果的干扰,广大茶学研究学者尝试采用茶汤色差值对茶叶品质进行定量化表征[3-6]。余书平等[7]对小叶种红茶发酵过程中发酵叶色差及儿茶素、茶黄素等成分进行跟踪检测,发现发酵叶色差与茶样感官品质和相关生化成分均呈现显著性相关。杨娟等[8]测定了福鼎大白等10 个茶树品种原料制成的工夫红茶干茶、汤色和叶底色泽,并分析了各色泽L、a、b值与审评因子得分、色素含量和总得分的相关性,结果显示红茶试样的感官审评评分与茶汤、叶底的色差均有较高的相关性。王家勤等[9]对26 个产于福建地区的工夫红茶的43 个茶汤样品进行色差分析,并结合多变量分析和线性回归拟合,建立茶汤亮度预测方程。陈星等[10]测定了滇红、祁红等8 种工夫红茶的茶汤色差、色素含量,并与感官审评评分进行相关性分析,结果显示采用亨特-Lab 表色系表色法能够较为准确、快速地反映茶汤色品质特点。以上研究都明确证实了茶叶色差与感官品质之间存在显著相关性,但目前的研究主要针对特定品种红茶的色差值与品质的相关性,且主要分析茶汤色泽,如需推广至其他品种红茶,需要根据具体品种色差值进行校正[11]。茶叶品质的影响因素众多,例如茶叶品种、种植环境和加工工艺等,各个因素与茶叶品质多是非线性对应关系,但目前的研究主要采用线性回归拟合的方法,难以满足茶叶品质分析的要求。
人工神经网络是人工智能的重要分支,采用并行分布式系统,具有自适应、自组织和实时学习的特点,在理论上可实现任意函数的逼近[12]。神经网络能够根据视觉图像处理[13]、电子舌[14]、电子鼻[15]、近红外光谱[16]等分析结果,实现对茶叶品质的准确评价。BP(Back Propagation)神经网络是人工神经网络中最为经典的模型之一,但由于BP 神经网络采用梯度下降法,容易出现收敛速度慢,陷入局部极值等缺点[17]。遗传算法(Genetic Algorithms,GA)是模拟自然界遗传和生物进化论的一种随机搜索优化算法,具有良好的全局寻优能力[18]。利用遗传算法生成BP 神经网络的权值和阈值,能够提高BP 神经网络的泛化和学习能力,从而改进神经网络的整体搜索效率[19]。
宝庆桂丁茶是湖南省新邵县特有的茶树品种,历史上曾是明清两朝贡茶。宝庆桂丁红茶是湖南兴盛茶业科技有限公司在湖南农业大学和邵阳市农科院茶科所指导下,借鉴湖南红茶工夫红茶加工技术规程,自主研发的新品类[20]。宝庆桂丁红茶花蜜香浓郁,滋味鲜爽,回味甘甜,品质优异。目前,关于宝庆桂丁红茶的品质研究还处于起步阶段,相关研究还鲜有报道。本文在感官审评的基础上,测定了不同等级宝庆桂丁红茶干茶、茶汤和叶底的色泽,利用GABP 神经网络建立宝庆桂丁红茶品质量化评价模型,以期为宝庆桂丁红茶品质评判和工艺优化提供数据支撑。
1 材料与方法
1.1 材料与仪器
供试的110 份宝庆桂丁红茶 全部由湖南兴盛茶业科技有限公司提供,2021 年3 月至6 月采自湖南省新邵县巨口铺镇,参照湖南红茶工夫红茶制作规程生产制作,按照采制时间顺序编号为1~110 号;试验用水 为农夫山泉天然饮用水。
NH300 电脑色差仪、色差仪多功能测试组件深圳市三恩时科技有限公司;FA1004 电子分析天平上海力辰邦西仪器科技有限公司。
1.2 实验方法
1.2.1 感官审评方法 参照《GB/T 23776-2018 茶叶感官审评方法》[21],称取3 g 茶样,用沸水150 mL 冲泡5 min 后,将茶汤倒入审评碗。由7 名专业审评人员分别对茶样的外形、汤色、香气、滋味和叶底进行感官审评,具体标准见表1。综合得分采用权数法:外形20%,汤色10%,香气30%,滋味30%,叶底10%。去除最高分和最低分后,余下的5 个审评结果取平均得到最终审评结果。
表1 宝庆桂丁绿茶感官评定标准和评分系数Table 1 Sensory evaluation standards and score coefficients of Baoqing guiding green tea
1.2.2 茶汤和叶底色差的测定方法 参照陆建良等[22]提出的方法。感官审评余下的茶汤经滤纸过滤后,冷却至40 ℃,倒入万能测试组件配备的石英比色皿,以蒸馏水为对照,用NH300 电脑色差仪测定色度,重复5次,取平均值。将冲泡后的红茶叶底置于万能测试组件的粉末测试盒,用NH300 电脑色差仪测试色度。色差值采用CIE-1976 色差系,测定三个分量L、a、b。
1.2.3 干茶色泽的测定方法 参照严俊等[23]提出的方法。取茶样10 g,用粉碎机粉碎后,过100 目筛。取5 g 茶样,置于万能测试组件的粉末测试盒中测定色差值。用NH300 电脑色差仪测试色度,测量5次,记录L、a、b值,取平均值。
1.3 数据处理
采用EXCEL 和SPSS 26.0 软件对试验数据进行分析处理。采用MATLAB2020b 软件进行GABP 神经网络构建,随机取110 份茶样中的88 份测试结果用于评价模型的建立,余下22 份用于模型的验证。
2 结果与分析
2.1 宝庆桂丁红茶的色差测试的描述性分析
对110 个宝庆桂丁红茶茶样分别测试了干茶、汤色和叶底的色差值,并进行了描述性分析,结果见表2。
表2 宝庆桂丁红茶色差结果描述性分析Table 2 Descriptive statistics of color difference analysis of Baoqing guiding black tea
表2色差分析结果显示,宝庆桂丁红茶汤L值在64.25~76.26 之间,平均值为68.95,a值在16.16~25.73,平均值为22.33,b值在60.88~77.34,平均值为71.58。根据CIE-LAB 表色体系,L值越大,说明茶汤的亮度越高,a值越大则颜色偏红,b值越大则颜色偏黄[24],因此,宝庆桂丁红茶茶汤呈现出橙黄明亮的特征。
宝庆桂丁红茶干茶的L值在16.29~19.55 之间,平均值为17.77,a值在2.15~3.14 之间,平均值为2.66,b值在4.08~4.92 之间,平均值为4.52。因此,宝庆桂丁红茶的干茶颜色特征为黑色,符合乌黑油润的颜色描述。
宝庆桂丁红茶叶底的L值为24.28~26.33,平均值为25.02,a值为8.24~11.06,平均值为9.79,b值为9.04~16.35,平均值为12.84。因此,宝庆桂丁红茶的叶底颜色特征为红褐色。
2.2 宝庆红茶色差与品质的相关性
2.2.1 宝庆红茶汤色与品质的相关性分析 对宝庆桂丁红茶茶汤色差与品质的相关性进行了分析,结果见表3。
表3 宝庆桂丁红茶茶汤色差与品质相关性分析Table 3 Analysis on correlation between infusion color and quality of Baoqing guiding black tea
从表3 的结果可以看出,宝庆桂丁红茶汤色指标、综合品质这两个指标均与茶汤的L值呈极显著的负相关(P<0.01),而与a值和b值呈极显著正相关(P<0.01)。且茶汤的L、a、b值之间呈极显著相关性(P<0.01),其中L值与a、b值之间为负相关,a和b值之间呈正相关。
2.2.2 干茶色泽与品质的相关性分析 对宝庆桂丁红茶的干茶色泽与品质之间的相关性进行了分析,结果见表4。
表4 宝庆桂丁红茶干茶色差结果相关性分析Table 4 Analysis on correlation between tea color and quality of Baoqing guiding black tea
从表4 的结果来看,宝庆桂丁红茶茶叶外形指标与综合品质这两个指标与干茶的L和b值相关性较低,而干茶的a值与外形和综合品质都呈显著正相关(P<0.05),这可能与茶叶外形审评时,不仅仅看色泽,还需要考虑茶叶的紧细度和净度等其他指标有关[25]。干茶的L、a、b值之间存在一定的相关性,其中L值与a、b值之间为负相关,a和b值之间呈正相关。
2.2.3 叶底色泽与品质的相关性分析 对宝庆桂丁红茶叶底色泽与品质的相关性进行了分析,结果见表5。
从表5 的结果可以看出,宝庆桂丁红茶叶底指标和综合品质这两个指标与叶底的L值均呈极显著负相关(P<0.01),而与a值和b值呈极显著正相关(P<0.01)。且叶底的L、a、b值之间呈极显著相关性(P<0.01),其中L值与a、b值之间为负相关,a和b值之间呈正相关。
表5 宝庆桂丁红茶叶底色差结果相关性分析Table 5 Analysis on correlation between leaves’ color and quality of Baoqing guiding black tea
从以上相关性分析得出,茶叶的茶汤、叶底和综合品质指标与茶汤和叶底三者的L、a、b值之间呈极显著相关性(P<0.01)。这是因为在对茶汤和叶底进行感官审评时颜色是最重要的审评标准,茶汤要求是橙红或橙黄明亮,而叶底则要求红匀明亮。因此,采用茶叶色差值作为茶叶品质的评价方法是可行的。
2.3 基于神经网络的宝庆桂丁红茶品质量化评价模型的构建
2.3.1 神经网络的选择 为了选择合适的神经网络,对BP 神经网络和GA-BP 神经网络的拟合情况进行了比较,结果见图1 和图2。两个神经网络的结构均为9-5-1 结构,即隐含层的节点数为5。其余神经网络结构参数为:神经网络算法为Levenberg-Marquardt算法,最大循环次数为1000次,学习速率为0.1,方差目标为0.0001。遗传算法初始化参数为:种群规模为10,进化迭代数为200,染色体编码长度为55,学习因子为C1=C2=1.5,交叉概率为0.4,变异概率为0.1。本文将110 组数据的80%(即88 组)划分为训练集、验证集和测试集,分别为62 组、13 组和13 组数据,用于模型的构建,余下的22 组数据作为预测集进行模型的验证。
图1 BP 神经网络和GA-BP 神经网络的拟合效果对比Fig.1 Comparisonof fitting ability of BP network and GA-BP network
图2 GA-BP 网络残差分析图Fig.2 Residual analysis of GA-BP network
从图1 中可以看出,BP 网络和GA-BP 网络都具有较好的拟合精度,决定系数R2都大于0.9。在相同的数据和神经网络结构情况下,GA-BP 网络的训练、验证、测试和预测的决定系数(R2)都明显高于BP 网络,说明GA-BP 网络的训练和拟合效果要优于BP 网络。GA-BP 网络采用遗传算法(GA)对BP 神经网络连接权值和阈值进行优化,利用遗传算法全局搜索最优解的算法,将BP 神经网络最优解的搜索范围缩小到一个较小的解空间,使得网络训练过程中收敛速度加快,同时解决BP 神经网络容易下入局部最优的问题[26]。
从图2 和图3 可以看出,2 种模型的测试集和预测集样本拟合结果的标准残差大部分都落在[-2,2]的95%置信区间内,标准残差点的分布没有明显规律,均匀地分布在0 的两侧,表明拟合结果误差服从正态分布,具有很好的随机性,模型的选择是合适的。
对比图2 和图3 可以发现,GA-BP 网络的训练集和预测集的残差也明显优于BP 网络。GA-BP 网络的训练和预测的残差全部均匀地落在[-1,1]区间内,而BP 网络的训练的残差也大多落在[-1,1]区间内,大约有不到10%的残差落在[-1,1]区间之外,但预测的残差波动相对大一些,22 个预测残差绝对值中有3 个超过1,其中两个甚至超过2。这表明GA-BP 模型的拟合精度比BP 模型高,GA-BP 模型更适合于对宝庆桂丁红茶品质量化模型的构建。
图3 BP 网络残差分析图Fig.3 Residual analysis of BP network
2.3.2 GA-BP 神经网络模型的构建 为了进一步优化GA-BP 模型的结构,在[3,8]范围内对不同隐含层节点数GA-BP 神经网络分别进行5次训练、验证、测试和预测,取5次的决定系数(R2)进行分析,结果见图4。从图4 的结果可以看出,GA-BP 模型的训练效果都非常好,隐含层的增加对训练结果影响不大,所有拟合的决定系数都在0.99 左右。但隐含层节点数对验证、测试和预测的决定系数影响较大,且都呈现先增大而后减少的趋势,在隐含层节点数为5 时达到最大值,验证、测试和预测的平均决定系数分别为0.973、0.988 和0.962,因此选择隐含层节点数为5 进行模型的构建。
图4 不同隐含层节点数拟合比较Fig.4 Comparison of fitting ability of different hidden layer nodes
对GA-BP 模型构建过程的均方误差(RMSE)进行观察,结果见图5。从图5 的结果可以看出,在GA-BP 神经网络训练的初期,训练、验证和测试的均方误差在第2次训练RMSE 即下降至0.1 以下,而后验证和预测集的RMSE 基本保持不变,训练集的RMSE 仍持续下降至0.01,在训练至第8次时,验证的RMSE 开始上升至0.1 左右。从网络的均方误差变化情况来看,在模型训练的后期可能存在一定的过拟合情况,导致验证的误差开始变大。通过对隐含层节点数的观察,最终的GA-BP 神经网络采用9-5-1 的3 层网络结构。
图5 GA-BP 神经网络训练曲线图Fig.5 Training curve of GA-BP network
图6是88 组数据在模型训练时的拟合效果,可以看出,GA-BP 模型的训练集、验证集和测试集的决定系数R2都大于0.9,说明该模型能够较好地完成输入数据与输出数据之间的非线性映射。训练集的决定系数最大,验证集的决定系数次之,测试集的决定系数最小,这样反映出GA-BP 神经网络在训练过程中存在一定的过拟合。结合图1 的对比结果也可以发现遗传算法的引进,对于BP 神经网络存在的过拟合情况也有一定程度的改善,模型测试的决定系数也达到0.933。未来,我们将通过增加数据组数和算法优化等方面的努力,进一步提高模型的预测能力,解决过拟合现象。
图6 GA-BP 神经网络拟合优度图Fig.6 Goodness of fit of GA-BP network
2.3.3 模型的预测结果分析 为了验证所构建的GA-BP 模型的预测精度,将22 组数据对模型进行验证,结果见图7。
图7 GA-BP 模型预测值与感官审评值的比较图Fig.7 Comparison of model predict value and sensor evaluation
从图7 中可以看出,虽然预测的决定系数仍然小于模型训练和验证的决定系数,但达到0.95,说明GA-BP 模型的预测性能是比较好的,可以准确地反映宝庆桂丁红茶品质情况,所构建地宝庆桂丁红茶品质量化评价神经网络模型是可靠的。
3 结论
茶叶色泽的审评普遍是通过人眼观察,并结合经验进行感官审评,不仅受到感官审评环境(亮度等)的影响,也容易受个人喜好所左右[27-28]。为了提高红茶品质评价的客观性,本文在感官审评的基础上,用色差仪对宝庆桂丁红茶的干茶、茶汤和叶底的色差值进行测定,并利用GA-BP 神经网络构建量化评价模型。研究结果表明:
宝庆桂丁红茶的感官审评因子和综合品质与茶汤和叶底的L、a、b值之间呈现极显著相关性(P<0.01),与干茶的L、a、b值之间相关性不显著。这说明感官审评在进行汤色和叶底审评时重点关注颜色,而对外形审评时不仅关注颜色,还有外形精细、显毫等其他维度。这也表明,利用茶叶色差值对茶汤和茶叶的颜色进行检测能够反映茶叶品质的优劣,因此基于色差值构建量化评价模型是可行的。
通过对比GA-BP 神经网络和BP 神经网络,可以发现通过遗传算法GA 的引进能够较好地解决BP 神经网络局部优化和收敛速度低等问题,更好地反映色差值与茶叶品质之间的非线性映射关系[29]。
通过对比不同隐含层的拟合效果,优选出9-5-1的网络结构,验证、测试和预测的平均决定系数分别为0.973、0.988 和0.962。对构建的GA-BP 神经网络模型的预测能力进行验证,发现该模型预测值与感官审评值的决定系数达到0.95,说明该模型具有可接受的预测网络输出的能力,且误差较小。
本文采用GA-BP 神经网络对茶叶色差值与感官审评综合品质评价得分进行非线性关联,对茶叶品质的色差分析以及非线性数学模型的构建进行了探索,为茶叶品质评价提供了新的思路和方法。课题组也发现因为所构建遗传算法和神经网络模型属于“黑箱”模型,无法揭示色差值与茶叶品质的内在关联关系,因此,构建的模型在理论上只能针对特定茶叶品种[30]。另外,神经网络容易出现过拟合的现象,也是在进一步优化模型算法时需要关注的方向。