基于主成分与聚类分析的樱桃番茄品质综合评价
2021-12-26周艳超葛海燕陈火英
周艳超,薛 坤,葛海燕,陈火英,刘 杨
(上海交通大学 农业与生物学院,上海 200240)
樱桃番茄俗称小番茄,果实富含氨基酸、维生素和矿质元素[1]。近年来,其消费量和种植规模逐年增加,新品种层出不穷。目前围绕番茄的品质改良已从环境调控[2-3]、转基因[4]和QTL定位[5]等方面进行了广泛研究,而在番茄品质评价和鉴定方面仅局限在品质性状与农艺性状的相关分析、综合评价指标的选择和聚类分析阐明番茄资源的遗传多样性[6]。已有的评价体系大多基于模糊数学的隶属函数法[7-8],指标权重的确定具有主观性,然而鲜食樱桃番茄的品质一般包括外观、风味、口感、营养物质等,其品质优劣的鉴定需要多指标的综合评价。主成分分析法是综合评价的一种有效方法,它可将多个有一定相关性的变量转化为几个互不相关的综合变量,其方差贡献率可作为权重构建可量化的综合评价体系。张春岭等[9]将标准化后的原15项品质指标值代入5个主成分表达式,再以主成分的方差贡献率作为权重计算出桃汁的综合主成分得分。汤兆星[10]也用此方法分析评价了19个酿酒葡萄,筛选出综合得分最高的赤霞珠,其具有最佳的酿酒适宜性。本研究以29份樱桃番茄杂交组合为试材,测定14项品质相关指标,通过因子分析结合聚类分析筛选评价指标,综合主成分分析得出综合评价得分,用系统聚类分析和判别分析建立樱桃番茄品质判别函数模型。首次建立了樱桃番茄的综合评价体系,为樱桃番茄品质评价提供了新思路。
1 材料与方法
1.1 试验材料与采样
29种樱桃番茄杂交组合在2018年1—6月种植于上海市浦东新区富农种业公司大棚。采用双行区、随机区组设计,设置3次重复。每个小区定植30株,株行距为35 cm×60 cm,气候、立地条件、田间管理一致,确保了果实品质间差异只来源于不同杂交组合间。供试材料性状及来源如表1所示。每个杂交组合从3株材料选取同一成熟期果实进行试验。
1.2 方法
1.2.1 非组分指标测定
单果重用电子天平测量,果实横径、纵径、梗洼、果梗长度用游标卡尺分别测定,重复5次取平均值。可溶性固形物用手持测糖仪测量,果实硬度用数字硬度计测定。
1.2.2 理化指标测定
可溶性糖、可滴定酸分别采用蒽酮比色法、酸碱滴定法测定;抗坏血酸依据GB5009.86—2016《食品安全国家标准 食品中抗坏血酸的测定》以2,6-二氯酚靛酚滴定法测定;番茄红素依据NY/T1614—2008《中华人名共和国农业行业标准 蔬菜及制品中番茄红素的测定》采用高效液相色谱测定;可溶性蛋白依据GB5009.5—2010《食品安全国家标准 食品中蛋白质的测定》以凯氏定氮法测定。
1.3 统计分析
试验数据采用Excel 2016、IBM SPSS 24.0软件进行统计分析。主成分法进行因子分析,最大方差法对因子旋转,以旋转后的特征向量结合对指标的聚类分析筛选评价指标[11]。判别分析基于Fisher原理,并对模型进行交叉验证。
2 结果与分析
2.1 不同樱桃番茄杂交组合的变异分析
如表2,品质测定结果表明多项指标观测值之间存在较大程度的变异。其中以番茄红素变异系数最大,达59%,VC次之为42%。糖酸比、可溶性糖、单果重、梗洼变异系数也相对较高,分别为35%、34%、27%、25%。遗传变异最为丰富的指标在品种选育中有更高的选择潜力。本实验中,营养品质的变异系数大于横径、纵径、果形等外观指标变异系数,这表明通过杂交育种培育营养品质优良的品种是可行的。
表1 供试材料种质性状及来源
表2 樱桃番茄品质性状分布
2.2 品质性状的主成分分析
以特征值大于1,方差贡献率大于80%为标准对14个品质性状进行主成分分析。图1的碎石图中位于陡坡的主成分特征值大,所含信息量大。本实验中前5个主成分特征值均大于1并位于陡坡,且表3中这5个主成分累积方差贡献率达79.05%,代表了樱桃番茄近80%的遗传信息。因此,可用这5个主成分代表14个品质指标评价樱桃番茄综合品质。
图1 主成分分析碎石图
表3 总方差的解释
2.3 主成分的解释和评价指标的选择
对品质指标进行系统聚类可从多维度筛选评价指标[10,12]。用主成分法进行因子分析时,主成分即为因子,可根据旋转后的载荷矩阵对主成分进行解释。由表4可知第一因子反映原始数据信息量的21.88%,其中单果重、横径、梗注与果实大小相关的指标因子载荷都在0.86以上,其余指标载荷大多低于0.3。果实的产量由结果数和单果重决定,提高其一即可显著增产。因此,第一因子可定义产量因子。由于单果重因子载荷最大,和纵径、横径高度正相关并且在聚类分析(图2)中和纵径、横径等反映果实大小的指标聚为一类,因此可用单果重代表产量因子。第二因子方差贡献率16.14%,决定其大小的指标主要是糖酸比、可溶性糖,载荷值分别为0.899、0.838。这两个指标和番茄风味密切相关,可定义为风味因子。由于糖酸比因子载荷更大,可代表风味因子。第三因子方差贡献率16.08%,各指标载荷相差不大,仅有蛋白质、可滴定酸和硬度相对突出,在图2的聚类分析中硬度和可溶性固形物聚为一类,两者都能反映番茄口感,所以将第三因子定义为口感因子。硬度是口感的主要来源,因此可用硬度代表口感因子。第四因子方差贡献率14.21%,它在果形指数、纵径、果梗长度上的载荷值较大,聚类分析中将果形指数、梗洼、果梗长度聚为一类而这三者都反映了果实外观,因而我们称其为外观因子。果形指数因子载荷远大于其他指标,并且果形指数与构成果实外观的纵径、横径高度相关,所以选择果形指数代表樱桃番茄外观品质。第五因子方差贡献率为10.74%。番茄红素、可溶性固形物、抗坏血酸(VC)这三个和营养密切相关的指标具有最大的载荷值,因此,可定义为营养因子。聚类分析中三者划为一类但是可溶性固形物主要由糖酸物质组成,反映果实风味。而番茄红素和VC是番茄中重要的营养物质,且两者因子载荷相差不大,所以用番茄红素和VC代表营养因子。
表4 旋转后的成分矩阵
图2 指标间的聚类分析
2.4 主成分综合评价
各因子所对应的方差贡献率与提取出的总方差贡献率(79.05%)的比值作为权重[11],得出主成分综合评价模型:VSCORE=0.278VFAC1+0.204VFAC2+0.229VFAC3+0.180VFAC4+0.136VFAC5。其中,VSCORE、VFAC1、VFAC2、VFAC3、VFAC4、VFAC5分别代表SCORE、FAC1、FAC2、FAC3、FAC4、FAC5的值。根据29份樱桃番茄组合的各因子得分和主成分综合得分,对5个因子综合得分排序,可直观地判断出各个杂交组合在综合品质和5个因子上的品质差异,从而筛选出综合品质或某一方面品质突出的优良品种。表5可知,FN208、FN402、FN403综合得分位居前三,具有更好的综合品质,FN401、FN112、FN207综合得分位于最后,品质最差。FN403产量因子(FAC1)排名第一,具有最好的丰产性。
表5 樱桃番茄综合主成分得分及排名
2.5 樱桃番茄杂交组合的聚类分析
以14项品质指标为依据,对29种樱桃番茄杂交组合进行系统聚类分析。图3中欧式距离为12.5时将其划分为6类。第Ⅰ类有15个组合,综合品质排名普遍居中。共同特征是单果重18~24 g;可溶性固形物大多在7%~9%;硬度、糖酸比在15~20;可溶性糖5~8 g,这些指标均接近于平均值。第Ⅱ类有7个组合,共同点在于都是高圆形果,单果重接近,硬度较大,拥有相似的外观。这一类各组合间得分差距较大。FN204、FN113、FN404综合得分排名7~9名,属于综合品质优良的组合,这与其果实番茄红素、糖酸比较高有关。而FN110、FN401、FN112综合得分排名26~28,综合品质较差,其中营养品质的差距更为明显。前三者番茄红素在46.70~52.40 mg·kg-1,远高于平均值,而FN110、FN112中则没有检出番茄红素,FN401中也仅有8.40 mg·kg-1。可见这7个组合是因为相似的单果重、外观和口感聚为一类,又因为在营养、风味品质上差异较大导致综合得分相差较大。第Ⅳ类有4个组合,综合得分位居前六。普遍特征是单果重在30 g以上,硬度低于平均值;VC、可滴定酸含量较高;糖酸比中等偏上。综合来看这一类别果实较大、酸甜适中、营养丰富和口感柔软是这批番茄中品质最好的组合。第Ⅲ、Ⅴ、Ⅵ类均只有1个组合,这3个组合均在某几项指标上与其他组合差别较大而单独成一类。聚类分析结果表明,综合得分较高的FN402、FN403这两个极优的组合被单独区分;得分次之的FN101、FN201、FN118聚为一类,这5个组合为适合推广的优良樱桃番茄。品质最差的FN110、FN112、FN114、FN401等被聚为一类,聚类结果与综合主成分得分较为一致。
图3 樱桃番茄杂交组合的聚类分析
2.6 品质判别及分类结果
以29个樱桃番茄杂交组合作为建模样本,强制引入可溶性固形物(C1),把步进法根据自变量贡献大小筛选出的单果重(m)、糖酸比(R)、VC(CVC)作为观测变量;以聚类分析的6个类别(Ⅰ-Ⅵ)作为分组变量[11];运用Fisher准则进行判别分析,得到6个线性判别函数:
Y1=-129.172-0.175m+0.884C1+0.516R+6.984CVC;
Y2=-134.104-0.391m+1.041C1+1.572R+6.534CVC;
Y3=-179.290+0.500m+1.238C1+1.299R+7.255CVC;
Y4=-192.737-0.193m+2.198C1+1.217R+7.620CVC;
Y5=-178.275+1.372m+0.875C1+0.049R+7.139CVC;
Y6=-288.428-0.741m+0.783C1+0.439R+11.065CVC。
将指标的实测值代入上述函数,计算函数值,函数值最大的即为樱桃番茄的品质类别,可用此函数对新样品进行品质判别。表6中自身验证的结果可见第1类的15个组合中仅有1个组合被错判归入第1类,正确判别率达96.6%。交叉验证表明,第1类中有2个组合被错判归入第2类,第2类中有1个组合被错判归入第3类,第3类种归入了来自4、5、6类的各一个组合,总体判别正确率79.3%。可见本研究中6个判别函数的准确率较高,基于聚类结果的判别函数模型较为稳定,能够满足樱桃番茄品质类型的判别需求。图4的联合分布图中4、5、6这三类边界清晰距离较远不太容易错判,而1、2和3、4之间边界接近,错判主要会在这几个类别间发生。第一判别维度上(函数1)六种类别明显区分,然而第二判别维度上(函数2)2,3,4,6这四个类别纵向距离接近,判别效果不如前者。
图4 判别函数联合分布图
表6 品质判别分类结果
3 讨论
本研究对29种樱桃番茄的14个品质性状进行观测与分析,试验结果表明,代表营养品质的番茄红素和抗坏血酸(VC)变异系数较大,可见樱桃番茄营养品质的遗传多样性主要来自品种间差异。而果形指数、可溶性固形物,可滴定酸等指标变异系数较小,选择难度较大。这与张静等[6]、王晓静[13]的研究一致。这可能与番茄的物种特性有关,因此探究基因的表达调控,尤其是发掘控制风味和营养成分的基因对选育优良品种具有重要意义。总体来看这批樱桃番茄存在着果实越小,可溶性固形物越高,番茄的糖、酸含量越高的趋势[14]。绿果番茄与黄果番茄不含番茄红素,但是其VC含量较高,这与常培培等[15]的研究一致。这可能是由于绿果与黄果番茄更接近于野生种,而普通红果番茄驯化较早,长期以产量和风味为筛选指标,忽视了VC等营养指标,造成了驯化植株VC含量相对较低。
主成分分析可将多个相关变量转变为少数几个独立的综合变量,目的是简化评价指标[16]。对指标进行聚类分析时,聚为同一类的指标具有较强的相关性,可选取其中的一个代表其它指标,两者结合能更好地筛选反映事物本质的主要变量[17]。综合评价结果可见,黄果樱桃番茄排名靠后,这可能是因为它果实较小且不含番茄红素。进一步观察发现黄果番茄可滴定酸含量远低于均值,最低仅为0.27%,由此导致黄果番茄口感偏甜,这与前人的研究相符[18]。这可能与黄果番茄生长周期长,糖积累较多而酸则被充分转化有关。FN113在FAC1(产量因子)中表现较差,其他指标均位于前10,属于综合表现优秀的小果番茄。可见综合主成分得分可以从多个角度指导品种选择。
聚类分析既可以反映参试品种的类别特征,也在一定程度上反映品种间亲缘关系。可根据育种目标,考虑遗传距离的远近,选择遗传差异较大的亲本进行杂交以获得更高的遗传变异率[19]。聚类结果显示,相同果色的品种聚在一类,推断原因是我国番茄地方品种形成时间较短,亲本材料来源单一,导致遗传距离接近,品质性状相似。判别分析的目的在于建立一种变量的线性组合来概括分类间的差异,从而根据已知样本的分类情况来判断未知样本的归属问题。它通常与聚类分析联合使用,先通过聚类分析对原来的一批样品分类,再用判别分析建立判别式以对新样品进行判别。本研究以聚类分析结果为分组变量,得出了品质判别函数,自身验证和交叉验证的正确判别率分别达到了96.6%和79.3%,高于目前已建立的苹果[20]判别函数模型的91.6%,龙眼[21]判别模型的70.0%。这可能与后者在判别分析时强制引入较多指标有关。
4 结论
对樱桃番茄14个品质性状进行主成分分析,提取出代表80%遗传信息的5个主成分;因子旋转结合对指标的聚类分析筛选出六个评价指标:单果重、糖酸比、硬度、果形指数、番茄红素和抗坏血酸(VC);通过基于综合主成分得分和聚类分析的综合评价模型筛选出适宜推广的樱桃番茄杂交组合FN208、FN402、FN403、FN101、FN201,为樱桃番茄品质评价和鉴定提供了新思路。