杏杂交后代果实经济性状的主成分分析与聚类分析研究
2019-10-30武晓红陈雪峰景晨娟赵习平
武晓红,陈雪峰,景晨娟,赵习平
(河北省农林科学院 石家庄果树研究所,河北 石家庄 050061)
杏原产我国,现已成为世界性水果之一[1]。随着人们对杏品质的要求越来越高,品种改良成为果树科研工作者的一项重要任务。杂交育种由于其技术简便易行,成效显著,育种者可以有目的地选择亲本,再从杂种后代中选育目标新品种,是最常用的育种手段[2]。我国从20世纪80年代才开始进行有目的的杏杂交育种工作,起步较晚,但已成功选育出一系列新品种[3-6]。杂交后代果实的评价是杂交育种中的一项重要步骤,传统分类方法主要依据个别明显特征进行人为分类,存在着考察性状少、主观因素多、忽略数量性状等局限性,分类结果不尽合理[7]。影响果实品质的因子很多,而且各因子之间存在密切的相关性和相对独立性,给综合评价带来了一定的难度[8]。因此,研究如何科学并快速地评价杏杂交后代果实,对杏杂交育种工作有着重要意义。
主成分分析和聚类分析可以简单地处理大量冗长的数据,实现精度较高的定量分析。因此,已有学者在苹果[9,10]、梨[8]、桃[11]、甜瓜[12]、柑橘[13,14]、核桃[15]、榛子[16]、橄榄[17]等树种上对果实品质进行了分析与评价。在杏上,王佳等对48 个不同杏品种的10 个数量性状进行主成分分析和聚类分析,表明前4个指标的累积方差贡献率可达到87%以上,可以反映10个相关性状的主要信息,并根据综合主成分值对48个杏品种进行排名,排名结果与实际的表现一致;根据计算出的主成分值,48个杏品种可聚为四大类[18]。郭宝林等[19]应用主成分分析法,对仁用杏9个品种的主要经济性状进行分析,认为主成分分析法对仁用杏主要经济性状综合评选比优良性状打分评优科学、简便,为仁用杏优良品种选择提供了理论依据。樊丁宇等[20]对58个新疆杏品种的10个果实品质指标进行了主成分分析和聚类分析,最终将10个主要品质指标简化为6个具有代表性的指标。前人均是对杏种质资源果实品质进行评价与分析,运用聚类分析和主成分分析方法评价杏杂交后代果实经济性状的研究还未见报道。本研究以金太阳×串枝红正反交后代实生苗为试材,对其果实的主要经济性状进行调查,通过主成分分析和聚类分析对杂交果实的经济性状进行综合评价,旨在为评价杏杂交后代果实经济性状提供科学依据,为杏杂交育种研究提供帮助。
1 材料与方法
1.1 试验材料
供试材料为金太阳×串枝红正反交后代实生苗,于2011年杂交,2012年播种,2013年定植于河北省农林科学院石家庄果树研究所杏杂种实生苗圃,株行距1 m×1 m×2 m,2015年杂交实生苗全部结果,2016年对200株杂交实生苗果实进行经济性状调查。于杂交实生苗果实不同成熟期进行采样,分别从每株树体东、南、西、北4个方位中部外围果枝采摘均匀一致的果实10个,将样品果带回实验室后立即进行各个指标的测定。
1.2 试验方法
测定指标有果实发育期、单果重、可溶性固形物、去皮硬度、果皮底色、果实盖色、果实外观、果实内质评价、韧性和香气。按照《杏种质资源描述规范和数据标准》[12]执行。果实发育期:盛花期至果实成熟期所经历的天数(d);单果重:电子天平测定10个果实的重量(g),求平均值;去皮硬度:用FHT-05型果实硬度计测量10个果实的硬度(kgf),求平均值;可溶性固形物含量:用ATAGO牌PAL-1型数显糖度仪测量10个果实的可溶性固形物含量(%),求平均值;果皮底色、果实盖色、果实外观、果肉内质评价、韧性和香气等质量性状,根据育种目标进行赋值。
1.3 数据处理
本文评价杏杂交果实经济性状所涉及到的果实发育期为负指标,取其倒数将其转化为正向指标。以果实发育期、单果重、去皮硬度、可溶性固形物、韧性、果实外观、果肉内质评价、香气、果皮底色和果实盖色构建数据矩阵,当各变量的单位不相同,或者单位相同但变量间的数值大小相差较大时,需将各原始变量做标准化处理。应用Excel 2007和IBM SPSS Statistics 19 统计软件对数据进行分析。
2 结果与分析
2.1 数据标准化处理与性状间的相关性分析
对200株金太阳×串枝红正反交后代实生苗果实的发育期、单果重、可溶性固形物含量、去皮硬度、果皮底色、果实盖色、果实外观、果肉内质评价、韧性和香气10个经济性状进行测定,将各性状的测定值进行标准化处理,并进行相关性分析。
从表1可以看出,果实发育期与单果重呈极显著负相关(P<0.01),与去皮硬度、韧性和果肉内质评价呈极显著正相关(P<0.01),与果实外观和果皮底色呈显著正相关(P<0.05);单果重与可溶性固形物、韧性和果肉内质评价呈极显著负相关(P<0.01),与果皮底色呈极显著正相关(P<0.01),与去皮硬度呈显著负相关(P<0.05);去皮硬度与可溶性固形物含量呈极显著负相关(P<0.01),与韧性呈极显著正相关(P<0.01),与果肉内质评价呈显著正相关(P<0.05);可溶性固形物与韧性和果皮底色呈极显著负相关(P<0.01);韧性与果肉内质评价呈显著正相关(P<0.05);果实外观与果皮底色和果实盖色呈极显著正相关(P<0.01)。由此可见,测定的10个性状之间存在不同程度的相关性,存在信息重叠现象,这就需要对测定的性状进行简化和归类,提高杏杂交后代果实经济性状评价的效率。
表1 杏杂交后代果实经济性状间的相关系数
注:**表示相关性极显著(P<0.01);*表示相关性显著 (P<0.05)。
2.2 杏杂交后代果实经济性状评价因子的主成分分析
经主成分分析得到10个主成分的特征向量、特征值、贡献率和累积贡献率(表2)。按照累积贡献率≥85%的标准选取主成分,前7个主成分的累积贡献率可达到88.305%,故选取前7个主成分的特征值,使它们能够较全面地反映出原来10个性状评价指标的主要信息。第1主成分中果实发育期、去皮硬度、韧性和果肉内质评价的特征向量较大,单果重特征向量的绝对值较大,第1主成分综合了大量的杏杂交后代果实经济性状信息,反映了果实的发育期、果实大小、果实硬度和果实肉质。第2主成分中果实外观和果实盖色的特征向量较大,反映了果实的外观和彩色。第3主成分中单果重和果皮底色的特征向量较大,可溶性固形物特征向量的绝对值较大,反映了果实大小、果实色泽以及果实的风味。第4主成分中香气的特征向量较大,反映了果实的香气。第5主成分中果实发育期、果皮底色的特征向量较大。第6主成分中果肉内质评价的特征向量较大。第7主成分中单果重、可溶性固形物的特征向量较大。以上7个主成分涵盖了原有的10个果实经济性状的全部信息,可用来作为评价杏杂交后代果实经济性状的综合指标。
单果重同时出现在第1、第3和第7主成分中,果实发育期同时出现在第1和第5主成分中,可溶性固形物同时出现在第3和第7主成分中,果皮底色同时出现在第3和第5主成分中,果肉内质评价同时出现在第1和第6主成分中,去皮硬度和韧性只出现在第1主成分中,果实外观和果实盖色只出现在第2主成分中,香气只出现在第4主成分中。主成分分析结果表明,单果重、果实发育期、可溶性固形物、果皮底色和果肉内质是决定杏杂交后代果实经济性状的主要成分。
表2 10个主成分的特征向量、特征值、贡献率及累计贡献率
2.3 杏杂交后代果实经济性状评价因子的聚类分析
对表2中前7个主成分的各个特征向量,采用组间联接平均欧氏距离法进行系统聚类。从图1可以看出,在距离为15时可划分为6个类别。果实外观和果实盖色聚为一类;单果重与果皮底色聚为一类;去皮硬度与韧性首先聚为一类,之后与果实发育期聚为一类;果肉内质、可溶性固形物和香气各为一类。聚为一类的果实品质指标之间具有密切的相关性,可选用1个因子代表其他因子,予以简化,单独为一类的品质因子具有相对的独立性[10]。综合主成分分析和聚类分析结果,可将杏杂交后代果实经济性状评价指标简化为:果实外观、单果重、果实发育期、果肉内质评价、可溶性固形物、香气。
图1 10个果实经济性状评价因子的聚类分析图
2.4 基于果实经济性状的杏杂交后代聚类分析
通过10个果实经济性状,对200株杏杂交后代采用组间联接平均欧氏距离法进行系统聚类。从图2可以看出,在距离为5时,可以划分为9类。第1类仅1个单株;第2类有2个单株;第3类有2个单株;第4类有2个单株,第5类有1个单株;第6类有3个单株;第7类有5个单株;第8类有8个单株;第9类有176个单株。
对杏杂交后代9个不同类群的果实经济性状进行分析(表3),第1类群的香气值为0.9,大于整个群体的平均值0.51,以及其他几个类群的,定义第1类群为果实香气浓郁类;第2类的韧性值仅为0.5,低于整个群体及其他几个类群的平均值,将第2类群定义为果肉韧性极低类;第3类群的果实外观、果肉内质和果实盖色值分别达到了0.97、0.96和0.90,大于其他几个类群的平均值以及整体类群的平均值,且果实发育期最短,为62.5 d,定义第3类群为综合性状优良类;第4类群的单果重、果实外观及果实盖色均低于其他几个类群,分别为43.69、0.50和0.20,将第4类群定义为小果外观差类;第5类群的去皮硬度和果肉韧性最大,分别达到了8.79 kgf和0.93,将第5类群定义为高硬度高韧性类;第6类群的单果重最大,达到了104.08 g,将第6类群定义为大果类;第7类群的果皮底色值较大,为0.88,将第7类群定义为果皮底色优良类;第8类群的果实可溶性固形物含量最高,为17.27%,将第8类群定义为高可溶性固形物类;第9类群体数量最大,10个果实经济性状值在9个类群中均居中,将第9类群定义为平庸类。
从表3还可以看出,10个果实经济性状指标的变异系数大小为:单果重>果实发育期>可溶性固形物>去皮硬度>果实盖色>韧性>果皮底色>果实外观>果肉内质评价>香气,杏杂交后代果实的平均单果重变异程度最大,为13.47%,果实发育期次之,为7.64%,说明这两个性状在杏杂交后代果实中呈现广泛分离,遗传多样性较丰富;而香味性状变异系数最小,仅为0.04%,表现很集中,说明香味具有较为稳定的遗传性。
图2 基于果实经济性状的200株杏杂交后代聚类分析图
3 讨论与小结
评价因子的确定是正确进行品质评价的基础,在现有果品的评价中,评价因子的选择决定着评价的效果[16]。本研究中用于评价杏杂交后代果实经济性状的10个因子之间既存在相关性又有相对的独立性,科学地选择评价因子才能对果实的经济性状做出正确的评价。主成分分析是将多个性状指标经正交变换转化为较少个数的综合指标,而这些综合指标彼此既互不相关, 又能综合反映原来多个性状指标的主要信息,并使得前几个主成分体现原来变量绝大部分的变异,对供试材料贡献率最大[22,23]。本研究对评价杏杂交后代果实经济性状的10个指标进行主成分分析,提炼归纳为7个主成分,保留了原始变量88.305%的信息量。聚类分析法反映了品质或因子之间相关或偏相关程度的大小[12],本研究将7个主成分各特征向量进行聚类分析,在距离为15时可划分为6类。结合主成分分析和聚类分析,可将杏杂交后代果实经济性状评价指标简化为6个,即果实外观、单果重、果实发育期、果肉内质评价、可溶性固形物、香气,简化了杏杂交后代果实经济性状评价指标。
表3 杏杂交后代不同类群的果实经济性状表现
聚类分析是应用多元统计分析原理研究分类问题的一种数学方法,其考察性状既可以是质量性状,也可以是数量性状,并可同时对大量性状进行综合考察[21]。本研究对串枝红×金太阳正反交200株后代进行了聚类分析,在距离为5时,可以划分为9类,对9个类群的果实经济性状进行分析发现,第1类群为果实香气浓郁类;第2类群为果肉韧性极低类;第3类群为综合性状优良类;第4类群为小果外观差类;第5类群为高硬度高韧性类;第6类群为大果类;第7类群为果皮底色优良类;第8类群为高可溶性固形物类;第9类群为平庸类。可见,通过对果实经济性状的聚类分析,可以将数量庞大的杏杂交后代群体进行类别划分,为育种决策提供有益的参考信息。