基于主成分与聚类分析的大茎野生种血缘后代育种潜力评价
2019-10-30俞华先经艳芬安汝东郎荣斌田春艳董立华桃联安孙有芳杨李和周清明
俞华先,经艳芬,安汝东,郎荣斌,田春艳,董立华,桃联安,孙有芳,杨李和,边 芯,周清明
(云南省农业科学院 甘蔗研究所 瑞丽育种站,云南 瑞丽 678600)
大茎野生种别名伊里安野生种(SaccharumrobustumL.),为多年生草本植物,具有植株高大、长势旺盛、茎硬抗风、抗虫、耐旱性强、宿根性好、纤维分含量多、生物产量高等特点[1],多数大茎野生种后代选育出的品种还具有萌芽率高、分蘖性好、生长快、植株高、有效茎数多、生势强和不易倒伏等优点,利用大茎野生种来拓宽甘蔗遗传基础及品种改良具有十分重要意义。近年来,利用大茎野生种同现有栽培品种、热带种杂交或回交,选择生势强、生物量高、抗风抗虫的杂种后代,是利用大茎野生种的有效利用途径。历史经验表明,不断利用新的种质资源,培育出新的良种替代老品种将是甘蔗产业保持健康稳定发展的必由之路[2]。为了丰富我国甘蔗种质资源,突破甘蔗育种遗传基础狭窄、育成品种宿根性差、适应性不广的瓶颈,云南省农业科学院甘蔗研究所瑞丽育种站(简称“瑞丽站”)自1988年建站以来兢兢业业,不断加大对云瑞亲本与国内、外新品种杂交利用的力度,结合抗病、抗旱性等鉴定试验,以及强宿根与褐条病早期胁迫筛选,培育了许多特色鲜明云瑞创新亲本材料。
在甘蔗育种过程中,为了选育具有高产、高糖、抗病、优质、适应性理想等的优良甘蔗创新种质材料,往往要对甘蔗种质材料进行比较试验,筛选较优组合,在筛选过程中不仅要分析各参试种质的产量表现,还要结合育种目标综合考虑生育期、株高、茎径、有效茎数、锤度和含糖量性状等,才能对各参试品种进行较全面的综合评价。由于产量和品质性状属于数量性状,并且涉及的性状较多,单考虑个别性状,往往顾此失彼,对大茎野生种血缘后代的综合评价也不科学。
多元统计分析方法——主成分分析是指在很少损失原有信息的前提下,将原来个数较多而且彼此相关的变量转换为新的个数较少而彼此独立或不相关的综合变量,这种降维的思想为综合评价提供了有力的理论依据和技术支持[3-5]。主成分分析可从构成性状的多因素关系中揭示供试材料的特点,可了解供试材料主成分构成及其特征和生物学意义,为遗传材料的客观评价和品种选育提供参考依据[6-7]。聚类分析既可以揭示类群间的遗传差异与相互关系,又可以了解类群内品种的遗传相似性[8]。主成分分析与聚类分析是农业研究中重要的统计分析方法[9],在红小豆[10]、胡麻[11]、烟叶[12]和苎麻[13]等许多作物中均有应用,且取得了良好的效果,但在甘蔗及其近缘属种质资源的数量性状评价分析方面的报道较少,周会等[14]利用主成分分析和聚类分析,对111份桂糖系列甘蔗种质资源的9个数量性状进行较全面、准确的鉴定评价,为其利用提供理论依据;张革民等[15]利用主成分分析和聚类分析,对割手密种质资源的主要性状进行了评价,为割手密资源的进一步开发利用提供理论依据;俞华先等[16]利用主成分分析和聚类分析,对云南甘蔗细茎野生种F2代的抗旱性进行综合评价,为抗旱性种质资源的筛选提供参考。近期一些学者在对甜糯玉米和甘蔗属种质资源割手密进行系统鉴定与综合评价时,将二维排序分析方法引入其中[3,17]。二维排序图可简洁、直观地反映供试材料的分布特征,较清楚地揭示出各品种性状表现等方面明显的差异及相近或相对的位置,然而,在大茎野生种农艺性状的研究上,目前同时综合主成分分析、聚类分析和二维排序等相关分析的报道还很少。
本研究对瑞丽育种站当前创制的14份大茎野生种创新种质(含对照粤糖93-159和ROC22)材料,运用相关性、主成分与聚类分析对其株高、茎径、有效茎数、锤度、单产和含糖量等7个主要农艺性状进行考察,以期揭示各农艺性状间的相关性与特征规律,为提高育种效率,进行种质资源改良和创新,以及选育出优质的甘蔗种质材料提供理论依据。
1 材料与方法
1.1 试验材料
供试材料来源于云南省农业科学院甘蔗研究所瑞丽育种站选配的12个杂交组合及2个生产上大面积种植的甘蔗品种粤糖93-159和新台糖22号,共计14份材料,其中以粤糖93-159和新台糖22号作为对照品种,参试组合及其杂交祖代信息见表1。
表1 供试材料
1.2 试验设计
试验安排在云南省农业科学院甘蔗研究所瑞丽育种站的基地内,试验地位于24°01′ N,97°51′ E,年均温20 ℃,海拔780 m,年降雨量1394 mm,属于南亚热带季风性湿润蔗区。试验地为沙壤土,地势平坦、地力均匀、阳光充足、排灌方便、前作为甘蔗。田间试验采用随机区组设计,设3次重复试验,试验小区面积7.2 m2,小区长6 m,宽1.2 m,四周设保护行,田间管理和大田生产一样。
1.3 调查项目
于2016年4月下旬调查宿根萌苗数,2015年9月18日对新植、2016年9月27日对宿根分别调查株高、茎径、丛有效茎数、11月锤度等性状,并计算其平均值、最大值、最小值、标准差、极差和变异系数。参照经艳芬等[18]的方法利用以下公式计算单产、11月份理论蔗糖分和11月理论含糖量。
单茎重/kg=(株高-50)×茎径2×0.785/1000
单产/(t/hm2)=茎径2×(株高-50)×0.785×丛有效茎数(条/hm2)×10-6
11月份理论蔗糖分/%=蔗汁平均锤度(%)×1.01-5.6
11月份理论含糖量/(t/hm2)=单产(t/hm2)×11月份理论蔗糖分/100
1.4 统计分析
采用SPSS19.0统计软件[19]对各项调查指标的原始数据进行整理,用DPS 15.1软件[20]进行主成分分析和系统聚类分析。在聚类分析过程中,对数据进行标准化转换,种质间距离采用欧氏距离,聚类方法采用离差平方和法。基于主成分分析结果作二维排序分析,评选出优良的甘蔗创新种质材料。
2 结果与分析
2.1 14份大野血缘后代材料工农艺性状的变异分析
14份参试材料7个表型性状的平均值及变异情况见表2。由表2可知,大茎野生种血缘后代的变异系数幅度比较大,在4.59%~35.83%之间,其中单产的变异系数最高,达35.83%,变幅为39.11~124.76 t/hm2;其次是含糖量,其变异系数为33.58%,变幅为5.43~15.24 t/hm2,这说明单产和含糖量是14份大茎野生种遗传变异最为丰富的指标;单茎重和有效茎数的变异系数分别是33.54%、28.62%,其变幅分别为0.39~1.28 kg和38385.76~126268.94条/hm2;株高、茎径的变异系数在10%~15%之间,锤度的变异系数最小,仅为4.59%。以上结论说明各个性状在不同材料间具有不同程度的多样性,供试材料的变异范围广、遗传变异丰富、育种潜力大。
表2 参试组合表型的变异分析
注:X1~X7分别为株高、茎径、锤度、单茎重、有效茎数、单产、含糖量。下同。
2.2 相关分析
对大野血缘后代的7个数量性状进行相关分析结果表明(表3):含糖量与锤度呈负相关,与其余性状呈正相关,且与株高、茎径、单茎重、单产达到显著或极显著水平;株高、茎径与有效茎数呈负相关,与含糖量呈显著或极显著正相关,与单茎重呈极显著正相关;锤度与单茎重呈正相关,与其余性状呈负相关;单茎重与有效茎数呈显著负相关,与其余指标呈显著正相关;有效茎数与单产、含糖量呈正相关,与其余性状呈负相关。以上分析表明,各项性状指标之间是相互联系、相互制约的。
2.3 主成分分析
利用DPS数据处理系统对大野血缘后代材料的7个工农艺性状进行主成分分析,解出特征根和特征向量,根据累计贡献率≥85%具有代表性的原则,提取前3个主成分特征值、贡献率及累计贡献率列于表4。从表4可以看出:前3个特征根累计贡献率已达95.7057%,足以反映该数据变化规律,同时也符合主成分分析的要求。第1主成分的贡献率为49.7842%,特征值为3.4849,其特征向量所包含的生物学信息主要是单茎重、株高、含糖量、单产和茎径,特征向量值依次为0.4781、0.4660、0.4361、0.4321、0.4107,主要反映的是产量构成方面的相关因素,故第1主成分可概括为单茎重产量构成因子;第2主成分的贡献率为36.779%,特征值为2.5745,其特征向量所包含的生物学信息主要是有效茎数、单产、含糖量,特征向量值依次为0.6015、0.3408、0.3140,主要反映的是有效茎数含糖量情况,可概括为有效茎数含糖量因子;第3主成分的贡献率为9.1425%,特征值为0.640,其特征向量所包含的生物学信息主要是锤度、含糖量、单产和有效茎数,特征向量值依次为0.7046、0.3537、0.2649、0.2333,主要反映的是锤度含糖量等品质情况,可概括为锤度含糖量因子。
表3 参试材料各性状间的相关矩阵
注:*、**分别表示差异达0.05、0.01的显著水平。
表4 试验材料相关阵的特征根、贡献率及累计贡献率
2.4 二维排序及其评价
以第1主成分(单茎重产量构成因子)作横坐标,分别以第2(有效茎含糖量因子)和第3主成分(锤度含糖量因子)为纵坐标作成二维散点图(图1、图2),可直观地揭示大茎野生种血缘后代材料基因型的差异状况。
结合表3的相关分析结论,单茎重、有效茎数与单产呈正相关,单茎重与含糖量呈显著正相关。从第1主成分和第2主成分构成的供试材料排序图(图1)中,品种的横坐标与纵坐标值越大,其有效茎数越多,产量越高。从图2可知,5(云瑞14-193)、9(云瑞14-216)、14(ROC22)、8(云瑞14-204)、6(云瑞14-199)等5份材料的第1主成分值(单茎重产量构成因子)较其他材料大,是大野血缘后代材料中产量较理想的材料;8(云瑞14-204)、12(云瑞14-224)、1(云瑞14-36)、5(云瑞14-193)、9(云瑞14-216)、6(云瑞14-199)、10(云瑞14-217)、11(云瑞14-225)、4(云瑞14-192)等9份材料的第2主成分值(有效茎含糖量因子)较其他材料大,说明其有效茎数较多,单产高。在所有供试材料中,5(云瑞14-193)、9(云瑞14-216)、6(云瑞14-199)和8(云瑞14-204)等4份材料是同时兼顾第1主成分(单茎重产量构成因子)和第2主成分(有效茎含糖量因子)的大茎野生种血缘后代材料,在育种工作中应重点加强利用。
图1 第1、2主成分二维排序图
图2 第1、3主成分二维排序图
结合表3的相关分析结果,单茎重与单产、含糖量呈显著正相关,且与锤度呈正相关。从第1和第3主成分二维排序图(图2)可以看出,在供试的大茎野生种血缘后代材料中,8(云瑞14-204)、3(云瑞14-38)、13(粤糖93-159)、2(云瑞14-37)、1(云瑞14-36)、7(云瑞14-200)、10(云瑞14-217)和6(云瑞14-199)等8份材料的第3主成分值(锤度含糖量因子)较其他材料大,具有较高的糖分;8(云瑞14-204)和6(云瑞14-199)是同时兼顾单茎重产量和锤度糖分的理想材料,其中8(云瑞14-204)是单产和糖分表现比较突出的大野血缘后代材料。
结合图1和图2的结果分析可知,在供试材料中,同时兼顾第1主成分、第2和第3主成分的材料主要有8(云瑞14-204)和6(云瑞14-199),这2份材料是所有参试的大茎野生种血缘后代材料中,最值得重视和加强利用的甘蔗优良种质材料。
2.5 系统聚类分析
对14份大野血缘后代材料的3个主成分进行系统聚类,结果如图3,在欧式距离D=5.00时可把14份供试材料被分成3类:第Ⅰ类包含5份材料,占供试材料的35.71%,该类型材料的主要特点是植株高大、中茎,供试材料的锤度值介于双对照ROC22和粤糖93-159之间,糖分相对较高;第Ⅱ类包含3份材料,占供试材料的21.43%,这些材料的共同特征是植株高大、中茎、株型直立,单产、有效茎数最均超过双对照ROC22和粤糖93-159,单产最高,达到124.76 t/hm2,锤度值均低于双对照,属于高产类型;第Ⅲ类包含6份材料,占供试材料的42.86%,这些材料的共同特征是植株高、中小茎、锤度低、大部分材料的单产超过双对照。
图3 系统聚类图
性状Ⅰ(n=5,35.71%)平均值变异系数/%Ⅱ(n=3,21.43%)平均值变异系数/%Ⅲ(n=6,42.86%)平均值变异系数/%株高193.6616.95213.3110.22183.6911.63茎径2.487.982.525.072.055.99锤度19.592.4517.983.1018.272.87单茎重0.8330.360.9317.300.5422.74有效茎数64043.6133.82108086.2112.98105392.4712.27单产57.5020.58114.518.0563.6523.51含糖量7.7320.0514.206.318.0725.45
3 讨论与结论
大茎野生种是甘蔗属中的一个种,具有植株高大、生势旺、抗螟虫及抗风力强、宿根性好的特点[21],部分育种机构利用其为父本同现有栽培品种、热带种杂交或回交,选择生势强、生物量高、抗风抗虫的杂种后代。在大茎野生种及其血缘后代种质材料的利用过程中,如何准确评价和鉴定品质较优的种质显得尤为重要。在甘蔗育种中,种质材料的农艺性状表现优劣是田间育种工作的主要依据,但农艺性状复杂多样,易受环境影响,选择的难度大和盲目性强[22-23]。因此,运用科学客观的分析方法对工农艺性状的进行评价尤为重要。目前对农艺性状的研究主要有相关性分析、主成分分析和聚类分析等方法,这些方法特别是针对大量材料和多个农艺性状的考察,能很好地处理大量复杂数据,找出规律,指导育种[23]。为了较客观准确地评价和鉴定大茎野生种血缘后代种质材料,本研究选用株高、茎径、锤度、单茎重、有效茎数、单产、含糖量等7个农艺性状,采用相关性分析、主成分分析、聚类分析和二维排序评价等方法进行综合评价。
直观、快速、简便、易行地鉴定农艺性状是研究种质资源最基本的方法和途径[24-25]。本试验中株高、茎径、锤度等农艺性状是由多基因控制的数量性状,改良数量性状而利用的种质一般是群体而不是单株。群体特征常用平均数、方差、变异系数等指标进行遗传多样性分析[26]。本研究对16份供试材料的7个工农艺性状进行调查分析,结果表明不同大茎野生种血缘后代材料的工农艺性状存在不同程度的变异,变异系数在4.59%~35.83%之间,其中单产的变异系数最大,含糖量和单茎重的变异系数次之,株高、单茎重和有效茎数与单产有较大关系,可通过对这些性状进行人工选择改良,选育出产量高的材料。相关分析表明,供试材料各性状间存在较高的关联度,改变其中一个性状的特性,同时也意味着与之关联度高的一个或几个性状也随之发生相应变化[23,27]。陆鑫[21]、吴建涛[28]和刘福业[29-30]等对甘蔗的农艺性状进行研究时发现有效茎数与单产呈显著正相关,锤度与单产呈负相关,与笔者研究一致。主成分分析表明:单茎重产量构成因子、有效茎数产糖因子和锤度含糖量因子等3个因子所含信息量占总体信息的95.7057%,足以反映供试材料农艺性状的总体信息。因此,在大茎野生种血缘后代材料的选育过程中,可根据育种目标调整各主成分的大小,选育适宜的大茎野生种血缘后代材料,如选育产量高的大茎野生种血缘后代材料,可侧重甘蔗产量构成因子成分的选育,相对降低其他因子的值。
本研究对3个主成分进行二维排序分析结果表明,5(云瑞14-193)、9(云瑞14-216)、6(云瑞14-199)和8(云瑞14-204)等4份材料是同时兼顾第1主成分(单茎重产量构成因子)和第2主成分(有效茎含糖量因子)的大茎野生种血缘后代材料;从第1主成分和第3主成分的二维排序图可以看出,8(云瑞14-204)和6(云瑞14-199)是同时兼顾单茎重产量和锤度糖分的理想材料,其中8(云瑞14-204)是单产和糖分表现比较突出的大野血缘后代材料;8(云瑞14-204)和6(云瑞14-199)是同时兼顾第1主成分、第2和第3主成分的材料,这2份材料是所有参试的大茎野生种血缘材料中,最值得重视和加强利用的甘蔗优良种质材料。
主成分分析基础上的聚类,可有效地剔除一些无关大局的因子,使结果更加精确,在种质资源分析及评价中应用效果较好[31]。本研究表明:14份供试材料在欧式距离D=5.00处被聚为3类,其中第Ⅰ类包含5份材料,占供试材料的35.71%,这些材料包含双对照(ROC22和粤糖93-159)除7(云瑞14-200)是大茎野生种51NG63的血缘F2外,其余材料均是福建大茎野生种与云瑞04-48的血缘F1,该系列材料的主要特点是糖分相对高;第Ⅱ类包含3份材料,占供试材料的21.43%,该类型的材料的主要特点均属于大野血缘F2,有效茎数多、单产高;第Ⅲ类包含6份材料,既有大野血缘F1又有血缘F2,该类材料锤度低,单产有高有低。通过聚类分析可得出,大茎野生种血缘后代材料,遗传变异丰富,育种潜力大。
本试验对大茎野生种血缘后代种质资源评价具有十分重要的现实意义和理论价值,基于重要农艺性状分级评价甘蔗种质资源,不仅省时、快速、有效,且不失种质性状的关键信息[32],但农艺性状的表现由于受到环境因子的影响较大,同一材料在不同的环境下其农艺性状的表现也存在较大的差异,而且本研究选择的材料数量有限,因此,本研究结果只能指导本地区或者类似生态环境下大茎野生种血缘后代材料性状的选择和改良。另外,本究所获得的部分研究结论还需在未来利用更丰富的大茎野生种血缘后代材料作进一步的验证和完善。