基于系统聚类方法筛选中长绒陆地棉优质新品系
2022-08-18彭小峰张选彭延黄顺礼刘素华艾尼玩尔黑里力黎蓉
彭小峰,张选,2,彭延,黄顺礼,刘素华,艾尼玩尔·黑里力,黎蓉
(1.新疆生产建设兵团第三师农业科学研究所,新疆图木舒克 843900;2.塔里木大学农学院,新疆 阿拉尔 843300;3.西南大学农学与生物科技学院,重庆 北碚 400715)
由于棉花市场的需求,棉农过于追求产量,棉花纤维品质长时间被忽视,棉纺织企业需求高品质的原棉,随着棉纺织企业改造升级和人们生活水平的提高,对棉花纤维品质要求越来越高,生产出的棉花纤维不能满足现代纺织产业的需求。在棉花的种质创新和选育过程中,由多亲本连续杂交育种系统(DMPC,Dynamic continuous cross breeding systems of many parents)技术产生的群体其遗传背景复杂,出现遗传变异的频率高、频谱宽,如果其中有符合育种需要的基因型,加以选择鉴定,从中可以育成许多新材料新品种。由于遗传变异和非遗传变异区分困难,遗传稳定性也是极大的挑战,加之新疆生产建设兵团第三师的棉花为多年连作,品种的抗病性也是重要攻克难题。
选择好的株系是育种工作中重要的环节之一,通过选择同一品种或品系得到的不同株系,其不同性状差异性小,相似度高,通过直观观察和数据的相似度比较,需要大量的人力和物力,且准确度和选择标准也对结果有很大影响。聚类分析方法在作物选择中应用比较广泛,通过对麦类、大豆、水稻、花生、玉米、李子、辣椒等作物不同性状的聚类分析,把存在相似性状的资源归为一类,进行更加准确的评价;或为产品应用和选育提供材料。孙振纲,等通过聚类分析,把27个陆地棉新种质材料分为两个类群,其中一类群是以优质品种为主;另一类群以高秆、高产品种为主。龚照龙,等对144份材料的农艺性状和SSR标记进行聚类分析,把不同耐高温性的棉花种质材料进行较合理的分类,从而区别于其它种质。宿俊吉,等对陆地棉主要农艺性状进行聚类分析,表明衣分和亩株数是影响皮棉产量的主要因素。董承光,等通过聚类分析发现,新陆早系列和新陆中系列在类群中相互杂交。
为提高品种选择的科学性和可靠性,应用Excel 2003软件和DPS 7.05软件的系统聚类方法进行数据处理,将陆地棉3D801各株系在常规栽培状态下观测的原始数据标准化成无量纲化的数据后,计算性状相关矩阵及对应的特征值和特征向量,进行性状间的相关性分析,并根据特征值和特征向量,计算卡方距离,进而对入选优异株系聚类进行比较,探索系统聚类方法对中长绒陆地棉株系选择的一致性和稳定性是否有提升。对株系进行相关性分析和系统聚类方法,为株系选择和划分类群提供参考,提高棉花育种工作的选择效率。
1 材料与方法
1.1 材料
品系3D801为采用DMPC技术选择的品系,其遗传背景复杂,后代存在一定的分离。2017年10月从品系3D801中选择大量单株,经过南繁筛选后,2018年获得了220个株系,再通过田间与室内考种综合决选获得90个株系。
1.2 田间种植与性状调查
2019年在新疆生产建设兵团第三师农业科学研究所试验地进行试验,4月13日人工滚筒播种。采用随机区组设计,重复3次,小区长20.0 m。采用机采棉播种机(2.27 m地膜)一膜六行三带种植,宽窄行配置,行距为 10 cm和66 cm。结合整地基施二铵300 kg/hm、尿素150 kg/hm、硫酸钾75 kg/hm。
每小区标记中间行20个单株,10月份分别调查株高、始果枝位节数、果枝数、单株结铃数。吐絮后,取中上部100个正常吐絮铃,测定单铃重,锯齿机轧花测定衣分,在国家棉花纤维检测中心(乌鲁木齐)测定纤维品质性状。
1.3 数据分析
数据分析采用DPS7.05和Excel处理。
2 结果与分析
2.1 品系不同性状统计分析
不同性状表型统计分析(表1)。研究表明,单株铃数、株高、果枝数的变异系数较大,分别为21.62%、18.84%、18.11%和12.26%,说明这些性状的株系间的变异程度较大,可供选择的范围较宽。纤维品质构成性状的变异系数相对较小,其中最大的为马克隆值,为6.01%;而整齐度和反射率的变异系数均为1.00%,其变异程度较小,对株系的选择没有较大影响。各性状变异系数表现为单株铃数>株高>果枝数>始果枝位节数>马克隆值>比强度>单铃重>黄度>衣分>纤维长度>反射率和整齐度。同一品系选择的单株也存在一定的差异,且在部分性状差异显著。从图1可以得出,除株高和始果枝位节数以外其他性状均呈正态分布。
表1 品系3D801的90个株系各性状统计性描述
2.2 性状间相关性分析
棉花具有无限生长习性,各性状之间具有复杂的相关性。通过相关性分析(图1)发现,株高与果枝数、单株铃数,单铃重与纤维长度、整齐度,黄度与马克隆值,纤维长度与整齐度、比强度,整齐度与比强度均表现为极显著正相关;始果枝位节数与果枝数,单株铃数与黄度,衣分与单铃重、纤维长度,纤维反射率与黄度、整齐度,马克隆值与纤维长度均表现为极显著负相关;农艺性状和纤维品质性状间均表现为极显著的相关性。由此可知,株系各性状间有较复杂的相关性,棉花纤维产量同步提高最大的问题是衣分与纤维的长度极显著负相关问题,后期在育种过程我们可以加大选种力度,协调衣分与纤维长度的关系,从而实现棉花纤维产量和质量同步提高。
注:***、**和*分别表示在0.001、0.01和0.05水平达到极显著相关和显著相关。
2.3 系统聚类分析
利用统计软件DPS V7.05和Excel对90个株系的12个性状数据进行规格化转换,以分辨能力较强的卡方距离及离差平方和法进行聚类分析。
株系间的不同性状基因型值构成的多维空间几何距离称为品种间的遗传距离,遗传距离是衡量品种间性状综合遗传差异的指标。试验采用卡方距离-离差平方和法对同一品种的90个株系的12个性状作系统聚类分析,聚类结果如图2所示,在卡方距离D=1.08的水平上,把90份株系分为6大类群。
图2 各株系聚类结果
2.4 类群特征分析
通过聚类结果,对每一类群的原始数据进行处理分析,结果列于表2。第Ⅰ类群,包含16个株系,单铃重和比强度较大;第Ⅱ类群,包含18个株系,单株结铃较多,衣分最高;第Ⅲ类群,包含19个株系,株高较高,始果枝位节数最少,果枝数和单株结铃数最多,但马克隆值最大;第Ⅳ类群,包含8个株系,株高最高,果枝数较多,但单株结铃数较少和比强度较小;第Ⅴ类群,包含7个株系,株高68.00 cm左右,始果枝位节数最多,适宜机械采收,单铃重最大,单株结铃9.29个左右,纤维长度最长,比强度最大;第Ⅵ类群,包含22个株系,株高最低、单铃重最轻、单株结铃数最少、纤维长度最短,黄度最大。第Ⅵ类群包含一个衣分最高的株系,可作为衣分改良的亲本材料。各类群在某一方面存在一定优势,且类群中各株系差异性相对较小,对于同一品系选育的株系,经过聚类分析后,按照类群合并株系可扩大原种的种子量,增加扩繁速度,用于种子生产。
表2 品系3D801的90个株系各性状的统计分析情况
3 结论与讨论
变异系数是测定植株各性状受到外界环境条件变化而发生变异程度的指标,它所反映的是植株性状遗传的简单动态,变异系数越小,该性状容易稳定遗传;变异系数越大,其受外界影响较大,或存在遗传变异。本试验中农艺性状的变异系数都较大(12.26%~21.62%),是因为这些性状不仅受基因的控制,土壤和水肥因素对其生长发育也有较大的影响。本试验马克隆值变异系数也表现为最大,与高进对纤维品质的数量性状进行遗传变异分析的结果较一致。
棉花各性状之间的相关性已有许多报道,其结果不尽相同。本研究中,相关系数绝对值较大的有株高与果枝数、黄度与反射率、纤维长度与整齐度。衣分与纤维长度、铃重呈极显著负相关,这与前人研究结果基本一致;衣分与断裂比强度呈负相关不显著,这与前人略有不同。产量性状与纤维品质之间相关性较小,抗病性和纤维品质之间不存在统计学意义上的相关性。从相关系数看,纤维长度越长,马克隆值和衣分越小,比强度越大,其中衣分和皮棉产量又密切相关,在选择中不能只注重某一品质性状的突出,更应该注重如何兼顾各品质性状的关系,重点关注衣分与纤维品质性状的关系,是可能同步提高纤维产量和质量,选择到综合性状较优的棉花品系。
表2 株系各性状的类群平均值
遗传距离是衡量品种间性状综合遗传差异的指标,遗传距离越大,其出现特异性种质资源的可能性就越大。董承光通过聚类分析, 筛选出33份特异种质材料。本研究采用系统聚类的方法对3D801的90份株系进行聚类分析和评价,结果将其分为6大类群,除第Ⅵ类群外,其余各类群内株系所表现出来的性状差异不大,可直接合并成一份种子,扩大亲本的种子量,加快种子的生产;第Ⅴ类群是中长绒类群,其纤维上半部平均长度≥31.0 mm,断裂比强度≥32 cN/tex,可作为中长绒陆地棉优质品种筛选。