新疆陆地棉品种资源的主成分分析和聚类分析
2016-12-19董承光周小凤马晓梅李生秀李保成
董承光,王 娟,周小凤,马晓梅,李生秀,余 渝,李保成
(新疆农垦科学院棉花研究所/农业部西北内陆区棉花生物学与遗传育种重点实验室,新疆 石河子 832000)
新疆陆地棉品种资源的主成分分析和聚类分析
董承光,王 娟,周小凤,马晓梅,李生秀,余 渝,李保成*
(新疆农垦科学院棉花研究所/农业部西北内陆区棉花生物学与遗传育种重点实验室,新疆 石河子 832000)
对新疆南北疆不同时期选育的84份陆地棉品种连续2年2点14个表型性状进行相关性分析、主成分分析及聚类分析。结果表明,新疆陆地棉品种主要性状变异丰富,尤其在籽棉产量、铃数、始节高等性状具有较大的变异系数;主成分分析结果显示前5个主成分累积贡献率为77.255 %,且第1主成分中的纤维长度、生育期和第2主成分中的衣分、籽棉产量具有较高的得分,反映了这4个性状在新疆陆地棉品种改良中的重要性;聚类分析结果将84份材料分为4个类群,各类群占总材料的百分比分别为39.2 %、54.8 %、3.6 %和2.4 %,且发现新陆早系列和新陆中系列两类品种在各类群中都有分布,并相互交杂。研究结果可为育种家亲本材料的选择,优异等位基因挖掘及探索新的育种方向提供依据。
新疆陆地棉;主要性状;主成分分析;聚类分析
棉花是我国重要的经济作物之一,棉花产业对中国经济发展具有十分重要的作用[1]。新疆是我国最大的植棉省区和优质原棉生产基地[2]。尤其近年来棉花生产发展迅速,棉花种植面积稳定在年平均140万hm2以上,总产保持在250~300万t,平均单产已达到1800 kg/hm2左右,并创造了667m2产籽棉838.31 kg的世界高产记录。棉花种植业已经成为新疆及兵团经济的重要支柱和植棉区农民收入的主要来源[3]。自20世纪70年代至今,已通过新疆自治区品种审定委员会审定的适合新疆南北疆种植的新陆早系列、新陆中系列品种为新疆棉区棉花生产提供了重要的物质保证。国内研究学者以育成品种群体为材料在水稻[4]、玉米[5]、小麦[6-7]等作物方面已开展了较多研究,在棉花方面,众多研究人员对不同棉区棉花品种及资源进行了主要性状的分析[8-13],为育种家了解品种的遗传背景、遗传多样性状况及高效发掘种质资源重要性状基因打下基础。新疆南北疆气候差异较大,且长期形成了“矮、密、早”特殊的栽培方式,因此棉花品种间具有较大的变异,高产、优质品种资源较为丰富,是良好的品种资源群体。本试验选用来自新疆南北疆不同时期审定的84个陆地棉品种进行2年2点种植,对其主要性状进行相关性分析、主成分分析及聚类分析,旨在全面了解新疆陆地棉品种的综合表现,为进一步筛选核心种质,合理利用现有品种,发掘利用新的杂种优势群体和探索育种方向提供依据。
1 材料与方法
1.1 试验材料与处理
试验材料为84份新疆不同年代审定的陆地棉品种(表1),其中新陆早系列47份,新陆中系列37份。所有材料于2013-2014年分别种植在新疆石河子新疆农垦科学院棉花研究所试验基地(北疆)与新疆库尔勒新疆兵团第二师农科所试验基地(南疆)2个不同环境,各试验点田间试验采用完全随机区组设计,双行区,株距10 cm,平均行距35 cm,3次重复,以当地常规方法进行田间管理。
1.2 性状调查及数据处理
按照杜雄明等[14]的棉花种质资源性状描述规范,田间调查株高、始节高、始节位、果枝数、单株铃数、生育期等;实收小区籽棉产量折算产量;室内扎花考种单铃重、衣分、衣指、籽指等;考种结束后分别取各材料的皮棉10~12 g检测棉花纤维长度、比强度、马克隆值等。获得上述各性状数据后,采用SPSS19.0计算各性状的平均值(X)、标准差(σ)及变异系数(c.v.)等,并进行各性状间的相关性分析及主成分分析[15];采用DPS V7.05软件进行聚类分析,并绘制聚类图。
表1 84份材料及审定年份
续表1 Continued table 1
序号品种名称审定年份序号品种名称审定年份27新陆早28号Xinluzao28200669新陆中22号Xinluzhong22200528新陆早29号Xinluzao29200670新陆中23号Xinluzhong23200529新陆早30号Xinluzao30200671新陆中24号Xinluzhong24200630新陆早32号Xinluzao32200672新陆中26号Xinluzhong26200631新陆早33号Xinluzao33200773新陆中27号Xinluzhong27200632新陆早34号Xinluzao34200774新陆中28号Xinluzhong28200633新陆早35号Xinluzao35200775新陆中30号Xinluzhong30200634新陆早36号Xinluzao36200776新陆中32号Xinluzhong32200735新陆早37号Xinluzao37200777新陆中34号Xinluzhong34200736新陆早38号Xinluzao38200878新陆中35号Xinluzhong35200737新陆早39号Xinluzao39200879新陆中40号Xinluzhong40200938新陆早40号Xinluzao40200980新陆中41号Xinluzhong41200939新陆早41号Xinluzao41200981新陆中45号Xinluzhong45201040新陆早42号Xinluzao42200982新陆中46号Xinluzhong46201041新陆早45号Xinluzao45201083新陆中47号Xinluzhong47201042新陆早46号Xinluzao46201084新陆中48号Xinluzhong482010
2 结果与分析
2.1 主要表型性状变异及分析
分别对2013和2014年调查的84份品种的14个表型性状进行统计分析(表2)。其中2013年各性状变异系数表现为始节高﹥籽棉产量﹥铃数﹥始节位﹥子指﹥株高﹥单铃重﹥衣指﹥果枝数﹥马克隆值﹥比强度﹥衣分﹥纤维长度﹥生育期,2014年各性状变异系数表现为籽棉产量﹥始节高﹥铃数﹥子指﹥始节位﹥株高﹥衣指﹥果枝数﹥单铃重﹥马克隆值﹥比强度﹥衣分﹥纤维长度﹥生育期,两年各性状变异系数顺序较为一致,说明其性状较稳定,受生态环境的影响较小;籽棉产量、始节高及铃数两年的变异系数都较大,说明其性状变异程度较大、选择范围较宽,而衣分、纤维长度及生育期两年的变异系数都较小,说明其性状变异程度较小,选择范围较窄。
表2 参试材料表型性状的一般性描述统计
续表2 Continued table 2
表型性状Phenotypictraits年份Year平均值Mean最小值Min.最大值Max.极差Range标准差SD变异系数(%)c.v.%单铃重Bollweight20135.714.307.503.200.518.8520145.834.907.202.300.457.70衣指Lintindex20137.846.209.703.500.688.7020147.525.609.103.500.668.74子指Seedindex201310.258.5013.805.300.929.01201411.058.6014.706.101.1010.00籽棉产量Rawcottonyield2013276.27188.24433.36245.1251.3518.592014276.31183.02440.81257.7955.4220.06纤维长度Fiberlength201328.5025.3032.206.901.364.78201429.1726.2032.406.201.234.22比强度Fiberstrength201329.2625.7035.209.501.916.53201432.4228.6038.509.902.056.31马克隆值Micronaire20134.663.905.401.500.337.1520144.293.604.801.200.307.07
2.2 主要表型性状间的相关性分析
分别对2013和2014年调查的14个主要表型性状数据进行相关性分析(表3)。2年结果显示始节高与生育期,株高、始节位表现为极显著正相关;
表3 参试材料各性状间的相关性分析
注:**和*分别表示在0.01和0.05水平上差著异显。
Note:**and * indicate significant difference at 0.01 and 0.05 (2-tailed).
衣指与衣分表现为极显著正相关;子指与单铃重、衣指表现为极显著正相关,与衣分表现为极显著负相关;籽棉产量与株高、衣分表现为极显著正相关;纤维长度与生育期、始节高、单铃重、衣指、子指表现为极显著正相关;比强度与单铃重、纤维长度表现为极显著正相关;马克隆值与纤维长度表现为极显著负相关;籽棉产量与纤维长度、比强度两年都表现为负相关性。分析结果表明,各性状间表现为较复杂的相关关系,其中产量性状(籽棉产量)与农艺性状(株高、衣分)表现为正相关性的居多,与纤维品质性状(纤维长度、比强度)表现为负相关性的居多。
2.3 各表型性状的主成分分析
对14个表型性状的2年平均值进行了主成分分析(表4),以特征值大于1为标准提取主成分,结果显示,前5个主成分的累积贡献率为77.255 %。其中第1主成分中纤维长度、生育期及始节高具有正向较大特征向量值,主成分值越大越好;第2主成分中衣分、籽棉产量及株高具有正向较大特征向量值,主成分值越大越好;第3主成分中果枝数、比强度、籽棉产量具有正向较大特征向量值,始节位、生育期具有负向较大特征向量值,主成分值适中为宜;第4主成分中子指、单铃重具有正向较大特征向量值,衣分具有负向较大特征向量值,主成分值适中为宜;第5主成分中衣指、衣分具有正向较大特征向量值,株高具有负向较大特征向量值,主成分值适中为宜。
2.4 聚类分析
利用DPS V7.05软件对两年平均值表型性状数据进行对数化转换,以欧氏距离为遗传距离,采用类平均法进行聚类分析(UPGMA)。从聚类图(图1)可以看出,84份材料可分为4个类群,不同类群品种的表型性状表现见下表5所示。第一类群包括33份品种,表现为矮杆,果枝数较少类型;第二类群包括46份品种,表现为生育期适中,衣分较高类型;第三类群包括3份品种,表现为生育期较短,始节位较低类型;第四类群包括2份品种,表现为生育期较长,纤维品质优异类型。
表4 参试材料主要性状的主成分分析
图1 参试材料基于表型数据的UPGMA聚类图Fig.1 UPGMA dendrogram based on phenotypic characteristics of materials
3 讨 论
表型性状用于检测遗传变异具有直观简易的方法,是种质资源收集、保存、鉴定和利用的基础。本研究以2年2点12个重复的表型数据为依据,对84份新疆陆地棉品种材料进行综合评价。结果显示新疆陆地棉品种主要性状变异丰富,尤其在籽棉产量、铃数等产量性状方面变异系数较大,选择范围较宽。两年相关性分析结果进一步证明了产量与纤维品质性状的负相关性[16-17],且考察始节高度可以预测品种生育期,考察棉铃大小可以预测纤维品质指标。主成分分析结果显示前5个主成分累积贡献率为77.255 %,可以概括原性状的绝大部分相关信息。其中第1主成分可以概括为主要农艺性状因子,第2主成分可以概括为产量性状因子,前2个主成分累积贡献率达45.662 %,且第1主成分中的纤维长度和生育期分别得分为0.737、0.720,第2主成分中的衣分和籽棉产量分别得分为0.735、0.706,具有较高的得分,进一步反映了这4个性状在新疆陆地棉品种改良中的重要性。
表型性状是遗传与环境共同作用的结果,能较为真实地表现品种间的遗传多样性。本研究聚类分析结果将84份材料分为4个类群,各类群占总材料的百分比分别为39.2 %、54.8 %、3.6 %和2.4 %。被聚在同一类群的品种间性状相似程度较高,遗传背景可能差异不大。其中第二类群中的新陆中4号是从{岱字棉45×[(KK1543×2依3)×(C-1470×C-460)]}组合中经过多年单株选择而成的,具有美国和前苏联棉花的遗传背景,而与它遗传距离较近的新陆早24号(有前苏联C6524背景)、新陆中13号(有美国海岛棉背景)、新陆中41号(有美国爱字棉背景)、新陆早20号(有美国贝尔斯诺背景)、新陆早25号(有美国贝尔斯诺背景)、新陆早23号(有美棉亲缘关系的中棉所27背景)、新陆中15号(有美国海岛棉背景)等品种均含有美国或前苏联棉花的遗传背景。第4类群的2个品种新陆早26号、新陆中9号由于生育期较长,纤维比强度较高而聚为一类,但新陆早26号是从新陆早8号的变异单株中选育而成,新陆中9号是从新陆中4号的群体中选育而成,具有不同的遗传背景。造成这种现象的原因可能是由于早期品种遗传不纯,材料本身存在遗传异质性,导致从同一系谱中选育而成的品种间遗传差异较大。
表5 不同类群品种的主要性状表现及变异程度
艾先涛等[18-19]将北疆新陆早系列品种和南疆新陆中系列品种分别进行了聚类研究,本研究将两类品种同时种植于南北疆不同环境中进行研究,发现两类品种在各类群中都有分布,且相互交杂。深入剖析各品种的遗传背景发现2类品种大部分具有美国、前苏联棉花的遗传背景,育种家为得到较好的育种效果常常利用这些材料进行复杂杂交创制出较好的资源材料,用其作为亲本之一再与本地自育品系进行杂交,经多年选育而成适宜本地的品种。在遗传与环境的共同作用下,使新疆陆地棉品种出现了较为丰富的变异。然而,当前育种家急需选育一批集适宜机采的优异株型、高产、优异纤维品质等性状于一体的棉花品种,以适应新疆棉花产业的不断发展。本研究对新疆不同时期育成的陆地棉品种进行综合评价,可为后续育种家亲本材料的选择,优异等位基因挖掘及探索新的育种方向提供依据。
[1]中国农业科学院棉花研究所.中国棉花遗传育种学[M].济南:山东科学技术出版社, 2003.
[2]田笑明,李保成.新疆棉区棉花育种现状及发展方向[J].中国棉花, 2001, 28(5): 2-4.
[3]田长彦.新疆棉产业可持续发展面临的挑战与科技对策[J].干旱区研究, 2001, 18(4):62-67.
[4]杨玉蓉,孙建昌,王兴盛,等.宁夏不同年代水稻品种的遗传多样性比较[J].植物遗传资源学报,2014,15(3):457-464.
[5]刘志斋,郭荣华,石云素,等.中国玉米地方品种核心种质花期相关性状的表型多样性研究[J].中国农业科学,2008,41(6):1591-1602.
[6]耿洪伟,曲延英,高文伟,等.新疆春小麦品种(系)农艺性状分析[J].中国农学通报,2009,25(5):151-154.
[7]徐红军,穆培源,相吉山,等.新疆春小麦品种主要性状的主成分及聚类分析[J].西北农业学报, 2013,22(7):100-106.
[8]别 墅,孔繁玲,周有耀,等.中国3大主产棉区棉花品种遗传多样性的RAPD及其与农艺性状关系的研究[J].中国农业科学,2001,34(6):597-603.
[9]徐秋华,张献龙,聂以春.长江、黄河流域两棉区陆地棉品种的遗传多样性比较研究[J].遗传学报, 2001, 28(7):683-690.
[10]王芙蓉,张 军,刘勤红,等.棉花种质资源纤维品质分析及评价[J].山东农业科学, 2002(2):29-31.
[11]朱青竹, 赵国忠, 马峙英.不同来源棉花种质资源材料主要农艺经济性状鉴定与分析[J]. 棉花学报, 2002, 14(4):237-241.
[12]贺道华,邢宏宜,李婷婷,等.基于表型的棉花遗传多样性分析及核心材料的筛选[J].安徽农业科学,2010,38(32):18067-18070.
[13]董承光,李成奇,李生秀,等.棉花种质资源主要农艺性状的综合评价及聚类分析[J].新疆农业科学, 2011, 48(3):425-429.
[14]杜雄明,周忠丽.棉花种质资源描述规范和数据标准[M].北京:中国农业出版社, 2005.
[15]李小胜,陈珍珍.如何正确应用SPSS软件做主成分分析[J].统计研究, 2010, 27(8):105-108.
[16]李成奇,董承光,王清连,等.不同生态环境对陆地棉杂交F2代主要农艺性状的影响[J].广东农业科学, 2010,11:21-24.
[17]董承光,王 娟,周小凤,等.北疆早熟棉主要育种目标性状的相关性研究[J].西南农业学报, 2014, 27(5):2255-2257.
[18]艾先涛,李雪源,沙 红,等.南疆自育陆地棉品种遗传多样性研究[J].棉花学报, 2010, 22(6):603-610.
[19]艾先涛,李雪源,王俊铎,等.北疆陆地棉育成品种表型性状遗传多样性分析[J].分子植物育种, 2011, 9(1):113-122.
(责任编辑 李山云)
Clustering and Principal Components Analysis of Xinjiang Upland Cotton Variety Resources (GossypiumhirsutumL.)
DONG Cheng-guang, WANG Juan, ZHOU Xiao-feng, MA Xiao-mei, LI Sheng-xiu,YU Yu, LI Bao-cheng*
(Cotton Research Institute, Xinjiang Academy of Agricultural and Reclamation Science/Key Laboratory of China Northwesten Inland Region, Ministry of Agriculture, Xinjiang Shihezi 832000, China)
To give some message to develop upland cotton variety in Xinjiang, 14 traits of 84 varieties were analyzed by correlation and principle component in 2 places for 2 years, and the varieties were clustered based on principal components factors score. There were rich variations of main traits, and the coefficient variation of raw cotton yield, boll number and height of the first sympodial branch were higher. Principle component analysis indicated that the characteristic vector accumulated contribution rate of 5 principal components were 77.255 %. Fiber length and growth period in the 1stprincipal component, lint and raw cotton yield in the 2ndprincipal component had higher scores. Results reflected the importance of the 4 characters in upland cotton variety improvement. According to 5 principal components factors score, 84 varieties could be divided into 4 categories. And the percentage was 39.2 %, 54.8 %, 3.6 % and 39.2 % respectively. Xinluzao series and Xinluzhong series were distributed in all categories, and mixed each other. The results provided the basis for breeders in parent material choice, excellent allele mining and breeding direction exploring.
Xinjiang upland cotton; Main traits; Principal components analysis; Cluster analysis
1001-4829(2016)08-1798-08
10.16213/j.cnki.scjas.2016.08.008
2015-08-04
国家自然科学基金(31260340);兵团博士资金(2013BB001)
董承光(1978-),山西孝义人,副研究员,主要从事棉花遗传育种研究,E-mail:dcg318@163.com,*为通讯作者。
S326
A