陆地棉F2代单株选择的主成分分析
2011-10-16王巧玲李哲
王巧玲,李哲
(河南科技学院,河南新乡453003)
自从20世纪90年代初人们采用基因工程的方法将苏云金芽胞杆菌Bscillus thuringiensis(Bt)的晶体蛋白基因转入棉花品种中以后,陆地棉品种基因库中就有了Bt抗虫基因.育种家们不但可以采用基因工程的方法培育抗虫棉品种,也可以利用基因库中丰富的非抗虫棉品种资源,采用常规育种的方法培育抗虫棉品种,而常规育种最常用的方法是杂交育种.将抗虫棉品种和非抗虫棉品种杂交F1代抗虫基因位点处于半合子状态[1],F2代基因位点间出现重组,当亲本组合确定以后,通过一定的方法和途径提高F2代的单株选择效果就成为重组育种的关键技术.主成分分析是一种多元统计分析方法,它是利用原始变量之间的相关性,经过数据转换将多个性状指标转化为较少指标,彼此互不相关,且能反映原来多个性状指标的主要信息,构建少数几个因子的线性组合解释原来变量实现降维[2].主成分分析用于遗传育种的研究已有很多报道[3-4],但对F2代在选择条件下单株性状的主成分分析的研究迄今未见报道.本文旨在通过主成分分析的方法对F2代在选择条件下的单株性状进行研究,为提高F2代单株选择效果提供理论依据.
1 材料与方法
1.1 材料
试验材料为抗虫棉品种“D17”和自育的非抗虫品种“HN68”的杂交F1代,F1代自交得F2代.
1.2 方法
1.2.1 试验方法 试验在河南科技学院百泉校区试验田进行,4月23日播种,行长8 m,行距1.0 m,株距0.3 m,土壤肥力中等偏上,管理同大田.于9月下旬在F2代群体中按照育种目标选择86个单株,经筛选保留 64 个单株,并调查各单株的果枝夹角(X1)、节位(X2)、株高(X3)、果枝数(X4)、果节数(X5)、第一果枝第一果节长(X6)、主茎平均节长(X7)、铃数(X8),并通过室内考种测得铃重(X9)、衣分(X10).
1.2.2 统计分析方法 统计分析利用主成分分析的方法,首先原始数据进行数据变换,进行标准化处理,然后从相关阵出发进行主成分分析.数据处理由SAS9.0[5]和Excel完成.
2 结果与分析
2.1 性状主成分分析
在主成分分析中,方差代表性状在主成分方向上的分散程度,方差越大,主成分在样本数据分析中所起的作用越大.对供试材料的10个性状进行主成分分析,得到10个性状的遗传相关矩阵(见表1).
表1 10个性状的相关系数
从相关矩阵出发求得其主成分的方差贡献率和累积方差贡献率(见表2).
表2 10个性状主成分的方差贡献率和累积方差贡献率
由表2可见,前5个主成分累积方差贡献率为74.95%,意味着前5个主成分的遗传信息在总遗传信息中占74.95%,其余5个主成分的遗传信息在样本试验中所起的作用仅为25.05%.所以,前5个主成分能反映该性状的大部分遗传信息.本文仅取前5个主成分来进行分析.其特征根和对应的特征向量见表3.
表3 64个单株的综合性状及产量相关矩阵的特征向量
由于主成分是原性状的线性组合函数,根据计算样本相关矩阵的特征向量,可给出各主成分的函数表达式:
由函数表达式可以看出:
第 1主成分 Y1中,果节数(0.506 1)的特征向量系数最大,其次是果枝数(0.461 8)、铃数(0.451 3)、株高(0.444 5),三者的信息载荷量较大且作用方向相同,说明植株较高的类型果枝数较多,其果节数也会随之增多,会导致成铃数增加.因而称之为结铃性因子.但在此主成分中,铃重也有较大的载荷量(0.331 3),说明由于株高的提高不但可以提高结铃性,也可以在一定程度上提高铃重.其它,如节位(-0.066 5)、第一果枝第一果节长(-0.037 6)和衣分(-0.027 6),三者的作用方向相反,但载荷量较小,对结铃性的影响不大,可以不予考虑或较少考虑.
第2主成分Y2中,夹角(0.572 0)的特征向量值最大,其次是主茎平均节长(0.533 2)、第一果枝第一果节长(0.403 3),三者的信息载荷量较大且方向相同均为正值.说明夹角越大,其主茎平均节长就越长,第一果枝第一果节也会较长.该主成分主要是反应株型的形态指标,故称之为株型因子.在此主成分中铃重也有较大的载荷量(0.331 1),且作用方向也相同,说明株型因子对铃重具有较高的正向作用,松散型也可有利于铃重的提高.衣分的绝对值(X10=-0.260 2)也较大,但为负值,说明松散型不利于衣分的提高.在育种中应注意协调这种关系,该因子不宜过高,应保持在一定的范围内.选择夹角适中、第一果节适当较长的植株,从而达到高产的目标.
第3主成分中,节位(0.825 0)值最大,铃重(0.331 1)次之,故称之为铃重因子.说明随着对节位的正向选择可使铃重增加.但在实际工作中,节位不宜过高,节位与早熟性有较大的相关性,大铃晚熟.第一果枝第一果节长的值也较大,但为负值(-0.367 9).在该组合中,节位较高的类型,第一果枝第一果节长的长度可较短,有利于铃重的提高,不利于综合性状的提高,一般节位应控制在一个适当的范围内.
第4主成分中衣分(0.810 1)值最大,其次是第一果枝第一果节长(X6=0.350 1)和铃重(X9=0.273 0),三者呈正相关.在此主成分中铃数(X8=-0.270 3)的负值最大,由此可以得到铃数与铃重、衣分的作用方向相反,表明第4主成分主要反映了棉花的衣分因子,即经济产量转换因子.铃重和衣分可同步提高,单株结铃数不能同步提高,三者都是构成产量的直接性状.
第5主成分中,第一果枝第一果节长(X6=0.501 0)值最大,其次是株高(X3=0.315 5)和节位(X2=0.302 6),即第一果节越长植株相对高大,节位高说明植株营养器官发达,生物产量高,第5主成分称为生物产量因子.该主成分中夹角(X1=-0.599 6)负值最大,其次是衣分(X10=-0.355 5)和果枝数(X4=-0.222 7).第一果节越长其夹角就相对越小,衣分值也相对降低,在一定程度上影响生物产量向经济产量的转换率.所以在选择过程中,不能选择第一果节过长的植株.
总之,由主成分的方差贡献率决定5个主成分(Y1-5),原性状(X1-10)的相关矩阵的特征向量进一步表明棉花的形态性状与各产量构成性状之间都有不同程度的相关作用,有些为负向作用[6].64个处理的主成分因子得分见表4.
表4 64个处理的主成分因子得分
注:得分由低至高排序.
2.2 利用主成分值选择优良组合
棉花主栽品种的形态性状及产量取决于夹角、节位、株高、果枝数、果节数、第一果节长、平均节长、铃数、铃重、衣分等10个性状指标.5个主成分可以反映其主要性状指标.因此,可用主成分值作为选择优良单株的依据,经对数据标准化转换,计算各个主成分值,以计算各个组合5个主成分的总分,进而可选择符合育种目标的优良单株.
通过5个主成分的得分,可以看出单株57得分最高,其次为单株45,而单株36和单株34得分最低,说明单株57和45综合性状表现优良,而单株36和单株34综合性状表现较差,在选择单株时应考虑是否淘汰,可以此作为单株选择的综合指标.
3 小结与讨论
3.1 小结
陆地棉F2代杂交种主要性状相关系数结果表明:果节数、果枝数、株铃数、单铃重、衣分与单株皮棉产量的相关系数大,对单株皮棉产量的直接作用最大,棉花新品种要在产量上有所突破,在选择结铃性强的材料前提下,可选择在同等条件下果枝数、果节数较多类型,这样有利于提高单株结铃数.衣分是构成产量的直接性状,衣分的提高有利于单株皮棉产量的提高[7].在育种实践中,产量与纤维品质必须兼顾.
陆地棉F2代杂交种主成分分析结果表明:第1主成分是结铃性的因子,第2主成分是植株形态性状的形态因子,第3主成分是铃重因子,第4主成分是衣分因子,第5主成分是生物产量因子.各个主成分反映了陆地棉F2代单株的形态性状和产量,但综合起来,基本上可以反映陆地棉产量性状的构成.因此,用主成分值得分作为陆地棉单株选择标准,较用单一性状加权打分选择更为简便,同时避免了性状间的相关性对选择效果的影响[8],较人为加权打分选种更具准确性和科学性.
应用主成分值对陆地棉F2代的64个单株进行排序分析[9],其结果表明用主成分值选种在抗虫棉单株选择中有一定的应用价值,在实际应用中,通过计算育种材料的主成分值,可以综合评判品种的优劣.本文由5个主成分值的总得分,可以看出单株57的得分最高,其次为单株45,而单株36和34的得分相对较低,说明单株57和45的综合性状表现优良,但单株36和34的综合性状则表现较差,应予以淘汰.研究未将棉株生长、发育性状同时考虑,其相关问题尚待进一步探讨.
3.2 将主成分值得分作为综合选择指数的讨论
作物育种的总目标是高产、优质、早熟、多抗性,归根结底要落实到产量和品质上,但构成产量和品质的综合性状间又存在着错综复杂的相关关系[10],对某单一性状的选择往往伴随其它相关性状的变化,常有顾此失彼之感,要提高选择效果,必须正确处理各性状的相关关系,选择指数正是在这种状况下提出的.选择指数是数量遗传研究的一个重要方面,近年来许多遗传学家构建了许多选择指数,如遗传相关系数、回归系数、相关遗传力、遗传力等.主成分分析首先进行数据标准化处理,然后从相关矩阵出发,求得各主成分的线性组合,并通过筛选、选择主成分值较大的主成分,作为该单株或品种材料的综合得分.这样在遗传信息失之甚少的情况下对各构成性状进行选择,会显得目标更加明确集中.因此,采用主成分分析法构建一个新的选择指数,以此作为F2代单株选择的依据,更加符合实际工作需要.
[1]李哲,崔秀珍,常俊香,等.半合子Bt基因抗虫杂交棉产量主要构成因素分析[J].河南农业科学,2007(8):46-49.
[2]陈荣江,王文峰,朱明哲.棉花新品种产量性状与品质性状的典型相关与主成分分析[J].农业系统科学与综合研究,2007,23(2):187-189,195.
[3]徐崇志,李青.陆地棉纤维品质性状的主成分分析[J].新疆农业科学,2006,43(2):121-124.
[4]刘英欣,张忠朕.陆地棉主要经济性状的相关分析[J].种子,1998(5):26-28.
[5]李静萍,谢邦昌.多元统计分析方法与应用[M].北京:中国人民大学出版社,2008:34-48.
[6]张志刚,李景龙,曾昭云,等.棉花新品种主要农艺及纤维性状综合评价的研究[J].江西棉花,2003(5):11-14.
[7]陈旭升,郭志刚,许乃银,等.转Bt基因抗虫棉与主要经济性状的相关研究[J].江西农业学报,2002,14(3):23-28.
[8]赫德荣,何林池,刘水东,等.转基因抗虫棉数量性状的典型相关和主成分析[J].金陵科技学院学报,2006,22(1):75-78.
[9]邢朝柱,靖深蓉,郭立平,等.转Bt基因棉杂种优势及性状配合力研究[J].棉花学报,2000,12(1):6-11.
[10]陈荣江,王清连,朱明哲.棉花产量性状与纤维品质性状的关联度及典型相关分析[J].河南农业科学,2005(5):43-46.