黑龙江省近期审定大豆品种的聚类分析和主成分分析
2010-07-31辛秀珺于凤瑶周顺启张代军邱红梅
辛秀珺,于凤瑶,周顺启,张代军,邱红梅
(黑龙江省农垦总局 红兴隆农业科学研究所,黑龙江 友谊 155811)
黑龙江省是我国最大的大豆生产区,已育出大量的大豆品种,特别是从20世纪90年代开始,随着育种工作的发展,大豆品种不断推陈出新,到2007年为止已育成200余份品种。面对众多的大豆品种,只有了解品种的特性和相互之间的关系,才能更好地为选择亲本,培育更优质品种服务。因此多名学者为节省育种者了解品种性状的时间,做了多项研究。冷建田等[1]对全国166个参试品系、8个主要农艺性状进行聚类分析和主成分分析,表明遗传分歧的多向性与其地理分布有平行关系;李向华等[2]对89个中国春大豆按遗传距离聚类分为6大类,最后选取了6个综合性状对品种进行综合评价;胡立成等[3]在黑龙江大豆中选取了50个品种,对6个主要生物学性状进行聚类分析,判别大豆品种的多样性和遗传分歧的多向性;李永忠[4]对东北春大豆区的30个主要亲本进行聚类分析,得出地理远缘和遗传差异之间并不具有必然联系;张玉革等[5]对10个大豆品种进行聚类分析,评价了大豆的适应性及如何科学选择品种。笔者选用黑龙江省自20世纪90年代以来审定的大豆品种中的70份材料,进行聚类分析和主成分分析,旨在了解黑龙江省近期大豆品种的基因资源,为择优选择杂交亲本,扩大品种资源的利用提供理论依据。
1 材料与方法
1.1 供试材料与试验设计
供试大豆品种70份 (表1),于2009年在红兴隆科研所试验地(46.7°N,131.5°E)种植。该地区作物有效生育日数为120~125 d,≥10℃ 有效积温2 300~2 400℃,年平均降水量450~500 mm。
每个品种2行区,行长2 m,行距70 cm,株距5 cm,3次重复,随机区组排列。2009年5月4日人工点播,田间管理同大田。生育期间调查了出苗期、开花期、成熟期、生育期 (x1)以开花期为界限分成生育前期 (x2)和生育后期 (x3)。成熟时在中间连续取5株考种,考察了株高 (x4)、主茎节数 (x5)、分枝数 (x6)、分枝荚数 (x7)、单株总荚数 (x8)、主茎荚数 (x9)、单株粒数(x10)、单株粒重 (x11)。收获后测百粒重 (x12)、完整粒率 (x13)、产量 (x14)。蛋白质含量 (x15)、脂肪含量 (x16)用Foss1241近红外分析仪测定,然后算出蛋脂总含量 (x17)。
1.2 统计方法
聚类分析按欧氏距离进行聚类,聚类结果人为分组、归类。主成分分析采用 SPSS16.0[6]软件包对大豆17个生物学性状进行统计。
2 结果与分析
2.1 聚类分析
利用Excel 2003对70份大豆品种的生物学性状调查数据进行整理,得到17个性状的平均值。再利用 SPSS16.0进行聚类分析,得聚类树 (图1)。把图中虚线设为分类水平,将70个品种分为5个类群。
表1 品种名称及编号
图1 70个大豆品种的欧氏距离聚类树
从图1看出,归入同一类的品种彼此的遗传距离较小,不同类群之间的品种具有较大的差异,同一生态区和相邻生态区的品种被聚在一起,表明遗传分歧的多向性与其地理分布有平行关系。
从表2看出,1类品种大多来自第1积温带的松哈平原[7],为黑龙江省农科院和绥化所培育的品种。这一地区积温高、日照长、雨量充沛,形成了大豆蛋白高,粒大,成熟期长的特点。2类大部分品种来自三江低湿平原,属第2积温带,多为合江所和农场系统科研单位的品种。这一地区积温略低,形成了这一类品种蛋白含量中等、中粒、中熟的特点。3类多数来自三江低湿平原地区的品种,表现出了脂肪高、蛋白低、中熟等特点。4类、5类大豆品种多来自黑河地区,主要是黑河所和农垦北安所的品种,表现为脂肪较高、植株矮、早熟等特点。
不同类群的大豆品种脂肪、蛋白的含量有着不同的地理分布。松哈平原的大豆品种蛋白质含量较高,三江低湿平原大豆品种脂肪含量较高,这一结果与胡国华等[8]在2006年分析黑龙江大豆品质区划时得出的结论相吻合。
从表2中我们也看到,同一地区有的大豆品种聚在不同的类群中,说明同一生态地区的品种,在不同方向的人工选择下,可以引起很大遗传分歧,使得同一生态区的品种产生了较大差异。这与周述明[9]等研究表明类群间的差异与地理上的差异并不完全一致相同。从聚类分析中看到,2类群的一部分品种来自松哈平原,这可能是由于全球气候的变暖,第2积温带积温增加,此区域的大豆育种者在对品种选育过程中,非定向地选择了生育期较长的品系,区域试验和生产试验与对照生育期差异不大,就得到生育期较长的品种。
表2 各类群内的品种与类型
2.2 主成分分析
如果主成分分析中所提取的多个主成分的特征值贡献率能达到70%以上,就可以用这几个主成分对事物的属性进行概括性分析,基本可以得出影响事物性质的主要因素[10]。试验提取前5个主成分累计贡献率可达79.532% (表3),可以概括不同大豆品种主要生物学性状的绝大部分信息。
表3 70个大豆品种生物学性状的相关矩阵的特征值
从表3可知,第1主成分贡献率29.494%为最大,第2主成分的贡献率为21.496%,第3主成分的贡献率为11.979%,第4主成分的贡献率为9.170%,第5主成分的贡献率为7.393%。这5个主成分的特征值分别为 5.014、3.654、2.036、1.559、1.257。第1主成分特征值最大,它所含的性状信息应较多,但其贡献率只有29.494%,这是因为本研究中的17个生物学性状包含品质性状、形态农艺性状、产量性状,性状差异大,线性关系少,故此主成分分析得到多个主成分,且累积贡献率没有达到80%。
大豆品种主要生物学性状的主成分矩阵表(表4)显示了各性状在5个主成分中的权重系数,用此数除以主成分对应的特征值平方根便得到每个指标所对应的系数即特征向量。得到的特征向量与标准化后的数据相乘,最终得到主成分性状因子 F1、F2、F3、F4、F5(5个主成分) 的表达式:
表4 70个大豆品种主要生物学性状的主成分矩阵
式中Zx1,Zx2…… Zx17是原始生态学性状变量经过标准化处理的值,数据标准化是指Z标准化。
从主成分矩阵表和5个主成分表达式可看出以下几点。
第1主成分中单株总荚数、单株粒数、单株粒重等系数较大,其次是株高和主茎节数、生育期的系数较大且比较接近,称之为“产量构成因子”。当品种第1主成分大时,表现为植株高大,主茎节数多,单株荚数多、粒数多、单株粒重高,产量较高。
第2主成分系数较大的是生育期、生育后期,称为“熟期因子”。其次系数较大的为百粒重和蛋白含量。当品种第2主成分大时,则单株生育期较长,百粒重大,蛋白含量较高,脂肪含量低,分枝少,产量较高。
第3主成分中分枝数和分枝荚数系数最大,称之为“分枝因子”。主茎荚数和脂肪含量系数负值最大。表明单株分枝和分枝荚数较多时,主茎荚数少,脂肪含量低,蛋白含量高,百粒重较大等。
第4主成分单株总荚数、主茎荚数系数最高,称“荚数因子”。当单株总荚数、主茎荚数多时,则生育期较短,株高偏矮,百粒重略小、产量较低。
第5主成分百粒重、单株粒重、生育后期系数大,称为“粒重因子”。当品种第5主成分大时,单株则有百粒重大、单株粒重高、生育后期长,主茎节数、荚数较少,脂肪含量高,蛋白较低等特点。
3 小结和讨论
从聚类分析的结果可以看出,大部分是相同区域的品种聚在了同一类群,表明遗传分歧的多向性与其地理分布有一定的平行关系,这是因为这些地方品种都是在一定的自然环境条件下通过长期自然选择和人工定性选择获得的,在一定区域内形成了特定的生态型。
从不同的类群都有大粒、小粒、高蛋白、高脂肪品种,早、中、晚不同熟期,不同株型的品种等,说明黑龙江大豆品种资源的类型是丰富的。
聚类分析的结果我们也看到,有一些不同地区的品种聚在一类中,而同一地区的品种却聚在不同的类群中。像第2类群中包含了几个地区的品种,一方面说明大豆品种可能出现了亲缘相近和性状单一化的倾向,容易造成遗传资源的匮乏,另一方面也说明人工的定向培育和选择会造成比地理差异更大的遗传差异。选择亲本时,只凭地理远缘不一定能反映出亲本材料的差异。定量测定品种间的遗传距离,在距离大的类群间选择材料,作为杂交亲本往往有较好的结果。
由于所选择的群体和研究的性状不同,主成分构成的综合性状也是有区别的。本试验主成分分析表明,前5个主成分的方差累计贡献率大于79%,这5个主成分分别称为产量构成因子、熟期因子、分枝因子、荚数因子、粒重因子。第1主成分和第2主成分方差累积贡献率大于50%。第1主成分大时品种荚数多、粒数多、单株粒重大。第2主成分大时生育期长,百粒重大。所以在进行高产育种中应选择荚数多、粒数多、单株粒重大、生育期长,百粒重大的品种作亲本,在后代选择中也应加强这些性状的选择。
从主成分分析看,蛋白和脂肪含量在任一综合指标中都呈负相关。因此要培育二者皆高的高产品种可能性不大。而提高一方为主是能够达到的。用主成分分析对大豆品种进行评价,以高产为主综合性状好的品种特点是:植株比较高大,主茎节数多、荚数多、单株总荚数多、单株粒数多,粒重大、中晚熟,蛋白和脂肪含量中等偏低。
[1]冷建田,陈应志,王英,等.中国不同地区大豆育成品系的特点分析及品种选育方向的探讨 [J].大豆科学,2007,26(3):293-299.
[2]李向华,常汝镇.中国春大豆品种聚类分析及主成分分析[J].作物学报,1998,24(3):325-331.
[3]胡立成,姚远,李秀兰,等.黑龙江大豆品种聚类分析初探[J].大豆科学,1991,10(1):10-16.
[4]李永忠.东北春大豆区的一些主要杂交亲本聚类分析[J].遗传,1987,9(3):5-8.
[5]张玉革,胡绪彬.基于主成分和聚类分析的大豆品种生物学性状的比较研究 [J].大豆科学,2004,23(3):178-183.
[6]卢纹岱.SPSS for Windows统计分析 [M].2版.北京:电子工业出版社,2002:312-358.
[7]栾晓燕,杜维广,满为群,等.黑龙江省1986-2000年大豆育种研究成就与展望 [J].大豆科学,2004,23(2):134-142.
[8]胡国华,陈庆山,张锡名.黑龙江省大豆品质区划的探讨[J].大豆科学,2006,25(2):118-122.
[9]周述明,谢林,林文君.四川大豆地方品种资源初步研究Ⅲ遗传距离测定及聚类分析 [J].四川农业大学学报,1994,12(1):37-41.
[10]徐克学.生物数学 [M].北京:科学出版社,1999:12-102.