24份黍子材料农艺性状主成分和聚类分析
2022-08-19梁海燕林凤仙宋晓强邓亚蕊
杨 芳,梁海燕,林凤仙,宋晓强,邓亚蕊,李 海
(山西农业大学高寒区作物研究所,山西大同 037008)
0 引言
糜黍,属禾本科黍属,是一种起源于中国的传统栽培作物,在中国的栽培面积和产量位居世界第二位,具有生育期短、耐寒、耐贫瘠等特性,是禾谷类作物中最抗旱的作物之一,在中国农业发展历程中占据着重要的地位,又因其籽粒有粳性糯性之分,糯性一般被称为黍子,粳性称为糜子[1]。
山西降雨量少、气候干燥,地形复杂,多为丘陵山地,农业生产条件差,其农业生产以旱作农业为主,因此糜黍生产在山西各地,特别是在晋北、晋西北等干旱半干旱地区,具有明显的地区优势和生产优势[2]。另外,糜黍作为救灾备荒作物,在稳定粮食生产和保障人民生活方面发挥着重要的作用[3]。因此,加强糜黍育种及栽培技术研究,对促进旱区农业增效,农民持续增收和农业可持续发展具有重要的意义[4-5]。
近年来,为了加快糜黍新品种的培育,实现糜黍丰产、优质、高效生产,很多学者对糜黍进行各方面的研究。但糜黍实际生产中仍然存在许多问题现,所以加快优质品系材料筛及新品种的选定工作显得尤为重要[6]。
通过观察和分析作物的主要农艺性状,探讨作物新品系的农艺特性,对作物新品种的选育有着重要的意义。目前一般采用差异分析、相关分析和聚类分析等多种统计分析方法对作物的主要农艺性状进行比较分析。主成分分析是考察多个变量间相关性的一种多元统计方法,其目的是用较小的变量去解释原始数据中的大部分变异,更好地解释事物内在的规律[7];聚类分析是根据某些数量特征将观察对象进行分类的一种数理统计方法,其实质就是将相近的样品或变量聚在一起,将众多观测变量进行分类,达到降维归类的目的[8]。这2种方法已被广泛运用于花生[9]、大豆[10]、棉花等经济作物领域,如徐敏等[11]对早熟棉创新种质资源主要农艺性状进行聚类分析,将144 份种质资源材料分为9大类群,这些类群可分别作为早熟、大铃、抗病、高产、优质材料加以利用。另外,在谷子[12]、小麦[13]、水稻[14]、玉米等大宗作物领域,也有应用主成分分析及聚类分析进行评价的研究,如贾小平等[15]对42个谷子品种9个农艺性状进行聚类分析,将其分为2大类,反映了谷子群体某些性状的遗传差异。但是对于黍子的主成分及聚类分析较少,因此,本研究以此为切入点,以山西农业大学高寒作物研究所培育的24 份黍子品系材料为试验材料,对主要农艺性状进行差异分析、主成分分析和聚类分析,综合评价这24 份材料,其相关分析结果可为筛选培育出综合性优良品系提供思路,也可为本区域试验或品种审定和推广提供依据。
1 材料与方法
1.1 供试材料
本试验的24份黍子资源(表1)均为山西农业大学高寒区作物研究所品系材料。
表1 2019、2020年24份黍子试验材料
1.2 试验设计
试验在山西省农业大学高寒区作物研究所毛家皂试验基地进行。
试验随机区组排列,重复3次。小区面积10 m2(2 m×5 m),行距33 cm,2019 年及2020 年均在5 月27 日整地,6 月1 日播种,10 月2 日收获。播种前整地浇水1次,中耕除草2次,各项田间管理措施按常规实施。成熟期(全田大约2/3 植株变黄)时,取各小区有代表性的5株植株进行考种,考察株高、穗长、基茎粗、公顷产量等10个农艺性状,以小区实收计产。
1.3 统计方法与数据处理
本研究利用数据软件Microsoft Excel2010和SPSS 22.0对所测得的数据进行统计分析以及图表制作。
2 结果与分析
2.1 描述性统计
本试验通过对选取的24 份黍子材料的株高、穗长、基茎粗、公顷产量等10个农艺性状2年数据的平均数进行描述性统计,结果如表2 所示。10 个黍子农艺性状均有不同程度的差异,株高平均值为121.95 cm,变化范围为97.4~146.8 cm;穗长平均值为32.59 cm,变化范围为26.4~38.1 cm;基茎粗平均值为0.62 cm,变化范围为0.5~0.8 cm;主茎节数平均值为7.44,变化范围为6.4~8.2;穗重平均值为8.41 g,变化范围为5~12.2 g;穗粒重平均值为6.43 g;变化范围为3.8~9.6 g;千粒重平均值为8.01 g,变化范围为7.1~10 g;小区产量平均值为3.06 kg,变化范围为2.4~3.8 kg;折合产量平均值为3070.05 kg/hm2,变化范围为2446.5~3843 kg/hm2;生育期平均值为96.17 天,变化范围为86~102 天。其中穗重和穗粒重的变异程度最大,分别为26.15%和27.77%;而生育期和主茎节数2 个性状方面变异程度较小,分别为3.76%和5.65%。结果表明,在24份供试材料中,生育期及主茎节数变异幅度不大,而产量相关性状变异幅度较大,各性状变异幅度的存在为优质资源的筛选创造了条件。
表2 描述性统计表
2.2 主成分分析
经过对数据进行KMO 检验和Bartlett 球度检验,结果如表3所示。KMO值为0.534,根据KMO度量标准,原始变量适合进行因子分析。且Bartlett球度检验得出的相伴概率为0.000,小于显著性水平0.05,因此拒绝Bartlett球度检验的零假设,认为变量间存在较强的相关性。验证结果表明,本试验数据符合因子分析。
表3 KMO与Bartlett检验
对这10个性状数据采用主成分分析法进分析,各个主因子的特征值、累积贡献率如表4 所示。从表中可以看出,前4 个因子变量的特征值均大于1,并且经过最大方差旋转后它们的方差贡献率分别为25.21%、24.478%、20.841%、14.372%,累计方差贡献率达到84.9%,即这4 个因子已经把24 份黍子材料的10 项农艺性状的绝大部分信息反映出来,因此可以选取这4个公因子代替原有的10个性状进行下一步分析。
表4 不同材料农艺性状主成分总方差贡献率
进一步得出成分得分系数矩阵,如表5所示。
表5 成分得分系数矩阵
从表中可看出第一公因子F1主要是穗粒重、粒重和千粒重3 个因子综合作用的指标;第二公因子F2主要是株高、穗长和基茎粗3个因子综合作用的指标;第三公因子F3主要是小区产量和折合公顷产量2个因子作用的指标;F4主要是生育期、主茎节数的2个因子作用的指标。
假设X1~X10依次为株高、穗长、基茎粗、主茎节数、穗重、穗粒重、千粒重、小区产量、折合产量和生育期。
由此可得出24 份黍子品系材料农艺性状各公因子的得分公式,见式(1)~(4)。
再根据4个公因子旋转后的方差贡献率及对应的公因子得分计算公式,即可得出Fz,即各材料综合评价得分公式见式(5)。
以此得出24份黍子材料综合评分如表6所示(按评分降序排列)。
表6 24个黍子品种综合得分情况
2.3 聚类分析
聚类分析是研究样本与指标分类问题的一种统计方法,已经被广泛地应用于各个领域。聚类分析根据相似性较高的特性可以把样本或指标分为几类,使得类内个体具有较高的同质性,类间个体具有较大的差异性。
本试验针对24 份黍子材料10 个农艺性状进行聚类分析,并根据聚合系数来确定最优系统聚类类别数,如表7和图1可得出此次聚类分4类效果最好。
图1 聚合系数折线图
表7 凝聚计划
如图2所示,当欧氏距离=10时,24份黍子材料分4类,序号21、23综合为一类,序号11、19、15、18、17、8、24、10、20、16、22、3、5、6、9 为二类,序号为2、4、7、1 为三类,序号12、13、14为四类。
图2 系统聚类谱系图
再对聚类进行OLAP 多维数据分析,得出OLAP多维数据集,如表8 所示。根据表6 的24 份黍子材料综合得分情况和表8 的OLAP 多维数据集的4 类变量信息的平均值可得出,序号21 和23 的第一类评分最高,均分为41.78,其小区产量和折合产量最高,均值分别为3.75 kg和251.1 kg/hm2,株高、穗长和基茎粗的平均值较低,分别为114.35、29.8、0.55 cm;第二类评分次之,均分为38.48,产量次之,小区产量和折合产量分别为3.15 kg 和210.6 kg/hm2,而株高、穗长、基茎粗、穗重、穗粒重的平均值也较高,为121.21 cm、32.69 cm、0.61 cm、8.49 g、6.54 g;第三类评分较低为37.69,小区产量和折合产量较低,为2.78 kg、185.1 kg/hm2,但株高、穗长、基茎粗平均值最高,为141.48、35.68、0.68 cm,穗重、穗粒重、千粒重平均值也较高,分别为8.7、6.48、7.83 g;第四类材料评分、产量的平均值均为最低,其他生物性状表现也不理想。
表8 OLAP多维数据集
3 讨论
虽然目前已有不少关于作物主成分及聚类分析的研究,但大多都是集中在大宗作物以及经济作物的研究上,对于需求较少的黍子的相关研究较少。李星聪等[16]对30 份糜子高代矮化品系进行方差分析和聚类分析,其结果可为培育高代矮化糜子品种提供育种思路,填补了高代矮化糜子研究的空缺。陈凌等[17]对100份糜子耐低氮性进行聚类分析和主成分分析,将100份糜子分为3类并得出4个耐低氮能力最强的品种,可作为糜子氮高效育种的参考资源。闫峰等[18]对149份糜子进行主成分和聚类分析,将其分为4个类群,为黍子高产育种的亲本选择了原材料。袁雨豪等[19]对100份黍子耐盐性进行主成分和聚类分析,筛选出了11份高度耐盐品种资源。本试验在借鉴其他科研人员的研究基础上,利用SPSS 软件对24 份黍子品系材料的农艺性状进行主成分及聚类分析,筛选出优异品系材料,以期为当地黍子下一阶段育种研究工作提供参考。
本试验的24份品系材料选自2019、2020年田间观测穗重较大的单株,选株方法符合系统选育“优中选优”的思想,所以此试验并不能完全地说明每个品系的状况。而且,本试验中穗重和穗粒重的变异系数较大,推测也有原因是因为参试材料在穗粒重方面表现还不太稳定,还需继续进一步的选育研究。另外,2019 年秋季因雨水较多,造成供试材料中‘97-2-1-6’、‘早杂9913-2’、‘975-9’出现倒伏情况,推测会对结果造成一定影响,影响情况还有待进一步研究验证。
最后,本试验仅从10个农艺性状方面入手研究24份黍子品系材料,其结果只是说明这24份材料糜子在农艺性状层面表现出的结果,还存在一定的局限性,为方便今后当地的黍子育种工作,日后还可从细胞学、生理生化等角度深入研究,才能更加充分地发挥品系材料的作用。
4 结论
根据描述性统计分析可得出,24份黍子材料的10个农艺性状均存在一定的差异。穗重和穗粒重的变异系数最大,均在25%以上,说明24 份品系材料在穗重和穗粒重性状上稳定性一般,育种改良空间较大;生育期和主茎节数2 个性状方面变异系数较小,表明在此方面育种改良空间较小。
从主成分分析结果可以看出,第一公因子F1主要是穗粒重、粒重、千粒重3 个因子综合作用的指标,主要反映了黍子单株产量的大小;第二公因子F2主要是株高、穗长、基茎粗3 个因子综合作用的指标,主要反映黍子生长性状的情况;第三公因子F3主要是小区产量和折合产量2 个因子作用的指标,主要反映的是黍子经济性状的情况,第四公因子F4主要是反映生育期、主茎节数的生理指标。另外,根据主成分分析也得出4个主成分公因子得分公式及24份材料的综合得分情况。
根据聚类分析可得出,当欧式距离为10时,24个黍子材料归为4类,‘201-8’和‘06-D69’为第一类,其评分及折合产量最高,为41.78和251.1 kg/hm2;‘973-28-2’、‘201-20’、‘21-28’、‘06-D4’、‘早杂9913-1’、‘Jul-54’、‘201-18-8’、‘8106-981-3-10’、‘974’、‘06-D-41’、‘黍21-7’、‘9721’、‘34042-287’、‘9716-28-03’、‘8305-183-3-9’为第二类,其综合得分情况及折合产量较高,为38.48和210.6 kg/hm2,且株高、穗长、基茎粗生物性状较高,穗重和穗粒重单株产量表现均较高;‘早杂9913-2’、‘97-2-1-6’、‘975-9、Y9801-2’为第三类,其评分和产量较低,为37.69和185.1 kg/hm2,但其株高、穗长、基茎粗等生物性状表现最好,分别为141.48、35.68、0.68 cm;‘9723-28-04’、‘9752-28-05’、‘9838-28-06’为第四类,其产量和评分最低,各农艺性状表现均不理想。
在对2年24份黍子材料农艺性状的分析后可得出结果:在进行黍子育种培育工作时,第一类、二类的品系材料,因其评分及产量较高,且在穗重和穗粒重的改良空间较大,所以在选择申报或者培育优秀新品种的工作中可优先考虑;第三类在株高、穗长、基茎粗等生物性状方面表现较好,可在高秆品种或者抗倒伏品种培育工作中考虑;第四类材料各项指标均不理想,不建议进行各项育种培育工作。