基于主成分分析和聚类分析的夏播花生综合评价研究
2021-08-18蒋相国李红梅蔡金兰
郭 凯,蒋相国,李红梅,蔡金兰
(1.湖北省襄阳市农业科学院,湖北 襄阳 441004;2.河南省邓州市农业技术推广中心,河南 邓州 474150)
花生是中国重要的油料作物和经济作物,总产量和单产均居世界首位[1],约占世界总产量4 398万t的40%[2]。随着农业经济结构调整和农业产业化的不断推进,花生生产日益受到重视[1,3]。提高单位面积产量和改进产品质量是中国花生产业发展的关键[4]。夏播花生较春播花生,其生长周期较短,产量、品质性状也具有较大差异[5]。小麦-花生轮作是主要的夏播花生种植方式[6]。薛云云等[7]对24份山西省花生资源农艺性状进行了相关性和主成分分析,发现饱果数与产量性状有极显著相关关系。殷冬梅等[8]通过主成分分析和聚类分析对18个花生品系的品质性状进行了综合评价,得到4个主成分因子,可以代表10个品质性状80.73%的原始数据信息量。范小玉等[9]对河南省32个夏播花生品种的农艺性状及品质性状进行相关性及聚类分析,适合夏播种植的品种大多属于果型较小的品种。
湖北省花生产区属长江流域春夏花生区[10],常年种植面积超过23万hm2[11]。近年来,湖北省花生播种面积和产量逐年增加[12],高产优质抗病的花生品种越来越受到育种和推广部门的重视[13],然而关于本地区花生综合评价分析研究较少。本研究通过对11个花生品种的主要农艺性状和品质性状进行主成分分析,以期充分了解各品种的优良特性和综合表现,进而筛选适宜鄂北地区夏播种植的花生品种,为推广优良夏播花生品种提供参考依据。
1 材料与方法
1.1 试验地点
试验地点位于湖北省襄阳市南漳县九集镇泉水堰村襄阳市农科院花生试验基地,试验地地势平坦、四周空旷,土壤类型为黄褐土,肥力均匀,前茬小麦,于2019年6月7日足墒播种,田间管理措施同一般高产田。
1.2 试验材料与试验设计
11个试验品种为引进优良品种和当地推广品种,品种来源见表1,随机区组排列,3次重复。
表1 11个试验品种及其来源
1.3 数据处理
采用Excel 2010软件对试验数据进行整理,并采用SPSS 22.0软件进行主成分分析和聚类分析。
2 结果与分析
2.1 不同夏播花生品种农艺性状的表现
由参试的11个花生品种农艺性状表现(表2、表3)可知,各品种生育期在111~113 d,符合鄂北地区麦后夏花生生育期要求,但合花1号和湘花666出苗率较低;主茎高变化范围为32.2~53.5 cm,极差为21.3 cm。从主茎高和侧枝长数据得出,杜皮红植株较高,生产上应考虑化控药剂的使用;百果重最大的花生品种是中花215,为225.6 g,杜皮红百果重、百仁重均较小,分别为131.0、52.3 g;中花16、天府22、泰花5号出仁率较高,达到75%以上;产量较高的品种有中花16、中花215、天府22、宁泰9922。
表2 不同夏播花生品种生育期及农艺性状的表现
表3 不同夏播花生品种产量性状的表现
2.2 不同夏播花生品种农艺性状的主成分分析
在SPSS 22.0软件中进行数据标准化和正向化处理后,对花生21个主要农艺性状和产量性状进行主成分分析,得到特征值、方差贡献率、累计方差贡献率及特征向量(表4、表5)。选取λ大于1的前6个主成分,累计方差贡献率达90.064%,代表了21个原始性状的90.064%的数据信息,可以用这6个主成分代替上述21个农艺性状进行适应性综合评价。第1主成分PC1的方差贡献率为33.940%,决定PC1的主要指标有生育期、总分枝数、结果枝数、单株生产力、百果重、百仁重、产量,PC1反映的主要是分枝特性和产量特性。第2主成分PC2的方差贡献率为20.141%,决定PC2的主要指标有出苗率、饱果重、饱果重率,PC2反映的主要是出苗特性和结果特性。第3主成分PC3的方差贡献率为13.447%,决定PC3的主要指标有饱仁重率、荚果饱满度,PC3反映的主要是果仁饱满特性。第4主成分PC4的方差贡献率为9.086%,决定PC4的主要指标有出仁率、荚果饱满度,PC4反映的是出仁特性。第5主成分PC5的方差贡献率为8.034%,决定PC5的主要指标有主茎高和侧枝长,PC5反映的主要是株高特性。第6主成分PC6的方差贡献率为5.416%,决定PC6的主要指标有饱果数和芽果数,PC6反映的主要是结果数量特性。
表4 不同夏播花生品种6个主成分的特征值、方差贡献率和累计方差贡献率
表5 主成分载荷矩阵和特征向量
2.3 不同夏播花生品种的综合评价
通过对6个主成分的特征向量和21个性状指标的标准化数值(X1+X2+X3……X21)进行处理,建立6个主成分的线性回归方程如下:
然后以每个主成分所对应的方差贡献率α1、α2、α3、α4、α5、α6作为权重系数,计算主成分综合模型为:
得到各主成分得分和综合得分见表6。评价得分较高的有中花16、天府22、宁泰9922、中花215、湘花645,这几个品种适应性较高,较其他花生品种适宜鄂北地区夏播种植。
表6 不同夏播花生品种的主成分得分及综合评价
2.4 不同夏播花生品种的聚类分析
采用SPSS 22.0软件对这11个参试夏播花生品种的主要农艺性状进行聚类分析,聚类采用欧氏距离,聚类方法采用最短距离法得到树状图,如图1所示。当阈值为7.5时,将11个夏播花生品种聚为3类,中花16、湘花645、中花215、天府26、宁泰9922、泰花5号聚为第一类,这6个品种主茎高和侧枝长表现中等,分枝数和结果枝数较多,百果重在189.7~225.6 g,除天府26外,5个品种总果数和饱果数均较多,产量表现均较好;皖花4号、合花1号、湘花666聚为第二类,这3个品种出苗率较低,分枝数和结果数较少,总分枝数5.9~6.5个,单株总结果数19.5~20.8个;天府22和杜皮红聚为第三类,此类品种果型和子粒较小,百果重分别为156.5、131.0 g,百仁重分别为64.1、52.3 g。
图1 不同夏播花生品种的聚类分析
3 讨论和结论
植物的生长发育、生理特性不仅受自身基因型的控制,水分、光照、温度等外界环境条件也会对其产生一定影响,同一品种在不同生态环境下性状表现也会有较大差异[14]。环境效应、基因型与环境互作效应降低了农作物可重复的遗传变异的可靠性[15],增加了品种推广应用效果的不确定性和生产应用风险。因此,对新品种在不同环境下综合性状的全面评价,对于品种的选育和推广具有重要意义。农作物品种的评价由于指标较多,而且各指标之间存在较复杂的相关关系,给品种筛选带来一定的困难[8,9]。主成分分析是利用降维思维,将多个变量简化成少数综合变量的一种统计分析,主成分分析和聚类分析已在水稻、小麦、玉米等多种作物的综合评价上得到了广泛应用[16-20]。
本研究通过主成分分析法对参试夏花生品种农艺性状指标进行了综合,并采用聚类分析对不同参试品种进行了聚类,将21个性状指标简化为6个指标,其累计方差贡献率达90.064%,能够反映原始数据的绝大部分信息,主成分分析可以简化分析评价流程,根据各主成分得分和综合得分情况,对参试品种的性状进行综合评定,筛选适宜本区域生态条件种植的夏播花生品种。利用聚类分析,将11个花生品种分为性状表现存在差异的3个类群,第1类群品种与主成分分析评分较高品种虽大多数一致,但也存在一定差异,实际应用中应根据具体情况加以选择。综合主成分分析和聚类分析,不仅能够更准确地分析评价参试品种,而且对品种性状差异分级、品种资源选育、种质资源鉴定等都具有重要意义。