黄淮海区玉米品种主成分分析和遗传距离测定及其适应性评价
2023-12-13马红珍许海涛冯晓曦郭海斌张军刚王友华
马红珍 许海涛 冯晓曦 许 波 郭海斌 张军刚 王友华
(驻马店市农业科学院 河南驻马店 463000)
玉米是黄淮海区重要的粮食作物, 也是我国工业与饲料的主要原料来源, 在粮食安全保障方面具有十分重要的战略地位[1]。2022 年我国玉米种植面积4 020 万hm2,全国总产量25 852 万t,其中黄淮海区玉米总产量8 562 万t, 约占全国玉米总产量的33.12%。 为选育应用高产稳产、优质、抗逆等具有优良性状的玉米新品种, 在选育过程中需要对玉米品种的众多性状进行研究, 从中筛选出适应生产需求的新品种[2-3]。 品种评价是玉米育种的关键环节之一,从确立育种目标、品种评价至优异品种选育,均需要一个全面、定量、客观、科学的评价体系[4]。 主成分分析对数个性状指标利用一种降维方法进行研究,在信息损失较少的基础上, 找到可代表原来较多变量的几个综合因子, 使其尽可能多地承载原变量的信息量,把多个因子转化成几个互不相关的综合指标,可避免信息重叠及交叉, 又可综合反映多个原指标信息,使结果分析进一步简化、清晰、可信、客观,从大量复杂试验数据中能够透析事物本质[1,5-6]。 国内外学者对玉米主成分分析评价已有应用并取得了一定进展。 Sandeep 等[7]对60 个玉米自交系主成分分析表明,自交系前3 个向量占总变异的82.41%,其中第一向量(PCⅠ)占总变异的58.36%,第二向量(PCⅡ)占总变异的16.11%, 第三向量 (PCⅢ) 占总变异的7.94%。 王俊花等[8]对60 个鲜食糯玉米组合进行主成分分析, 前5 个主成分累计贡献率已达87.629%,第1 主成分是评判糯玉米组合的关键指标, 为产量因子, 第2、3、4、5 个主成分因子分别为穗位高、 秃尖长、生育期、穗长因子,基于主成分分析评价结果筛选优良糯玉米组合18 份,在山西晋中盆地高产优质糯玉米品种选育中要优先选择长穗、 短秃尖、 鲜穗重、生育期为87 d 的组合。
近年来黄淮海区每年审定的玉米品种较多,加速了玉米品种的更新换代, 玉米种植户对玉米品种选择范围扩大,而选择难度提高,使不适宜在黄淮海区种植的玉米品种流入当地的风险增加[9]。 目前缺乏有关品种的优化评价方面的文献, 未来玉米品种评价中需对品种间的差异性做更细致的分析[10]。当前对玉米品种优良与否的评判多以品质、 抗逆性和产量指标作为评价因子,受主观因素影响显著,而采用主成分分析方法,能够去除评判因子之间的相关影响,减轻因子选择时的较大工作量, 截至目前尚未见有关主成分分析和遗传距离测定在黄淮海区玉米品种适应性评价应用的相关报道。 本文作者选用近年来黄淮海区选育成的34 个玉米新品种, 对玉米12 个性状进行主成分分析和遗传距离测定, 旨在全面评判黄淮海区玉米品种各性状的综合表现, 为进一步选育核心种质,充分采用既有品种,对玉米品种资源采取数量化研究,挖掘具有新杂种优势的玉米群体,为探明玉米品种的选育目标性状,提供理论基础。
1 材料与方法
1.1 试验材料
以34 个玉米品种为试验材料。 材料名称、亲本组合及选育单位见表1。
表1 供试品种及组合
1.2 试验设计
试验安排在驻马店市农业科学院试验站, 前茬作物为小麦,秸秆还田,2022 年6 月10 日播种,6 月15-16 日出苗,行长6 m,行距66.7 cm,5 行区,小区面积20 m2,留苗密度7.5 万株/hm2,3 次重复,随机区组排列,田间管理同一般大田生产一致,9 月19-24 日成熟收获。
1.3 指标测定与方法
34 份供试玉米材料的农艺性状严格按照 《农作物品种试验技术规程 玉米》 附录A (NY/T 1209-2006)的要求标准记载与测定。 调查测定指标:成熟期实收中间3 行测定小区产量 (X1)、 调查百粒重(X2)、穗粗(X3)、穗长(X4)、穗行数(X5)、行粒数(X6)、出籽率(X7)、秃尖长(X8)、籽粒含水量(X9)、生育期(X10)、株高(X11)、倒伏率(X12)。
参照文献[11],利用Shannon-weaver 信息指数计算遗传多样性指数(H′),H′=-ΣPilnPi,其中Pi是某一性状在第i个级别的出现频率。 多样性指数分级划分:按照供试材料平均值(X)及标准差(S)共划分成10 级,从第1 级Xi<X-2S到第9 级Xi<X+2S, 第10 级Xi>X+2S,每一级增加0.5S,通过每一级相对应的频率进行多样性指数计算。
1.4 数据处理
采用Microsoft Office Excel 2003 计算遗传多样性指数及处理数据、制表;采用DPS 9.01 进行主成分分析;利用IBM SPSS Statistics 27 的对数然值及施瓦茨贝斯准则(BIC)对性状指标进行二阶自动聚类,以欧式距离(D2)、最短距离法对品种进行遗传距离测定及聚类;采用SigmaPlot 14.0 进行绘图。
2 结果与分析
2.1 玉米品种主要性状指标、遗传多样性分析结果
变异系数是评价各性状指标测定值的差异大小与变异幅度的统计量,其值越大选择的潜力也越大[6]。由表2 可知,34 个玉米品种12 个性状指标的变异系数与遗传多样性指数存在显著差异, 变异范围为1.19%~90.21%,遗传多样性指数(H′)为0.37~1.86;变异系数依次为倒伏率>秃尖长>行粒数>百粒重>穗行数>株高>小区产量>籽粒含水量>穗长>穗粗>生育期>出籽率,遗传多样性指数(H′)依次为百粒重、出籽率>行粒数>秃尖长>小区产量、 株高>穗长>生育期>穗粗>籽粒含水量>倒伏率。变异系数大于10%的倒伏率、秃尖长、行粒数、百粒重受品种基因型与环境的影响较大,遗传多样性指数(H′)整体较高,表明不同玉米品种间具有显著的多样性。 变异系数较低的生育期、出籽率受环境与基因型影响较小,由自身内在遗传因素决定,但遗传多样性指数(H′)均大于1,仍具有广泛的遗传基础。 综上所述,黄淮海区玉米品种倒伏率变异系数最高,为90.21%,而生育期、出籽率、穗粗、穗长变异幅度较低,为1.19%~6.23%,其中生育期最小,为1.19%。 在黄淮海区玉米品种不同性状指标中,遗传多样性指数(H′)在0.37~1.86 之间, 倒伏率遗传多样性指数 (H′) 除倒伏率外均大于1,表明黄淮海玉米品种主要性状指标存在较丰富的遗传变异。
表2 玉米品种主要性状指标及遗传多样性指数
2.2 主成分分析
2.2.1 12 个性状指标的主成分分析 34 个玉米品种12 个性状指标经Bartlett 球形检验,卡方值=103.187 4,p=0.002 3,采用DPS 对性状指标进行主成分分析,依据其特征值>1 的提取标准,选取了前5 个主成分。特征向量值的大小可评价主成分中不同性状指标影响力的高低与方向,涵盖了12 个性状指标绝大部分的信息, 前5 个主成分可以作为黄淮海区玉米品种适应性评价的综合指标。 由表3 可知,主成分1 中特征向量较高且为正的性状指标为小区产量、 穗粗、穗长、行粒数、生育期。 和产量形成紧密相关的因子称为品种的产量构成因子, 百粒重是产量形成的重要因子之一,对产量建成具有较大贡献,秃尖长特征向量载荷最大,对小区产量形成具有一定的负效应,整体上来看主成分1 越大越好。 主成分2 反映了穗长、行粒数、秃尖长、籽粒含水量、生育期、株高的信息,穗长、行粒数的提高有利于小区产量的增加,倒伏率载荷最大,显著影响小区产量,表明选择玉米品种时尽量选穗长、行粒数较大的品种,同时也要参考秃尖长、籽粒含水量、倒伏率,平衡协调好各性状间的关系。 主成分3 可作为百粒重因子,同时综合了小区产量、穗长、行粒数、出籽率、秃尖长的信息,百粒重、穗长、行粒数、出籽率、秃尖长是影响产量的主要因子,主成分3 以偏大为好。 主成分4 特征向量为正的有小区产量、百粒重、穗长、秃尖长、籽粒含水量、生育期,其中百粒重、籽粒含水量载荷较大,百粒重、穗长越大,越有利于产量的形成,但秃尖过长、籽粒含水量过高会影响产量,因此主成分4 不宜过大,本地玉米籽粒含水量不宜过高, 否则对机械收获产生一定影响,不利于大面积推广应用。 主成分5 株高载荷最大且为正,可作为株高因子,小区产量、百粒重、出籽率也为正效应,随株高的增加而提高,有利于产量的形成,在选择品种时尽量选择株高较高的品种,株高增加可挖掘玉米品种产量的潜力, 但倒伏率也呈现正效应, 株高的增加也会增加倒伏的风险, 因此主成分5 不宜过大。
表3 12 个性状指标的主成分分析
2.2.2 特征值及累计贡献率 由表4 可知, 主成分1、2、3、4、5 特征值在1.161~2.173 之间, 其值均大于1 且依次降低,累积贡献率达71.99%,可包含性状指标的大部分信息, 可作为评价玉米品种的综合指标。 主成分1 贡献率最大,为18.11%,主成分1 比主成分2、主成分3、主成分4、主成分5 贡献率分别增加0.84 个、3.03 个、6.26 个、8.43 个百分点。其他成分贡献太小可忽略不计。
表4 特征值及累计贡献率
2.2.3 基于主成分的二维排序分析 基于黄淮海区玉米品种主要性状指标的主成分分析结论, 以品种前5 个主成分得分值作为指标, 以主成分1 小区产量因子为横坐标, 分别以主成分2、3、4、5 为纵坐标做二维排序图, 能够更直观呈现黄淮海区玉米品种组合间的基因型差异[12]。 由图1 可知,品种编号4、9、11、13、21、25、27、29 的主成分1 得分值(产量构成因子)比其他品种大,是产量较高的新品种;品种11、14、28、30、32、33 的主成分2(穗粒因子)得分值比其他品种大,说明其穗行数、行粒数、穗长较大,产量构成因子较好; 品种编号4、5、6、7、8、13、28、30、34 等主成分 3(百粒重因子)比其他品种百粒重高,对产量形成起决定性作用; 品种编号2、10、14、29、30 等主成分4(百粒重、籽粒含量因子)比其他品种高,与成熟时籽粒机械收获密切相关; 品种编号7、11、16、21、32 等主成分5(株高因子)比其他品种株高高,具有一定生长优势。从主成分1 和主成分2 的二维排序图(图1-Ⅰ)可知,品种编号11、21、28 在穗部性状和小区产量方面协调兼顾最好;从主成分1 和主成分3的二维排序图(图1-Ⅱ)可知,品种编号4、13、28 在小区产量和百粒重方面表现较好, 同时综合了小区产量、穗长、行粒数、出籽率的优点;从主成分1 和主成分4 的二维排序图(图1-Ⅲ)可知,品种编号11、21、29 的小区产量和百粒重、籽粒含水量方面协调较好;从主成分1 和主成分4 的二维排序图(图1-Ⅳ)可知, 品种编号11、13 在小区产量和株高方面可协调发展,可为产量形成提供充足的物质基础。 综上所述,品种编号11、13、21、28、29 表现优良,适宜在黄淮海玉米种植区推广应用。
图1 玉米品种主成分二维排序图
2.3 遗传距离测定及聚类分析结果
对34 个玉米品种通过系统聚类法对各性状指标原始数据进行标准化处理, 以欧式距离作为品种间距离,以最短距离法构建聚类分析图[9,12]。 若品种至少有1 个性状显著不同于近似的已知品种, 即可判定该品种具有特异性[13]。 由图2 可知,遗传距离长短反映了34 个玉米品种遗传差异的高低,不同品种先后合并次序可以衡量品种间的亲缘关系和相似程度, 合并早的品种间遗传距离较小, 品种间差异也小,合并晚的品种遗传距离大,差异也大。
图2 34 个玉米品种性状指标聚类分析
2.4 类群构成及类间(内)平均遗传距离
通过计算34 个品种两两之间欧式距离 (D2)共561 个 [34×(34-1)/2], 并按照欧式距离 (D2=5)把34 个品种划分为12 类, 计算12 类品种的类群内与类群间的平均距离(表5)。 由聚类结果可知,同一省份选育的玉米品种由于遗传差异被划分成不同的类群,河南选育品种分别归入Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅵ、Ⅶ、Ⅸ、Ⅻ类群中,山东选育品种分别归入Ⅰ、Ⅱ、Ⅲ、Ⅶ、Ⅺ类群中,河北选育品种分别归入Ⅱ、Ⅵ、Ⅻ类群中,江苏选育品种归入Ⅵ类群, 安徽选育品种归入 Ⅰ类群。 地理远缘玉米品种可能被划分到同一类群,Ⅰ类群中有河南、山东、安徽、河北、北京选育的玉米品种,Ⅵ类群中有河南、河北、江苏、辽宁选育的玉米品种。 因此,在玉米生产中应尽量选择类群内或类群间遗传距离较大的不同品种,这样品种遗传性状丰富,可规避各种植品种因自然条件影响同时受害, 降低种植风险。
3 讨论与结论
3.1 玉米品种主要性状指标、遗传多样性分析
本研究表明34 个玉米品种的各性状指标的变异系数表现不同,倒伏率、秃尖长、行粒数、百粒重变异丰富,这与张中伟等[14]的研究结果基本一致。 本研究也发现生育期、出籽率、穗粗、穗长变异幅度较低,为1.19%~6.23%,黄淮海区玉米品种生育期、出籽率、穗粗、穗长相对稳定,是品种应用的基础;倒伏、秃尖受品种与自然环境的影响较大, 在选育玉米品种时抗倒伏性状指标的选择范围更为广泛, 表明在黄淮海玉米种植区适合选育抗倒伏较强的玉米品种。 本研究显示黄淮海区玉米品种遗传多样性指数(H′)均大于1,仍具有广泛的遗传基础,主要性状指标遗传丰富,这与张凡等[10]对小麦遗传多样性分析结果类似。 前人有关采取分子标记分析资源遗传多样性已有较多研究, 但其不能评价不同环境条件下的差异表现, 因此性状指标分析仍是遗传多样分析不可或缺的鉴定环节。
3.2 玉米品种性状指标的主成分分析
对玉米品种评价时分析了较多的数量性状,在大量性状指标取舍时常常会有疏漏, 给玉米品种评价增加一定困难。 通过主成分分析能够把多数彼此相联的变量经过缩减相关关系变成少数彼此无关的主成分,可以把多个性状问题转变为较少的综合性新指标,可避免信息重复干扰、消除主观因素的影响[15]。本研究采选取了前5 个主成分, 特征向量值的大小可评价主成分中不同性状指标影响力的高低与方向,涵盖了12 个性状指标绝大部分的信息,前5 个主成分可以作为黄淮海区玉米品种适应性评价的综合指标。 主成分1、2、3、4、5 的特征值范围为1.161~2.173, 其值均大于1 且依次降低, 累积贡献率达71.99%,通过与理想对照品种的差距进行比较,筛选出优良品种11、13、21、28、29, 为品种筛选提供了可信度高的适应性评价指标。 主成分分析降低了多数性状指标选择时的工作量与盲目性, 增加了有效选择的效率。 本研究通过主成分二维排序方法获得了切实可行的结果。
3.3 遗传距离测定及聚类分析
本研究利用遗传距离(D2)=15 时把34 个品种分成3 大类群,第Ⅰ类群品种小区产量、百粒重最低,行粒数、株高中等,籽粒含水量较高,属于营养旺盛生长类型品种; 第Ⅱ类群品种小区产量、 百粒重均高,但行粒数最少,籽粒含水量低、株高较高,属于丰产类型品种;第Ⅲ类群小区产量、百粒重中等,行粒数较大,生育期短,株高中等,抗倒性强,属于适合机械收获类型品种。 3 大类群品种的穗粗、穗长、穗行数、出籽率无显著差异,同一省份的品种由于遗传距离的差异被分成不同的类群,这与前人[6,14]的分析类似。 因此,在黄淮海玉米种植区,应根据当地品种目标性状指标要求,选择不同类群中的玉米品种,化解同类品种的种植风险。
3.4 类群构成及类间(内)平均遗传距离分析
目前尚未见玉米品种类群构成及类间(内)平均遗传距离的有关文献报道,本研究通过计算得出34 个品种两两之间的欧式距离(D2)共有561 个,并以欧式距离(D2=5)把34 个品种划分为12 类,计算12 类品种的类群内与类群间的平均距离。 从聚类结果可知,同一省份选育的玉米品种由于遗传差异被划分成不同的类群, 地理远缘玉米品种可能被划分到同一类群。 由此可见,在玉米生产中应尽量选择类群内或类群间遗传距离较大的品种, 可规避生产中各品种因自然环境影响同时受害,降低种植风险。