寒地水稻抗旱相关性状主成分分析及综合评价
2020-11-25张巩亮魏媛媛赵海成陈可馨黄纪情刘梦红李红宇
张巩亮,李 逸,魏媛媛,赵海成,陈可馨,黄纪情,刘梦红,李红宇,2
(1.黑龙江八一农垦大学农学院,黑龙江 大庆 163319;2.黑龙江省现代农业栽培技术与作物种质改良重点实验室,黑龙江 大庆 163319)
0 引言
【研究意义】我国是水资源相对匮乏的国家,而且分布十分不均。干旱会导致水稻产量及品质下降,甚至绝收[1-4]。筛选和培育抗旱的水稻品种是解决上述问题的最有效途径。【前人研究进展】水稻抗旱性是其对干旱环境的一种适应性变化,包括形态抗性、生理生化抗性以及生长发育进程的改变等,是由多种因素相互作用构成的复杂的综合系统,而其中的每种因素都和抗旱性有一定的相关性,只是相关性大小存在差异[5-6]。在抗旱性鉴定时,仅通过单一的抗性指标对其鉴定是不全面的,应该运用多种指标综合衡量。水稻从种子发芽到成熟都可以进行抗旱性的评价,所涉及的指标也很多[7-8]。敬礼恒等[9]认为,相对发芽率、相对芽长等指标可作为水稻种子萌发期抗旱性评价指标;钟娟等[10]认为,在进行水稻的抗旱性评价时可以选取干物质胁迫指数、株高胁迫指数、胁迫敏感指数作为研究指标;张军等[11]对7 份喀麦隆水稻种质资源的发芽势、发芽率、芽鞘长、芽长、根数目和根鲜重进行测定,将发芽势、发芽率、胚芽鞘长和根数等4 项指标作为鉴定水稻苗期抗旱性的指标,并采用加权隶属函数法进行萌发期抗旱性综合评价;王贺正等[12]研究了水、旱条件下水稻苗期和开花期的形态及生理指标,认为叶龄、心叶下倒数第1 叶叶面积、叶鲜重、根长等4 项指标可作为苗期抗旱性的形态指标;刘云开等[13]考查了18 个水稻品种分蘖盛期、孕穗期在不同水分环境下的叶绿素含量(SPAD值)、产量性状等,发现孕穗期SPAD值在2 种水分处理下差异小的品种,其旱管处理下的结实率、千粒重、实际产量均较高,认为孕穗期是水稻对水分敏感的临界期;刘三雄等[14]选用形态、生理、产量等方面的多个指标,构建水稻抗旱综合评价体系,并运用隶属函数综合分析,提高了评价的准确性。由于综合指标法全面考虑了各指标的贡献率大小,同时去除了重复的信息,具有科学、准确、全面的特点。因此,此方法已广泛应用于作物复杂性状的抗性鉴定及评价[15-16]。【本研究切入点】目前,对水稻抗旱指标适宜性评价研究多集中在对抗旱力指标进行回归分析的单一评价,缺少准确性与稳定性。现有的少数关联方法多利用线性模型定性或定量关联水稻生育性状与抗旱能力,存在抗旱适宜性评价不合理、抗旱特征指标筛选不全面、模型关联性差等问题,预测准确率较低。【拟解决的关键问题】通过构建BP 神经网络学习模型,实现水稻抗旱指标适宜性的定量预测,筛选水稻抗旱适宜性评价的特征指标,为作物种质资源综合评价提供方法和支持。
1 材料与方法
1.1 试验材料和设计
试验于2018 年在黑龙江八一农垦大学校园内大棚试验基地内进行。盆栽试验,采用二因素完全随机试验设计,水分因素2 个水平:常规灌溉(CK)和干旱胁迫;种质资源因素30 个水平(表1),为前期初步筛选出的30 份抗旱材料。常规灌溉(CK)的水分管理为花打水插秧、深水扶苗、浅水增温促蘖、分蘖期深水护苗、结实期干湿交替灌溉。干旱胁迫:于返青期后开始干旱胁迫,返青期以80%以上秧苗早晚叶尖吐水为标志。干旱胁迫的方法是返青期排干水,采用负压式土壤湿度计测定土壤水势(将湿度计的陶头插入土表以下10 cm 位置),保持全生育期土壤水势在-30~-35 kPa。常规灌溉(CK)和干旱胁迫每份材料各种植14 盆,插秧规格为每盆4 穴、每穴4 苗。其他管理方法同常规。
表1 参试材料名称及来源Table 1 Names and origins of specimens
1.2 测定项目与方法
水稻返青后,定点15 穴植株,调查拔节期株高、最高分蘖数。齐穗期每处理取样6 穴,每穴分叶、茎鞘、穗3 个部分,测量叶片长宽,每部分单独包装,105 ℃杀青30 min,80 ℃烘干至恒重,计算齐穗期叶面积、齐穗期叶重、齐穗期干物重。
成熟期每处理选择长势均匀的植株10 穴,于阴凉通风处风干,之后分为穗和茎叶2 部分,分别称重。穗用于穗数、穗粒数、结实率和千粒重考察。计算产量、生物量、经济系数和单穗重等。
1.3 数据处理及统计分析
1.3.1 抗旱系数(DTC) 采用水稻抗旱系数(drought tolerant coefficients,DTC),即各抗旱指标的相对值进行抗旱性综合分析,以消除参试材料间的基础性状差异。
1.3.2 综合指标值 综合指标值计算公式:
式中:αi是某一指标特征值所对应的特征向量;xi是指标相对值。
1.3.3 隶属函数分析 参试材料各主成分的隶属函数值按公式(3)计算。
式中: μ (Zi)是各参试材料第i个主成分的隶属函数值;Zi是各参试材料第i个综合指标值;Zimin和Zimax分别是各参试材料第i个综合指标的最小值和最大值。
1.3.4 各综合指标的权重 根据各主成分贡献率按公式(4)计算各主成分的权重。
式中:Wi是各参试材料第i个综合指标的权重;Pi是各参试材料第i个综合指标的贡献率。
1.3.5 参试材料的综合抗旱值(D) 参试材料综合抗旱D 值按公式(5)计算。
式中:D 值为干旱胁迫下各参试材料应用主成分评价的抗旱性综合评分值。
1.3.6 BP 神经网络建模思路 为构建水稻抗旱性状与抗旱性综合品质关联模型,本研究选用25 个水稻参试材料样本采用BP 神经网络算法构建学习模型,其中输入层为抗旱力特征指标值,输出层为抗旱综合评价值,剩余5 个样本为验证样本,评价学习模型的预测准确性。为优化建模样本,同时验证建模方法的稳定性,变换3 组学习样本(25 个样本)构建3 个学习模型,对比3 个模型的预测准确性。若预测准确率均在合理范围内,则说明该建模方法合理、稳定。
1.3.7 统计分析软件 利用Excel 2010 进行数据整理、描述性分析、权重和抗旱综合评价D 值的计算。利用DPS7.05 软件进行主成分分析、聚类分析以及BP 神经网络模型构建并计算指标预测值。
2 结果与分析
2.1 参试材料抗旱系数和相关分析
表2 结果表明,干旱胁迫条件下30 个参试材料的13 个性状的抗旱系数平均值为0.735,数值分布在0.475~0.894,穗数、穗粒数、千粒重、拔节期株高、最高分蘖数等5 个性状的抗旱系数大于0.8,产量性状的抗旱系数小于0.5。
从变异系数方面看,变异系数最大为产量(24.83%),穗重(17.10%)次之,齐穗期叶重(14.06%)再次之;变异系数最小为拔节期株高(4.56%),千粒重(5.54%)次之,生物量(9.74%)再次之。
对干旱胁迫下13 个性状间的相关分析结果(表3)表明,性状间存在不同程度的相关性,性状间的相关性易导致信息重叠。因此,对这些性状直接利用会影响抗旱性评价的真实性。为消除这些重叠信息的不利影响,使用主成分分析法对水稻抗旱性进行综合评价。
2.2 参试材料抗旱性的主成分分析
主成分累计贡献率大于80%即可认为信息具有代表性。表4 结果表明,前5 个主成分的贡献率分别为32.404%、20.972%、15.024%、8.553%和6.808%,其累计贡献率达到83.761%,即前5 个相互独立的主成分代表了13 个性状83.761%的变异信息。
第一主成分的贡献率为32.404%,该主成分以与结实率密切相关的穗重(0.346)、结实率(0.432)、产量(0.400)、经济系数(0.393)的正载荷较大,齐穗期干物重(-0.307)和齐穗期叶面积(-0.342)的负载荷较大,称为结实率因子;第二主成分的贡献率为20.972%,其中穗粒数(0.442)、拔节期株高(0.393)的正载荷较大,穗数(-0.466)具有较大的负载荷,称为穗数因子;第三主成分的贡献率为15.024%,以生物产量(0.495)、最高分蘖数(0.460)、齐穗期叶重(0.338)载荷较大,称为生物量因子;第四主成分的贡献率为8.553%,以千粒重(0.700)、齐穗期干物重(0.334)的载荷较大,称为千粒重因子;第五主成分的贡献率为6.808%,以拔节期株高(0.664)具有较大的正载荷,经济系数(-0.461)具有较大的负载荷,称为株高因子。
表2 参试材料抗旱系数的描述性分析Table 2 Descriptive analysis on drought resistant coefficients of specimens
2.3 抗旱性综合评价
依据公式(2)计算各参试材料的综合指标值,进一步利用公式(3)计算各参试材料干旱胁迫下各主成分隶属函数值。依据主成分贡献率的大小,利用公式(4)计算出前五个主成分的权重分为0.387、0.250、0.179、0.102、0.081。利用公式(5)对各综合指标隶属函数值和相应权重进行线性加权,计算得到抗旱综合评价值D。表5 结果表明,30 个参试材料平均D 值为0.517 3,分布区间在0.186 7~0.767 7。品种H23(农丰3161)的D 值为0.660 3,排位第3 名。H06(农丰3055)和H08(DPB120)的D 值大于H23,分别为0.767 7 和0.684 6,可作为抗旱种质资源使用。抗旱能力最差的是H07(稻坚强,D 值为0.186 7),其次是H10(DPB15,D 值为0.210 6)。
2.4 参试材料抗旱性的聚类分析
以D 值为依据,采用欧氏距离的离差平方和法对30 份参试材料进行聚类分析,在欧式距离0.71 处分为4 类:强抗旱型、抗旱型、中间抗旱型和干旱敏感型(图1)。第Ⅰ类由1 个材料(H06)组成的强抗旱型类群,占总材料数的3%;第Ⅱ类由H04、H05、H30、H08、H23、H16、H17、H18、H19、H21、H25、H26 等12 个材料组成的抗旱型类群,占总材料数的40%;第Ⅲ类由H07、H10、H11、H29、H15、H22 等6 个材料组成的中间抗旱型类群,占总材料数的20%;第Ⅳ类由H01、H24、H02、H12、H13、H09、H14、H03、H20、H27、H28 等11 个剩余材料组成的干旱敏感型类群,占总材料数的37%。
2.5 水稻抗旱鉴定指标的筛选
以y值为因变量,各鉴定指标的抗旱系数为自变量,建立抗旱性评价的逐步回归方程。除x5、x10和x11外,其余鉴定指标全部进入回归方程。回归方程为:
图1 30 个参试材料抗旱能力的系统聚类分析Fig.1 System clustering on draught resistance of 30 specimens
式 中:x1、x2、x3、x4、x6、x7、x8、x9、x12和x13分别表示穗重、穗数、穗粒数、结实率、产量、生物产量、经济系数、拔节期株高、齐穗期叶重和齐穗期叶面积的抗旱系数。
回归方程的F值为25 977.42**(P<0.01)。
表3 相关分析结果表明,D 值与穗重、穗粒数、结实率、产量、生物产量、经济系数等 6 个鉴定指标的抗旱系数呈显著或极显著正相关。可将这6 个指标作为农业抗旱力评价的指标。
2.6 水稻抗旱指标适宜性评价模型的构建
从30 个水稻参试材料样本中筛选出25 个样本作为学习样本进行神经网络学习模型构建,剩余5 个样本作为预测样本验证模型准确性,其中BP 神经网络学习模型结构如图2 所示。由图2 可知,该模型包含输入层、隐含层和输出层3 层,其中模型输入为穗重、穗粒数、结实率、产量、生物产量、经济系数等6 项抗旱力特征指标值,因此有6 个神经元。模型输出为抗旱综合评价值D,因此输出层神经元有1 个。隐含层神经元在BP 神经网络中扮演特征检验算子的角色,起到决定性作用,隐藏层节点数一般设为输入层节点数的一半左右,本神经网络将隐藏层设为4 个节点。最终构建一个“输入层-隐藏层-输出层”为“6-4-1”的三层BP 神经网络。
图2 BP 神经网络结构Fig.2 Makeup of BP neural network
本研究从30 个水稻参试材料样本中随机筛选25 个样本建立学习模型,剩余5 个样本进行抗旱指标适宜性得分预测。为评价模型预测准确性及建模方法稳定性,变换25 个学习样本构建了3 个学习模型,其预测结果如表6 所示。由表6 可知,3 个学习模型共15 个验证样本抗旱适宜性预测得分与实际得分相对误差均小于10%,最小相对误差仅为0.07%,说明BP 神经网络模型预测效果较好。将水稻参试材料实际得分与神经网络预测得分进行回归分析,以参试材料实际得分作为横坐标,模型预测值作为纵坐标进行线性拟合,3 组预测结果的决定系数R2分别为0.972 1、0.913 9、0.959 5(图3),预测值与实际值相符程度均较高,证明神经网络模型能够较准确、稳定地评价水稻抗旱力指标是否适宜进行水稻的抗旱性综合评价。但不同水稻参试材料样本构建的学习模型预测效果存在较大差异,说明用于建立学习模型的样本数量仍较少,变换少量学习样本会议对预测效果产生较大影响。同时,学习模型所需的样本应具有典型性与代表性,部分水稻参试材料样本与其他样本差异较大也可能对预测效果产生较大影响。
表6 基于BP 神经网络算法的水稻抗旱指标适宜性预测结果Table 6 Prediction by BP neural network algorithm on drought resistance indicators of rice for cultivation suitability
图3 水稻抗旱指标适宜性模型稳定性验证Fig.3 Verified stability of model on evaluating drought resistance indicators of rice suitable for cultivation
3 讨论
水稻受自然进化压力以及人工选择的作用,产生了多种不同类型的适应干旱能力,但水稻全生育期的抗旱性评价指标还缺乏统一的标准[17-19]。水稻抗旱性受到多基因控制,并且在干旱环境下的应对机制上也有很大的区别[20]。在水稻抗干旱性研究中,综合考虑、分析水稻的表型、生理生化功能等多种方面的因素,才能使分析和判断更为准确、可靠。在水稻全生育期中,相比于其他时期,在苗期进行抗旱性鉴定具有时间短、容量大、重复性强、环境影响小等优点。通过对水稻抗旱性鉴定指标的研究、筛选,李艳等[1]对水稻品种抗旱性进行了综合实验分析和鉴定评价,得出了与大田试验结果基本一致的数据,充分证明了在水稻苗期进行抗寒性鉴定,可以更好地展现出水稻在营养生长和生殖生长的整个生育期内的抗旱性能。以往在鉴定和评价水稻品种的抗旱能力时,都采用产量抗旱系数和抗旱指数进行分析研究,其中产量抗旱系数主要反映水稻对干旱的敏感程度,弱化了水稻自身的丰产特性。但运用此项指标开展水稻抗旱性评测工作时,需要较多参试材料作为研究基础,如果供试材料的数量较少,或者水稻的基因型比较单一,其研究结果的准确性就会有所减弱[21-24]。本研究采用主成分分析法将13 个指标简化为产量因子、穗数因子、生物量因子、千粒重因子和株高因子彼此互不相关的5 个主成分,方差累计贡献率达83.761%。结合各主成分隶属函数值及相应权重加权,计算出30 份参试材料平均综合评价D 值为0.517 3,分布区间在0.186 7~0.767 7。采用欧氏距离离差平方和法,依据D 值将30 份参试材料分为强抗旱型、抗旱型、中间抗旱型和干旱敏感型。排在第二位和第三位的品种分别为DPB120 和农丰3161,D 值分别为0.684 6和0.660 3,农丰3055( 0.767 7 )排名第一,为强抗旱类型,可以作为抗旱育种的杂交亲本。
另外,不同研究者所筛选得到的抗旱指标也不尽相同。抗旱水稻品种的筛选与水稻生育周期密不可分。发芽期主要利用聚乙二醇、甘露醇等高渗液模拟干旱胁迫[25],筛选指标为发芽率、发芽势、胚芽长度,以及烘干后的种子干重、胚芽干重和物质转运率等[26]。安永平等[27]认为,萌发胁迫指数和芽鞘长的反应指数可作为评价水稻苗期抗旱性的间接鉴定指标。而王贺正等[28]则认为,胚芽鞘长不适合作为水稻抗旱鉴定指标为;相对根干重尽管是根系生长状况的综合反映,但其变异较大,不适于品种间选择。王贺正等[29]还认为POD 酶活性、GSH 含量、叶鲜重和叶龄等4 个指标的相对值与水稻苗期的抗旱性显著相关。人工神经网络是一种由多个单一、简单的微小单元组合而成的复杂、综合、非线性的系统,其结构类似于人体大脑的神经元,本质是一种通过学习确定大量神经元之间的相互关联,并且能够完成对大量信息数据进行处理的数学模型。人工神经网络具有良好的自适应能力、泛化性、容错性和自我学习能力。对于非线性系统,利用BP 神经网络可以很好地完成系统内各神经元之间权重值的调整工作[30]。BP 神经网络主要包括正向的工作过程和反向的学习过程[31],工作过程即由输入层经隐藏层各节点向输出层开展计算,学习过程则是将得到的实际结果与已知的理想输出结果作比较,并得出相对计算误差,然后由输出层反向传递误差信号调整各节点的权值,从而完善神经网络结构。本研究通过逐步回归及相关分析,筛选得到穗重、穗粒数、结实率、产量、生物产量和经济系数等6 个与D 值显著或极显著相关的指标,可用于水稻抗旱筛选,并讨论了基于BP 人工神经网络算法的水稻抗旱指标适宜性评价方法,取得了较好的效果,但仍有许多需要优化与改进的地方。在未来的工作中,要提高模型预测准确性与稳定性,优化该评价方法,也可以与软件结合,形成实用型水稻抗旱指标适宜性预测工具。
4 结论
通过主成分分析、隶属函数分析及聚类分析,利用D 值对30 份种质资源的农业抗旱能力进行综合评价,获得强抗旱种质资源农丰3055。通过逐步回归分析和相关分析,并构建BP 神经网络预测抗旱力指标的准确性,从13 个指标中筛选出穗重、穗粒数、结实率、产量、生物产量和经济系数等6 项适宜作为农业抗旱性筛选的指标,为农业抗旱的水稻种质资源筛选与鉴定,及其抗旱品种选育提供依据。