APP下载

基于PCA-GA-BP网络B、Cu胁迫下油菜生理响应机制的研究

2019-04-09郭海如崔雪梅李春生但小娜

西南农业学报 2019年2期
关键词:叶绿素遗传算法油菜

郭海如,崔雪梅,李春生,万 兴,成 俊,但小娜

(1.湖北工程学院计算机与信息科学学院/湖北省新农村发展研究院智慧农业重点实验室,湖北 孝感 432000;2.湖北工程学院生命科学技术学院,湖北 孝感 432000;3. 湖北理工学院计算机学院,湖北 黄石 435003)

【研究意义】我国的油菜种植面积和总产量均居世界首位。油产量在国产食用植物油中占 50 % 以上[1]。营养元素硼(B)和重金属元素铜(Cu)均是高等植物生长发育所必需的微量元素,是影响油菜产量和品质的重要元素。我国土壤普遍缺B,油菜缺B会导致花而不实和返花现象,因而要及时施B肥补充,但是B适合作物生长的范围非常窄,控制不当就容易出现缺硼与硼毒害现象[2]。Cu对植物正常的生理代谢、生长发育和产量形成起着重要作用,但如果土壤中Cu过量,就会抑制植物对N、P、K、Ca、Mg、S及微量元素的吸收[3],抑制酶的活性,加剧植株体内膜脂过氧化,导致植物生理代谢紊乱,对植物产生毒性作用。 【前人研究进展】土壤环境中存在离子的颉颃或促进作用,目前国内外研究B、Cu对油菜生长的影响主要集中在单一元素的胁迫上,而缺乏两种元素同时作用于油菜的生理响应研究。在信息处理方面,大多数采用传统的数理统计方法[4-5],主要对油菜指标数据进行方差分析[6-7]、显著性分析[8-9]、多重比较[10]等。主成分分析法可以在原始大量指标中抽取部分不相关的新指标,但新指标包含原始指标的绝大多数信息,采用主成分分析法可以对油菜各指标进行综合评价,并分析出各指标的影响程度[11-13]。也有少数文献采用模糊数学隶属函数法[14]对油菜各指标的耐盐性进行综合评价。【本研究切入点】本研究提出一种PCA-GA-BP(主成分遗传神经网络)评价方法,综合主成分分析和遗传神经网络的优点,在B、Cu共同胁迫下对油菜的各项指标进行综合分析。【拟解决的关键问题】采用PCA-GA-BP网络(主成分遗传神经网络)分析不同B、Cu处理下各指标的变化规律,找出B、Cu的最佳施用浓度,为油菜种植提供一种更加科学高效的智能化评价方法。

1 材料与方法

1.1 供试材料

供试油菜品种为油霸旺,2015-2017年期间四川某公司在其实验基地进行实验,平均每667 m2产298.78 kg。实验选取油菜种子中质量饱满、大小均匀的种子。

1.2 试验方法

选用5种不同浓度的铜溶液和3种不同浓度的硼溶液交叉处理盆栽油菜幼苗,处理结束后测定油菜幼苗的叶绿素、蛋白质、硝态氮、淀粉酶、丙二醛含量以及过氧化物酶活性等指标。用0.525 %的NaClO溶液浸泡25 min,清水洗净后用去离子水浸泡过夜,次日挑选沉于下方的种子进行催芽。将种子均匀放置在铺有两层滤纸的托盘中,用蒸馏水浸润滤纸,以滤纸上积累的水量恰好不流动为宜。将托盘放入25℃,光照强度为4,型号是MJX-250B-Z的恒温培养箱中培养,每隔8 h浇1次水,水量均等。3 d后种子露白,将种子移入装有沙土的45个花盆中继续培养(10株/盆),开始改浇1/2霍格兰营养液,时间间隔与蒸馏水一致。21 d后,待幼苗长出5~6片子叶,幼茎较硬时,将45盆油菜随机分成3组,每组3个重复,进行B、Cu胁迫处理。铜溶液用CuSO4配制,浓度设置为0、25、75、100、200 mg/L,B溶液用Na2B4O7配制,浓度设置为:0、0.5、1.0 mg/L。B、Cu浓度配置如表1所示。胁迫处理20 d后,取油菜样品测定各项生理指标。

表1 B、Cu浓度配置

注:B1、B2表示硒浓度为0.5、1.0 mg/L;T25、T75、T100、T200分别代表铜浓度为25、75、100、200 mg/L;CK为对照。下同。

Note:B1, B2:The selenium concentration of 0.5 and 1.0 mg/L;T25, T75, T100, T200:The copper concentration of 25, 75,100, 200 mg/L; CK: The contrast. The same as below.

1.3 数据处理方法

所有数据均为 3 次重复的平均值,在 MATLAB环境下采用PCA-GA-BP网络处理数据[15-17]。首先采用主成分分析法对各项指标进行优化,并分析得到评价结果。然后将主成分分析法优化后的指标作为BP网络的输入,将主成分分析法的评价结果作为神经网络的输出。对样本进行训练学习,并选定几个典型样本作为测试样本。在神经网络训练学习过程中,拟合精度很高,但测试样本的测试误差比较大,BP网络的泛化能力不强。为增强BP网络的泛化能力,采用GA(遗传算法)对BP网络的权阈值进行优化,经过优化后的神经网络,泛化能力得到大大提高。

1.3.1 主成分分析优化样本 主成分分析主要过程如下:对原始数据进行标准化处理,计算相关系数矩阵,求出各个指标之间的相关系数,计算特征值和特征向量,选择几个主成分,计算综合评价值,计算各指标在主成分中的权重。

采用主成分法优化神经网络的样本时,根据各指标之间的相关系数值确定是否删除某些不必要的指标,若某些指标相关系数很大,再比较指标的权重,删除权重比较小的指标。删除其中的几项指标后,再重新用新的指标进行分析,若分析结果跟优化指标之前的结果一致,则采用优化后的指标作为神经网络的样本。

1.3.2 GA优化BP神经网络 采用GA优化BP神经网络权阈值的主要过程:①确定训练样本和测试样本,并根据样本确定神经网络结构。建立神经网络,确定神经网络的训练步数、误差要求等。求测试值的均方误差,并将其作为遗传算法的适应度函数。②确定遗传算法代沟、二进制编码长度、初始种群等参数。其中初始种群的维数根据神经网络神经元的权阈值个数确定。遗传算法的代数gen=0。③将遗传算法的初始种群个体作为神经网络的权阈值赋值给BP网络。进行神经网络训练,训练后根据适应度函数值记下神经网络的最优权阈值。④选择、重组、变异遗传操作,将遗传算法个体值作为权阈值重新赋值给神经网络,重新进行神经网络训练。⑤训练后判断新的适应度值是否最优,若最优则记下当前权阈值。遗传算法代数gen+1,进入第四步,即下一代遗传。⑥遗传代数达到要求,遗传算法停止。

该优化方法难点在于适应度函数的确定,神经网络的权阈值由遗传算法随机产生,经过神经网络学习训练之后,再跟测试样本比较,求其均方误差,并将测试值的均方误差作为适应度函数值。由于第五步中,每次都记下最优权阈值,所以,遗传算法结束后,将得到最优适应度值,即测试值的均方误差最小。当测试结果满足要求时,表示神经网络建模成功,可以采用该模型对油菜指标进行综合评价。

2 结果与分析

2.1 B、Cu各处理对油菜生化指标的影响

用不同浓度的B、Cu交叉处理油菜幼苗,测定油菜幼苗各项生理指标结果见表2。单独供铜时,油菜叶绿素a/b、总叶绿素含量、蛋白质含量、硝态氮含量均是先增加后降低;而淀粉酶活性则先降低再增加后又降低,但均低于对照;过氧化物酶活性随着铜浓度的增加而降低;丙二醛含量随着铜浓度的增加而增加。单独供B时,与对照相比油菜叶绿素含量差异不明显;蛋白质质量分数随着B浓度的增加先降低再增加,但均低于对照;硝态氮含量、淀粉酶活性随B浓度先增加后降低,均高于对照;过氧化酶活性则随着B浓度的增加而降低;丙二醛量随着B浓度的增加而增加。与对照相比,油菜各项生理指标的变化差异不明显。

B、Cu配合施用时,叶绿素含量、蛋白质质量分数、淀粉酶、过氧化酶活性均是低浓度B(0.5 mg/L)和Cu组合明显高于高浓度B(1.0 mg/L)和Cu的组合;当0.5 mg/L的B和200 mg/L的Cu配施时,油菜的叶绿素含量、蛋白质质量分数、淀粉酶活性、过氧化物酶活性均高于单施200 mg/L Cu的情况,丙二醛含量则明显低于单施200 mg/L Cu的情况,说明B对高浓度的Cu有较好的缓解作用;硝态氮含量、丙二醛含量在低浓度B(0.5 mg/L)和Cu组合高于高浓度B和铜配施的组合,说明高浓度B和Cu配施可以减少硝态氮、丙二醛的产生。

2.2 主成分分析硒、铜交互作用下油菜生理指标变化规律

从实验数据很难得出不同浓度的B、Cu胁迫处理对油菜各项指标的综合影响。采用主成分分析法对实验数据进行分析处理。在MATLAB环境下编写程序,采用zscore()对表2中的数据进行标准化,并且采用corrcoef()函数求出标准化后的相关系数矩阵,相关系数矩阵如表3所示。

表2 B、Cu胁迫下油菜各指标统计结果

表3 相关系数矩阵

注:x1~x8分别代表:叶绿素a、叶绿素b、总叶绿素、蛋白质、硝酸氮含量、淀粉酶活性、过氧化物酶活性、丙二醛含量。

从相关系数可以看出:叶绿素b和总叶绿素相关性很强,叶绿素与总叶绿素、硝酸氮含量变化与过氧化物酶活性相关性比较强,丙二醛含量变化与硝酸氮含量变化、过氧化物酶活性负相关性比较强,其他指标相关性一般。

采用pcacov()函数计算表4中相关系数矩阵的特征值、方差贡献率和累积贡献率。前4个主成分累计贡献率达到89.76819 %,浓缩了源数据的大部分信息,因此提取前4个成分作为分析不同B、Cu处理下各指标的特征。分别以4个主成分的贡献率为权重,构建主成分综合模型表达式如下:

Z=0. 4733179y1+0.1912162y2

+0.147591y3+0.08555678y4

把不同硼、铜处理下的4个主成分值代入上式,以各自的贡献率为权数进行加权求和,求出不同硼、铜处理下各指标的综合排名。从表5中可以看出,T200B1组合时综合权重最高,排第1名,说明当200 mg/L的Cu和0.5 mg/L 的B配施时对各项指标最好,其次是T100B1、T75,分别是第2、3名;对照组排名13,最差的是T25B1组合,说明低浓度的B、Cu产生了相互抑制作用。

表4各成分的特征值、贡献率和累计贡献率

Table 4 Characteristic root,contribution rate and cumulative contribution rate of each main components

特征根yCharacteristic root y贡献率z(%)Contribution rate z累计贡献率(%)Cumulative contribution rate3.78654347.3317947.331791.52972919.1216266.453411.18072814.759181.212510.6844548.55567889.768190.42335.29124895.059440.2493143.11642398.175860.1267421.58427799.760140.0191890.239863100

最后,进一步计算各指标在主成分中的权重,并对各指标的权重进行排序,反过来可以分析不同硼、铜处理浓度对各指标的影响程度。各指标在主成分中的权重及排序如表6所示,不同硼铜浓度对叶绿素影响最大。其次是蛋白质含量,对硝酸氮含量变化影响最小。

表5不同硼、铜处理下各指标综合排名

Table 5 Comprehensive ranking of various indexes from different treatment of boron and copper

不同处理Treatment综合权重Comprehensive weight排名RankingCK-1.00612213T250.6248445T750.85160453T1000.70641184T2000.40236557B1-1.45596714T25B1-1.67121315T75B10.44016016T100B10.87775992T200B11.79729461B2-0.88032512T25B2-0.0956329T75B2-0.48848711T100B2-0.33885910T200B20.23616438

表6 各指标权重及排序

2.3 主成分分析对神经网络样本的优化

根据表3中相关矩阵数据,叶绿素b和总叶绿素相关性很强达到0.91,可以删除其中的1个指标,再根据表6中指标权重的排序,总叶绿素权重为3.182114,排名第一,叶绿素b权重为2.682663排名第三。因此,选择权重比较小的指标叶绿素b删除,以达到优化指标的目的。

删除指标叶绿素b后,重新采用主成分法分析数据,得到不同B、Cu处理下各指标的新的综合排名,如表7所示。对比表5和7中的排名顺序,可以看出,综合权重排名最高的2个组合没变,其他组合排名顺序变动比较小,变化规律基本上相同。因此,可以采用优化后的指标作为神经网络样本。

2.4 GA-BP网络分析油菜生理响应机制

结合表2(删除指标叶绿素b)和表5中的数据(也可以选择表7的数据),构建神经网络的训练样本和测试样本,将表2中的数据作为神经网络的输入,表5中数据作为神经网络的输出。典型数据(表5中综合权重排名第1和2名)作为测试样本,测试误差的大小是衡量神经网络建模是否成功的标准。对表2和5中数据进行无量纲化后,得到神经网络的训练样本和测试样本,如表8和9所示,其中表9中的数据不参与神经网络的训练。根据油菜指标个数以及评价结果,BP网络的输入层节点数为7,每个节点代表一个油菜指标,输出层节点数为1,表示指标综合评价的权重。中间层节点数根据实际实验设为3比较合适。因此,建立BP网络结构如图1所示。其中输入层x1~x7代表油菜生长的7个指标,y表示评价结果。采用newff()函数创建BP神经网络,传递函数均采用S型正切函数,采用Levenberg-Marquardt BP训练函数,训练步数设为200,均方误差为10-6。

表7不同硼、铜处理下各指标新的综合排名

Table 7 New comprehensive ranking of various indexes from different treatment of boron and copper

不同处理Treatment综合权重Comprehensive weight排名RankingCK-1.1078314T250.8358614T750.8464093T1000.8062175T2000.0057558B1-1.699315T25B1-0.966612T75B10.6249556T100B10.8549042T200B11.5242111B2-1.0975413T25B20.1526337T75B2-0.3055410T100B2-0.4453411T200B2-0.028799

表8 神经网络训练样本

表9 神经网络测试样本

根据神经网络各层节点的个数,得到遗传算法种群的维数为(7+1+1)×3+1=28个,种群个体数为40个,遗传算法变量二进制位数设为20,代沟为0.9,遗传代数为20。采用crtbp()函数随机产生初始种群,将初始种群每个个体的28个数据作为BP网络的权阈值。神经网络得到权阈值后,对训练样本进行学习训练。经过学习之后,神经网络对测试样本进行测试,求出测试样本的均方误差,并将均方误差作为遗传算法的适应度函数。经过遗传算法20代遗传,一共训练800次,找出适应度函数值最小的数据,并记下此时神经网络的权阈值。

在遗传算法每一代遗传中分别采用select()、recombin ()和mut () 3个函数进行 选择 、交叉和变异操作,其中交叉概率选择0.7。经过20代遗传后,得到各代种群的最优解和均值的变化如图2所示。从图中可以看出,在第13代即得到最优解,随着遗传代数的增加,种群均值变化逐渐减小并趋于稳定。

图1 BP网络结构Fig.1 Structure of BP neural network

图2 各代种群最优解和种群均值的变化Fig.2 Changes of optimal solution and mean value from each generation population

经过遗传算法优化神经网络后,最终得到神经网络的最优权阈值,将权阈值赋值给神经网络对表8中的训练样本进行拟合,拟合结果如图3所示,拟合误差如表10所示,从图3和表10中可以看出神经网络学习能力非常强,基本上是100 %拟合。

最后,将表9中测试样本的输入作为神经网络的输入,得到2个测试结果,其测试误差分别为-1.93 %、2.85 %,最大测试误差为2.85 %,说明可以用该神经网络模型评价油菜生长情况。

图3 神经网络拟合曲线图Fig.3 Fitting curve of neural network

序号Serial number误差Error序号Serial number误差Error10.000222738-0.000732-0.001108890.0003653-0.0008899100.0030764-0.0003699110.0004545-0.0016354120.00061668.72E-0513-0.002957-6.89E-05

为证明遗传算法优化神经网络权阈值的效果,不采用遗传算法,随机产生初始权阈值,重复试验3000次,记下最优测试误差,得到最大测试误差为18.92 %。再次随机产生初始权阈值,重复训练10 000次以上,最大测试误差为15.31 %。通过遗传算法优化神经网络权阈值后,神经网络泛化能力能得到很大地提高。

实际应用该模型时,在种植油菜过程中,检测神经网络输入神经元的相关油菜指标,将得到的输出结果跟综合权重值进行比较,进而可以判断油菜种植的B、Cu配置情况,然后根据最佳配置情况进行动态调整。

3 结 论

(1)单独供Cu时,油菜各指标变化规律说明适量Cu对叶绿素、蛋白质硝态氮含量及过氧化酶活性均有促进作用,且能抑制丙二醛的产生,提高油菜的抗逆性。单独供B时,与对照相比,油菜各项生理指标的变化差异不明显。B、Cu配合施用时,油菜各指标变化规律说明B对高浓度的Cu有较好的缓解作用,高浓度B和Cu配施可以减少硝态氮、丙二醛的产生。

(2)采用主成分分析确定评价等级,可以避免人工主观干预,能够更加客观地对B、Cu胁迫下油菜各项指标进行综合评价。T200B1组合时综合权重最高,即0.5 mg/L的B 和200 mg/L 的Cu配施时对各项指标最好,说明适量的B、Cu施用对油菜生长有很好的促进作用; T25B1组合效果最差,表明低浓度的B、Cu产生了相互抑制作用。

(3)PCA-GA-BP网络跟单纯的主成分分析评价相比具有自适应能力,可以采用该模型用于指导实际的油菜种植实践。该模型除了可以进行评价之外,还能够根据结果自动识别B、Cu配置情况,在实际油菜种植过程中,只要检测出油菜生长的相关指标数据,可以根据评价结果确定B、Cu的配置情况,进而优化种植,用此模型指导油菜种植将更加科学高效。

(4)主成分分析能够优化评价指标,减少神经网络输入层节点数,进而可以优化神经网络的结构,给出如何采用主成分分析优化神经网络结构的方法。神经网络训练学习过程中,采用遗传算法优化其权阈值,能够大大提高BP网络的泛化能力。

采用PCA-GA-BP网络对不同B、Cu处理下油菜指标进行综合评价,结果客观科学,测试效果较好,为油菜种植提供一种更加科学高效的智能化评价方法。

猜你喜欢

叶绿素遗传算法油菜
油菜田间管理抓『四防』
油菜可以像水稻一样实现机插
油菜“不务正业”,单产3.4吨
基于遗传算法的高精度事故重建与损伤分析
提取叶绿素
基于遗传算法的模糊控制在过热汽温控制系统优化中的应用
锌对白菜和香葱叶绿素含量的影响研究
基于遗传算法的智能交通灯控制研究
桃树叶绿素含量与SPAD值呈极显著正相关
基于改进多岛遗传算法的动力总成悬置系统优化设计