APP下载

基于PCANN的Zn对油菜Cd胁迫的缓解效果研究

2020-04-22郭海如李春生崔雪梅

西南农业学报 2020年1期
关键词:丙二醛遗传算法油菜

郭海如,李春生,崔雪梅,成 俊,陈 驰

(1. 湖北工程学院计算机与信息科学学院/湖北省新农村发展研究院智慧农业重点实验室,湖北 孝感 432000; 2. 湖北工程学院生命科学技术学院,湖北 孝感 432000; 3. 湖北理工学院计算机学院,湖北 黄石 435003)

【研究意义】近年来,全国土壤污染状况调查公报显示,土壤污染总超标率为16.1 %,镉(Cd)的点位超标率高达7.0 %,是表层土壤中污染最严重的重金属。由于Cd更容易进入食物链并在土壤-动植物-人体之间进行富集转移,最终危害人体健康,是相对于其他重金属更具有危害性的重金属元素[1]。研究发现十字花科植物对Zn元素具有较强的吸收和富集作用[2],油菜属于十字花科, 是我国主要的油料作物,种植面积和产量均为世界第一位[3]。减少油菜对镉的吸收和累积是农业、生态和环境科学研究的重要内容[4]。锌(Zn)是植物生长必需的微量元素,也是一种常见的对环境有毒的重金属元素。由于Zn和Cd 具有相似的地球化学和环境特性,在土壤-作物系统中镉、锌常常发生颉颃作用[5]。因此,通过施用 Zn 肥来缓解Cd对植物的胁迫成为研究热点。【前人研究进展】在研究油菜指标信息处理问题方面,大多数采用传统的数理统计方法[6-7],主要对油菜指标数据进行方差分析[8-9]、显著性分析[10-11]、多重比较[12]等。主成分分析法可以在原始大量指标中抽取部分不相关的新指标,但新指标包含原始指标的绝大多数信息,采用主成分分析法可以对油菜各指标进行综合评价,并分析出各指标的影响程度[13-15]。也有少数文献采用模糊数学隶属函数法[16]对油菜各指标的耐盐性进行综合评价。【本研究切入点】本研究提出一种PCANN(主成分神经网络)评价方法,综合主成分分析和神经网络的优点,对油菜的各项生长指标进行综合分析。本研究选用油菜品种—油霸旺作为研究对象,采用盆栽实验培养至壮苗,研究300 μmol/L的Zn对不同浓度的镉(0、150、300、500、700 μmol/L)胁迫下油菜的生长特征、抗逆性及抗氧化酶活性的影响[17]。【拟解决的关键问题】采用PCANN分析各指标在不同处理下的变化规律,进一步探明修复油菜对重金属耐受机制和植物在重金属Cd胁迫下外源锌对油菜的解毒机理提供理论依据。

1 材料与方法

1.1 实验材料

实验于2017年10月至2018年2月在湖北工程学院生科楼进行,不同Cd、Zn浓度实验设计如表1所示,供试油菜品种为油霸旺。

1.2 实验方法

挑选颗粒饱满的种子,先用1.0 %的次氯酸钠消毒10 min,清水洗净后,再用蒸馏水浸泡24 h,选沉于底部的种子,均匀撒在铺有滤纸的托盘内,将托盘置于25 ℃的MJX-250B-Z型恒温箱内进行催芽,定期(每天2次)浇蒸馏水让种子保持充足水分,6 d后将幼苗均匀移栽于装有贫瘠沙土的30个小花盆内,每盆12株。每天定时浇2次等量的Hoagland’s营养液,持续添加至幼苗生长出4~5片真叶后,改用Cd、Zn处理液继续培养。Cd处理液用CdCl2·5H2O配制,浓度的的分别为0、150、300、500、700 μmol/L一共5个浓度梯度,Zn处理液用ZnSO4配制,浓度为300 μmol/L,每个处理3次重复。胁迫处理17 d后,测定油菜各项指标。

表1 实验设计Table 1 Design of experiment

注:Cd1Cd2Cd3Cd4表示镉浓度为150、300、500、700 μmol/L;CK为对照,下同。
Note: Cd1Cd2Cd3Cd4:The Cd concentration of 150, 300, 500, 700 μmol/L;CK: The contrast. The same as below.

1.3 指标测定方法

为了反映Cd、Zn胁迫对油菜的综合影响,测定指标选择3类,一类是代表根系生长情况的根长指标;二类是代表抗逆性能的丙二醛(MDA)、过氧化氢(H2O2)含量;三类是代表抗氧化能力的超氧化物歧化酶(SOD)、过氧化物酶(POD)及过氧化氢酶(CAT)活性。各个指标测定方法[18]如表2所示。

1.4 数据处理

所有数据均为3次重复的平均值,在 MATLAB环境下采用PCANN处理数据[19-21]。

1.4.1 PCANN概述 PCANN首先采用主成分分析法对各项指标进行优化,并分析得到评价结果。然后将主成分分析法优化后的指标作为BP网络的输入,将主成分分析法的评价结果作为神经网络的输出。对样本进行训练学习,并选定几个典型样本作为测试样本。在神经网络训练学习过程中,拟合精度很高,但测试样本的测试误差比较大,BP网络的泛化能力不强。为增强BP网络的泛化能力,采用遗传算法对BP网络的权阈值进行优化,经过优化后的神经网络,泛化能力得到大大提高。

1.4.2 主成分分析法优化样本 主成分分析主要包括以下几个过程:对原始数据进行标准化处理,计算相关系数矩阵,求出各个指标之间的相关系数,计算特征值和特征向量,选择几个主成分,计算综合评价值,计算各指标在主成分中的权重。

采用主成分分析法优化神经网络的样本时,根据各指标之间的相关系数值确定是否删除某些不必要的指标,若某些指标相关系数很大,达到0.98以上时,再比较指标的权重,删除权重比较小的指标。删除其中的几项指标后,再重新用新的指标进行分析,若分析结果跟优化指标之前的结果一致,则采用优化后的指标作为神经网络的样本。

表2 各指标测定方法Table 2 Measurement methods for each index

1.4.3 遗传算法优化BP神经网络 采用遗传算法优化BP神经网络的权阈值主要过程如下。

(1)确定训练样本和测试样本,并根据样本确定神经网络结构。

(2)建立神经网络,确定神经网络的训练步数、误差要求等。

(3)求测试值的均方误差,并将其作为遗传算法的适应度函数。

(4)确定遗传算法代沟、二进制编码长度、初始种群等参数。其中初始种群的维数根据神经网络神经元的权阈值个数确定。

(5)将遗传算法的初始种群个体作为神经网络的权阈值赋值给BP网络。

(6)神经网络训练。

(7)根据适应度函数值记下神经网络的最优权阈值。

(8)遗传算法的代数gen=0。

(9)选择、重组、变异遗传操作。

(10)遗传算法个体值作为权阈值重新赋值给神经网络。

(11)神经网络训练。

(12)新的适应度值是否最优,若最优则记下当前权阈值。

(13)遗传算法代数gen+1,进入第(9)步,即下一代遗传。

(14)遗传代数达到要求,遗传算法停止。

该优化方法难点在于适应度函数的确定,神经网络的权阈值由遗传算法随机产生,经过神经网络学习训练之后,再跟测试样本比较,求其均方误差,并将测试值的均方误差作为适应度函数值。由于在第?步中,每次都记下最优权阈值,所以,遗传算法结束后,最终将得到最优适应度值,即测试值的均方误差最小。当测试结果满足要求时,表示神经网络建模成功,可以采用该模型对研究对象进行综合评价。

神经网络的权阈值来自于遗传算法的初始种群,需要将种群个体值作为权阈值赋值给神经网络,其赋值核心代码如下。

net.iw{1,1}(i1,i2)=x(i,k);

net.b{1}(i1,1)=x(i,k);

net.lw{2,1}(1,i1)=x(i,k);

net.b{2}(1,1)=x(i,k);

在每一代遗传过程中,遇到最优解时,需要记录当前神经网络的权阈值,记录权阈值核心代码如下。

if (ms>ObjV(i,1))

ms=ObjV(i,1);

iw=net.iw{1,1};

b1=net.b{1};

lw=net.lw{2,1};

b2=net.b{2};

end

2 结果与分析

2.1 Cd、Zn处理对油菜各项指标的影响分析

胁迫处理结束后,测定油菜幼苗根长、丙二醛含量、H2O2含量、SOD活性、POD活性、CAT活性等指标,结果见表3。

从表3中可以看出,单施Cd时,油菜根长随着Cd浓度的增加而降低,单施300 μmol/L的Zn时,根长为对照的138 %;Cd、Zn配施时根长均比单施Cd时长;说明300 μmol/L的 Zn对油菜根长有较好的促进作用。

单施Cd时,丙二醛含量和H2O2质量浓度均随着Cd浓度的增加而增加;单施300 μmol/L的 Zn时,丙二醛含量和H2O2质量浓度均低于对照,Cd、Zn配施时,丙二醛含量和H2O2质量浓度均低于单施Cd时的含量,说明300 μmol/L的Zn有效抑制了丙二醛、H2O2的产生,能提高油菜的抗逆性。

单施Cd时,SOD活性、CAT活性、POD 活性均随着Cd浓度的增加先增加后降低,且在Cd浓度为300 μmol/L时达到最高值,在Cd浓度为700 μmol/L达最低值,且低于对照,说明适量镉对3种酶活性均有促进作用,浓度过高则产生抑制作用。Cd、Zn配施时,3种酶活性均比单独施Cd时要高,说明300 μmol/L的Zn对Cd胁迫有较好的缓解作用。

2.2 主成分分析Cd、Zn胁迫下油菜各项指标变化规律

在MATLAB环境下编写程序,采用zscore()对表3中的数据进行标准化,并且采用corrcoef()函数求出标准化后的相关系数矩阵,相关系数矩阵如表4所示。

其中,x1~x7分别表示:根长、丙二醛含量、H2O2含量、SOD活性、CAT活性、POD活性。从相关系数矩阵的值可以看出,丙二醛含量和H2O2含量相关性很强,SOD活性、CAT活性和POD活性相互之间相关性也很强,根长与丙二醛含量、H2O2含量的负相关性比较强,SOD活性与丙二醛含量、H2O2含量的负相关性也比较强,其他指标相关性比较弱。

表3 Cd、Zn胁迫下油菜各项指标统计结果Table 3 Statistical results for each rape index under the stress of Cd and Zn

表4 相关系数矩阵Table 4 Correlation matrix

采用pcacov()函数计算表4中相关系数矩阵的特征值、方差贡献率和累积贡献率如表5所示。前2个成分的累计贡献率达到97.654247 %,浓缩了源数据的绝大部分信息,因此提取前2个成分作为分析不同盐浓度下各指标的特征。

分别以2个主成分的贡献率为权重,构建主成分综合模型表达式如下:

Z=0.6635597y1+0.3129828y2

把不同Cd、Zn处理下的2个主成分值代入上式,以各自的贡献率为权数进行加权求和,求出不同Cd、Zn处理下各指标的综合排名,如表6所示。从表中可以看出,300 μmol/L的Cd和300 μmol/L的 Zn配施时综合权重最高,各项指标最好;其次是单施300 μmol/L的Cd,综合权重排名第2,说明低浓度的Cd对油菜生长有一定的促进作用,也是油菜对逆境的适应调节机制,300 μmol/L的Zn与低浓度的Cd配施对油菜有促进作用。单施700 μmol/L的Cd时各项指标的综合权重最低,且低于Cd4Zn组合,说明300 μmol/L的Zn对高浓度的Cd胁迫也有较好的缓解作用。

最后,进一步计算各指标在主成分中的权重,并对各指标的权重进行排序,反过来可以分析不同锌、镉处理浓度对各指标的影响程度。各指标在主成分中的权重及排序如表7所示,从表中可以看出,不同锌镉浓度对POD活性影响最大。其次是CAT活性和SOD活性,对H2O2含量和丙二醛含量影响最小。

表5 各成分的特征值、贡献率和累计贡献率
Table 5 Characteristic root, contribution rate and cumulative contribution rate of each main components

特征根yCharacteristicroot贡献率zContributionrate累计贡献率Cumulativecontributionrate3.98135866.3559766.3559651.87789731.2982897.6542470.1083521.80585999.4601060.0180040.30007499.760180.0118440.19740499.9575830.0025450.042417100

表6 不同锌、镉处理下各指标综合排名
Table 6 Comprehensive ranking of various indexes from different treatment of Zn and Cd

不同处理Treatment综合权重Comprehensiveweight排名RankingCK-0.2701177Cd1-0.0169976Cd21.16307942Cd3-0.2879258Cd4-2.45625310Zn0.04496455Cd1Zn1.02749783Cd2Zn1.98185461Cd3Zn0.8564144Cd4Zn-2.0425199

超氧化物歧化酶(SOD)、过氧化物酶(POD)、过氧化氢酶(CAT)等在协调自由基的清除中起着重要作用。

2.3 主成分分析对神经网络样本的优化

从表4可知,丙二醛含量和H2O2含量的相关性很强,数值为0.978,再根据表7中指标权重的排名可以看出,丙二醛含量权重比较H2O2大,因此保留该指标,删除H2O2含量指标。另外,从表4中可以看出CAT活性和POD活性2个指标相互之间相关性也极强,数值为0.986,也可删除其中一个指标,从表7中可以看出, CAT活性权重较小,也可删除。因此,只保留根长、丙二醛含量、SOD活性和POD活性4个指标,这样可以达到优化神经网络结构的目的,神经网络结构得到优化后,其计算量会减少1/3。同时,在下次进行实验研究时,可以不检测H2O2含量和CAT活性2项指标,可以大大节省人力物力以及检测时间。

保留4个指标后,重新采用主成分法分析数据,得到不同Cd、Zn处理下各指标新的综合排名,如表8所示。从表6、8中可以看出,去掉H2O2含量和CAT活性2项指标后,不同处理下综合权重的排名完全一致,说明可以采用简化后的指标代替原来的指标,因此,可以用优化后的指标作为神经网络的样本。

表7 各指标权重及排序Table 7 Ranking for weight of each index

表8 不同锌、镉处理下各指标新的综合排名
Table 8 New comprehensive ranking of various indexes from different treatment of boron and copper

不同处理Treatment综合权重Comprehensiveweight排名RankingCK-0.1114852097Cd10.0469770636Cd20.8463618432Cd3-0.2680567018Cd4-1.97361795410Zn0.2168582715Cd1Zn0.7946812693Cd2Zn1.6561332771Cd3Zn0.5225409824Cd4Zn-1.7303928419

2.4 神经网络分析油菜生理响应机制

结合表3(删除H2O2含量和CAT活性2项指标)和表8中的综合权重数据(也可以选择表6的综合权重),构建神经网络的训练样本和测试样本,将表3中的数据作为神经网络的输入,表8中数据作为神经网络的输出。典型数据(表8中综合权重排名第1和第2)作为测试样本,测试误差的大小是衡量神经网络建模是否成功的标准。对表3、8中数据进行无量纲化处理后,得到神经网络的训练样本和测试样本,如表9、10所示,其中表10中的数据不参与神经网络的训练。

根据油菜指标个数以及评价结果,BP网络的输入层节点数为4,每个节点代表一个油菜指标,输出层节点数为1,表示指标综合评价的权重。中间层节点数根据实际试验设为2比较合适。因此,建立BP网络结构如图1所示。其中输入层x1~x4代表油菜生长的4个指标,y表示评价结果。采用newff()函数创建BP神经网络,传递函数均采用S型正切函数,采用Levenberg-Marquardt BP训练函数,训练步数设为150,均方误差为10-6。

根据神经网络各层节点的个数,得到遗传算法种群的维数为(4+1+1)×2+1=13个,种群个体数为40个,遗传算法变量二进制位数设为20,代沟为0.85,遗传代数为20。采用crtbp()函数随机产生初始种群,将初始种群每个个体的13个数据作为BP网络的权阈值。神经网络得到权阈值后,对训练样本进行学习训练。经过学习之后,神经网络对测试样本进行测试,求出测试样本的均方误差,并将均方误差作为遗传算法的适应度函数。经过遗传算法20代遗传,一共训练800次,找出适应度函数值最小的数据,并记下此时神经网络的权阈值。

表9 神经网络训练样本Table 9 Training samples of neural network

表10 神经网络测试样本Table 10 Testing samples of neural network

图1 BP神经网络结构Fig.1 Structure of neural network

在遗传算法每一代遗传中分别采用select()、recombin ()和mut () 3个函数进行选择、交叉和变异操作,其中交叉概率选择0.7。经过20代遗传后,得到各代种群的最优解和均值的变化如图2所示。从图中可以看出,种群均值逐步减少,在第7代种群的均值基本上达到最小并趋于稳定,随着代数的增加,逐步得到最优解。

图2 各代种群最优解和种群均值的变化Fig.2 Changes of optimal solution and mean value from each generation population

经过遗传算法优化神经网络后,最终得到神经网络的最优权阈值,将权阈值赋值给神经网络,对表9中的训练样本进行拟合,拟合结果如图3所示,拟合误差如表11所示,从图3和表10中可以看出神经网络学习能力非常强,基本上是100 %拟合。

最后,将表10中测试样本的输入作为神经网络的输入,得到2个测试结果,其测试误差分别为2.93 %、-1.82 %,最大测试误差为2.93 %,说明可以用该神经网络模型评价油菜生长情况,通过遗传算法优化神经网络权阈值后,神经网络泛化能力得到很大地提高。

图3 神经网络拟合曲线图Fig.3 Fitting curve of neural network

表11 神经网络拟合误差
Table 11 Fitting errors of neural network

序号Serialnumber误差(%)Error序号Serialnumber误差(%)Error10.95670250.244060120.123484560.07326873-0.23614567-0.18627334-0.050763280.0107062

为进一步说明遗传算法优化神经网络权阈值的效果,不采用遗传算法,随机产生初始权阈值,重复试验3000次,记下最优测试误差,得到测试误差在15 %左右,即使随机产生初始权阈值,重复训练10 000次以上,也很难得到理想结果。

3 结 论

(1)采用PCANN模型确定评价等级,可以避免人工主观干预,能够更加客观地对Zn、Cd胁迫下油菜各项指标进行评价。各项指标的综合权重排名显示,300 μmol/L的Cd和300 μmol/L的Zn配施时综合权重最高,其次是单施300 μmol/L的Cd和150 μmol/L的Cd、300 μmol/L 的Zn配施时的情况,说明低浓度的Cd对油菜生长有一定的促进作用,300 μmol/L的Zn与低浓度的Cd配施对油菜有促进作用。单施700 μmol/L的Cd时各项指标的综合权重最低,说明300 μmol/L 的Zn对高浓度的Cd胁迫也有较好的缓解作用。

(2)采用PCANN模型分析不同Zn、Cd处理浓度对各指标的影响程度,表明不同Zn、Cd浓度对对POD活性影响最大,其次是CAT活性和SOD活性,对H2O2含量和丙二醛含量影响最小。

(3)PCANN模型跟单纯的主成分分析评价相比具有自适应能力,可以采用该模型用于实际的油菜种植实践。该模型除了可以进行评价之外,还能够根据结果自动识别Zn、Cd的配置情况,在实际油菜种植过程中,只要检测出油菜生长的相关指标,可以根据评价结果给出解决办法,用此模型指导油菜种植将更加科学高效。

(4)主成分分析能够优化评价指标,减少神经网络输入层节点数,进而可以优化神经网络的结构,给出如何采用主成分分析法优化神经网络结构的具体实现方法。优化指标后,能极大减轻后续研究中检测样本的工作量,减少神经网络的运算量。

(5)神经网络训练学习过程中,采用遗传算法优化其权阈值,能够大大提高BP网络的泛化能力。

猜你喜欢

丙二醛遗传算法油菜
油菜田间管理抓『四防』
油菜可以像水稻一样实现机插
油菜“不务正业”,单产3.4吨
基于遗传算法的高精度事故重建与损伤分析
基于遗传算法的模糊控制在过热汽温控制系统优化中的应用
基于遗传算法的智能交通灯控制研究
[CX2]NaCl胁迫对萌发期甜高粱和春小麦生理生化特性的影响
[CX2]NaCl胁迫对萌发期甜高粱和春小麦生理生化特性的影响
基于改进多岛遗传算法的动力总成悬置系统优化设计
如何翻译“香菇油菜”?