蓄水坑灌条件下苹果树蒸腾速率预测模型对比研究
2019-01-21王颖苗
王 颖 苗
(山西省水利水电科学研究院,太原 030002)
0 引 言
蓄水坑灌法是一种有效解决山地果园灌溉水资源利用率低下问题的优势灌溉方法。它主要由蓄水坑、环状沟、固壁设施构成。山地坡面水流进入蓄水坑后,沿坑壁侧向进入果树根系集中层,从而达到提高水分利用率的目的。近些年来,许多学者围绕土壤-植物-大气连续体(SPAC系统),对土壤水分分布及动态[1,2]、棵间蒸发[3]、根系吸水[4]、树干茎流[5]、叶片蒸腾[6]开展了相关的研究工作,取得了一定的研究进展。
蒸腾作用是植株生长的重要生理过程,也是农田耗水的关键途径。蒸腾速率是反映蒸腾作用强度大小的重要指标,反映了植株体调节机制的能力。王颖苗[6]、仇群伊[7]等人仅是对蓄水坑灌条件下果树蒸腾速率(WSPIT)的日变化特征进行了定性分析,定量预测方面还有待进一步深入研究。随着计算机技术的不断发展,BP神经网络等人工智能模型被相继提出,并应用于各个领域。在植株蒸腾预测方面,现有模型主要包括经列文伯格(LM)算法[8]、遗传(GA)算法[9]和附加动量(AM)算法[10]优化的BP神经网络模型。这些模型主要用于膜下滴灌、常规滴灌和地下滴灌方法,研究对象主要为茄子、西红柿和甜瓜[8-10]。这些方法在蓄水坑灌条件下苹果树蒸腾速率定量预测方面未见相关报道,哪种模型更适合于蓄水坑灌法也有待进一步深入研究。因此,本文将采用LM算法、GA算法和AM算法优化的三种BP神经网络模型,实现蓄水坑灌苹果树蒸腾速率的定量预测,以期为蓄水坑灌条件下果园水分管理提供支持。
1 材料及方法
1.1 试验区概况
本研究于2014年在山西省农科院果树研究所进行。地理坐标为东经112°32′,北纬37°23′。该试验区属于暖温带大陆性气候,海拔789.1 m,平均降雨量460 mm,无霜期175 d,年平均气温5~10 ℃。降水年内分布不均,主要集中于6-8月。试验区苹果树品种为红富士丹霞,种植行株距为4 m×2 m。
1.2 测定项目与方法
测定项目主要包括苹果树蒸腾速率和气象环境因子。其中,蒸腾速率采用LI-6400XT便携式光合仪进行测定,每5 d测定一次,测定时间为早8∶00,每次测定时选取5片树叶,测定值取平均。环境因子由ADCON无线自动气象监测站进行测定,测定指标主要包括气温、大气相对湿度、光辐射强度和饱和水汽压差。气象站每10 min自动采集一次数据。
2 模型构建
BP神经网络是一种具有反向传播学习能力的多层神经网络。它由输入层、中间层(隐含层)和输出层组成,分别负责信息处理、传递和输出。当一对学习样本输入给神经网络时,神经元的激活值将从输入层传播到输出层,输出层节点得到输入响应。然后,利用网络反向传播机制,对连接相邻网络层的权值进行反复修正,从而提高网络对输入的响应准确性。BP模型的计算公式如下所示。
隐含层节点的输出:
yi=f(∑ωijxj-θi)
(1)
输出层节点的输出:
Ol=f(∑Tliyi-θl)
(2)
输入层到隐含层的权值修正公式:
(3)
输入层到隐含层的阈值修正公式:
(4)
隐含层到输出层的权值修正公式:
Tli(k+1)=Tli(k)+ηδlyi
(5)
隐含层到输出层的阈值修正公式:
θ(k+1)=θl(k)+ηδl
(6)
2.1 神经网络模型输入输出项的确定
气温、大气相对湿度、光辐射强度和饱和水汽压差是影响叶片蒸腾速率的关键环境因子。当气温逐渐升高时,会促使叶片内外的水汽压梯度增加,在水汽压差作用下,蒸腾速率会进一步加强[11]。当大气湿度增加时,空气黏滞性较大,叶片内外蒸气压差减小,不利于气孔下腔中水蒸气的扩散,蒸腾作用会被进一步抑制[12]。光辐射是蒸腾作用的主要动力来源,当光辐射强度增加时,在叶片大气界面的温差作用下,气孔开度进一步增大,从而促进光合作用进行[13]。饱和水汽压差反映了实际空气距离水汽饱和状态的程度,能够直接通过干预叶片气孔开闭大小,来影响蒸腾作用的强烈程度[14]。因此,本文将上述4种因子作为模型的输入项。模型的输出项为叶片蒸腾速率。因此,模型的输入节点数为4,输出节点数为1。试验中共有278组样本数据,以7∶3比例将该样本分为训练集和预测集。
2.2 神经网络模型隐含层节点确定
隐含层节点数与神经网络精度紧密相关。当隐含层节点数过少时,模型精度会较差,但当隐含层节点数过多时,又会引起过拟合问题[15]。本文通过经验公式法[式(7)]和试算法结合的方法来解决该问题。首先,由经验公式[式(7)]确定最优节点数范围为2~13,然后在该范围内,通过试算法进一步确定最优节点数。经计算,当节点数为8时,模型误差最小。因此,最优的神经网络拓扑结构为4-8-1。
(7)
式中:L为隐含层节点;m和s为输入和输出层节点;q为介于0~10之间的常数。
2.3 神经网络模型求解
神经网络的初始权值和阈值是通过离线训练的方式获得,但初始权重和偏差是随机分配的,较难获得全局最优解,这是BP神经网络的缺点,需要进一步改进。本文分别将遗传算法(GA)、列文伯格算法(LM)和附加动量算法(AM)的宏观搜索能力与神经网络进行结合,先用优化算法进行寻优,达到缩小搜索范围的目的,再用神经网络进行精确求解,从而实现优化权值,提高模型预测能力的目标。
遗传算法是一种基于自然界生物进化原理的自适应搜索算法。它通过模拟生物进化,对种群反复进行选择、交叉和变异操作,通过优胜劣汰达到优化种群的目的,使模型的结果也不断逼近最优解[16]。在本文中,神经网络的输入层、隐含层和输出层的节点数分别为4、8和1,则权值数为4×8+8×1=40,阈值数为8+1=9,遗传算法中个体编码长度为40+9=49。选择浮点数编码方式对权值编码。交叉算子选择算术交叉,变异算子选择均匀变异[17]。将蒸腾速率实测值和预测值间的均方误差作为个体适应度值,个体适应度值越小,该个体越优。算法求解步骤已有相关报道[17],不再赘述。遗传算法进化过程中设置种群规模为50,迭代次数为100,变异概率为0.001,交叉概率为0.7。对于该遗传算法优化的神经网络模型(GA-BP-WSPIT),网络层之间的传递函数均采用tanh函数,学习函数用trainlm,迭代次数为10 000,训练目标误差为0.000 1。
标准BP神经网络模型的求解方法是基于梯度下降法,而LM算法兼备梯度下降法和改进牛顿法的优点。设神经网络模型在第k次迭代时,权值和阈值组成的向量为xk,则第k+1次迭代时,新向量xk+1的更新可表述为式(8)[18]。由于LM 算法是高斯-牛顿法的一种改进形式,因此,式(8)中权值及阈值变化量Δx可描述为式(9)[18]。由于LM 算法应用了近似的二阶导数信息,因此比梯度法收敛速度要快得多,并且算法更稳定。在该LM算法优化的神经网络模型(LM-BP-WSPIT)中,所有的网络参数设置均与GA-BP-WSPIT模型相同。
xk+1=xk+Δx
(8)
Δx=-[JT(x)J(x)+μI]-1J(x)e(x)
(9)
式中:J(x)为Jacobian 矩阵;μ(μ>0)为比例系数;I为单位矩阵。
标准BP算法在调整神经网络权值时,并没有考虑迭代过程中的梯度方向,可能会导致训练过程出现振荡趋势,引起神经网络陷入局部极小点和出现迭代速度慢等问题。基于AM算法的神经网络模型(AM-BP-WSPIT)则考虑了以前时刻的贡献,其权值迭代公式如式(10)所示[19]。
ωij(n+1)=ωij+η[(1-α)D(n)+αD(n-1)]
(10)
式中:D(n)和D(n-1)分别表示n时刻和n-1时刻的负梯度;η为学习率;α为动量因子。
2.4 模型评价指标
模型预测性能的评价指标包括:平均相对误差MAPE和均方根误差RMSE,计算式分别为:
(11)
(12)
式中:WL为蒸腾速率预测值;WR为蒸腾速率实测值;N为样本数。
3 结果与分析
3.1 训练结果分析
本文主要通过预测值和实测值间的线性一致性和统计学指标(MAPE和RMSE)对模型训练效果进行分析评价。图1为三种神经网络模型(GA-BP-WSPIT、LM-BP-WSPIT和AM-BP-WSPIT)的预测值和实测值间的线性关系。由图1可知,GA-BP-WSPIT、LM-BP-WSPIT和AM-BP-WSPIT模型预测值与实测值间所构成的线性方程的斜率分别为1.004、1.003和1.013,决定系数分别为0.998、0.991和0.982。由此可以说明,GA-BP-WSPIT、LM-BP-WSPIT和AM-BP-WSPIT模型预测值与实测值间均具有较好的一致性,它们的一致性优劣程度表现为:GA-BP-WSPIT模型>LM-BP-WSPIT模型>AM-BP-WSPIT模型。为了进一步分析模型的训练效果,结合数据样本,对MAPE和RMSE两项统计学特征值进行了计算以及对样本进行了t检验分析,结果如表1所示。由表1可知,GA-BP-WSPIT模型、LM-BP-WSPIT模型和AM-BP-WSPIT模型的MAPE分别为1.94%、3.90%和5.23%,RMSE分别为0.074、0.154和0.220。由此说明,三种模型的训练效果好坏表现为:GA-BP-WSPIT模型>LM-BP-WSPIT模型>AM-BP-WSPIT模型。t检验结果表明,三种模型的预测值和实测值之间均无显著的统计学差异。综上表明,GA-BP-WSPIT模型、LM-BP-WSPIT模型和AM-BP-WSPIT模型的训练结果具有较高的精度,均可用于蓄水坑灌苹果树蒸腾速率预测,其中GA-BP-WSPIT模型的训练效果最优。
图1 训练组实测值与预测值间的线性关系Fig.1 Linear relationship between measured values and predictive values in training group
3.2 验证结果分析
为了进一步验证三种模型的预测效果,首先将56组验证集样本带入训练好的模型中,得到验证集样本的预测值,然后对验证集样本实测值和预测值间的线性一致性和统计学误差进行分析评价。图2为验证集样本实测值与预测值间的线性关系。由图2可知,GA-BP-WSPIT、LM-BP-WSPIT和AM-BP-WSPIT模型预测值与实测值间所构成的线性方程的斜率分别为1.004、0.991和0.968,决定系数分别为0.997、0.993和0.981。说明GA-BP-WSPIT模型预测值与实测值间的线性一致性最好,LM-BP-WSPIT模型次之,AM-BP-WSPIT模型最差。表2为三种模型预测值和实测值间的统计学特征。由表2可以看出,GA-BP-WSPIT、LM-BP-WSPIT和AM-BP-WSPIT模型预测值与实测值间的MAPE分别为2.17%、3.56%和5.68%,RMSE分别为0.403、0.070和0.111。t检验结果表明,三种模型的预测值和实测值之间均无显著的统计学差异。综上所述,GA-BP-WSPIT模型的预测效果最好。因此,在蓄水坑灌条件下苹果树蒸腾速率定量预测中,建议采用GA-BP-WSPIT模型。
图2 预测组样本实测值与预测值间的线性关系Fig.2 Linear relationship between the measured value and the predicted value in the predicted group
模型MAPERMSEt值显著性GA-BP-WSPIT2.17%0.4030.0960.924LM-BP-WSPIT3.56%0.0701.9290.059AM-BP-WSPIT5.68%0.1111.4810.144
4 结 论
本文基于遗传算法、列文伯格算法和附加动量算法优化的BP神经网络,建立了以气温、大气相对湿度、光辐射强度和饱和水汽压差为输入,蓄水坑灌苹果树蒸腾速率为输出的GA-BP-WSPIT、LM-BP-WSPIT和LM-BP-WSPIT预测模型,并采用野外实测数据对模型进行了率定和验证。三种预测模型的精度好坏表现为:GA-BP-WSPIT>LM-BP-WSPIT>LM-BP-WSPIT。GA-BP-WSPIT模型的预测误差为2.17%,预测效果最好。在蓄水坑灌条件下苹果树蒸腾速率定量预测中,建议采用GA-BP-WSPIT模型。蒸腾速率影响因素较多,如何选取适当的输入项,从而优化神经网络输入层和输出层之间的高维非线性拓扑关系,实现模型结构合理化和模拟结果高精度化,是有待进一步研究的方向。