基于BP神经网络的Gardner模型参数预测
2017-03-21赵红光樊贵盛舒凯民
赵红光,樊贵盛,于 浕,舒凯民
(太原理工大学水利科学与工程学院,太原 030024)
0 引 言
土壤水分特征曲线是表征土壤水吸力与土壤含水率之间相互关系的曲线,描述了土壤水能量和数量之间的函数关系,是研究土壤水分保持和运动的基本特性曲线[1]。土壤水分特征曲线能够揭示土壤的持水性能、土壤水分的有效性以及土壤中孔隙分布等物理参数,同时也为包气带土壤中水分的存蓄与运移以及土壤水分运动数值模拟等方面的研究提供了理论依据和计算参数。因此,准确、有效的获取土壤水分特征曲线一直是土壤物理学研究的重点课题。
目前,直接法测定土壤水分特征曲线的试验器材有压力膜仪、负压计和砂性漏斗等,但由于土壤水分特征曲线自身的高度非线性并且容易受到土壤本身性质和外界环境因素的影响,使得通过试验方法直接、准确测定这一特征曲线的难度较大。并且,通过直接试验方法测定水分特征曲线周期长、成本高、无法兼顾大尺度上土壤空间的强烈变异性等实际问题,也使得土壤水分特征直接测定法的推广应用受到制约。针对这一现状,利用通过试验手段易于获取的土壤基本理化参数(如质地、容重、盐分含量等)间接推求土壤水分特征曲线的方法成为诸多科学工作者研究的热点。截至目前,常用的水分特征曲线的间接推求方法有土壤传递函数法[2]、几何分形法[3]和物理经验法[4]。其中,土壤传递函数法(PTFs)是一种利用易于通过试验手段获取的土壤基本理化参数通过数据转换来间接推求得到土壤水分特征曲线模型参数的预测函数方法,是当前应用较为广泛的研究方法。例如:Vereecken[5]通过在土壤基本理化参数与土壤水分特征曲线之间建立用多元线性回归方程来实现间接获取,但由于精度较低而逐渐被非线性回归所代替[6];夏达忠等[7]基于土壤传递函数基本理论验证了通过土壤粒径级配资料和容重资料来间接推求土壤水分特征曲线的可行性;姚姣转等[8]对科尔沁沙地土壤水分特征曲线传递函数进行了研究,认为土壤体积质量和砂粒含量是预测土壤水分特征曲线模型参数的主要变量;王改改等[9]利用前馈神经网络预测多数据源的土壤水分特征曲线模型,并对其预测性能及其应用不确定性进行分析。但是,关于以土壤基本理化参数为输入变量,以土壤水分特征曲线模型参数为输出变量的BP预测模型的研究还相对缺乏。因此,本文选取结构形式简单、易于理解并便于掌握的Gardner模型,建立黄土土壤水分特征曲线试验数据样本,以土壤传输函数基本理论为依据,实现了基于土壤基本理化参数的土壤水分特征曲线Gardner模型参数的BP预报。
1 材料与方法
1.1 试验区土壤条件
本文试验选择在山西省黄土高原区典型耕作农田进行取样,利用环刀分别在各试验田0~20和20~40 cm土层深度处取出原状土。田间原状土体积质量变化范围为1.10~1.70 g/cm3。试验田地形、土壤种类、土样的质地组成、土样含有机质量和含无机盐量等理化参数的变化范围见表1。
表1 样本数据的取值范围
1.2 试验方案
土壤水分特征曲线测定采用压力膜仪进行,试验仪器为美国1500F型压力膜仪。首先,土样自然风干后过筛(孔径1 mm),干容重配比范围为1.10~1.70 g/cm3之间,将土样均匀装填在垫有滤纸的环刀中,保证其上下界面整齐且均与环刀平齐。环刀体积为20 cm3,高度为1 cm。将盛有土样的环刀连同滤纸一起放置于压力室中的陶土板上,并向板上加水至水面略低于土样上表面,经过24 h水分饱和后,测定土样饱和含水率,随后打开压力膜仪加压阀,按由低到高逐次增加室中压力,设置的压力值分别为0.03、0.06、0.1、0.3、0.5、0.8、1.0、1.2、1.5 MPa,加压后土样中水分透过滤纸从排水孔口排出。在某一压力下每隔24 h称土样重量至前后2次变化差异小于0.05 g,则认为试验土样达到该压力下的含水率平衡,同时称量该压力下普通滤纸的重量用以数据处理。试验结束后,将压力室中所有土样和单张滤纸放入烘箱中,在102 ℃下烘12 h,称其干土重,计算得出土样的体积质量值,并计算各压力下不同土样的体积含水率,由此可以得到多个水吸力对应的土壤含水率值。
土壤基本理化参数测定包括土壤质地分析,土壤含有机质量测定和无机盐量测定等。利用激光粒度分析仪测定土壤中黏粒、砂粒、粉粒的百分比;土壤含有机质量的测定则通过利用重铬酸钾容量法实现;运用指示剂滴定法和火焰光度计分别测定土样中八大离子的质量分数,取八大离子的和作为土壤所含的全盐量。
1.3 土壤水分曲线拟合模型
试验测得的不同水吸力下的土壤体积含水率只有有限的数据点,不能完整的描绘出连续的曲线,因此需要利用经验模型进行拟合。常用的经验模型有:Van-Genuechten模型[10]、Gardner模型[11-12]、Brooks-Corey模型[13]、Campbell模型[14]以及Mualem模型[15]等。其中,Gardner模型具有参数相对较少、形式简单且易于掌握和计算的优点。所以,为了方便广大农民和基层水管理者快速、有效的获取土壤水分运动参数,本文选择使用Gardner模型进行本文试验数据点的数据拟合,其表达形式如下:
h=aθ-b
(1)
式中:h为土壤水吸力,cm;θ为土壤体积含水率,cm3/cm3;a、b为拟合参数,无量纲。
Gardner模型表达式是幂函数形式,常采用非线性最小二乘法拟合非线性函数,处理过程较为繁琐,拟合难度较大[16]。宋孝玉[17]等通过转换Gardner模型,得到其对数形式较指数形式拟合效果更好且参数取值范围更合适的结论。因此,为了方便应用,本研究通过函数变换得到Gardner模型的对数形式为:
logh=-Alogθ-B
(2)
式中:h和θ含义与上式相同;A、B为拟合参数,无量纲。
2 BP神经网络模型的建立
2.1 输入、输出因子及样本的确定
(1)输入输出因子的确定。在前人的研究基础上并结合自己的试验,得出影响土壤水分特征曲线Gardner模型参数的土壤基本理化参数较多,且各自具有不同的影响机理。经过综合比较,本研究从Gardner模型参数的物理意义出发,合理确定模型参数的主要影响因子,主要包括土壤质地、土壤体积质量、土壤含有机质量和含无机盐量等。黏粒含量越高,则中小孔隙发育越多,导致土壤比表面积增大,土壤颗粒吸持水能力越强;土壤体积质量的增大致使土壤紧实,孔隙中毛管作用加强,土壤的吸持水能力亦随之得以增强;土壤有机质是土壤中重要的胶结物质,可以改善土壤孔隙状况,有机质含量高的土壤在大量毛管孔隙的作用下持水能力增大;随着含盐量的增加土壤饱和含水率减小,残余含水率增大,原因在于土壤含盐量升高,土壤分散度增大,土壤孔隙毛管作用增强,土壤表现出更好的持水能力。综上分析,选择土壤含黏粒量、含粉粒量、土壤体积质量、土壤含有机质量和无机盐量5个基本理化参数作为土壤转换函数BP预测模型的输入因子,选择Gardner模型参数A、B为本研究所建BP神经网络预测模型的输出参数。
(2)训练样本的建立。利用Excel软件将试验过程中测得的样本土壤不同水吸力下的土壤体积含水率按Gardner模型的对数形式进行拟合处理,得到模型参数A和B的确切拟合数值。从试验数据中选取具有代表性的70组试验数据进行建模,并从70组以外的数据随机选取10组试验数据预留用以模型精度检验。将用于建模和模型检验的80组数据样本的土壤的体积质量、粉粒质量分数、黏粒质量分数、土壤含有机质量、土壤含无机盐量基本理化参数以及Gardner模型参数A和B值进行汇总整理。表2为从80组数据样本中随机选取的10组土样的基本理化参数和Gardner模型参数数据表。
表2 土样基本理化参数和模型参数数据表(部分)
2.2 BP神经网络的设计与建立
(1)BP神经网络的结构与原理。本文所建立的BP预测模型结构分为输入层、中间隐含层和输出层。基本原理是输入神经元将所携带的信息传递到隐含层,在隐含层经过运算最终在输出神经元处输出计算值,若输出值与预期值相差较大,则该神经网络会将误差自动反馈,从而改变各层神经元连接的权值和阈值[18]。为达到预期训练值,需在试算过程中对隐含层节点数进行调整,并反复计算,直至达到模型的目标精度。按照满足精度要求下减少训练次数的原则,文章最终建立比例为5∶13∶2的BP预测模型。
(2)样本预处理。为了减小输入输出数据的量纲影响并加快样本的迭代运算速度,需要对样本数据进行归一化处理,使输入值落在(0,1)之间。利用Matlab7.0归一函数premnmx和还原函数postmam来实现对输入输出样本的归一化处理和数据还原,并依据公式(3)对输入参数进行预处理:
Y=(X-Xmin)/(Xmax-Xmin)
(3)
式中:Y为处理后样本值;X为输入样本值;Xmin为建模样本最小值;Xmax为建模样本最大值。
(3)函数选取和参数设定。选择学习速度快且单次迭代误差降幅大的trainlm函数作为模型的训练函数,正切函数tansig作为隐含层的激活函数,线性purelin函数作为输出层的激活函数。设定模型训练参数如下:训练迭代步数上限为1 500次,学习率为1%,训练精度值为0.000 5。
2.3 土壤水分特征曲线Gardner模型参数的BP预报模型
按照预先确定的输入输出因子对70组建模样本进行训练,在经过187步迭代计算后,训练精度达到4.998 2×10-4,满足目标要求,这表明利用选取的70组数据成功建立起了土壤基本理化参数与Gardner模型参数间的BP预测模型。训练结构和训练结果分别见公式(4)和公式(5):
net=newff(min max(traininput),[13,2],
{’tansing’, ’purelin’}, ’trainlm’),
(4)
式中:net为本文所创建的BP神经网络模型;newff为在Matlab7.0中生成的BP神经网络函数;min max( )为决定输入参数取值范围的向量矩阵;13和2为分别为隐含层和输出层神经元的个数;{‘tansig’,‘purelin’}分别为隐含层和输出层的传输函数形式;‘trainlm’ 为网络的训练函数形式。
[A,B]=purelin(iw2×(tansig(iw1×p+b1))+b2)
(5)
式中:A、B为土壤水分特征曲线Gardner模型参数;iw1为模型输入层到隐含层的权值;iw2为模型隐含层到输出层的权值;b1为模型输入层到隐含层的阈值;b2为模型隐含层到输出层的阈值;p=[λ,θ,ω,β,δ],其中,λ为土壤体积质量;θ为土壤含黏粒量;ω为土壤含粉粒量;β为土壤含有机质量;δ为土壤全盐量。
Gardner模型参数的BP预测模型矩阵数值见表3。
2.4 建模数据分析
基于Matlab7.0对70组建模数据的预测,得到模型2个参数的迭代计算值,与预测值的离散程度如图1、2所示,并计算A、B两参数迭代值和实测值的相对误差。
由图1、图2可知,在70组建模数据中,参数A实测值与预测值的相关度达到0.998 9,相对误差范围为0.001%~16.247%,平均相对误差为1.955%。参数B实测值与预测值的相关度达到0.996 7,相对误差最小值为0.006%,最大值为14.190%,平均相对误差达2.386%。结果显示,2参数相对误差平均值均控制在3%以内,精度较高,这表明本文所建立的BP神经网络预报模型预测精度高,以土壤基本理化参数作为输入参数来预报Gardner模型参数是合理。
3 BP预测模型检验
用随机选取的10组预留试验数据进行模型预测精度的检验,检验结果如表4所示。
表3 BP预报模型矩阵数值表
图1 参数A建模样本拟合图
图2 参数B建模样本拟合图
分析表4数据,参数A预测相对误差最大值7.108%,最小值0.697%,平均值2.718%;参数B相对误差最大值11.409%,最小值1.831%,平均值5.782%。检验样本的平均相对误差在6%以内,预测精度较高。因此,应用本文所建立的BP预测模型进行黄土高原区土壤水分特征曲线Gardner模型参数预测可获得较好效果。
表4 Gardner模型二参数检验结果表
4 结 语
本文建立BP 神经网络预报模型来反映土壤水分特征曲线Gardner模型参数与其主要影响因素(土壤体积质量、土壤黏粒量、粉粒量、土壤含有机质量以及无机盐量)之间的非线性关系,实现对Gardner模型参数的预测是可行的。检测样本相对误差平均值均控制在6%之内,误差较小,研究结果可为研究黄土高原区土壤包气带水分运移规律提供了重要的理论依据。
BP神经网络存在对样本依赖大,易陷入过度拟合的缺陷,建议应用遗传算法优化网络模型的权值阈值以克服上述不足;输入因子选择的合理选取是提高模型预测精度的关键。另外,目前还没有结构化方法来合理确定建模参数, 而是多依赖经验,这都需要学者深入探索研究。
[1] 雷志栋,杨诗秀,谢传森.土壤水动力学[M].北京:清华大学出版社,1988.
[2] Wosten J HM, Pachepsky YA, RawlsW J. Pedotransferfunctions: bridging the gap between available basic soil data and missing soil hydraulic characteristics[J]. Journal of Hydrology, 2001,251:123-150.
[3] Mandelbrot B B. The fractal geometry of nature[M]. San Francisco: W HFreeman, 1983.
[4] Arya LM, Paris J F. A physicoempirical model to predict the soil moisture characteristic from particle-size distribution and bulk density data[J]. Soil Science Society of America Journal, 1981,45:1 023-1 030.
[5] Vereecken H, Maes J,Feyen J, Darius P. Estimating the soil watermoisture retention characteristic from texture, bulk density, and carbon content[J]. Soil Science, 1989,148:389-403.
[6] 刘建立,徐绍辉,刘慧.估计土壤水分特征曲线的间接方法研究进展[J].水利学报,2004,(2):68-76.
[7] 夏达忠,张行南,贾淑彬,等. 基于土壤物理特性的土壤水分特征曲线推求方法[J].实验室研究与探索,2010,(10)29:18-20.
[8] 姚姣转,刘廷玺,王天帅,等.科尔沁沙地土壤水分特征曲线传递函数的构建与评估[J].农业工程学报,2014,(20)30:98-108.
[9] 王改改,张玉龙,虞 娜. 多数据源土壤传递函数模型在水分模拟中的不确定性[J].农业机械学报,2012,(11)43:45-50.
[10] Van Genuchten M Th.A closed-form equation for predicting the hydraulic conductivity of unsaturated soils[J]. Soil Science Society of America Journal,1980,44(5):892-898.
[11] Gardner W R,Hillel D,Benyamini Y. Post-irrigation movement of soil water:I. Redistribution[J]. Water Resources Research,1970,6(3) :851-861.
[12] Gardner W R,Hillel D,Benyamini Y. Post-irrigation movement of soil water:P. Simulations Redistribution and evaporation[J]. Water Resources Rrsearch,1970,6(4):1 114-1 153.
[13] Brooks R H,Corey A T. Hydraulic properties of porous media[J]. Hydrology Paper,1964,3(3):1-27.
[14] Campbell G S.A simple method for determining unsaturated conductivity from moisture retention data[J]. Soil Science,1974,117(6):311-314.
[15] Maulem Y.A new model for predicting the hydraulic conductivity of unsaturated porous media[J]. Water Resources Rrsearch,1976,12(3):513-522.
[16] 蔡 飞,邵孝侯,王振宇,等. 天津滨海绿地土壤水分特征曲线的拟合与比较分析[J].地球信息科学学报,2010,12(3):336-341.
[17] 宋孝玉,李亚娟,李怀有,等. 土壤水分特征曲线单一参数模型的建立及应用[J].农业工程学报,2008,24(12):12-15.
[18] 何 勇,宋海燕. 基于神经网络的作物营养诊断专家系统[J].农业工程学报,2005,21(1):110-113.