APP下载

不同覆盖类型土壤电阻率影响因子及其PLS和BP模型的预测研究

2017-06-20冯旭宇刘晓东石湘波李庆君

现代农业科技 2017年9期
关键词:BP神经网络预测

冯旭宇++刘晓东++石湘波++李庆君++王卫红++宋昊泽++博格++刘翠

摘要 土壤电导率是反映土壤质量和物理性质的重要参数。本研究通过对试验区不同覆盖类型下土壤温度、含水量及电导率的测试,探讨土壤温度和含水量对土壤电阻率的影响。结果表明,不同土壤覆盖类型土壤温度的变化对土壤电阻率的影响不同,土壤电阻率随着土壤含水量的增加而逐渐变小。将偏最小二乘回归模型(PLS)与BP神经网络模型应用于土壤电阻率的预测,PLS模型及BP神经网络模型对土壤电阻率预测皆有较好效果,偏最小二乘回归模型对沙地和草地土壤电阻率预测的误差较小,BP神经网络对农田土壤电阻率建模精度较为理想。

关键词 土壤电阻率;覆盖类型;偏最小二乘回归;BP神经网络;预测

中图分类号 X43;P4 文献标识码 A 文章编号 1007-5739(2017)09-0198-04

Abstract The soil electrical conductivity is an important parameter to reflect soil quality and physical properties.In this study,the soil temperature,water content and electrical conductivity of different coverage types of farmland,grassland and sand were tested to explore the effect of soil temperature and water content on soil electrical conductivity. The results showed that different coverage types had different effects on soil electrical conductivity,the soil electrical conductivity decreased gradually with the increase of soil water content. The partial least squares regression(PLS)model and BP neural network model were applied predict soil electrical conductivity,and got good prediction effects. The PLS model had little error in the prediction of soil electrical conductivity of grassland and sand,and BP neural network model was more ideal for modeling farmland soil electrical conductivity.

Key words soil electrical conductivity;coverage type;partial least squares regression;BP neural network;prediction

土壤电导率是反映土壤质量和物理性质的重要参数[1-3],是土壤科学中的一项重要研究内容,故国内外许多土壤学家对土壤电阻率进行了相关研究。国外Sundberg[4]最早于1992年将电阻率理论运用于地质勘探,并建立了电阻率结构因子,Archie 1942年提出了地层电阻率阿尔奇公式[5],Wyllie、Gregory和Jackson[6-9]等许多学者对土壤电阻率的影响因素进行了进一步研究,并建立了与各影响因子的理论表达式。国内孙宇瑞[10]通过对壤土的研究指出土壤盐分对土壤电导率的影响远大于土壤含水率;刘国华[11]则建立了非饱和土壤电阻率的结构模型;刘春泉、段旭等[12-15]分析了宁夏等地区土壤电阻率影响因素;刘磊[16]、李博伦[17]对影响不同类型土壤电阻率的物理、化学性质的因素及其影响机理进行了相关研究。总的来看,上述研究主要集中在与土壤肥力相關的土壤电导率的物理、化学性质方面,而对于土壤电阻率应用于气象灾害风险区划方面的研究甚少。因此,本文对不同覆盖类型下影响土壤电阻率的主要因素(土壤温度和含水量)进行分析,揭示其对土壤电阻率的影响规律,并运用偏最小二乘回归模型(Partial Least Square Regression,PLS)与BP(Back Propagation)神经网络模型对土壤电阻率进行预测,进而确定区域土壤电阻率的分布特征,为气象灾害风险区划工作提供重要的参考依据。

1 研究区域概况

本文土壤电阻率等参数的测试区域选在内蒙古中部的巴彦淖尔地区(图1),选取了该地区农田、沙地和草地3种不同土壤类型的17个测试地点开展为期2年的数据采集,农田10个测试点、沙地4个测试点、草地3个测试点,每年的测试时间为5—10月。测试所用的仪器为美国产2265FS便携式土壤电导仪和6440FS土壤水分测定仪,并用GPS定位测试点的经度、纬度坐标。每次测试将传感器插入土壤中,保持每次插入深度一致(3~4 cm),如图2所示。待数据稳定后记录样本的测试值,每个样本采集数据3次后求平均值。通过2年的测试共取得1 262个数据样本,其中1 075个农田类型的数据样本,90个沙地类型的数据样本和97个草地类型的数据样本。

测试所用的便携式土壤电导仪2265FS和土壤水分测定仪6440FS的相关参数见表1和表2。便携式土壤电导仪2265FS是通过电流-电压四极法来测量土壤表观电导率[18],由于四电极能消除电极极化效应,该方法最早由Wenner和Schlumberger于20世纪20年代提出[19]。四电极包括2个电流电极和2个电压电极,工作时向电流电极提供激励电流,通过检测电压电极的电势来确定土壤表观电导率。而土壤水分测定仪6440FS是通过时域反射法(Time Domain Reflectrometry,TDR)来测量土壤水分,它依据电磁波在介质中的传播速度与介质的介电特性相关电磁理论[20],通过测量电磁波在介质中的传播时间确定土壤介电常数,从而间接得到土壤体积含水量。

2 数据处理及分析方法

2.1 数据质量控制

根据研究区土壤电阻率等参数的测试特征,测试数据的质量控制主要通过缺失检验、逻辑检验来完成。同一时间测试的数据,如果缺少土壤电阻率、土壤温度或土壤体积含水量任一参数值,则剔除该数据。此外,依据土壤电阻率与土壤温度和体积含水量之间的定性关系对测试数据进行逻辑判断,对测试的要素允许范围合理性进行检查,剔除超出允许范围的错误数据资料。

2.2 数据分析方法

本文通过应用SAS和Matlab软件编程实现土壤电阻率等参数的常规数理统计分析,及运用偏最小二乘回归和BP神经网络法对土壤电阻率进行了预测。

偏最小二乘法于1983年由S. Wold和C. Albano等提出,该方法集主成分分析、典型相关分析和多元线性回归分析3种分析方法的优点于一身,它在处理样本容量小、解释变量个数较多及解决变量存在多重共线性问题方面开辟了一种较为有效的技术路径[21]。偏最小二乘回归的目的是在自变量空间里寻找某些线性组合,以便更好地解释因变量的变异信息,其计算步骤[22]主要包括标准化原始数据、主成分提取、建立回归方程3个主要步骤,其偏最小二乘回归的基本思路如图3所示。

BP神经网络是一种误差反向传播算法[23-24],主要特点是信息正向传递、误差反向传播。BP神经网络一般由输入层、隐含层和输出层3层构成,其拓扑结构如图4所示。输入信号从输入层经隐含层逐层处理,直至输出层,每一层的神经元状态只影响下一层神经元状态,隐含层可以设计为单隐层或者多隐层结构。如果期望输出与实际输出不符,则进入反向传播,根据预测误差调整网络权值和阈值,从而使误差减少到可以接受的程度。

本文对2种预测模型的预测精度的检验主要采用平均相对误差MRE和均方根误差RMSE函数,平均相对误差MRE和均方根误差RMSE最小方为合适。计算公式[25]如下:

3 土壤温度和含水量对土壤电阻率的影响规律

根据实际测量结果可知,当土壤的温度和体积含水量变化时,其土壤电阻率也会相应发生变化,图5~7为农田、沙地和草地等不同土壤类型下土壤电阻率与土壤温度、含水量的散点图。可以看出,土壤温度为0~40 ℃时,随着土壤温度的变化,农田与草地土壤类型下电阻率缓慢增大,变化不明显,说明在常温下上述2种土壤温度的变化对土壤电阻率的影响不大,这与何金良等[26]的研究结果一致;但是沙地土壤电阻率随着温度的变化先减小,到20 ℃左右降至最低而后又随着温度的增加而显著增大,这可能是由于沙土的孔隙度与农田、草地土壤不同而导致的结果。

不同土壤类型下,土壤电阻率与土壤含水量的相关性相对较好,随着土壤含水量的增加,3种类型的土壤电阻率都逐渐变小;其幂函数拟合相关性较高,沙地土壤类型下较农田和草地的相关系数最大,达到0.8。由图5~7可以看出土壤含水量较小时,电阻率随着含水量的增加显著减小,当含水量达到一定值时,土壤电阻率减小的速度变慢,具有一定的饱和性,这可能是由于土壤颗粒孔隙中的水分连通形成通道后,含水量再增加对整体的导电性所起的作用很小的缘故。

4 基于偏最小二乘回归的土壤电阻率的预测

按照不同土壤类型将测试样本分为2组,第1组数据选取865个农田数据样本、77个草地样本和70个沙地样本,共1 012个数据样本用于进行偏最小二乘回归模型的建立;第2组数据选取210个农田数据样本、20个草地样本和20个沙地样本,共250个数据样本用于模型精度检验。将土壤温度作为自变量x1,土壤含水量作为自变量x2,将土壤电阻率作为因变量y。偏最小二乘回归的基本作法是首先在自变量中提出第一成分t1(t1是x1、x2的线性组合,且尽可能多地提取原自变量集中的变异信息);同时在因变量中也提第一成分u1,并要求t1与u1相关程度达到最大。然后建立因变量y与t1的回归,若回归方程已达满意的精度,則算法终止。否则继续对第二成分进行提取,直到能达到满意的精度为止。若最终对自变量集提取r个成分t1,t2,…,tr,偏最小二乘回归将通过建立y与t1,t2,…,tr的回归式,再表示为y与原自变量x1、x2的回归方程式,即偏最小二乘回归方程式。通过对农田、沙地和草地3种不同土壤类型测试数据的回归,得到的回归方程分别为y=18.582 6+0.474 9x1-0.475 5x2、y=25.560 8+0.918 6x1-0.776 6x2和y=-17.199 3+2.852 6x1-0.604 3x2。

图8为农田、沙地和草地3种土壤类型下建模样本的土壤电阻率实测值与偏最小二乘回归预测值以及检验样本集的实测值与预测值的相关散点图。样点越接近线,说明模型预测值越接近实测值,预测效果越好;可发现,大部分建模和检验样本都分布在回归线附近,但也有一些样本离回归线较远。从农田、沙地和草地不同土壤类型电阻率对土壤温度和含水量的偏最小二乘回归的建模精度来看,沙地类型的回归相关系数R最大,达0.468 7;农田类型的相关系数次之,接近0.4。对照检验精度的平均相对误差MRE和均方根误差RMSE值来看,农田类型的平均相对误差MRE和均方根误差RMSE最小,其次是草地类型。由不同土壤类型的偏最小二乘回归模型可看出,利用偏最小二乘回归预测土壤电阻率效果优于一般线性回归方法,但还有一定的改进空间。

5 基于BP神经网络的土壤电阻率的预测

同样按照土壤类型将测试样本分为2组,分组情况同偏最小二乘回归相同,第1组数据用于BP神经网络模型的训练,第2组数据用于模型的精度检验,所有样本进行归一化处理,便于提高BP神经网络的训练速度[23-24]。本文输入层的2个因子分别为土壤温度和土壤含水量值,土壤电阻率值作为输出层,则神经网络的训练将在隐含层的节点[2,13,16]之间反复进行,直至其预测的误差最小为止。表3为农田、沙地和草地3种土壤类型下BP模型选取的参数值。

图9为农田、沙地和草地不同土壤类型下数据样本的电阻率实测值和BP模型预测值的比较。从农田类型的BP模型模拟来看,相对PLS回归的散点图数据样本比较均匀的分配在直线附近,其相关系数R=0.540 4,比农田电阻率的PLS回归模型相关系数大35.4%;同样,其回归模型的平均相对误差MRE和均方根误差RMSE也有所减小,较农田电阻率的PLS回归模型的相对误差和均方根误差分别降低27.22%和8.06%,可见农田土壤类型下的BP神经网络模型预测效果更好。沙地BP神经网络拟合相关系数比PLS回归模型相关系数小9.68%,其平均相对误差MRE有所下降,但是均方根误差RMSE也有所增大,较沙地电阻率的PLS回归模型均方根误差增加7.38%。草地类型BP神经网络模型的相关系数R=0.449 4,比草地电阻率的PLS回归模型相关系数增大34.83%;但是其平均相对误差MRE和均方根误差RMSE都有所增大,较草地电阻率的PLS回归模型分别增加31.23%和53.79%,可见相对草地电阻率的PLS来说,BP神经网络模型的预测误差不太理想,但其建模精度效果较好。

6 结论

通过对研究区域农田、沙地、草地3种土壤类型下土壤温度、含水量、电阻率等参数的测试,得出了不同土壤类型下土壤电阻率与其影响因子的定量关系,建立了土壤电阻率的偏最小二乘回归模型和BP神经网络预测模型,结论如下:

研究区域土壤含水量、土壤温度对土壤电阻率均有一定影响。土壤温度为0~40 ℃时,随着土壤温度的变化,土壤电阻率缓慢增大,变化不明显,说明在常温下土壤温度的变化对土壤电阻率的影响不大。而土壤电阻率与土壤含水量的相关性较好;土壤含水量较小时,电阻率随着含水量的增加而减小较快,当含水量达到一定值时,土壤电阻率减小的速度变慢,具有一定的饱和性。

通过PLS和BP神经网络对不同覆盖类型土壤电阻率进行模拟预测,表明PLS偏最小二乘回归模型以及BP神经网络模型对土壤电阻率估算皆有较好效果。PLS对沙地和草地土壤电阻率预测的误差较小,而BP神经网络对农田土壤电阻率建模精度较为理想。

7 参考文献

[1] 冯松涛.基于电阻率特征的黄土结构性试验研究[D].南京:东南大学,2009.

[2] 于小军,刘松玉.电阻率指标在膨胀土结构研究中的应用探讨[J].岩土工程学报,2004(3):238-243.

[3] 余东.土石坝渗漏的电阻率成像诊断试验研究[D].重庆:重庆交通大学,2010.

[4] SUDHA K,ISRAIL M,MITTALC S,et al.Soil characterization using electrical resistivity tomography and geotechnical investigations[J].Journal of Applied Geophysics,2009,67(1):74-79.

[5] KAHRAMAN S,ALBER M.Predicting the physico-mechanical properties of rocks from electrical resistivity[J].International Journal of Rock Mech-anics & Mining Sciences,2006,43(2):543-553.

[6] SHEA P F,LUTHIN J N.An investigation of the use of the four electrode probe for measuring soil salinity in situ[J].Soil Science,1961,92(5):331-339.

[7] RHOADES J D,SHOUSE P J,ALVES N A,et al.Determining soil salinity from soil electrical conductivity using different models and estimates[J].Soil Science Society of America Journal,1990,54(1):46-54.

[8] SAMOUELIAN A,COUSIN I.Electrical resistivity survey in soil science:a review[J].Soil & Tillage Research,2005,83(2):173-193.

[9] YAO Rongjiang,YANG Jingsong.Quantitative evaluation of soil salinity and its spatial distribution using electromagnetic induction method[J].Agricultural Water Management,2010,97:1961-1970.

[10] 孫宇瑞.土壤含水率和盐分对土壤电导率的影响[J].中国农业大学学报,2000,5(4):39-41.

[11] 刘国华.于田绿洲土壤盐分特征及其成盐驱动因子分析[D].乌鲁木齐:新疆大学,2009.

[12] 刘春泉,厚军学,张伟.宁夏土壤电阻率时空分布观测试验[J].气象科技,2008,36(4):474-479.

[13] 李良福,郭在华,覃彬全.LQG-1型土壤电阻率远程自动测量装置研制[J].气象科技,2009,37(4):434-438.

[14] 李萍,蔡河章,马秀玉,等.高土壤电阻率下防雷装置的设计[J].气象科技,2014,42(5):912-917.

[15] 段旭,王彦辉,徐丽宏,等.六盘山香水河小流域典型坡面的土壤电阻率空间变异[J].土壤学报,2011,48(5):912-921.

[16] 刘磊.土壤电阻率估算及影响因素研究[D].南京:南京信息工程大学,2011.

[17] 李博伦.土壤电阻率估算及影响因素研究[D].南京:南京信息工程大学,2011.

[18] 刘梅先,杨劲松.土壤盐分的原位测定方法[J].土壤,2011,43(5):688-697.

[19] BURGER H R,BURGER D C.Exploration Geophysics of the Shallow Subsurface[M].Upper Saddle River,NJ:Prentice Hall PTR,1992.

[20] 王勇志.基于时域传输原理的土壤水分测试仪的研究与开发[D].北京:北京林业大学,2013.

[21] 王惠文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社,1999.

[22] 王文圣,丁晶,赵玉龙,等.基于偏最小二乘回归的年用电量预测研究[J].中国电机工程学报,2003,23(10):17-21.

[23] 王小川,史峰,郁磊,等.MATLAB神经网络43个案例分析[M].北京:北京航空航天大学出版社,2013.

[24] 陈明.MATLAB神经网络原理与实例精解[M].北京:清华大学出版社,2013.

[25] 黄嘉佑,李庆祥.气象数据统计分析方法[M].北京:气象出版社,2014.

[26] 何金良,曾嵘.电力系统接地技术[M].北京:科学出版社,2007.

猜你喜欢

BP神经网络预测
选修2—2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
选修2—2期中考试预测卷(A卷)答案与提示
选修2—2期中考试预测卷(B卷)答案与提示
就bp神经网络银行选址模型的相关研究
基于DEA—GA—BP的建设工程评标方法研究
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 
BP神经网络算法在数值预报产品释用中的应用
《福彩3D中奖公式》:提前一月预测号码的惊人技巧!