监测采样间隔对土壤墒情预测模型性能的影响
2020-04-14张武洪汛李蒙宋一帆金秀
张武,洪汛,李蒙,宋一帆,金秀
(1.安徽农业大学信息与计算机学院,安徽 合肥 230036;2.智慧农业技术与装备安徽省重点实验室,安徽 合肥 230036)
土壤墒情对作物的生长起着重要的作用.对土壤墒情进行预测是实现农田精准灌溉的主要技术手段.土壤墒情通常指的是土壤的干湿情况,一般用土壤湿度表示.土壤墒情的预测本质上是数据建模的过程,即按照具体的试验设计,对农田环境参数进行监测,获取数据,然后运用计算机技术和信息处理方法建立数学模型[1],以此来间接的预测土壤墒情[2].目前人们建立了多种预测模型[3-7],这其中基于神经网络、深度学习等技术的土壤墒情预测模型获得了广泛应用[8-9].
在墒情检测和预测过程中,合理的采样间隔对数据建模非常重要,不同的采样因子其时间变化尺度存在着差异,例如光照强度的时间变化尺度是分钟级,而环境的温湿度的时间尺度是小时级.采样间隔过小,会使数据量增加导致分析处理速度变慢[10].采样间隔过大,则会遗漏重要的信息数据,导致模型的预测误差增加.目前选取采样间隔时,往往存在主观性和随意性,以至墒情预测无法达到满意效果.
针对采样间隔的研究,李立刚等根据构建的复平面中辨识模型的特征值到原点的距离来判断采样间隔是否合理,并提出了折半查找算法,在给定的范围内寻求系统中最优的采样间隔[11].赵志远等针对不同采样间隔轨迹数据的识别和出行模型的网络构建问题,研究不同采样间隔下不同活动的识别率的差异性,并得出了最优采样间隔以确保人群出行网络的完整性[12].李柯等研究了土壤湿度的传感器的动态采样策略,动态采样模式通过当前的测量值来计算下一次的采样间隔时间,让传感器进入休眠,降低了系统功耗[13].
本文以茶园地表下不同深度的土壤墒情与主要环境因子的关系为试验对象,采用不同的采样间隔,构建多种预测模型,进行建模、预测和比较研究,探讨不同采样检测对土壤墒情预测模型精度的影响程度,确定合理的采样间隔为茶园土壤墒情预测与建模提供客观依据.
1 材料与方法
1.1 研究区域概况
研究区域位于安徽省黄山市太平区,该区域以山地为主,气候属湿润性季风气候,全区四季分明,空气湿度大,多云雾,热量丰富,年平均空气相对湿度在80%以上,年平均气温15.5 ℃~16.4 ℃,日照百分率为40%.试验区面积约100 hm2,茶园位于低海拔的山脚部分,试验区的土壤为山地黄棕壤土质,土壤表层富含腐殖质,有机质含量高,偏酸性,但土壤中石砾含量较高,保水性较差.
1.2 数据采集与处理
随着物联网技术在农业领域的广泛应用[14],通过物联网系统采集茶园的气象数据和土壤理化数据.气象数据包括风速、光照、空气温度、空气湿度和降雨量.土壤理化数据主要包括土壤湿度、土壤温度和土壤电导率值.以多点采集的方式保证数据的准确性.本研究的数据时间跨度为2018年10月~12月,共计79 343组.
数据采集过程中不可避免的存在数据偏差、缺失数据和冗余数据,因此在数据应用之前需要进行预处理,确保数据的有效性和完整性.本文采用拉依达准则剔除数据序列中的粗大误差数据.按照贝塞尔公式求得标准差σ,公式如下.
(1)
土壤墒情反映的是土壤水分含量值,一般与降雨量、蒸发量、雨量因子[降水(mm)/气温(℃)]、空气湿度等因子有较强的相关性[15].
以茶园环境中的风速、光照、空气湿度、空气温度、降雨量等气象因子以及土壤温度、土壤电导率为
墒情预测的影响因子,分别将土壤20、40、60 cm深度的土壤湿度为输出量,建立土壤墒情预测模型.考虑到土壤湿度的变化具有滞后性,初始时段的土壤湿度对下一刻的土壤湿度值影响较大,因此,将时段初(前一时刻)的土壤湿度作为墒情预测的影响因子.
由于数据计量单位不同,彼此之间的数量级不相等,因此在数据分析之前进行了归一化转换.在建立土壤墒情预测模型之前,对影响土壤墒情的各因素数据进行了相关性分析,确定各影响因子与土壤含水量的相关系数,分析结果如表1所示.
表1 各影响因子与土壤墒情相关性分析
由表1可得,风速与土壤墒情相关性较小,其相关系数为0.09,小于0.1,呈现为弱相关,故删除该因子.选取光照、空气湿度、空气温度、土壤温度、土壤导电率、降雨量以及土壤初始湿度作为土壤墒情的主要影响因子,代入模型中运算.
1.3 模型建立与应用
本文以多元二次回归、BP神经网络(Back-ProPagation network)和LSTM深度学习模型(Long-short term memory network)为建模工具,选定10、30、60、90、120 min的采样间隔,对地表之下20、40、60 cm不同深度的土壤墒情建立预测模型.
1.3.1 多元二次回归 多元二次回归模型是回归分析方法中应用比较广泛的一种模型[16],是一种重要的曲线回归模型,同时也是数理统计中最为常用的方法,其基本公式如下.
Y=W1TX2+W2TX+ε
(2)
式中,W1是二次项的回归系数,W2是一次项的回归系数,ε是剩余参数(常数).回归分析的问题是根据X自变量与因变量Y之间的映射关系确定相应的回归系数,(2)式中各参数矩阵如下.
(3)
(3)式中m为因变量数量,n为影响因子的个数.
1.3.2 BP神经网络 BP神经网络是神经网络模型的典型代表,能够实现输入到输出的非关系型映射,并广泛应用于多个领域[17-19].通过样本的训练,模型不断修正网络权值和阈值使误差函数沿负梯度方向下降,逼近期望输出.模型主要由输入层、多个隐含层以及输出层所构成.其算法流程分两步进行.
1) 前向传输.数据沿着神经网络从输入层传输到隐藏层,再从隐藏层传输到输出层.公式如式(4).
(4)
2) 逆向反馈.根据输出的值与真实的值存在误差,本研究用均方误差来衡量预测值与真实值之间的误差.
(5)
wnew=wold-η▽E(w)
(6)
式中▽为梯度算子,η为学习速率.其中▽E(w)是E(w)的导数.
1.3.3 LSTM深度学习模型 LSTM深度学习模型广泛应用于解决时间序列问题[20-23].一个LSTM单元包含一个或多个具有内部状态的记忆细胞(Memory cell),分别是遗忘门、输入门和输出门.通过3个门结构,共同完成对状态的更新并且输出目标值.
遗忘门确定遗忘信息的程度.读取ht-1和xt,ht-1表示的是上一个记忆细胞的输出,xt表示的是当前细胞的输入,按照(7)式对数据进行筛选处理.
ft=sigmoid(Wf·[ht-1,xt]+bf)
(7)
上式中的Wf是权重项,bf是偏置项.ft是信息的遗忘程度.
(8)
输出门确定输出项.首先基于记忆细胞状态,运
行一个sigmoid层来确定记忆细胞的哪些信息将输出;其次,把记忆细胞状态通过tanh进行处理(得到一个在 -1到1之间的值)并将它和输出门的输出相乘.根据(9)式和(10)式进行计算,下式中Ot为将要输出的内容,ht为最终输出的部分.
Ot=sigmoid(Wo[ht-1,xi]+bo)
(9)
ht=Ot×tanh(Ct)
(10)
2 结果与分析
本文以土壤温度、土壤湿度、光照、空气温度、空气湿度、土壤电导率、降雨量等7个影响因子为输入,输出为土壤湿度的预测值.将数据所采集的数据分为训练集与测试集.训练集为10月26日到12月7日的数据,测试集为12月8日到12月23日的数据.采用多元二次回归、BP神经网络、LSTM深度学习模型建立预测模型.
BP神经网络采用的(7,12,1)的3层网络结构,而LSTM深度学习模型采用的(7,25,1)的3层网络结构.选用ReLu激活函数,该函数存在不饱和区域,也同时具有非线性性质,能够有效的减弱梯度消失的问题.选择Adam优化算法,该算法能利用梯度的一阶矩和二阶矩动态调整学习率.迭代次数为300次.
以地表之下20 cm的土壤墒情为例,将采样间隔设置为10、30、60、90和120 min进行试验验证.不同采样间隔时模型预测曲线如图1所示.
计算最大相对误差,最小相对误差,平均相对误差,如表2所示.
由图1和表2可知,多元二次回归模型随着采样间隔的增加,各种误差指数也在随之增加,且平均误差从0.045%增加到2.1%,增加较快.BP神经网络模型和LSTM深度学习模型的误差随着采样间隔的增加而先下降再增加,当采样间隔为30 min时为最小值,大于30 min之后随着采样间隔增加误差也不断增加.LSTM深度学习模型的误差比BP神经网络更小,拟合效果更好.
图1 不同采样间隔下的预测曲线Figure 1 Prediction curves at different sampling intervals
对地表下40 cm和60 cm的土壤湿度进行预测,在10、30、60、90、120 min采样的间隔下,得出的不同深度的土壤墒情实测值与预测值之间的平均相对误差,如图2所示.
表2 不同采样间隔的土壤墒情的误差
由图2可知,不同深度的土壤墒情预测误差存在着差异性,但误差变化的趋势是一致的.不同模型的预测误差的变化规律不同,多元二次回归模型的误差随着采样间隔增加而增加, 10 min采样间隔的误差值最小,随着采样间隔的增加误差迅速增大,且明显大于BP神经网络与LSTM深度学习模型.比较BP神经网络与LSTM深度学习模型,误差曲线均呈现“V”型规律,选用30 min为采样时相对误差最小.
综合考虑误差、网络传输及设备功耗等因素,30 min的监测采样间隔最合适.
3 结论
以茶园土壤墒情为研究对象,分别采用10、30、60、90、120 min的监测采样间隔,并运用多元二次回归、BP神经网络与LSTM深度学习模型进行建模、预测,分析模型的预测精度.
结果表明,在不同的监测采样间隔下,不同深度的土壤墒情的预测误差是存一定的差异性,但变化趋势是一致的;LSTM深度学习模型稳定性好、精度高,是3种模型中预测误差最小的,该模型适用于土壤墒情预测;监测采样间隔为30 min时误差最小,30 min为最适合的监测采样间隔.
A:多元二次回归平均相对误差随采样间隔变化曲线;B:BP神经网络平均相对误差随采样间隔变化曲线;C:LSTM深度学习模型平均相对误差随采样间隔变化曲线.A:Average relative error curve of Multiple quadric regression varies with sampling interval;B:Average relative error curve of BP neural network varies with sampling interval;C:Average relative error curve of LSTM in-depth learning model varies with sampling interval.图2 不同模型的平均相对误差比较Figure 2 Comparison of mean relative errors of different models
本文选取的采样时间间隔较少,没有对其他的采样间隔进行分析实验,后续研究将获取更大时间尺度的数据、选用多种预测模型、细化监测采样间隔,以获取更精准的试验结果.