基于物联网和LSTM的柑橘园土壤含水量和电导率预测模型
2020-11-29谢家兴孙道宗陈文彬杨明欣王卫星
高 鹏,谢家兴,2,孙道宗,2,陈文彬,杨明欣,周 平,王卫星,3
(1 华南农业大学 电子工程学院/人工智能学院,广东 广州 510642; 2 广东省农情信息监测工程技术研究中心,广东 广州 510642; 3 广东省智慧果园科技创新中心,广东 广州 510642)
柑橘Citrusspp.是一种重要的经济作物,主要分布在我国的广东、广西和四川等地[1-3]。我国的柑橘种植面积和年产量已经位居世界首位,并且连续多年不断增长[4-5]。目前我国的柑橘灌溉由传统的漫灌逐渐升级到滴灌,能够较好地实现节水灌溉[6]。但是滴灌作业主要还是由人为主观意识根据气象状况来进行判断,缺乏客观依据[7-8]。柑橘生长需要适宜的土壤含水量和电导率,过低或者过高的土壤含水量都会对根系生理活动产生负面影响[9],而土壤电导率则直接反映土壤的含盐量[10],过高的盐胁迫会导致柑橘产生盐毒害,过低的盐含量导致柑橘难以吸收所需的无机盐离子。因此,在柑橘种植作业中,及时获取柑橘果园的气象、土壤数据,以及建立果园的土壤含水量和电导率预测模型,对于制定和指导果园灌溉施肥管理具有重要意义。
近年来,物联网技术在农业中得到了广泛的应用,其结合相关传感器能够实现果园生长环境的远程实时监测。杨伟志等[11]建立了基于物联网和人工智能的柑橘灌溉系统,该研究利用传感器实时监测柑橘果园土壤水分等信息,整合物联网系统与专家系统知识库的灌溉规则来制定灌溉控制措施,该系统主要依靠已有的控制规则,部分参数的设置需要依靠经验来确定。李中良等[12]利用物联网和空气温湿度传感器、土壤温湿度传感器设计了实时监测柑橘环境的系统,综合了无线传感器网络、通用无线分组服务(General packet radio service,GPRS)网络与远程服务器网络来实现田间数据的远程传输,但该系统没有针对果园环境数据进行进一步的分析。罗党等[13]利用灰色神经网络,研究降雨量、温度、湿度、风速等因子对土壤含水量的影响,该模型说明了神经网络在土壤含水量预测方面是可行的,具有不错的精度。蔡亮红等[14]设计了基于极限学习机(Extremelearning machine,ELM)算法的土壤含水量预测模型,采用定点采集土壤样本并获取光谱数据的方法,经过小波变换和特征工程处理后,利用ELM算法建立非线性模型,实现土壤含水量的预测,但该系统没有利用物联网等实时传输方法,而且加入的训练因子较少,在复杂环境条件下,还需要进一步研究。张武等[15]利用反向传播(Back propagation,BP)神经网络和长短期记忆(Long short-term memory,LSTM)深度学习模型研究了不同采样间隔对茶园土壤墒情预测模型性能的影响,结果表明在30 min的采样间隔下,模型的性能表现最好,但是该研究的数据采集时间跨度较短,模型也未给出更多可解释性指标来描述其模型性能。
针对以上研究现状,本文设计一种基于物联网的柑橘园环境信息实时采集与传输系统,并建立基于LSTM的土壤含水量和电导率预测模型,为果园灌溉施肥管理提供指导。
1 柑橘园环境信息物联网传输系统设计
1.1 系统总体架构
物联网传输系统包括远程服务器、数据库、无线通信模块、信息采集节点、气象站等[16]。物联网系统架构如图1所示。信息采集节点负责采集柑橘园中的土壤含水量和电导率信息,气象站负责采集果园中的气象信息,包括空气温度、湿度、风速、降雨量等,通过无线通信模块传输至物联网网关与远程服务器,传输的数据最终存储在数据库中。
1.2 物联网传输系统硬件
硬件系统包括STM32F103C8T6处理器模块、电源模块、GPRS模块、ZigBee模块、空气温湿度传感器、风速传感器、降雨量传感器和土壤温度、含水量、电导率三合一传感器。传感器模块用于直接采集相关果园环境信息,ZigBee模块负责各个节点与网关数据传输,GPRS模块将各个节点数据远程传输至远程服务器。硬件框图如图2所示。
1.3 物联网传输系统软件
图1 物联网传输系统架构图Fig. 1 Framework of IoT transmission system
1.3.1 ZigBee组网协议 常见的ZigBee组网协议主要包括树型组网、星型组网和网状型组网等[17-19]。本文信息采集节点和气象站布置于柑橘果园中,需要考虑节点数据传输性能和续航能力。由于星型组网方式下,各个节点需要与网关直连以传输数据,在果园中存在着数据无法传输的可能性。网状型组网方式需要经过多轮数据转发,容易引起额外的能量损耗和丢包。因此本文采用树型组网方式,能够利用少量的节点中继实现数据传输,也能够尽可能减少路由转发引起的丢包问题。
图2 物联网传输系统硬件框图Fig. 2 Hardware framework of IoT transmission system
1.3.2 节点软件 系统节点主要负责数据采集与转换,包含2种工作模式,即正常模式和休眠模式[20-21]。在正常工作模式下,节点负责开启传感器并采集数据;而在休眠模式下,节点仅保留时钟唤醒机制,定时开启并采集数据,以实现节能的目的。节点软件工作流程如图3所示。
图3 软件工作流程图Fig. 3 Flowchart of software
2 材料与方法
2.1 区域概况与数据采集预处理
试验地点设在华南农业大学试验基地,该基地面积约13 hm2,海拔约为200 m,属于山地地形,土壤主要为含沙土质。该地区夏季高温多雨,年降雨量为1 700 mm左右,但是冬季降雨较少,易干旱。昼夜温差较大,适合柑橘等作物的糖分积累。在果园设置了5个节点,气象站和网关位于果园中央位置;使用激光测距仪测量得到单节点之间最长距离为344 m,节点使用高度为2.5 m的支架进行固定以减少果树对无线信号传播的干扰。其布置示意图如图4所示。节点数据与气象站数据分别传输至网关,由网关负责将数据打包传输至远程服务器,完成数据的传输。
图4 节点布置位置图Fig. 4 Figure of node location
本文的系统搭建完成后正式数据采集时间为2019年10月1日至2020年6月16日,节点数据传输间隔设置为每10 min传输1个数据包,单个节点理论上每天的数据包量为144个。数据采集期间平均每个节点接收数据包总数为36 326个,总平均丢包率为2.6%。利用汇总后的数据包统计当天的最高空气温度、最低空气温度、平均空气温度、空气湿度、降雨量、土壤含水量、土壤电导率和土壤温度。土壤含水量和电导率一般与蒸散量、降雨量、温度、湿度等相关,根据气象参数和彭曼公式计算蒸散量[22]:
式中,ET0为日参考蒸散量,mm·d-1;Rn为净辐射量,MJ·m-2·d-1;G为土壤热通密度,MJ·m-2·d-1;T为离地2 m高的平均空气温度,℃;u2为离地2 m高的风速,m·s-1;es为饱和蒸汽压,kPa;ea为实际蒸汽压,kPa;Δ 为蒸汽压力曲线斜率,kPa·℃-1;γ为温湿度常数,kPa·℃-1。采用估算公式 (2)计算辐射数据[23]:
式中,Rs和Ra分别为太阳辐射和地外辐射,MJ·m-2·d-1;t为日照时长,h;tmax为最大日照时长,h;as和bs通常取常数0.25和0.50。
由于各个环境参数具有不同的数量级,因此需要在数据预处理环节进行归一化处理。各个节点预处理后的数据取平均值后,分别建立各个环境参数与土壤含水量和电导率的相关性分析[24],结果如表1所示。
由表1可见,气象环境因子与土壤含水量和电导率存在一定的相关性,具备输入模型参与拟合的条件。
表1 土壤含水量和电导率与环境参数的相关系数Table 1 Correlation coefficients of soil moisture, electrical conductivity and environmental parameters
2.2 GRNN模型
GRNN模型最早是由Specht[25]提出的。GRNN模型能够利用连续的非线性数据进行训练,并收敛于底层回归曲面,该算法能够应用在学习植物模型的动力学中。GRNN建立在非参数回归基础上,以样本数据为后验条件,执行Parzen非参数估计,依据最大概率原则计算网络的输出并传输给下一级。GRNN的基础是径向基网络,具有较好的非线性拟合功能,但在训练过程中需要选定合适的学习参数,否则会容易产生过拟合现象。GRNN的网络结构分为4层,分别是输入层、模式层、求和层和输出层。其基础结构图如图5所示。
图5 GRNN网络结构Fig. 5 Structure of GRNN model
GRNN的网络输入为矩阵X=[x1,x2,…,xn]⊤,输出为矩阵Y=[y1,y2,…,yk]⊤,k为输出向量的维数。GRNN的模式层的神经元数目等于输入样本数目n,模式层的传输函数(pi)为公式(3):
式中,i表示模式层中第i个神经元,Xi为第i个神经元对应的学习样本,δ为平滑参数,改变 δ即可改变网络学习率。
GRNN网络求和层包含2种求和方式,即直接求和与加权求和,计算公式分别如公式(4)和(5)所示:
式中,SD为求和层神经元输出,SNj为求和层加权神经元输出,j表示输出层中第j个神经元,Pi为模式层第i个神经元的权值。
GRNN网络的输出层中神经元数目等于输出向量的维数,如公式(6)所示:
2.3 LSTM模型
实践证明,神经网络能够有效地解决复杂的非线性问题,但传统的神经网络无法利用时间序列数据特征预测未来的情况,特别是对市场销售、股票价格、pm2.5等时间序列数据的时序建模。时间序列数据不仅与当前条件相关,而且与最后的数据具有很高的相关性,而传统的神经网络难以对时间序列进行建模。近年来,递归神经网络[26-28](Recursive neural network,RNN)在自然语言处理、机器翻译和文本预测等方面得到了成功的应用,其效果明显优于神经网络。不同于一般的前馈网络,RNN包含隐藏状态提取特征,然后转化为输出数据。另一方面,RNN在所有计算步骤中共享权值、偏差等,使其与所连接的节点相依赖。然而,标准RNN也有不足之处,如要求输入和输出数据大小相同。另外,RNN通过对前一层隐状态的变换,经过激活函数后得到新的隐状态,但当RNN进行反向传播时容易产生梯度消失或者梯度爆炸问题。因此,RNN有时不能很好地处理长期依赖问题。
作为一种特殊的RNN网络,LSTM[29]包含了1个控制应该丢弃哪些信息的门,即遗忘门(Forget gate)。其次,为了避免梯度消失问题,在计算隐层状态时,用求和代替梯度导数。因此,理论上LSTM具有解决长期问题的能力。在本文中,LSTM网络是由3个部分组成的,即1个输入层用于处理数据,50个隐藏层用于训练和建模,1个输出层用于输出建模结果。模型的核心部分即LSTM节点[30],主要由3个部分组成,分别是输入门、输出门和遗忘门。其结构如图6所示。
图6 LSTM结构图Fig. 6 Structure of LSTM
其中,遗忘门控制丢弃的信息(ft),如公式(7)所示:
式中,ft的范围为[0,1],σ函数使得方程非线性化,更接近实际值从而提高预测精度。Wf和bf分别为遗忘门的权重和偏差参数。ht-1和xt为上一状态值和当前输入值。
输入门的功能是控制输入到当前单元中的信息,其状态更新如公式(8)和(9)所示:
式中,it由σ激活函数控制输入数据,如果其值为0,表示输入数据被完全阻塞,如果值为1,则表示完全允许数据进入门中。细胞状态由负责,它的激活函数是tanh。Wi和bi表示激活函数的权重和偏差参数,WC和bC表示细胞状态方程的权重和偏差参数。
输入门经过运算的数据,需要更新到细胞状态中,更新公式为:
式中,ftCt-1代表遗忘的信息,代表需要更新到当前细胞状态的信息,两者之和共同决定向下一个状态传递的信息量。
LSTM网络结构的最后一部分是输出门,其更新公式为:
式中,ot表示激活函数的输出,由σ函数决定,同时更新后的细胞状态值Ct在tanh函数作用下,与传递函数ot的乘积作为向下一个单元输出的内容,Wo和bo表示激活函数的权重和偏差参数。
经过上述LSTM单元的运算后,输出的信息能够被存储,也能够进入下一个节点进行运算,从而在训练过程中提取出信息。
2.4 模型性能测试标准
本文模型的性能表现使用均方根误差(RMSE)来表示,计算模型预测值与真实测量值的决定系数(R2)[31]来表征模型可解释性。相关公式为:
式中,ypred表示预测值,ycal表示实测值,表示预测值均值,表示实测值均值,N表示样本数。
3 结果与分析
3.1 LSTM和GRNN模型训练设置
试验中,使用了果园气象站气象数据和5个信息采集节点采集到的土壤墒情数据,现场布置的节点如图7所示。由于无线传感器网络传输过程中存在复杂因素的干扰,产生了个别异常(如空数据)与丢包数据,使得数据包不完整或整体丢失,本文将异常数据进行剔除,最终得到符合模型需求的数据。将70%数据划分为训练集,30%数据划分为测试集,5个节点数据划分结果如表2所示。训练参数设置方面,LSTM模型包含2层,每层128个LSTM单元,使用Relu激活函数,损失函数使用均方误差(MSE),优化算法使用Adam,共设置72个epoch和128个batch size。GRNN模型包含4层,模式层与输入样本相同,求和层使用128个神经元,激活函数、损失函数和优化算法、epoch和batch size等参数与LSTM模型保持一致。
图7 柑橘果园节点安装图Fig. 7 Fig of nodes installation in citrus orchard
表2 节点数据信息Table 2 Datasets of nodes
3.2 模型性能表现
基于本文所提出的模型和预处理的输入样本经过训练后的性能测试标准如表3所示。
从表3中可以看出,在土壤含水量的预测模型表现中,LSTM模型的RMSE值范围为6.74~8.65,低于GRNN模型的7.01~14.70。LSTM模型中,节点2和3的RMSE在5个节点中较低,这可能是因为这2组训练样本数较多。节点4的RMSE比节点5更低,但其训练样本数比后者少,因此RMSE除了受训练样本数量影响外,还与数据集自身样本情况有关。GRNN模型的RMSE与训练样本数量没有呈现明显的关系或趋势。RMSE用来衡量离散程度,与原样本具有相同的量纲,而R2作为一种无量纲的性能指标,能够反映模型的可解释性。从表3可以看出,对于土壤含水量,虽然相较于GRNN模型,LSTM模型的RMSE没有表现出明显优势,但是其R2范围为0.760~0.906,远大于GRNN模型的0.126~0.369,这意味着LSTM模型预测的土壤含水量呈现出了较高的可解释性,意味着该模型给出的预测值能够较好地反映土壤含水量。表3中土壤电导率模型预测表现与土壤含水量呈现类似的趋势,同样表明LSTM模型在给定的试验样本下,适合用来对土壤电导率进行预测。
表3 模型性能表现Table 3 Performance of models
3.3 模型拟合分析
LSTM模型的预测精度较高、性能稳定,故而使用该模型观察预测效果。利用模型和气象数据得到预测值,与节点采集到的实测值进行对比,结果如图8和图9的a1~e1所示,之后利用最小二乘法进行回归拟合,其结果如图8和图9的a2~e2所示。其中,5个节点分别布置在果园5个分区中,由于果园面积较大,同时不同区域有高低落差,因此5个节点数据分别代表果园各个分区的土壤墒情。
图8 LSTM模型在不同节点的土壤含水量实测值与预测值的比较Fig. 8 Comparison of measured and predicted soil moisture of LSTM model in different nodes
图9 LSTM模型在不同节点的土壤电导率实测值与预测值的比较Fig. 9 Comparison of measured and predicted soil electrical conductivity of LSTM model in different nodes
节点1的土壤含水量(图8a1、a2)预测值相对于实测值偏小,而拟合得到的回归方程中,实测的土壤含水量数据点主要集中在56~76 mm区间,这个趋势在图8a1中的折线图中无法反映出来,这可能是由于节点1处在相对低洼的位置,加上外界环境变化如大量降雨积水或者人工灌溉导致的短时间内土壤含水量升高,在图9a1中可以观察到此时的土壤电导率在土壤含水量升高后迅速下降的现象。节点2土壤含水量(图8b1、8b2)的回归拟合决定系数高达0.906,折线图中,预测值很好地贴近了实测的土壤含水量。节点3(图8c1、8c2)的拟合效果与节点2接近,说明模型在节点2和3的数据集中能够获得较好的训练结果。节点4和5(图8d2、8e2)模型拟合的R2分别为0.760和0.768,低于0.8,根据回归方程图可以看到,主要是由于个别数据相对于其他样本偏差较大导致的。这2个节点对应模型的RMSE并不是最大的,这也再次说明了仅根据RMSE指标不能证明模型的性能高低。
从图9可以看出,节点3的土壤电导率(图9c1、9c2)数据点多集中在 30~55 μS.cm-1区间,从折线图中可以看到预测值与实测值曲线比较接近,而其回归拟合R2仅为0.648,说明模型预测性能会受到数据分布的影响,较多的数据量可能会减少此种影响。虽然使用了同样的气象数据,但土壤电导率的预测模型性能总体上稍逊于土壤含水量预测模型,这可能是由于土壤电导率除了受气象因子、柑橘果树蒸散量影响外,还受到人工施肥、生物无机盐代谢等多种因素的影响,这可能是需要进一步研究的方向。
4 结论
本文提出了利用物联网来实现远程实时获取柑橘果园土壤含水量和土壤电导率的方法,并搭建气象站获取柑橘果园气象信息,利用LSTM和GRNN模型对土壤墒情进行建模,实现对柑橘园土壤含水量与土壤电导率的预测。部分已有的对土壤墒情进行建模的研究,以BP神经网络或光谱反演方法为基础,存在着实时性不足、长时间预测精度较低的问题。本文利用物联网及相关传感器搭建远程获取果园环境数据的系统,在果园中设置5个土壤墒情采集节点和1个气象站,实现了实时采集和传输果园环境数据与气象数据的目的。
利用采集到的气象数据与节点土壤墒情数据在LSTM模型和GRNN模型上的训练结果表明:LSTM模型训练的土壤含水量和土壤电导率的RMSE范围分别为6.74~8.65和6.68~8.50,R2范围分别为0.76~0.906和 0.648~0.850,相比于 GRNN 模型的RMSE 和R2(7.01~14.70和 7.60~13.70,0.126~0.369和0.132~0.268),表现出了较好的模型性能与预测效果。在LSTM模型的土壤含水量和土壤电导率拟合分析中可以发现,模型的RMSE与R2之间并没有明确的相关性,即较小的RMSE并不意味着较高的R2,因此只用RMSE来衡量模型性能可能是片面的。
LSTM模型的预测值与实测值的拟合回归方程和对应的折线图说明模型的预测效果较好,能够满足预测的需求。但是部分节点如节点3的土壤电导率拟合决定系数较低,说明数据样本分布可能会对模型效果产生影响。本文建立的LSTM预测模型在土壤电导率的预测性能方面稍逊于土壤含水量模型,这可能是由于土壤电导率受到环境中其他因素影响更多,需要更进一步地深入研究。另外,果园的土壤含水量和土壤电导率在不同的种植和生理条件下,存在一定的差异,根据生产过程中的灌溉与施肥情况,利用本文提出的方法能够为柑橘果园的灌溉和施肥提供一定的指导,也可以根据LSTM预测模型,结合未来一段时间的气象数据与当前田间土壤墒情数据,预测未来一段时间的土壤墒情数据,及时掌握土壤墒情变化趋势,方便果园管理者提前做好施肥灌溉准备工作,能够帮助实现科学精细的果园灌溉与施肥管理,带来较好的管理效益。