APP下载

基于BiLSTM-GRU融合网络的稻虾养殖溶解氧含量预测

2023-11-23石庆兰束金阳李道亮黄凯欣查海涅

农业机械学报 2023年10期
关键词:稻虾溶解氧神经网络

石庆兰 束金阳 李道亮 黄凯欣 查海涅

(1.中国农业大学信息与电气工程学院, 北京 100083; 2.农业农村部智慧养殖重点实验室, 北京 100083;3.国家数字渔业创新中心, 北京 100083; 4.北京市农业物联网工程技术研究中心, 北京 100083;5.安庆师范大学计算机与信息学院, 安庆 246052)

0 引言

近年来,由于稻虾共作模式在保障粮食产量的前提下还能给农民增加经济收入[1],因而有着良好的推广前景。

相较于水稻单作和自然水环境的养殖,稻虾共作可以提高水体pH值、总溶解固体(TDS)、电导率和氧化还原电位等参数,此外在抑制潜水蒸发、提高水体自净能力等方面也产生了积极作用[2]。然而,在养殖过程中,由于虾的日常活动不断搅混田间水体,水中的太阳光穿透率低,抑制水生植物的光合作用,导致水体溶解氧含量降低,不利于水生物的生长和腐败物质的分解消化[3-4]。水中的溶解氧含量是水质监测的一项重要指标,当稻虾互作养殖环境中的溶解氧含量不足时,氨和硫化氢不能实现无毒转化,极易危及小龙虾的生长发育[5-6]。因此精确预测溶解氧含量是实现智慧稻虾养殖的关键。

关于溶解氧浓度的预测国内外学者采用了多种方法。LIU等[7]在池塘养殖环境下通过阈值处理、小波滤波等方法对溶解氧数据集进行处理,大大提高溶解氧预测模型的准确性。孙龙清等[8]和陈英义等[9]通过改进的天牛须搜索算法和改进粒子群优化算法对参数选择和特征提取进行优化,进而降低模型预测误差。在工厂化循环水养殖环境下,频繁的人为调控使得溶解氧的变化更为复杂[10-11],REN等[12]采用变分模态分解(VMD)算法降低原始数据中的噪声,有效提高神经网络输入数据的质量,后通过深度置信网络(DBN)实现溶解氧的预测。TA等[13]通过逆向理解卷积神经网络建立溶解氧预测模型,在收敛速度、预测准确性及稳定性上,模型均满足实际生产需求。在鱼菜共生系统中,溶解氧的变化受到更多动植物生存环境因素的影响[14],精准预测的难度大大增加。这种养殖模式下,REN等[15]通过遗传算法优化模糊神经网络溶解氧预测模型,提高了模型效率和预测准确性。

在诸多预测算法当中,以循环神经网络(RNN)[16]为代表的深度学习适应性好、学习能力强、适合时间序列的参数预测,其预测精度取决于训练样本数量。长短期记忆神经网络(LSTM)[17-18]和门控循环单元(GRU)[19]是在RNN的基础上引入门控机制,增强了处理长序列信息和记忆能力,防止梯度消失或爆炸,使模型训练效果更佳。目前稻虾养殖中影响溶解氧含量变化的因素较多,不仅受养殖水体环境参数影响,还受作物生长及其气象环境等参数影响[20]。针对稻虾养殖复杂环境下采用传统循环神经网络存在计算效率低下、特征提取能力不足、缺乏对环境变化的适应能力和过拟合风险高等问题[21],本文采用BiLSTM[22]与GRU神经网络融合的方法对溶解氧含量进行预测,以期为溶解氧的调控提供依据和决策。

1 数据获取与预处理

1.1 数据获取

试验在安徽省全椒县银花家庭农场稻虾养殖基地(31.74°N,116.52°E)完成,养殖总面积为700 hm2,其中一个稻虾养殖单元面积约为50 hm2,长185 m,宽180 m,虾渠宽度为6 m,投放幼虾规格为 160~200尾/kg,投放量为450~600 kg/hm2。水质监测设备包括溶解氧水温一体化传感器、pH值传感器、浊度传感器、氨氮传感器,稻虾养殖田中部署情况如 图1所示,采集到数据如表1所示。

表1 农场中采集到的水质数据Tab.1 Water quality data collected in farm

图1 稻虾田传感器部署图Fig.1 Sensor deployment diagram for rice and shrimp fields

1.2 数据预处理

由于传感器探头表面容易附着水中的浮游物使得测量误差增大,因此需对传感器进行清洗校准 2次,偏差为0.67~1.82 mg/L,对数据集进行校准,计算公式为

式中XMax——校准数据集最大值

XMin——校准数据集最小值

X——某时刻溶解氧含量

Xrevised——同一时刻校准后溶解氧含量

C——校准偏差

校准后溶解氧含量如图2所示。

图2 溶解氧含量数据校准结果Fig.2 Correction results of dissolved oxygen content data

2 基于BiLSTM和GRU网络融合预测模型

采用两层循环神经网络模型,如图3所示,第1层使用BiLSTM神经网络,将2次得到的LSTM结果进行拼接作为最终输出。借助LSTM细胞单元的结构来保存较长的依赖关系,通过前向、后向两个传播方向的LSTM传输序列数据,调整前后的状态对当前细胞单元状态的影响,不仅可以保存序列数据中前向输入对后向输入的影响,也可以保存后向输入对前向输入的影响,大大提高了模型预测精度。第2层使用GRU神经网络以降低神经网络的计算复杂度、参数量和计算时间,在第1层得到序列特征的基础上,保证模型预测精度的同时,大大减少了模型训练时间。

图3 BiLSTM-GRU融合神经网络结构Fig.3 BiLSTM-GRU fusion neural network structure

根据采集的水质数据,模型输入层设置为前48个时间刻度的水质参数,输出层为未来12个时间刻度的溶解氧含量,具体预测方法如图4所示。

图4 BiLSTM-GRU融合神经网络流程图Fig.4 Flow chart of BiLSTM-GRU fusion neural network

3 模型构建与分析

3.1 水质参数相关性分析

计算溶解氧含量校准前后与温度、pH值、浊度、氨氮含量等参数之间的皮尔逊相关系数[23],如表2所示。由表2可知,pH值与溶解氧含量的相关性最大,故将溶解氧含量和pH值作为模型输入,按照比例7∶3分为训练集和测试集后,将训练集输入模型中对模型进行训练。

表2 溶解氧含量与各参数之间的皮尔逊相关系数Tab.2 Pearson correlation coefficient between dissolved oxygen content and various parameters

3.2 模型构建及指标评估

采用均方根误差(RMSE)、平均绝对误差(MAE)和决定系数R2[24-25]进行评价。分别在不同隐藏层节点数、每次迭代不同的输入样本数量以及不同的训练轮次下进行运算,同时计算每种参数下的评价指标。如表3所示,对比结果表明隐藏层节点数为48时表现最佳。将隐藏层节点数设置为48时不同输入样本数量对比如表4所示,结果表明当每次迭代输入的样本数量为24时表现最佳。再将隐藏层节点数设置为48,每次迭代输入的样本数量设置为24,如表5所示,当模型训练轮次为500时表现最佳。

表3 不同隐藏层节点数结果对比Tab.3 Comparison of number of nodes in hidden layer

表4 不同输入样本数量结果对比Tab.4 Comparison in different iteration sample numbers

表5 不同训练轮次结果对比Tab.5 Comparison of number of turns

3.3 模型训练结果

3.3.1神经网络模型运行结果

确定模型各个参数后,即隐藏层节点数为48,每次迭代输入的样本数量为24,训练轮次为500,建立BiLSTM-GRU融合神经网络模型结构如图5所示。

图5 BiLSTM-GRU融合神经网络模型Fig.5 BiLSTM-GRU fusion neural network model

通过构建完成的BiLSTM-GRU融合神经网络模型以及4个对比模型(LSTM、GRU、BiLSTM、BiGRU)对测试集进行训练,得到预测值与真实值差值如图6所示。

图6 各模型预测值与真实值差值变化曲线Fig.6 Difference between predicted results of each model and actual value

3.3.2不同采样周期下的模型运行结果

传感器数据采样周期小会增加传感器的耗电量,增加数据采集器及接收平台的存储空间,降低模型的运算速度。采样周期增大又容易漏测溶解氧的变化,合理地设置采样周期非常重要。

为确定传感器最佳的采样周期,模型构建完成后,将不同采样周期数据集(5、10、15、20、30、40 min)分别进行模型训练,结果如图7所示。

3.4 性能分析

3.4.1多种模型性能对比

将5种模型的预测值与真实值进行误差对比分析,结果如表6所示。从表6可以看出,BiLSTM-GRU模型的表现最优,MAE和RMSE分别为0.275 9、0.616 0 mg/L,相较于LSTM模型提高25.14%和13.25%,相较于GRU模型提高13.02%和6.76%。在引入双向神经网络对传统的两种循环神经网络优化后,模型性能有所提升,但相较于融合神经网络模型在性能表现上稍显不足,BiLSTM-GRU模型的MAE和RMSE相较于BiLSTM模型提高17.52%和9.90%,相较于BiGRU模型提高11.26%和8.08%。BiLSTM-GRU模型对数据的拟合效果(R2)达到0.954 7,对比另外4种模型依次提高2.22%、1.26%、1.70%和1.44%。因此,BiLSTM-GRU融合神经网络模型能够更加充分挖掘到数据之间的隐藏信息,更为精准地预测了稻虾养殖环境溶解氧含量,为后续低溶解氧含量的预测预警提供了更加可靠的依据。

表6 模型误差对比Tab.6 Comparison of model performance

3.4.2不同采样周期对预测的影响

将不同采样周期下的数据集模型训练结果分别进行误差计算,并统计模型运行时间,得到模型运行时间和平均运行时间。根据一个传感器在一次数据采集时的能耗(平均约为400 mA·s)计算4个传感器在不同采样周期下的传感器总能耗。记录不同采样周期下的数据集和文件占用内存量、24 h传感器采集次数和总能耗、模型运行时间和平均运行时间以及在预测60 min时的MAE、RMSE、R2误差结果,采样周期为40 min时,预测60 min时间点溶解氧浓度的误差为预测40 min误差和80 min误差的平均值,得到不同采样周期下的各项指标如表7所示。

表7 不同采样周期下各项指标Tab.7 Various indicators in different sampling periods

从表7可以看出,传感器的能耗以及数据集所占用内存量均随着采样周期的增加而减小,当达到一定程度时,能耗虽仍在减小,但幅度较小。同时当采样周期为30 min时,模型在预测60 min这个公共点的误差最小,并且模型平均运行时间最短。综上所述,确定传感器最佳采样周期为30 min。

3.5 模型验证

采集基地稻虾田7—8月的水质数据并作为输入数据集对模型的预测效果进行验证,得到预测结果以及预测误差如图8和表8所示。

表8 实际生产中的预测误差Tab.8 Prediction error in actual production

图8 实际生产中的预测结果Fig.8 Operation results in actual production

从图8、表8中可以看出,模型在7—8月实际生产的溶解氧含量预测中,60 min的平均绝对值误差为0.319 1 mg/L、均方根误差为0.620 7 mg/L以及R2为0.924 1。综合来看,模型在实际生产中得到验证,其预测效果表现良好。

4 结论

(1)为保证预测的精准,对传感器进行了清洗校准,根据偏移量对传感器进行了标定,并对历史数据进行了修正,以减小传感器漂移出现的测量偏差。 对不同采样周期下的模型性能与资源消耗综合分析,确定传感器最优采样周期为30 min。

(2)通过皮尔逊相关系数分析确定影响溶解氧含量变化最大的水质参数pH值一同作为输入数据集对模型进行训练。采用循环神经网络模型(LSTM和GRU),在保证模型提取更多的特征因子以达到更加精准的预测同时,减少模型运行时间,大大提高模型性能。

(3)通过与4种传统循环神经网络模型对比表明,在最优传感器采样周期下,对于校准后的数据,融合神经网络模型的预测效果更好,其MAE、RMSE、R2分别为0.275 9 mg/L、0.616 0 mg/L和0.954 7,比传统的LSTM神经网络模型分别提高25.14%、13.25%和2.22%。

猜你喜欢

稻虾溶解氧神经网络
浅析水中溶解氧的测定
神经网络抑制无线通信干扰探究
2019年第一季稻虾行情报告新鲜出炉,致敬奋战在一线的广大虾农们
发展稻虾产业,重振鱼米之乡
污水活性污泥处理过程的溶解氧增益调度控制
城市河道洲滩对水流溶解氧分布的影响
南县稻虾产业富民强县
稻虾共生高效种养关键技术
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用