基于优化的长短时记忆神经网络牧群采食量估测模型
2022-11-24孟云琪宣传忠张蒙秦樊先涛
孟云琪,宣传忠, 2*,张蒙秦,樊先涛,布 库
基于优化的长短时记忆神经网络牧群采食量估测模型
孟云琪1,宣传忠1, 2*,张蒙秦1,樊先涛1,布 库3
(1. 内蒙古农业大学机电工程学院,呼和浩特 010018;2. 内蒙古自治区草业与养殖业智能装备工程技术研究中心,呼和浩特 010018;3. 中国农业科学院草原研究所,呼和浩特 010010)
为了能够较为精准的估测牧群的采食量信息,提出一种基于遗传算法(genetic algorithm, GA)和长短时记忆神经网络(long short-term memory,LSTM)的牧群采食量估测模型。首先通过皮尔森系数法分析得出影响牧群的采食量的主要影响因子,以减少输入维度并解决信息冗余问题。在此基础上,构建基于 LSTM 神经网络算法的牧群采食量估测模型,并引入遗传算法来优化LSTM 神经网络模型参数来增加模型的可靠性。最后,利用该模型对牧群采食量进行估测。试验结果表明:该采食量估测模型各评价指标平均绝对误差(mean absolute error,)、平均绝对百分比误差(mean absolute percentage error,)、以及均方根误差(root mean square error,)分别为2.982、9.85%和6.108。与单一的LSTM神经网络以及GRU神经网络模型相比,均优于其他模型;且该模型具有较好的估测性能和较强的泛化能力,能够为合理轮牧提供科学指导,对草地保护有一定的应用价值。
放牧羊;采食量估测;LSTM;遗传算法优化;轨迹数据
草地畜牧业是农业的重要组成部分,在我国国民经济中占有极其重要的地位[1],21世纪初,受牧民长期过度放牧等因素的影响,中国近90%的草地出现了不同程度的退化,这不仅影响了畜牧业的发展,而且严重威胁中国的生态安全[2]。因此,能够大范围、快速评估放牧羊群采食量信息并制定出相应的划区轮牧[3]、轻牧还草[4]、草原生态补偿[5-6]、围栏封育[7]等科学决策是必不可少的。现有的放牧羊群采食量估测方法有畜牧业工作者直接通过人工观察法进行估测[8],也可以通过给试验羊只佩戴相关传感器监测采集放牧羊只采食信号,进而估测采食量数据[9]。以及利用GPS技术与网格分析方法分析放牧轨迹获得放牧分布,并通过网格叠加法得到给定时空范围内的牧群采食量模型[10]。但人工观察法劳动强度大,工作效率低;而传感器监测法操作复杂,同时传感器的佩戴会对试验羊只的采食行为造成影响,并不适合长时间牧群采食量的采集与估测;GPS技术结合网格分析法虽可以大范围的估测牧群的采食量分布,但估测精度不足。
随着机器学习的深入研究,以卷积神经网络(convolutional neural network,CNN)为代表的深度学习网络得到了广泛的发展和应用[11],同时,在对文本序列的非线性特征学习上具有一定优势的循环神经网络(recurrent neural network, RNN)逐渐发展起来[12],LSTM循环神经网络能够较好地保存早期的信息以便后面使用,从而防止较早期的信号在处理过程中逐渐消失[13],可较好地处理以时间序列为引导的文本数据。
因此本研究提出GA-LSTM(genetic algorithm long short-term memory)模型估测牧群采食量,通过利用遗传算法选取最优LSTM网络参数,来提高LSTM模型估测精度,并进一步评估模型性能,验证模型的可靠性,方便牧群采食量的估测以及相关科学决策的制定。
1 材料与方法
1.1 试验地点及对象
试验选取内蒙古自治区鄂尔多斯市阿尔巴斯绒山羊为研究对象,于鄂尔多斯市鄂托克旗乌兰镇胜利队当地牧场进行试验。该试验牧场地表面积约为4.993 7 km2,牧场有1个羊舍、1个饮水区,羊只共计325只。羊只于7:00—20:00时间段处于全牧区自由放牧状态,其余时间可在羊舍自由活动。
1.2 原始数据来源
通过GPS卫星定位系统和传感器监测设备共同采集放牧羊群试验数据。试验时,随机选取大、中、小体型羊各一只,并将太阳能定位追踪器宽松捆绑在试验羊背部,对试验羊只进行自由放牧。并设置定位器以3 min为单位时间上传定位点信息,定位追踪器采集所得信号通过GPRS无线传输模块传输到数据云存储平台进行保存。为保证不影响试验个体的正常牧食活动,试验人员远距离跟踪观察,通过望远镜观察记录试验羊只单位时间内的采食口数,通过应用模拟采食法[14]合理估测试验羊只采食量。并实时采集风速、风向、空气温度、空气湿度、气压以及试验羊只所处地形植被情况。
本课题试验时间为2020年6月1日到2020年11月30日,试验数据有效记录天数合计85 d,其中6月记录了10 d数据,7、8、9月份各记录了16 d数据,11月记录了11天数据。总结整理有效定位点信息共计9 846条,大、中、小3种不同体型试验羊只分别获取有效定位点信息分别为3 956、3739和2 151条。
1.3 数据预处理
为了方便试验羊只采食量标定、提高采食量数据的可靠性,本研究通过创建线追踪间隔将相邻时间2个轨迹点P、P(0<<)连接形成轨迹段L,使用轨迹段L内采食量数据取代单个定位点的采食量数据。同时,轨迹段L所包含的两点之间的距离l、时间间隔T以及羊只行进速度V等信息也可作为采食量估测模型的影响因子,有助于提高模型的泛化性。
按照天数比例随机抽取大、中体型试验羊只轨迹段信息各2 151条并与小体型试验羊只轨迹段信息共同组成试验样本数据集,该试验样本集包含 6 453条数据,每条试验样本包括羊只体型编号、轨迹起始点P、P的经纬度坐标、定位时间、高程、坡度、坡向、所处位置植被覆盖度、轨迹段距离、轨迹段时间间隔、羊只行进速度、空气温度、空气湿度、风速、风向、气压以及轨迹段内采食量标定数据。
由于采集到的数据具有不同的维度和量纲,同时数据差距过大会对模型的估测造成较大的误差。因此,需要将输入数据进行归一化处理来调整到合理的范围内。本研究选用z-score (zero-mean normalization)标准化方法完成标准化,其标准化处理的表达式为
式中为输入参数;该输入参数的均值;该输入参数的标准差;*为该输入参数标准化后的数据。
由1.2节可知,本试验收集了大量的试验样本数据,若将采集到的试验样本数据直接输入模型中,模型会变得非常复杂,极易出现无法收敛、收敛速度慢等问题[15]。因此,本研究采用皮尔森相关系数法筛选影响采食量的关键因子,通过减少输入维度来达到解决信息冗余的目的。
由采食量与部分影响因子之间的皮尔森相关系数(表1)可知,不同影响因子对于采食量所占影响权重排序为植被覆盖度、轨迹段距离、轨迹时间间隔、羊只体型、温度、高程、坡度、坡向、坡位和风速。本试验选取前6个影响因子作为采食量估测模型的输入样本,以降低数据维度和复杂度。
表1 采食量与部分影响因子的皮尔森系数
1.4 试验方法
图1为羊只牧食信号采集处理架构图。图中虚线框为在服务器上运行的训练集、验证集和测试集划分与采食量估测模型创建流程,具体流程为将已标定好采食量的试验数据分为训练集、验证集与测试集,并将训练集数据输入到GA-LSTM神经网络中进行采食量估测训练,并使用验证集进行验证,得到具有泛化能力和记忆性的采食量估测模型。然后将准备好的测试集数据输入到训练好的采食量估测模型中,进行模型性能的评估。
1.试验羊只;2.太阳能GPS定位器;3.GPRS网络通讯;4.GPS信号接收平台;5.服务器;6.数据集;7.平稳进食的羊只。
Figure 1 Structure diagram of sheep grazing signal acquisition and processing
1.5 基于GA_LSTM神经网络的采食量估测模型
由于本课题研究数据是以时间序列为引导的文本数据,而具有长短时记忆的LSTM神经网络(long short-term memory)擅长处理具有长时间间隔的时间序列预测问题[16],因此,选用LSTM神经网络能够较好地提高模型的估测精度,而神经网络参数的选取对模型准确度具有较大的影响。因此,为了避免人工选取的主观性和随机性,通过遗传算法(genetic algorithm, GA)[17]筛选并设定最优神经网络参数可提升LSTM模型的可靠性。
本课题将GA算法与LSTM神经网络相结合,构建了基于GA_LSTM的采食量估测模型。模型估测流程主要包括牧群采食量数据的获取与预处理、影响采食量关键因子的筛选、基于GA_LSTM神经网络模型的训练以及模型的验证与应用。其估测流程如图2所示,具体实施步骤如下。
(1)通过GPS定位系统和环境与采食量监测系统获取试验羊只时空轨迹、气象、采食量和地形数据,并对其进行修正和归一化预处理。
(2)利用皮尔森相关系数筛选影响试验羊只采食量的关键影响因子,以降低模型输入的维度和复杂度,并划分相应的样本训练集、验证集和测试集。
(3)初始化GA参数:种群数量为20、DNA个数为2、每条DNA的长度为8、DNA的交叉率为0.5、变异率为0.01以及遗传迭代次数为40。
(4)设定并初始化DNA参数:本研究GA算法中的DNA参数主要表现在DNA所含基因上,其中每个DNA所含基因依次表示LSTM堆叠层的层数、Dense堆叠层的层数、每个LSTM堆叠层所包含神经元的个数以及每个Dense堆叠层所包含神经元的个数。
(5)设置GA适应度函数:GA适应度函数用来评价LSTM估测模型的性能。当LSTM模型的训练误差越小,模型的性能越好。
因此,定义GA适应度函数为:
式(2)中,为验证集样本数,Y为模拟采食法估测的采食量,y为模型估测的采食量。
(6)采食量估测与结果分析:通过GA算法完成遗传迭代计算,选取GA适应度最高时的DNA参数代入LSTM采食量估测模型,建立GA_LSTM神经网络采食量估测模型,然后将测试样本集输入到新建立的模型中进行采食量的估测,并与其他估测模型进行模型性能对比,并对结果进行分析。
图2 GA_LSTM估测流程图
Figure 2 Flow chart of GA-LSTM
1.6 试验运行平台与软硬件环境
试验所使用计算机的配置如下:处理器为Xeon(R) Gold 6130双处理器,CPU 频率为 2 GHz;内存为 128 GB;操作系统为 Windows10下64位操作系统;GPU为Inter(R) 4块NVIDIA GetForce Rtx2080 Ti显卡。代码编写语言为 python3.7,集成开发环境为Anaconda3 ,并基于tensorflow2.2.2框架下在Jupyter Notebook中完成GA-LSTM 模型的实现。
2 结果与分析
2.1 模型性能评估指标
为了验证GA-LSTM采食量估测模型的估测性能,本研究分别选用平均绝对误差()、平均绝对百分比误差(mean absolute percentage error,)、以及均方根误差(root mean square error,)[18]作为估测模型的损失函数对GA-LSTM估测模型进行训练和测试。如下所示,公式(3)为平均绝对误差的计算公式,公式(4)为平均绝对百分比误差的计算公式,公式(5)为均方根误差的计算公式。
式中,为训练集和样本集的总数量,Y为模拟采食法估测的采食量,f为模型估测的采食量。、和的值越低,模型的估测效果越好。
2.2 模型对比分析
GA-LSTM模型需要与不同的估测模型进行对比,进而评估GA-LSTM模型的性能。本研究除了与单一的LSTM估测模型进行对比外,还将GA-LSTM模型与GRU(gated recurrent unit)门控循环网络进行估测性能的对比。
图3 GA_LSTM模型估测值散点图
Figure 3 Scatter plot of GA_LSTM estimated value
图4 GA_LSTM模型的估测误差
Figure 4 Estimation error of GA_LSTM
为保证数据可靠性,同时提高模型训练速度,本试验使用1.3节所创建的试验样本数据集对模型精度进行评估。首先通过1.5节描述的方法构建GA-LSTM采食量估测模型,模型训练迭代次数设定3 000次、模型优化函数选用可自主调节学习率的Adam算法。经GA优化处理得出LSTM最优参数组合为LSTM层数为3层:第1个LSTM层神经元个数为166个;第2个LSTM层神经元个数为47个;第3个LSTM层神经元个数为56个。dense层数为2层:第1个dense层神经元个数为218个;第2个dense层神经元个数为1个,并利用该参数组合进行模型的训练与验证。图3和图4为训练GA-LSTM模型得到的估测值散点图和估测误差。
图5和图6分别为通过单一的LSTM循环神经网络和GRU(gated recurrent unit)门控循环网络估测模型得到的估测误差。从图中可以直观地看出,GA-LSTM神经网络的估测值和通过观察法得到的估测值误差最小,预测效果较为理想,单一的LSTM循环神经网络次之,GRU神经网络效果最为一般。并且 GA-LSTM神经网络模型的误差波动较小。
图5 单一的LSTM模型的估测误差
Figure 5 Estimation error of simple LSTM
图6 GRU模型的估测误差
Figure 6 Estimation error of GRU
表 2 模型估测结果分析
为了更加直观比较GA-LSTM神经网络预测模型的误差值,表2为试验后得到的GA-LSTM模型、单一的 LSTM 模型和GRU神经网络模型的平均绝对误差、平均绝对百分误差和均方根误差的值。由表2可知,GA-LSTM模型的整体预测精度较为理想,、和分别达到了2.982、9.85%和6.108,与单一的 LSTM 模型相比,、和分别提高了13.52%、1.24%和9.55%,由此可以直观地发现,利用遗传算法极大地提升了LSTM 模型的估测精度和稳定性。除此之外,与GRU神经网络模型相比,GA-LSTM神经网络模型明显优于GRU神经网络模型。
3 结论
本研究引入遗传算法(GA)来优化长短时记忆神经网络(LSTM),建立了自由放牧状态下牧群采食量的非线性估测模型,得出了以下结论。
(1)采用皮尔森系数法确定影响因子对采食量估测的影响权重,进而筛选出影响采食量的关键因子,减少模型输入的维度,提高模型工作效率,避免了非关键因子对模型的干扰,提高了模型的估测精度。
(2)通过遗传算法(GA)来优化长短时记忆神经网络(LSTM)参数选取,合理的避免了LSTM模型参数选取的盲目性,减少了人工选择参数的主观影响。
(3)将本研究提出的GA-LSTM模型与单一的LSTM模型、GRU神经网络模型进行估测性能对比。GA-LSTM模型估测结果最为精确,拟合效果较为理想,能够较大程度上解决传统采食量估测方法估测精度低,泛化性差等问题,同时具有可以快速、大范围地进行牧群采食量估测的优点。
本研究所得采食量估测模型在试验牧场采食量估测中具有优良的估测性能,但对于其他类型的牧场和不同种类的试验个体还需进行进一步试验与讨论。同时,需不断对模型进行完善,提升模型估测性能,为划区轮牧、围栏封育等决策的制定提供科学的指导意义。
[1] 赵青山, 侯向阳, 段俊杰, 等. 混播人工草地不同方式放牧苏尼特羊生产效益趋势[J]. 中国草地学报, 2019, 41(3): 130-135.
[2] NUMATA I, ROBERTS D A, CHADWICK O A, et al. Characterization of pasture biophysical properties and the impact of grazing intensity using remotely sensed data[J]. Remote Sens Environ, 2007, 109(3): 314-327.
[3] CAMPOS D P, ABATTI P J, BERTOTTI F L, et al. Short-term fibre intake estimation in goats using surface electromyography of the masseter muscle[J]. Biosyst Eng, 2019, 183: 209-220.
[4] PITTARELLO M, PROBO M, PEROTTI E, et al. Grazing Management Plans improve pasture selection by cattle and forage quality in sub-alpine and alpine grasslands[J]. J Mt Sci, 2019, 16(9): 2126-2135.
[5] YU H Q, LI Y, OSHUNSANYA S O, et al. Re-introduction of light grazing reduces soil erosion and soil respiration in a converted grassland on the Loess Plateau, China[J]. Agric Ecosyst Environ, 2019, 280: 43-52.
[6] HU Y N, HUANG J K, HOU L L. Impacts of the grassland ecological compensation policy on household livestock production in China: an empirical study in Inner Mongolia[J]. Ecol Econ, 2019, 161: 248-256.
[7] LIU J K, BIAN Z, ZHANG K B, et al. Effects of different fencing regimes on community structure of degraded desert grasslands on Mu Us desert, China[J]. Ecol Evol, 2019, 9(6): 3367-3377.
[8] 江兴美, 宋德荣, 张祥奎, 等. 贵州黑山羊秋季牧食行为观察[J]. 贵州畜牧兽医, 2015, 39(1): 3-5.
[9] 王奎, 武佩, 宣传忠, 等. 放牧家畜牧食信息监测的研究进展[J]. 南京农业大学学报, 2020, 43(3): 403-413.
[10] 汪传建, 王伟强, 鲁为华, 等. 基于放牧时空轨迹数据的牧群采食量分布模型[J]. 农业工程学报, 2016, 32(13): 125-130.
[11] 许德刚, 王露, 李凡. 深度学习的典型目标检测算法研究综述[J]. 计算机工程与应用, 2021, 57(8): 10-25.
[12] LECUN Y, BENGIO Y, HINTON G. Deep learning[J]. Nature, 2015, 521(7553): 436-444.
[13] GAVAHI K, ABBASZADEH P, MORADKHANI H. DeepYield: a combined convolutional neural network with long short-term memory for crop yield forecasting[J]. Expert Syst Appl, 2021, 184:115511.
[14] 郭强, 殷国梅, 赵和平, 等. 放牧绵羊牧食行为及采食量研究[J]. 中国草地学报, 2011, 33(4): 95-98, 110.
[15] SHI P, LI G H, YUAN Y M, et al. Prediction of dissolved oxygen content in aquaculture using Clustering-based Softplus Extreme Learning Machine[J]. Comput Electron Agric, 2019, 157: 329-338.
[16] SHAHID F, ZAMEER A, MUNEEB M. A novel genetic LSTM model for wind power forecast[J]. Energy, 2021, 223: 120069.
[17] 墨蒙, 赵龙章, 龚嫒雯, 等. 基于遗传算法优化的BP神经网络研究应用[J]. 现代电子技术, 2018, 41(9): 41-44.
[18] 陈英义, 程倩倩, 方晓敏, 等. 主成分分析和长短时记忆神经网络预测水产养殖水体溶解氧[J]. 农业工程学报, 2018, 34(17): 183-191.
Estimation model of feed intake in herding sheep based on optimized long short-term memory neural network
MENG Yunqi1, XUAN Chuanzhong1,2, ZHANG Mengqin1, FAN Xiantao1, BU Ku3
(1. College of Mechanical and Electrical Engineering, Inner Mongolia Agricultural University, Hohhot 010018; 2. Inner Mongolia Engineering Research Center for Intelligent Facilities in Grass and Livestock Breeding, Hohhot 010018; 3. Grassland Research Institute, Chinese Academy of Agricultural Sciences, Hohhot 010010)
In order to accurately estimate the feed intake information of herds, a herd feed intake estimation model based on genetic algorithm (GA) and long short-term memory neural network (LSTM) was proposed. Firstly, the main influencing factors affecting the feed intake of herds were analyzed by Pearson coefficient method to reduce the input dimension and solve the problem of information redundancy. On this basis, a herd feed intake estimation model based on LSTM neural network algorithm was constructed, and genetic algorithm was introduced to optimize the parameters of LSTM neural network model to increase the reliability of the model. Finally, the model was used to estimate the feed intake of herds. The results showed that the mean absolute error (), mean absolute percentage error () and root mean square error () of the evaluation indexes of the feed intake estimation model were 2.982, 9.85% and 6.108, respectively. Compared with the single LSTM neural network and GRU neural network model, they were better than other models; the model had a good estimation performance and strong generalization ability, which can provide a scientific guidance for reasonable rotational grazing, and it has a certain application value for grassland protection.
grazing sheep; estimation of feed intake; LSTM; neural network improved GA; trajectory data
S826; S818.9
A
1672-352X (2022)05-0832-06
10.13610/j.cnki.1672-352x.20221111.008
2022-11-14 10:55:50
[URL] https://kns.cnki.net/kcms/detail/34.1162.S.20221111.1112.016.html
2021-12-03
国家自然科学基金(31860666)资助。
孟云琪,硕士研究生。E-mail:984097201@qq.com
宣传忠,博士,教授。E-mail:xcz@imau.edu.cn