APP下载

基于深度学习的密闭式猪舍内温湿度预测模型

2020-10-29谢秋菊苏中滨

农业机械学报 2020年10期
关键词:实测值预测值温湿度

谢秋菊 郑 萍 包 军 苏中滨

(1.东北农业大学电气与信息学院, 哈尔滨 150030;2.东北农业大学农业农村部生猪养殖设施工程重点实验室, 哈尔滨 150030;3.东北农业大学动物科学技术学院, 哈尔滨 150030)

0 引言

随着商业利益和消费需求的不断增长,环境可控式的密闭猪舍养殖方式发展迅速。在密闭式猪舍的有限空间中环境品质尤为重要,它是除遗传基因之外制约养猪生产发展的关键因素[1]。在众多因素中,温度是维持猪体温恒定、影响猪的健康水平和繁殖能力的重要外部环境因素之一,直接影响猪体的热平衡[2]。猪体通过产热和散热平衡来维持恒定的体温,进行正常的生命活动[3]。猪舍空气湿度影响猪的体热调节,高温高湿环境严重影响猪的日增质量,同时造成细菌滋生,诱发疾病[4]。因此,营造适宜的舍内热湿环境可以有效地提高猪群的健康水平、繁殖能力,降低饲料消耗,提高生长效率。研究低延迟、精准化的猪舍环境调控方法是实现猪舍内环境精准控制的关键。

猪舍内热湿环境受猪舍建筑样式、舍内饲养猪的数量和质量、通风模式[5]、猪的活动量、生产方式、舍外天气情况等多种因素相互耦合的影响。国内外许多学者针对畜禽舍内温湿度控制进行了大量研究[6-17]。

这些研究大多基于传感器网络技术实时监测猪舍中的环境状况,并做出判断,实现舍内环境调控。传感器只能对当前舍内环境状况进行监测,无法提前对舍内的环境因子变化趋势作出预判,因而只依靠传感器监测数据来决定控制系统的运行状态。然而,由于猪舍内的热湿环境随着舍内的气流而逐渐变化,因此导致环境调控设备运行后对环境调控达到预期效果会存在一定的滞后性,这种滞后性因受猪舍空间结构、建筑样式、舍内通风、加热等控制设备运行效率的影响而不同。试验测试表明,在开启通风或加热等设备20 min后舍内热湿环境可以得到明显改善。因此,需要对猪舍内环境因子变化提前作出预测,从而提前决定环境控制设备的运行状态,实现舍内环境优化控制、降低控制效果的滞后。目前,随着传感器及大数据技术的发展,猪舍环境监测的数据量不断增加,传统的数据驱动预测方法,如线性[18]和非线性的方法[19-20]、CFD方法[8-9]、神经网络方法[21-23]等,已经无法实现大数据量的输入时序序列数据的精确预测。

猪舍内温湿度监测数据是由猪舍环境监测传感器在一定时间间隔内获取的大量时序数据。长短时记忆(Long short-term memory,LSTM)网络是由GERS等[24]提出的深度学习的典型代表方法之一。LSTM 通过对时序数据历史特征的提取实现数据未来变化的预测,它适合于多个领域时序数据处理及预测应用[25-28]。然而,根据传感器监测获取的大量猪舍内温湿度时序数据,应用LSTM预测模型的研究尚未见报道。

本文基于深度学习方法,结合传感器监测的大量时序序列历史数据,综合考虑各环境因素对猪舍内温湿度变化的影响,建立具有多层结构的长短时记忆LSTM网络的温湿度变化预测模型,以实现当前时间猪舍内温湿度的变化预测。

1 影响因素相关性分析

密闭猪舍是一个由砖、保温板等为围护结构的封闭空间。猪舍内环境温湿度变化受猪舍建筑样式、围护结构,舍内饲养猪的数量和质量,舍内加热及通风系统,舍外天气状况等的影响。建立猪舍内温湿度变化预测需要对影响因素进行分析,确定影响因素,为建立优化的预测模型奠定基础。本文在实际监测的数据基础上,考虑除建筑样式和围护结构相关的影响因素,利用皮尔逊(Pearson) 相关分析方法 (P<0.05),确定猪舍内温湿度变化的相关影响因素,如表1所示。

表1 影响因素相关性系数Tab.1 Correlations coefficients between factors

从表1可以看出,猪舍内温度(Pig living space temperature, PLS T)与猪舍外温度(Outdoor temperature, Out T)、粪坑温度(Pit temperature, Pit T)和猪的活动量(Activity, Act)呈现较大的正相关性,相关系数分别为0.489、0.518和0.395;同时,猪舍内温度与猪舍外相对湿度(Pig living space relative humidity, PLS RH)和猪的总质量(Weight, Wt)呈现负相关性,相关系数分别为-0.315和-0.436。因此表明,猪舍内温度受猪舍外温度、舍内猪的总质量、粪坑温度、舍外相对湿度影响较大;此外,猪舍内温度与猪舍内相对湿度和通风量(Ventilation, Vent)也具有一定的相关性,相关系数分别为0.284和0.147。

猪舍内相对湿度与猪的活动量呈现正相关性,相关系数为0.378,表明当猪由于进食或排泄等的活动量增大时可导致舍内相对湿度增大;同时,猪舍内相对湿度与猪舍内温度和粪坑温度呈现正相关性,相关系数分别为0.284和0.293;与猪的总质量和猪舍外相对湿度(Outdoor relative humidity, Out RH)呈现负相关性,相关系数分别为-0.253和-0.178。

因此,本文选取猪舍内相对湿度、猪舍外相对湿度、猪舍外温度、猪的活动量、猪的总质量、通风率、粪坑温度作为猪舍内温度预测的外部影响因素;选取猪舍内温度、猪舍外温度、猪舍外相对湿度、猪的活动量、猪的总质量、通风率、粪坑温度作为猪舍内相对湿度预测的外部影响因素。

2 基于LSTM的猪舍内温湿度预测模型

2.1 模型结构

预测模型由时序数据输入层、隐含层和输出层组成。模型结构如图1所示。

图1 LSTM预测模型结构图Fig.1 Structure diagram of LSTM prediction model

输入层负责接收采集到的猪舍内温度、相对湿度历史数据,舍外温度、相对湿度,粪坑温度,通风率,猪的活动量及总质量数据,并且将其进行标准化处理。标准化处理公式为

(1)

式中z′i——标准化后的数据

zi——输入的时序数据

n——时序序列数据的长度

标准化后的猪舍内温度和相对湿度历史数据转换成时序序列x1和x2。猪舍内温度和相对湿度的外部影响因素被标准化处理后参与完全连接层的运算。输入层节点数量为2t,t为猪舍内温度和相对湿度历史时序序列长度。

隐含层包含LSTM、完全连接和回归3个子层。LSTM子层负责学习时间序列数据每步之间的长期依赖关系,以执行有助于改善长序列梯度流的交互。LSTM子层由元胞状态c、隐含状态h、输入门i、遗忘门f、候选门g和输出门o组成,如图2所示[29-30]。

图2 LSTM子层组成结构图Fig.2 Consist structure diagram of LSTM sublayer

元胞状态c包含从前一步学习来的信息,并且在每一步的学习中,LSTM子层将从元胞状态c中加入或删除信息。每一步的隐含状态h都包含上步LSTM层的输出信息。为了使信息能够更好地更新,LSTM层增加了输入门i、遗忘门f、元胞候选门g和输出门o。输入门i决定元胞的更新程度,遗忘门f决定元胞状态的重置水平,候选门g负责向元胞中加入一些新的信息,输出门o决定将有多少元胞信息加入隐含状态。

每一步元胞状态和隐含状态计算式为

ct=ft∘ct-1+it∘gt

(2)

ht=ot∘σ(ct)

(3)

式中 ∘——向量元素相乘符号

it、ft、gt、ot——输入门、遗忘门、候选门、输出门

σ——状态激活函数

在每一个时间步t中, 输入门it、遗忘门ft、输出门ot和候选门gt可描述为

it=σg(wixt+Riht-1+bi)

(4)

ft=σg(wfxt+Rfht-1+bf)

(5)

gt=σc(wgxt+Rght-1+bg)

(6)

ot=σg(woxt+Roht-1+bo)

(7)

式中σc——状态激活函数,采用双曲正切函数tanh来计算状态激活函数

σg——门状态函数

激活函数由公式σ(x)=(1+e-x)-1计算得到;LSTM层中的权重是由具有可学习性的输入矩阵W、回归权重矩阵R以及每个分量偏差矩阵b组成。这些矩阵表示为

完全连接子层中的所有节点都与LSTM子层中的节点以及外部影响数据相连接,以获得上一层和外部影响因素对输入变量x1和x2学习所得的所有特征。完全连接层的每一步都是独立执行的,输入变量与权重矩阵W相乘后,再加上偏置矩阵向量b。此层输出变量数目等于输入变量的数目2,即温度和相对湿度2个输入变量。

回归子层与完全连接子层相连,用于计算序列到序列网络的均方根误差损失(Half-mean-squared-error loss)。每步的未归一化的损失预测响应计算式为

(8)

式中L——计算序列到序列网络的均方根误差损失

S——序列的长度

tkj、ykj——第k步的序列值、网络预测值

当网络训练时,观察值的平均损失由小批量网络训练时计算而得。

输出层将隐含层输出量O1和O2反归一化处理成预测值猪舍内温度y1和猪舍内相对湿度y2,反标准化公式采用式(1)对观察值进行标准化处理时的变换所得。

2.2 模型评价

本文通过统计分析方法中的决定系数R2、均方根误差eRMSE和平均绝对误差百分比eMAPE来评价LSTM预测模型的性能。

2.3 模型参数设置

在LSTM子层中,初始网络参数设置为:隐含层神经元数为200,状态激活函数为双曲正切函数tanh,门激活函数为sigmod,采用自适应矩估计Adam优化器进行训练,最大步数设置为250,初始学习速率为0.005,时间间隔(Time lag)为1。

为了获得最优的LSTM预测模型,需要对预测模型中的LSTM子层和完全连接层中的神经元数、网络的学习速率2个主要参数进行对比及组合优化。设LSTM子层和完全连接层中的神经元个数取值集合为{200,400,800,1 200,1 600,2 000},网络的学习速率取值集合为{0.001, 0.003, 0.005, 0.008, 0.010}。

2.4 模型数据集选取

时序序列数据集分为训练数据集和验证数据集。训练数据集训练LSTM模型自学习及调整连接参数等,验证数据集对模型相关性能参数进行验证。本文中所用数据集包含从2015年8月28日至9月30日(代表夏季数据集)和2015年12月24日至2016年1月13日(代表冬季数据集)共计1 320组监测数据。将这些数据分成4个数据集,在夏季数据集中前94%的监测数据(从2015年8月28日至9月28日)用作模型训练,剩余6%的监测数据(从2015年9月29日至30日)用于模型验证;在冬季数据集中前90.4%的监测数据(从2015年12月24日至2016年1月11日)用于模型训练,剩余9.6%的监测数据(从2016年1月12日至13日)用于模型验证。

本文使用Matlab对LSTM模型进行训练及验证。在LSTM模型中共用到8个变量,分别作为输入变量和外部影响变量进行模型特征提取,实现下一时刻猪舍内温度和相对湿度的预测。其中,猪舍内温度、相对湿度历史数据作为模型的输入变量;猪舍内相对湿度、猪舍外温度、猪舍外相对湿度、猪舍粪坑温度、舍内通风率、猪的活动量、猪的总质量作为猪舍内温度预测的外部影响变量;猪舍内温度、猪舍外相对温度、猪舍外湿度、猪舍粪坑温度、舍内通风率、猪的活动量、猪的总质量作为猪舍内相对湿度预测的外部影响变量。

3 预测结果实例验证

3.1 数据来源及数据监测

本文LSTM预测模型中用到的训练及验证数据来源于普渡大学动物研究教育中心猪舍[31]开展的研究项目(the USDA National Institute of Food and Agriculture Hatch project)。该猪舍位于美国印第安那州西拉法叶市,地处大陆性湿润气候,冬季寒冷,1月气温最低,平均温度为-7.2℃,相对湿度为69%;夏季炎热,7月温度最高,平均温度为29.4℃,平均相对湿度为71%。

该猪舍为密闭式机械通风、钢木混结构。猪舍共有12个南北朝向的小间,舍外新鲜空气通过猪舍东西两侧进风口送入舍内,然后通过棚顶和过道入口送入各个小间。单个小间尺寸为11 m×6.1 m×2.7 m(长×宽×高),内部建有双列钢质围栏,中间为过道,每列有6个猪栏,可以容纳60头育肥猪。小间内是水泥漏缝地板,地板下方有1.8 m深的储粪池。猪舍外部实景及结构如图3所示[32]。

图3 猪舍外部实景和结构图Fig.3 Photo and structure diagram of pig building

每个小间分别安装有天然气加热器(Guardian 60型,L.B. White Co.,美国)和2个直径分别为356 mm(V4E35型,Multifan,美国)和508 mm(V4E50型, Multifan,美国)的墙上恒速风机,用于舍内加热和通风。舍内温度和粪坑温度数据分别通过安装在距离猪舍地面1.5 m和储粪池的排风口处的T型热电耦监测得到。猪舍内相对湿度通过安装在猪栏中间距离地面1.5 m处的相对湿度传感器(HX92BC型,Omega,美国)测量得到。小间内墙上风机所受压力通过气压测量仪(260型,Setra Systems,Inc.,美国)测得。

猪舍的通风率包括舍内墙上风机的通风率和粪坑风机通风率。在猪舍下方的储粪池外墙上部安装有2个直径为250 mm的变速风机(P4E30型,Multifan,美国),为每间猪舍提供最小量通风,粪池风机的通风率由风速仪直接测量得到[32];墙上风机的通风率通过持续测量墙上风机的运行时间、小间内静压力以及后期风机测量模型[33]间接计算得到。

在每个小间墙上安装有红外活动量传感器(Visonic SRN 2000 Detector型,Visonic Inc.,美国)将探测到的红外光线信号转换成电压信号,用于猪的活动量(以电压度量)监测[34]。

每个小间中猪的数量是由人工每个星期进行计数得到。猪的质量由猪的初始质量和生长模型计算而得到,猪的生长模型曲线表示为

W0~29=0.008 592 3D2+0.107 91D+5.35

(9)

W30~150=0.002 339 7D2+0.562 14D-3.31

(10)

式中W0~29、W30~150——入栏0~29 d和30~150 d的猪质量

D——入栏的时间,d

由生长曲线计算得到的猪的质量与实际质量的拟合度为0.999 8,说明由生长模型计算得到的猪的质量完全可以反映猪的质量变化情况。这些数据根据需要,插值处理成时间间隔为1 h的数据。

猪舍外部温度与相对湿度等天气数据来源于距离猪舍5 km的普渡大学园艺研究与教育中心,以及安装在距离猪舍南侧70 m的Davis 6152 Wireless Vantage Pro2型气象站(Davis Instruments,美国)监测得到。

根据猪舍所处地理位置、气候特点以及监测数据的完整性等,本文分别选取2个朝南向的小间2和小间4,从2015年8月28日至9月30日和2015年12月24日至2016年1月13日2个阶段的采集间隔为1 min的舍内、外环境数据,将这些数据处理为时间间隔为1 h的数据进行模型训练与验证,实际监测数据变化,如表2和图4所示。

表2 实际监测数据变化范围Tab.2 Variations of collected data

图4 猪舍内外环境监测数据Fig.4 Indoor and outdoor environmental data of pig building

3.2 模型参数性能对比及选取

3.2.1不同学习速率

从不同网络的学习速率取值集合{0.001,0.003,0.005,0.008,0.010}中对模型进行测试,以得到高时效、训练损失较小的优化模型。不同学习速率下网络损失如表3所示,当学习速率取值增大时,网络训练损失迅速下降。虽然在学习速率0.010时网络训练损失值最小,但是,网络损失变化率最小,在夏季和冬季分别为0.500 0和0.517 2;然而在学习速率为0.008时的预测模型在夏季和冬季的网络训练损失变化率分别为0.843 3和0.701 0,基本达到最大值,表明在学习速率大于0.008后,预测模型的网络训练损失下降不再明显。因此综合考虑网络训练损失和训练时间效率,本文选取0.008作为LSTM预测模型的网络训练学习速率。

表3 不同学习速率下的网络训练损失Tab.3 Training losses at different learning rates

3.2.2不同节点数

网络训练的学习速率为0.008时,对LSTM子层和完全连接子层的节点数进行测试,以获得较优的预测性能。如图5a、5b所示,舍内温度和相对湿度夏季预测模型的eRMSE和eMAPE虽然在节点数为2 000和1 600时达到最小值,然而当节点数大于400时,eRMSE和eMAPE下降较缓慢,并且相对湿度预测的eRMSE变化曲线有逐渐上升的趋势;冬季温度和相对湿度预测模型都在节点数为400时,eRMSE和eMAPE达最小值。如图5c所示,夏季舍内温度和相对湿度预测模型的决定系数R2分别在节点数为2 000和1 600时达到最大值,然而当节点大于400时,温度预测模型的R2增加较为缓慢;冬季温度和相对湿度预测模型都在节点数为400时,R2达最大值。因此,根据以上温度和相对湿度预测模型的eRMSE、eMAPE和R2的性能变化分析,同时结合模型节点数与运行效率考虑,本文选取节点数400作为预测模型LSTM子层和完全连接层神经元的数目,优化模型的预测性能。

图5 不同节点数时LSTM预测模型的性能变化Fig.5 Performances of LSTM mode with different neurons

3.3 预测结果验证

选取2015年9月29—30日和2016年1月12—13日4 d监测的猪舍内环境数据以及舍外的天气数据作为猪舍内夏季、冬季温度和相对湿度验证数据对预测模型进行验证。

3.3.1温度预测验证

如图6所示,猪舍内温度预测值和实际测量值变化趋势非常一致,能够很好地反映舍内温度变化情况。

图6 舍内温度预测值与实测值对比Fig.6 Comparisons of indoor temperature predictions and observations

如图6a所示,夏季猪舍内温度高峰出现在14:00—15:00,温度低谷出现在01:00—02:00;猪内实测温度变化范围为21.5~26.6℃,预测温度变化范围为21.6~25.3℃;预测值与实测值的最大误差为1.9℃,最小误差为0℃,平均误差0.6℃;预测值与实测值的平均绝对百分比误差eMAPE为2.504%,决定系数R2为0.703。

如图6b所示,冬季猪舍内温度高峰出现在22:00—01:00,温度低峰出现在04:00—05:00;温度实际测量值变化范围为17.6~22.1℃,预测温度变化范围为17.6~22.1℃;预测值与实际测量值的最大误差为1.3℃,最小误差为0,平均误差为0.3℃;预测值与实测值的平均绝对百分比误差eMAPE为1.392%,决定系数R2为0.938。

因此,无论在冬季还是在夏季,温度预测值与实测值的误差都较小,能够较准确地反映猪舍内温度变化情况,本文所建立的温度预测模型,可以作为猪舍内温度优化调控策略的参考,实现舍内风机或加热器等温度控制设备的预先启停控制,在一定程度上弥补环境控制效果滞后问题。

3.3.2相对湿度模拟验证

猪舍内相对湿度预测值与实际测量值对比如图7所示,猪舍内相对湿度预测值与实测值的整体变化趋势一致。

图7 舍内相对湿度预测值与实测值对比Fig.7 Comparisons of indoor relative humidity predictions and observations

如图7a所示,由于在9月29日06:00起完全开启直径为508 mm的风机进行通风,通风量达到9 800 m3/min以上,此时刻的舍外温度为20.6℃,舍内相对湿度在10:00出现低峰值28.2%,相对湿度变化较大;夏季舍内相对湿度实际测量值变化范围为28.2%~50.1%,平均值为46.8%;相对湿度预测值变化范围为34%~50.7%,平均值47.1%;相对湿度预测值与实测值的最大误差为7%,最小误差为0,平均误差为1.6%;相对湿度的预测值与实测值eMAPE、eRMSE、R2分别为3.769%、2.346%、0.747。

如图7b所示,冬季猪舍内相对湿度变化呈现正弦周期曲线变化趋势,高峰值出现在13:00—15:00,低峰值出现在02:00—06:00;相对湿度实测值变化范围为27.7%~55.2%,相对湿度预测值变化范围为35.4%~51.7%;相对湿度预测值与实测值的最大误差为13.5%,最小误差为0,平均误差为3.1%;相对湿度的预测值与实测值的eMAPE、eRMSE、R2分别为7.281%、4.245%、0.542。

根据猪舍环境控制要求及猪舍环境管理经验,在猪舍各环境因素中舍内相对湿度重要性稍次于舍内温度,允许在一定范围内舍内相对湿度稍微大一些的变化。虽然,冬季相对湿度预测值与实测值最大误差为13.5%,但是仍然满足舍内相对湿度控制要求。因此,本研究建立的舍内相对湿度预测模型能够反映舍内实际相对湿度环境变化情况。

3.3.3结果分析

本文建立的LSTM温湿度预测模型是结合传感器监测所得猪舍内外环境历史时序数据和相关影响因素时序数据,对建立的预测模型进行训练,获取最优化的网络参数;而文献[20]是通过能量和质量平衡方程,建立猪舍内动态变化的热湿小气候模型,结合传感器监测数据,利用多元非线性回归的方法和一些经验值来确定模型中的相关参数,会有一定的局限性。

文献[20]中,温度模拟值与实测值的最大误差为2.4℃,平均误差为0.6℃,平均决定系数R2为0.812;相对湿度模拟值与实测值的最大误差为13.3%,最小平均误差为3.35%,平均决定系数R2为0.905。

本文建立的预测模型中,温度预测值与实测值最大误差为1.9℃,平均误差为0.5℃,平均决定系数R2、平均eRMSE和平均eMAPE分别为0.821、0.605℃和1.984%;相对湿度预测值与实测值的最大误差为13.5%,平均误差为2.3%,平均决定系数R2、平均eRMSE和平均eMAPE分别为0.645、3.297%和5.525%。

因此,综合考虑各项参数,本文建立的温湿度预测模型性能较优。

4 结论

(1)通过实测数据对LSTM温湿度预测模型参数进行训练优化,确定网络学习速率为0.008,完全连接子层神经元数目为400时,模型可以达到较优的性能。舍内温度预测的平均eRMSE和eMAPE分别为0.605℃和1.984%,舍内相对湿度预测的平均eRMSE和eMAPE分别为3.297%和5.525%。

(2)无论在夏季还是在冬季,采用建立的预测模型舍内温度与相对湿度预测值与实测值变化趋势一致。预测温度与实测温度的平均决定系数R2为0.821,舍内温度预测值与实测值最大误差为1.9℃,平均误差为0.5℃;预测相对湿度与实测相对湿度的平均决定系数R2为0.645,舍内相对湿度预测值与实测值的最大误差为13.5%,平均误差为2.3%。

(3)提出的基于深度学习的温湿度预测模型较精确地反映了猪舍内温度与相对湿度的变化情况,将预测模型的预测输出加入到控制策略中,可以预测下一小时的猪舍环境状况、提前对环境控制设备发出控制指令,控制设备提前运行可缓解控制效果滞后的问题,为猪舍内环境优化控制策略提供可靠的参考。

猜你喜欢

实测值预测值温湿度
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
考虑相关长度误差的含水层渗透系数反演研究
变电站集合式电容器故障分析和处理
文物展柜内环境温湿度的调控与监测
蛋鸡育雏育成舍环境控制技术
温湿度独立控制空调系统在医院建筑中的应用研究
AI讲座:ML的分类方法
自体荧光内镜对消化道肿瘤诊断临床应用分析
基于Ansys屋盖不同单元类型下的模态分析
温湿度计检定校准注意事项