APP下载

基于K-medoids和LSTM的冷链运输环境预测方法

2022-05-12苑严伟孙国庆刘阳春汪凤珠

农业机械学报 2022年4期
关键词:温湿度冷链神经网络

苑严伟 孙国庆 刘阳春 王 猛 赵 博 汪凤珠

(中国农业机械化科学研究院集团有限公司土壤植物机器系统技术国家重点实验室,北京 100083)

0 引言

近年来,冷链物流规模迅速发展[1]。冷链储运环境的品质对货物尤为重要,在众多环境因子中,车厢内温度和湿度为关键因素,异常的温湿度环境会造成储运环境内细菌滋生,污染货物,从而严重影响货物的品质。因此,研究高效、精准的冷链储运环境监测方法是保证运输物品安全和品质的重要前提。

目前国内外学者针对冷链监测进行了大量的研究[2-12],取得了一定的成果[13-16]。这些研究仅对冷链运输当前环境因子实时监测,无法对环境因子的变化趋势作出预判,只靠传感器监测数据来决定制冷机组运行状态,其数据采集的反馈与调控措施的生效都存在滞后性,致使冷藏车厢内的环境状态低于临界状态时才进行补救,常造成经济损失。通过试验测试得到,在开启制冷机组设备35 min后冷藏车厢环境可以得到明显改善。因此,需要对冷藏车厢内环境因子变化提前预测,从而提前决定环境控制设备的运行状态,实现环境优化控制、降低控制滞后效果。

近年来深度学习因其可以实现高维函数的逼近,并具有强大的函数映射能力,逐渐成为研究热点[17-22]。在众多深度学习算法中,长短时记忆神经网络(LSTM)作为循环神经网络的特殊变种,被广泛地应用到各个领域,文献[23]提出了基于主成分分析和LSTM神经网络的水产养殖溶解氧预测模型;文献[24]提出了基于LSTM和XGBoost的超短期电力组合预测模型;文献[25]利用长短期记忆神经网络预测某柴油机的NOx排放。LSTM神经网络对于时序数据能够很好地建模,适宜解决冷链环境温湿度预测问题,能够有效提高预测精度。

因此,在前人研究的基础上,本文提出并构建基于K-medoids和LSTM的冷链运输多步预测模型,该模型首先利用K-medoids算法将历史温湿度数据进行空间数据融合,然后采用LSTM网络构建温湿度变化预测模型,以此实现冷链储运环境温湿度变化的准确预测。

1 数据来源与预处理

1.1 试验场所

本试验于舟山兴业集团的大型重卡冷藏车内进行,冷链运输路线:浙江省舟山市—北京市大兴区。所选冷藏车长为14 m、宽为2.3 m、高为2.5 m,厢体材料为聚氨酯隔温材料,运输食品为舟山带鱼、梭子蟹。结合车厢大小、已有制冷设备和货物摆放情况,选取15个点位安装传感器,具体分布示意图如图1所示。

图1 传感器分布示意图Fig.1 Diagram of sensor distribution

1.2 数据采集

采用自行设计的冷链运输远程监测系统获取试验冷藏车厢温湿度数据,进行实时在线采集,其系统构架如图2所示。

图2 系统构架图Fig.2 Structure diagram of monitoring system1.云服务器 2.基站 3.4G dtu 数据传输单元 4.温湿度采集节点 5.北斗定位系统 6.车载终端 7.PC终端

试验时间为2020年11月15日—12月13日,设定每1 min采集1次数据,24 h连续采样。温度传感器测量范围-40~60℃,测量精度±1℃,相对湿度传感器测量范围0~99%,测量精度±5%,因篇幅有限,仅展示2020年11月19日采集的部分原始数据,如表1所示。

表1 2020年11月19日采集的部分原始数据Tab.1 Part of experimental original data collected on November 19th,2020

1.3 数据预处理

采集节点长期处于低温环境下,会使得传感器在数据采集过程中发生偏差,传感器精度会受到影响。同时,传感器网络的数据传输也会产生数据的丢包,这些问题都会造成数据的缺失异常,因此针对短时数据的缺失采用线性插值法对数据进行修复预处理,得到高质量的数据集。同时对各数据项进行归一化处理,为接下来的数据处理提供基础。

2 预测原理与方法

2.1 K-medoids数据融合

针对现有技术中无线传感器感知数据量大、数据冗余度高,为减少数据的模糊性和不确定性,使用K-medoids算法进行空间数据融合。K-medoids算法是K-means(K均值)算法的一种改进聚类算法,K-means算法求取的是簇中“平均数”,而K-medoids算法求取的是簇中“中位数”,因此,K-medoids算法对于噪声和孤立点更具有鲁棒性[26]。通过使用K-medoids算法将温湿度序列进行空间数据融合,实现数据维度压缩和降低数据冗余,并且提高数据的准确性,以融合后的温湿度时间序列代表整个冷藏车厢的温湿度状态,并以此构建预测模型的输入时间序列样本。

数据融合的基本思想是:在n个采集周期中,m个采集节点,将每个采集周期的数据设定为一个数据集合,从每个数据集合中找出1个数据中心点,以该中心点代表本次采集周期的所有数据。在实际应用中,以温度数据融合为例,K-medoids数据融合算法步骤如下:

(2)在每个采集周期中,先随机选择一个中心点称为tcenter,其他数据点称为非中心tnon-center,然后随机选取本周期中的非中心tnon-center不断与中心点tcenter进行替换,成为新的中心,计算每次替换后中心点与其他非中心点的绝对差值和(Sum of absolute difference,SAD)。

若替换后的SAD小于替换前的SAD,则此次替换是更优的替换,原来的中心点将被此次的非中心点替换。算法迭代执行替换操作直到找到使SAD最小的一个节点,成为本次采集周期最终的中心点Oi。

(3)对每个采集周期进行步骤(2)计算,获取一条时间序列(O1,O2,…,Oi,…,Om),以此来代表m个采集节点n个采集周期的温度融合数据,相对湿度数据融合同理。

算法示意图如图3所示。

图3 K-medoids数据融合示意图Fig.3 Diagram of K-medoids data fusion

2.2 LSTM神经网络

长短时记忆网络(Long short-term memory,LSTM)是一种循环神经网络(Recurrent neural network,RNN)的特殊类型,可以避免长期依赖的问题,通过设立门控机制,使其选择性地存储信息,以此来实现信息的保护和控制,其结构如图4所示,本文利用长短时记忆网络对融合后的时间序列(O1,O2,…,Oi,…,Om)进行预测分析[25-26]。

图4 LSTM网络结构Fig.4 Structure of LSTM network

LSTM拥有3个门,即输入门、输出门、遗忘门,以此决定每一时刻信息记忆与遗忘。输入门决定有多少新的信息加入到细胞当中,遗忘门控制每一时刻信息是否会被遗忘,输出门决定每一时刻是否有信息输出[27-28]。

长短时记忆网络计算公式为

ft=σ(Wf[ht-1,xt]+bf)

(1)

it=σ(Wi[ht-1,xt]+bi)

(2)

(3)

(4)

Ot=σ(W0[ht-1,xt]+b0)

(5)

ht=OttanhCt

(6)

式中it、ft、Ot——输入门、遗忘门、输出门

xt——t时刻的输入值

σ——Sigmoid激活函数

Wi、Wf、W0——输入门、遗忘门、输出门权重

WC——候选向量权重

bf、bi、b0——输入门、遗忘门、输出门偏置

bC——候选向量偏置

Ct——t时刻的候选向量

ht、ht-1——t、t-1时刻模型的所有输出

本文利用LSTM神经网络预测多步温湿度数据,采用递归预测策略,网络结构为一输入一输出,训练时输入与输出间隔一个时间步长,对网络进行训练、优化权重参数后,在每次计算时,使用上一次计算得到的预测值作为本次网络的输入值,获取新的预测值,通过迭代计算得到多步预测值,获取未来一段时间的温湿度变化。

2.3 K-medoids算法和LSTM神经网络组合

为提高预测模型的精度,将K-medoids算法和LSTM模型进行有机结合,构建了基于K-medoids和LSTM的冷链运输多步预测模型。其基本思想为首先对冷链运输环境数据进行修复处理,其次利用K-medoids算法作为长短时记忆网络的前置数据处理系统,对冷链运输环境温湿度数据进行空间数据融合,简化长短时记忆网络预测模型结构,随后对预测模型进行训练和预测,获得最终预测结果,有效提高了组合预测模型的预测精度。预测流程如图5所示。

图5 基于K-medoids和LSTM的冷链运输环境预测方法流程图Fig.5 Flow chart of environmental prediction method for cold chain transportation based on K-medoids and LSTM

冷链运输环境温湿度预测具体步骤为:

(1)设计试验方案,通过冷链运输远程监测系统在线采集冷藏车厢内环境时间序列数据。

(2)对数据进行清洗,剔除重复、异常数据,补充缺失数据。

(3)采用K-medoids算法进行数据融合,消除冗余信息,降低神经网络模型输入参数的维度,精简预测模型结构。

(4)对融合后的数据进行标准化,并划分相应的训练集和测试集。

(5)初始化LSTM神经网络模型参数,将训练集输入至模型中,模型通过不断进行参数优化,直至模型准确率达到最高或达到既定训练轮数时为止。

(6)输入测试集测试模型的精确度,通过模型的评价指标表,与其他模型进行对比,得出最优的冷链运输温湿度预测模型。

2.4 模型评价指标

为了评价模型的预测效果与精度,选用均方根误差(Root mean squard error,RMSE)、平均绝对误差(Mean absolute error,MAE)以及平均绝对百分比误差(Mean absolute percentage error,MAPE)3个指标对其进行评价,MAE、RMSE、MAPE越小,表明模型的预测效果更加精准。

3 试验与结果分析

3.1 试验准备

3.1.1数据源

以某冷藏车内的温湿度为研究对象,采用1.2节的冷链运输远程监测系统,试验选取2020年11月17日16:00—19:20的15个采集节点获取温湿度数据,采用已经预处理过的试验数据。最终实现1 h后的温湿度预测,在线采集到的6 000条样本数据为数据源,利用交叉验证法验证和测试模型性能。

3.1.2试验平台

试验所使用的计算机硬件配置如下:处理器为Intel(R)Core(TM)i5-1035G1 CPU 1.00 GHz,内存16 GB(Samsung DDR4 3 200 MHz),操作系统为Windows 10(x64),GPU显卡NVIDIA GeForce MX350 2GB。程序设计语言为Matlab(64-bit),集成开发环境为Matlab 2019a。

3.2 结果与讨论

3.2.1数据融合结果

使用K-medoids算法对数据进行融合试验,并将K-means算法作为对比算法。在数据采集和传输过程中会产生“垃圾”数据,如图6a所示,在温度原始数据中存在一个异常点,被圆圈标出,若在有异常点的采集周期中,采用K-medoids算法计算时,异常点的数值相较于其他簇内数据点较大,根据K-medoids算法取最小的点作为中心点这一规则会忽略掉异常点,而K-means算法会计算本次采集周期数据的平均值,会受到异常值的干扰。两种算法的融合结果如图6c所示,K-means算法异常计算结果用圆圈标出,所以K-medoids算法呈现更强的鲁棒性,融合后的变化规律更加明显,故本研究选择K-medoids算法对温湿度数据进行融合。

图6 温湿度原始数据及融合结果Fig.6 Raw temperature and humidity data and fusion results

3.2.2LSTM神经网络预测结果

在K-medoids数据融合的基础上,将融合后的数据按照7∶3比例划分为训练集和测试集,作为LSTM神经网络的输入,建立K-medoids结合LSTM冷藏车厢温湿度预测模型。采用Adam算法进行优化,迭代次数为250次,其中输入层节点数为1,输出层节点数为1,5次试验所对应的隐含层节点数、学习率和时间步长如表2所示。图7为训练后的误差曲线和预测趋势图。

表2 预测模型参数对比Tab.2 Comparison of prediction model parameters

从图7中可以看出,试验1和3的温度预测精度较高,试验1和2的相对湿度预测精度较高,而试验4和5温湿度预测误差波动较大。但从整体来看,各组试验的预测结果总体趋势与实际值较吻合。

图7 K-medoids-LSTM模型的误差曲线和预测趋势Fig.7 Error curves and prediction trend of K-medoids-LSTM model

为了更加直观比较预测模型的误差,表3为5次试验后得到的预测模型的平均相对误差、平均误差百分比和均方根误差。从表3可以看出,试验1最终取得的预测性能最好,温度的MAE、MAPE、RMSE分别达到了0.273 0℃、1.51%、0.343 8℃,相对湿度的MAE、MAPE、RMSE分别达到了1.995 6%、3.53%、2.561 9%。此外,预测模型的整体预测精度较为理想,温度MAE、MAPE、RMSE分别达到了0.752 6、4.12、0.629 7℃,相对湿度的MAE、MAPE、RMSE分别达到了2.874 5%、5.07%、3.385 7%,说明了K-medoids算法结合LSTM神经网络预测模型具有较为理想的泛化能力。

表3 不同参数下预测误差Tab.3 Prediction error under different parameters

3.2.3模型比对

本文设置了对照试验。将K-medoids-RBF神经网络、K-medoids-BP神经网络、K-medoids-Elman神经网络作为参照模型,分析和对比K-medoids-LSTM对预测性能的影响。各模型的预测值与真实值对比结果如图8所示,各模型的误差如表4所示。图8显示,各预测模型均能在不同程度上较好地实现冷藏车厢温湿度的预测,温湿度的预测变化趋势与实际变化趋势较为一致,但预测效果存在一定的差异。就整体预测结果而言,K-medoids-LSTM的预测结果比其他模型的拟合结果效果更好,变化起伏更小,预测效果更稳定,全局无较大起伏的波动点。结果表明提出的K-medoids和LSTM神经网络预测模型的预测精度高、泛化能力强,能够准确掌握冷藏车厢内未来1 h温湿度的变化,达到了比较理想的预测效果,可以为调控提供策略依据。

图8 各模型的预测结果Fig.8 Prediction results of each model

表4 不同预测模型的预测性能对比Tab.4 Comparison of prediction performance of different models

由表4可知,K-medoids-LSTM模型与K-medoids-RBF模型相比,温度的MAE、MAPE、RMSE分别降低了55.9%、54.9%、55.4%,相对湿度的MAE、MAPE、RMSE分别降低了13.6%、8.5%、21.4%;与K-medoids-BP模型相比,温度的MAE、MAPE、RMSE分别降低了59.8%、59.2%、55.4%,相对湿度的MAE、MAPE、RMSE分别降低了25.4%、25.2%、18.2%;与K-medoids-Elman模型相比,温度的MAE、MAPE、RMSE分别降低了74.3%、74%、73.2%,相对湿度的MAE、MAPE、RMSE分别降低了41.9%、40.3%、38.5%。

从总体来看,K-medoids-LSTM组合预测模型的各项指标都优于其他预测模型,能更准确地预测冷链储运环境温湿度变化规律和变化趋势。

4 结论

(1)采用K-medoids算法对冷链运输环境温湿度数据进行数据融合,降低了模型输入的维度,减小数据的模糊性和不确定性,有利于提升LSTM预测精度和稳定性。

(2)提出的K-medoids-LSTM模型能够预测冷藏车厢内未来1 h温湿度变化趋势,预测精度和稳定性较高,优于传统的BP、RBF、Elman神经网络等浅层模型,解决了传统预测方法预测精度低、鲁棒性差等问题。

猜你喜欢

温湿度冷链神经网络
一种智能化电热处理炉用温湿度传感器的变送器
基于神经网络的船舶电力系统故障诊断方法
中国冷链物流:应对冬奥的技术大考
国务院办公厅印发 《“十四五”冷链物流发展规划》
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
文物展柜内环境温湿度的调控与监测
蛋鸡育雏育成舍环境控制技术
重庆市冷链物流共同配送模式的研究
重庆市冷链物流共同配送模式的研究