基于LSTM循环神经网络的盐城汽车试验场气温预测模型研究
2021-04-16陈宏伟于群崔晓川李志国康林中汽研汽车检验中心天津有限公司
陈宏伟 于群 崔晓川 李志国 康林(中汽研汽车检验中心(天津)有限公司)
整车道路试验作为整车客观评价的重要组成部分,通常受到试验场气象条件因素影响。其中,环境温度主要对轮胎温度、发动机进气温度以及空气密度等产生影响,进而使整车道路试验结果的复现性、可对比性较差。文章利用LSTM深度神经网络,以中汽中心盐城汽车试验场(以下简称“盐城试验场”)2018—2019年温度数据建立数据样本,并搭建精细化气温预测模型,对实现整车道路性能试验的精细化、可控化、可对比等方面具有重要实际意义与研究价值。温度数据是典型的时间序列数据。就当前的预测技术而言,天气学方法预测具有一定不稳定性[1],统计学分析方法也有仅适用于固定长度的序列信息的缺点[2]。而随着深度学习模型逐渐成熟,在解决时间序列数据处理问题上体现了强大的适应性和决策能力[3]。LSTM是在循环神经网络(Recurrent Neural Networks,RNN)基础上解决了其梯度消失、长期依赖能力不足等问题[4],在语音识别[5]、机器翻译[6]等时序问题取得了巨大的成功。
1 LSTM神经网络
LSTM最早由Hocheriter和Schmidhuber提出[7],在RNN基础上摆脱了简单的记忆叠加,增加了门控状态来控制传输状态,适用于“长期记忆”任务。典型的LSTM结构如图1所示。LSTM在传统神经网络的输入层、隐藏层、输出层的基础上,将隐藏层额外加入1个或多个记忆单元,并且每个记忆单元都拥有3个“门”结构:遗忘门、输入门和输出门[8]。
其中,遗忘门读取ht-1和xt,输出“完全保留”或“完全舍弃”的信息至Ct-1中;输入门应用sigmoid层决定信息更新、应用tanh层备选用来更新的内容;输出门应用sigmoid层决定输出内容,并与tanh层相乘,仅仅输出所需部分。整个过程通过引入门的机制,对经过网络的信息进行有选择的记忆或遗忘,采取sigmoid激活函数和tanh双正切函数相乘的计算方式进行“门”操作,如图2至图4所示。
图1 LSTM内部结构
图2 遗忘门结构
图3 输入门结构
图4 输出门结构
为了更加详细描述LSTM内部结构,列出相关公式:
式中:ft、it、ct、ot——分别表示当前时刻t的遗忘门、输入门、单元状态、输出门的结果;
ht——最终的输出;
W和b——分别表示权重矩阵和偏置项;
σ和tanh——分别是sigmoid激活函数和双正切函数[9]。
2 数据处理
盐城市地处北亚热带向暖温带气候过渡地带,具有过渡性特征,且受海洋影响较大,季风气候较明显,冬季多偏北风而夏季多偏南风。文章选取中汽中心盐城汽车试验场气象站2018—2019年的温度数据作为样本,采集时间间隔为5 min。通过宏观分析,春季气温波动较大,整体呈周期性上涨;夏季气温波动较小;秋季气温变化周期性不如春季明显,伴随一定随机性;冬季最低平均气温在0℃左右,基本不存在结冰现象[10]。
数据预处理过程如图5所示,首先对气温数据进行清洗,主要包括插值法修正错误值和去除连续空值。为了实现以18:00至5:00的气温来预测6:00至17:00的气温,从18:00开始将气温时间序列重新排序,即从18:00至第2天17:55结束为1组数据。然后将每个小时中的12组数据取平均值,形成从18:00至第2天17:00的24个数据组成的气温数据样本,数据样本范例如表1所示,共计620组。
图5 数据预处理流程图
3 LSTM气温预测模型搭建
研究利用TensorFlow语言包搭建LSTM短期气温预测模型,通过对历史气温样本的学习,并根据第1天气温数据来预测第2天气温。模型结构及流程如图6所示,模型由输入层、隐藏层、输出层和损失优化器4部分组成。
3.1 输入层
输入层对数据进行归一化处理,然后划分训练集和测试集。模型使用的归一化方法为z-score标准化方法,公式为:
表1 数据样本 ℃
σ——样本标准差。
按照时间顺序划分训练集和测试集,取前600组数据为训练集,后20组数据为测试集。
图6 气温预测模型流程图
3.2 隐藏层
隐藏层由长短期记忆网络(LSTM)构成。模型使用64个隐藏单元,学习率设置为0.000 001,迭代次数为500次。
3.3 输出层
输出层的主要任务是将模型预测输出值反馈计算损失并传递至优化器,同时完成模型最终输出结果的反归一化计算。
3.4 Adam优化器
文章研究气温预测模型采用Adam优化算法经行迭代以降低预测输出值与实际输出值的损失。Adam算法相比其他优化算法的不同之处在于其在迭代过程中对梯度均值以及梯度均值方差进行矫正,因而Adam优化算法受学习率的影响较小[11]。
4 结果分析
基于长短期记忆网络的短期气温预测模型能够较好地预测气温升降变化趋势,模型预测结果与实际值的高最气温平均差值和最低气温平均差值都不超过2℃。气温预测结果,如图7所示。
图7 气温预测模型结果
定义模型准确率为实际值与预测值差值占实际值的百分比,如式8所示。综上,文章研究短期气温预测模型的模型准确率为64.1%。
短期气温预测模型能够较好地预测每天气温升降趋势,但是模型对于不可控的急剧升温降温天气的预测精度较低,如图7曲线中间部分所示。
5 结论
文章运用LSTM深度神经网络气温预测模型,对中汽中心盐城汽车试验场气温数据进行深度挖掘,取得了较好的预测结果,准确率达64.1%。该模型为整车道路试验提前获取了环境边界条件,对试验日程的组织计划、顺利开展、降本增效提供基础数据支撑。
同时,通过采取扩大样本数量、结合数据挖掘等方法可以提升模型预测精度;在此模型基础上,能够进一步开展对于风速风向、降雨等环境边界条件的预测模型研究。