一种基于深度学习的数据预测方法
2019-04-26陈建婷
文/陈建婷
1 引言
近年来,随着人工智能的发展,更多的神经网络方法用于进行数据预测。愈发成熟的算法所预测出的结果也越来越精准。然而,多变量时间序列预测是一项艰巨的任务。以电力负荷预测为例,负载是复杂的并且具有多个季节性水平,给定小时的负载不仅取决于前一小时的负载,而且还取决于前一天同一小时的负载。其次,必须考虑许多重要的外生变量,特别是与天气有关的变量。
多变量时序预测方法通常分为两种,一种是基于时间序列模型的传统方法,自回归积分滑动平均模型是其中的典型代表。自回归积分滑动平均模型的原则是探索序列和数据变化之间的规律和特点,而序列即为随时间变化的随机数列。该方法的利用了时间序列数据的时序性,但是缺点在于对非线性关系的预测准确度较差。
另外一种是基于人工智能的方法。如使用简单的神经网络方法,人工神经网络最初是受人类大脑处理信息方式启发的数学工具。人工神经网络由神经元所构成,不同的输入信息经由神经元处理,并发出响应。随着深度学习算法完善和发展,单一的基于神经网络的方法预测结果不够精准。
针对传统方法所存在的缺陷,本文使用了一种基于长短期记忆神经网络的方法对多变量时序数据进行预测。该方法的优势在于考虑到了多变量时序数据的时序性和非线性的特点。论文剩余部分将首先介绍循环神经网络和长短期记忆神经网络的原理,之后通过数据集的实验,证明基于LSTM 的电力负荷预测方法精准度高,稳定性强。
2 LSTM神经网络模型
2.1 循环神经网络
循环神经网络(RNN)是人工神经网络的一种,RNN 的特点在于不同层之间的神经元相互也建立权的连接,当序列继续推进,之前隐藏层将对之后的隐藏层产生效果。如图1所示,是一个RNN 的示意图。
在图1中,右侧是计算时便于理解记忆而展开的结构。简单说,x 为输入层,o 为输出层,s 为隐含层,而t 指第几次的计算。V,W,U分别为不同层的权重,其中计算第t 次的隐含层状态时为St=f(U*Xt+W*St-1),实现当前输入结果与之前的计算关联的目的。
RNN 的缺陷是当输入数据的时间间隔逐渐变长的情况下,RNN 将失去学习较长时间之前数据的功能,此情况即是梯度消失。
2.2 LSTM模型
LSTM 模型是RNN 的一种改进体,最早是由Juergen 提出的。经典的LSTM 模型单元结构如下:
如图2所示,LSTM 的特征是在RNN 的结构基础上,将其每一层都增加了阀门节点。 阀门一共有三种类型:遗忘门,输入门和输出门。 可以开启或关闭增加的阀门以确定每一层的输出处的模型网络的存储器状态的结果是否达到阈值,若超过阈值,将被增至到当前层的计算中。 在图2中,阀节点以sigmoid 函数计算网络的状态为输入;若超过阈值,阀门输出和当前层的乘积被视为下一层的输入;若结果未能超过阈值而选择忘记输出。在不同模型的每次反向传播训练期间进行不同层的权重更新。而某些修改(例如耦合输入和遗忘门)简化了LSTM,不会显着损害性能。对参数交互的分析表明,可以独立调整参数。 尤其是使用相当小的网络首先校准学习速率,这样做可以节省大量的实验时间。
3 实验结果
图1:RNN 单元结构图
根据2014年全球能源预测竞赛(GEFCom2014)给出的数据集,以2003年3月-2008年11月电力负荷数据作为训练集,以2008年12月的电力负荷数据作为测试集。
首先,将数据集中的数据进行标准化,先把数据集中的电力负荷值除以1000,再计算数据集的平均值,最后用原值减去平均值。
在本次实验中,将用均方误差(MSE)和百分误差(e)两个参数来评判该方法的预测数据的准确性。对比预测数据与真实数据的均方误差,计算公式如下:
其中N 为预测结果总个数,yt为真实值,为预测值。根据实验结果,最终测试集的MSE 是0.035。
如图3所示为使用本文方法得到的电力负荷预测结果,预测值为橙色线,真实值为蓝色线,可以看出预测值和真实值的差值较小。
比较真实值和预测值,采用百分误差来衡量,公式如下:
图3:基于LSTM 的预测结果
图4:基于LSTM 方法的预测误差
4 结论
多变量时序数据预测具有时序性和非线性的特点,本文使用的基于长短期记忆神经网络的预测方法很好的利用了多变量时序数据的特点。从实验中可以看出,使用本文方法预测出的数据精准度较高,误差率一直保持在较低的范围内,说明基于LSTM 的多变量时序预测方法稳定性较强,具有实际意义。
更正
兹有李锐、马军、傅宁、张喆、曾令康同志发表在《电子技术与软件工程》杂志2019年3月上半月刊通信技术栏目第18 页中《激光链路对天地协同通信网络系统性能影响》一文,此文章为国家电网公司科技项目《支撑全球能源互联网的天地协同通信技术架构研究》文章,项目编号:526806160036;
文章添加作者简介:
李锐,大学本科学历。中级工程师。研究方向为电力通信技术。
马军,大学本科学历。中级工程师。研究方向为电力信息通信、北斗。
傅宁,硕士研究生。高级工程师。研究方向为电力信息通信、北斗。
张喆,硕士研究生。高级工程师。研究方向为电力通信技术。
曾令康,博士研究生。高级工程师。研究方向为电力通信技术。
《电子技术与软件工程》编辑部
2019年3月