一种基于深度学习的居民家庭短期用电预测方法
2019-09-24雷鸣唐李洋叶振宇黎川潘李伟
雷鸣 唐李洋 叶振宇 黎川 潘李伟
摘要:单个居民家庭的用电量与多种复杂因素相关,可能包括其历史用电量、节假日因素、天气以及居民用电习惯等。通过研究和实验,我们提出了一种端到端的结构来预测单个家庭的短期用电量,称为残差卷积融合网络。具体来说,我们的网络结构使用了:1)利用残差卷积单元的三个分支分别来模拟用电量的时间邻近性、周期性和趋势特性;2)利用一个全连接的神经网络来模拟工作日或周末特性;3)通过残差卷积网络来融合上述输出以产生短期用电量的预测。通过对澳大利亚居民用电数据集的实验研究,验证了我们所提出的网络优于几种众所周知的方法。
关键词:短期居民用电预测;卷积神经网络;残差网络
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2019)21-0240-03
开放科学(资源服务)标识码(OSID):
Abstract: Electricity consumption is related to multiple complex factors, including historical amount of consumption, calendar dates and holidays, as well as residential power consumption habits. To this end, we propose an end-to-end structure to collectively forecast short-term power consumption of private households, called RCFNet (Residual Conventional Fusion Network). Specifically, our RCFNet uses:1) three branches of residual convolutional units to model the temporal proximity, periodicity and tendency properties of electricity consumption, 2) one fully connected neural network to model the weekday or weekend property, and 3) a residual convolution network to fuse the above output to produce short-term prediction. All the convolutions used here are one-dimensional. Through experimental studies on residential electricity consumption dataset in Australia, it is validated that the proposed RCFNet outperforms several well-known methods. Besides, we demonstrate that residential power consumption is closely related to the living characteristics of residents.
Key words: short-term load forecasting; Convolutional Neural Network; Residual Network
1引言
文獻中报道了多种关于短期负荷预测的方法,大多数现有的工作都是针对电力消耗的群体行为,而不是针对单个居民的,因为针对个别用户用电负荷的波动性,对于居民群体性的用电预测来说通常被认为是微不足道的。因此,短期家庭负荷预测的问题现在[1]仍然是面临挑战并值得研究的。
作为当前许多研究领域中最活跃的技术,深度学习的本质是分层表示观测数据,并实现将低级特征进一步抽象为高级特征表示[2]。长短期记忆网络(LSTM)最初由Hochreiter等人[3]提出,在时序学习领域中取得了巨大进展,因此也被广泛应用于用电负荷的预测中。随着AlexNets[4]的突破性成功,CNNs(Convolutional Neural Network,卷积神经网络)被广泛应用于图像识别、语音识别、序列生成等领域。研究人员[5]提出了越来越深的卷积神经网络,揭示了网络深度的重要性。ResNets (Residual Networks,残差网络) [6]通过使用跳跃连接的方式,解决了随着网络深度的增加而产生的梯度消失的问题。Zhang等[7]将这两种方法结合起来,提出了一种基于深度学习的方法用于预测城市每个区域的人流量变化。
在上述现有工作的启发下,我们考虑使用深度学习中的卷积网络进行居民用电特征的提取,设计了一个名为RCFNet (Residual Conventional Fusion Network,残差卷积融合网络)的深层网络来预测短期的居民用电量。具体来说,RCFNet使用残差卷积单元的三个分支来提取用电量的时间邻近性、周期性和趋势性特征,同时使用一个全连接神经网络来模拟工作日/周末属性,最后使用一个残差卷积网络来融合上述输出来产生短期预测。我们使用来自澳大利亚的智能电表数据评估模型,实验结果表明,与历史平均模型、季节自回归滑动平均模型(SARIMA)、多层感知器和长短期记忆模型相比,我们的方法具有优势。
2算法设计与分析
2.1深度残差卷积网络
残差网络(ResNets) [6]通过使用跳跃连接,执行由堆叠的非线性层定义的残差映射,这比原始映射更容易优化。Identity Mapping ResNet[8]简化了残差网络,解决了随着网络深度的增加产生的梯度消失问题,从而大大提高了网络的训练效果。具有Identity Mapping的残差单元[8]被定义为:
其中[X(l)]和[X(l+1)]分别是第[l]层残差单元的输入和输出序列,[F]是残差函数[6]。
2.1.1 残差卷积网络结构
我们的任务描述如下:对于给定电表读取的一系列观测数据[{St|t=0,1,...,n-1}],预测下一个时间段的用电量[Sn]。
通过对居民用电的分析,我们发现居民用电具有邻近性、周期性和趋势性特征,因此我们考虑使用深度网络来提取这几个特征,图1显示了所使用的模型结构。
如前所述,居民用电量时间序列数据是以半小时间隔获得的。这里我们将数据的时间相关性分为三种类型: (a)邻近数据,使用最近24小时的数据;(b)周期数据,这里选取了最近28天的数据;(c)趋势数据,选择最近10周的数据。这样,三个特征的时间序列数据被构建为模型的输入。我们使用相同的网络结构来提取上述三种类型的特征,即,所有特征都使用残差卷积网络(图1中的残差卷积网络细节参见图2(a))。考虑到外部信息获取的困难(比如气象因素),这里只是简单地区分工作日和周末,被编码成one-hot向量,作为全连接网络的输入。四个模块(即趋势性、周期性、邻近性、外因)输出长度固定的特征向量拼接成一个向量,被用作特征融合模块的输入(详见图2(c))。融合网络的输出被馈送到激活函数,将结果映射到[0,1]。
2.1.2时间序列特征提取网络
前三个组件(趋势性、周期性、邻近性)共享相同的网络结构,如图2(a)所示。
(1)卷积。使用一维卷积核来执行一维卷积,以便提取时间序列中的邻近特征。图1所示的结构中邻近性特征提取模块对最近一段时间的用电数据进行采样,以模拟数据的邻近性特性。这里[Xat=Xat0=[St-la,St-(la-1),...,St-1]]表示时刻[t]作为模型输入的邻近特征依赖序列,通过卷积操作输出到下一层:
这里的[*]代表卷积操作,[f]为激活函数,[Wa1,ba1]表示第一层的可学习参数,上标表示对应的网络层。
(2)残差单元。使用残差学习方法[8]构建深层网络来提取序列的特征,在残差卷积网络中,如图2(a)和2(b)所示,在卷积输出上叠加[L]个残差单元:
这里,[F]代表残差函数(参见图2(b)), [θal]表示第[L]层的全部可学习参数,这里在ReLU层前执行了批量正则化[9]操作。最终的残差单元顶部,添加一个卷积层来构建由两个卷积层和一个残差单元组成的网络结构,用于提取邻近性的特征。类似的,周期性和趋势性的特征提取也是通过相同的结构实现的(参见图1)。
(3)外部因素。这里只考虑工作日和周末对居民用电的影响。将它编码one-hot向量为连接到一个两层的全连接网络,外部特征输出定义为[Et],输出映射到固定大小的矢量长度,以确保和前三个分量的输出一致。
(4)融合网络。将四个模块的输出(即趋势性、周期性、邻近性和外部因素)输入融合网络(見图2(c)),输出通过激活函数映射到[0,1]。网络通过输入三个数据序列和外部特征序列来训练预测值[St],最小化预测用电量和实际用电量之间的均方差:
这里的[θ]代表可学习参数,[St]代表时刻[t]的观测值。
2.2算法及优化步骤
程序1中的伪代码演示了算法的执行过程。首先,训练实例由原始序列数据构建(第①-②行)。然后,执行反向传播算法和Adam[10]优化器(行③-⑧)来训练模型网络。最后,在测试集(⑨-⑩)上验证模型。
程序1:RCFNet 模型训练验证程序
输入:
邻近性、周期性和趋势性输入数据长度: [la,lp,lq];周期数据间隔:[p]; 趋势数据间隔:[q] ;历史数据序列:[S={S0,...,Sn-1}];外部因素特征:[E={E0,...,En-1}];
数据准备:
3实验结果分析
我们对澳大利亚的居民用电数据集进行了实验,以验证所提出的模型的有效性。该数据集(来源: http://data.gov.au/dataset/electricity-consumption-benchmarks)包含澳大利亚维多利亚州25户家庭的电力消耗,时间从2012年4月1日至2014年3月31日,采样间隔为半小时。在数据训练和测试的工作中只选择了其中8户完整用户数据。将RCFNet模型与以下4个常见的基准预测算法进行比较: HA (History Average,历史平均方法)、SARIMA (Seasonal Autoregressive Integrated Moving Average,周期性滑动自回归模型)、MLP (Multi-Layer Perceptron,多层感知器)、LSTM (Long Short-Term Memory,长短期记忆网络) [3]。
3.1数据预处理
在本模型中,使用最小-最大正则化方法将训练数据归一化为[ 0,1]之间的值,输出部分使用了ReLU激活函数。模型使用3x1大小的卷积核。训练集前90%用于训练,后10%用于验证。为了防止过多的训练迭代,使用了早期停止技术来找到最佳的训练迭代次数。在LSTM和MLP模型中,输入为长度为48的序列,而本模型中的最终融合模型采用以下参数:邻近序列长度为48,周期序列长度为28,趋势序列长度为10。使用最后60天的数据进行模型验证,其余数据作为训练数据集。
3.2实验结果及分析
使用均方根误差( RMSE )来验证预测性能,定义如下:
其中[n]是预测结果的总数。
将模型与表1中的其他四个模型进行了对比,其中每个模型的性能按每个用户家庭ID列出。此外,为验证不同参数对RCFNet的影响,设计了六种不同的模型变量,分别是RCF (考虑邻近性、周期性、趋势性和外部因素的网络模型)、RCF-NoE (不考虑外部因素的模型)、RCF-NoP (不考虑周期性的模型)、RCF-NoQ (不考虑周期性和趋势性的模型)和RCF-NoEPQ (不考虑周期性、趋势性和外部因素的模型)。表1中的数值表示各方法的实际值和预测结果之间的均方根误差,数值越小越好,每一列中的最佳结果由带下划线的粗体数字显示。
从表1中,可以看到RCFNet优于其他四个基准模型,这表明RCFNet很好地捕捉了居民的用电特性。此外,还可以发现,不同家庭的邻近性、周期性、趋势性和外部因素对预测结果的精确度影响不同,这也反映出不同居民的用电特点具有很大不同,一些居民用电具有更强的周期性特征,而另一些则表现出更明显的趋势特征。可以看出,如果不考虑某些特征分支,RCFNet的一些结果可能比某些基准模型差,这表明这些特征对RCFNet的精度有很大影响。
4总结
本文主要研究了居民用電的短期预测算法,提出了一种称为RCFNet的深层网络架构,以实现准确的短期用电量预测。该模型结构综合考虑了用电量的邻近性、周期性和趋势性特征,同时考虑了外部因素的影响。通过对澳大利亚居民用电数据集的案例研究,将模型与其他四种典型的预测模型(即历史平均方法、周期性滑动自回归模型、多层感知器和长短期记忆网络)进行了比较,验证了我们所提出的RCFNet的预测性能。此外,RCFNet具有良好的可扩展性,可广泛用于其他类型的时间序列预测。
本项目收到国家科技部重点研发计划重点专项“重大事故灾难次生衍生与多灾种耦合致灾机理与规律”项目(资助号 2016YFC0800100), 安徽省自然科学基金青年基金项目(资助号 1708085QG162), 社会安全风险感知与防控大数据应用国家工程实验室主任基金项目资助。
参考文献:
[1] Yu C N, Mirowski P, Ho T K. A Sparse Coding Approach to Household Electricity Demand Forecasting in Smart Grids [J]. IEEE Transactions on Smart Grid, 2017, 8(2):738-748.
[2] Bengio Y, Courville A, Vincent P. Representation Learning: A Review and New Perspec-tives [J]. IEEE Trans Pattern Anal Mach Intell, 2012, 35(8):1798-1828.
[3] S.Hochreiter and J. Schmidhuber, Long Short-Term Memory, Neural Computation, Vol. 9, No. 8, 1997, pp. 1735-1780.
[4] A. Krizhenvshky, I. Sutskever, and G. Hinton, Imagenet classi?cation with deep convolu-tional networks, in Proc. Adv. Neural Inf. Process.Syst., 2012, pp. 1097–1105.
[5] Simonyan K, Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition[J]. Computer Science, 2014.
[6] He K, Zhang X, Ren S, et al. Deep Residual Learning for Image Recognition [J]. 2015:770-778.
[7] Zhang J, Zheng Y, Qi D. Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction [J]. 2016.
[8] He K, Zhang X, Ren S, et al. Identity Mappings in Deep Residual Networks [C]. European Conference on Computer Vision. Springer, Cham, 2016:630-645.
[9] Ioffe, S., and Szegedy, C. 2015. Batch normalization: Accelerating deep network training by reducing internal covariate shift. In ICML, 448-456.
[10] Kingma D P, Ba J. Adam: A Method for Stochastic Optimization [J]. Computer Science, 2014.
【通联编辑:梁书】