计及气象累积效应的特征解耦峰荷预测模型
2022-03-23丁鹏飞
秦 川,丁鹏飞,刘 波,鞠 平
(1. 河海大学能源与电气学院,江苏省 南京市 211100;2. 国网江苏省电力有限公司淮安供电分公司,江苏省 淮安市 223002)
0 引言
负荷预测对于电力系统的规划运行、管理运营、市场交易等方面具有重要意义。在日负荷曲线中,峰值一般是电力部门最为关心的数据[1]。特别是在夏季,负荷功率幅值处于一年中的高位水平,日峰荷与电网安全稳定运行之间具有密切联系[2]。为此,许多学者对夏季日峰荷展开研究,尤其关注峰荷与温度之间的关系[3-5]。
夏季温度对负荷的影响具有累积效应,使得负荷与温度之间呈现一种复杂的非线性关系,对预测造成不利影响[6-7]。温度累积效应是指预测日负荷不仅受预测日温度影响,同时也受到预测日相邻前几日温度的影响[8-10],例如,在夏季连续多日高温后温度突然降低并不会导致负荷骤然下降。导致这一现象的原因在于人体对温度的感知滞后于外界温度的变化以及人类生活行为的惯性。不少学者针对累积效应提出了温度修正公式[6,8-9,11],以加权方式将前几日的温度与预测日温度结合起来计算修正温度,目标函数通常为最大化负荷与修正温度间的线性相关性。除了温度,相对湿度同样对负荷具有一定的影响[12],因此在对累积效应修正前,普遍会先基于相对湿度对温度进行一次修正。研究结果表明,温度修正有助于改进预测效果。文献[13]依据峰荷与累积效应修正温度的拟合曲线获得不同日历属性下峰荷的典型差值,并对其标幺化,即将传统的独热编码日历属性转换为与峰荷值相对应的标幺值,削弱了温度累积效应对日期类型系数的影响。此外,文献[14-15]在多元线性回归基准预测模型[16]的基础上,前者根据近因原理引入滞后温度和移动平均温度体现累积效应,后者进一步引入了相对湿度变量以改进预测效果。
综上所述,对于累积效应的处理,目前的主流方法为温度修正。温度修正公式量化了相邻前几日温度对预测日温度的影响,事实上累积效应是一种复杂的非线性关系,难以被直接量化,修正公式本质上类似于一种简化方法,且公式的形式依赖于人工经验来确定。与此同时,深度学习自2006 年被Hinton等人提出以来,在当前大数据的背景下一直处于极高的热度,能够挖掘难以发现的深层特征或反映某些难以用明确统一的数学模型描述的复杂关系,特别是长短期记忆(long short-term memory,LSTM)网络十分适合于处理当前信息与历史信息之间的关系[17-21],而累积效应正是历史温度序列对负荷的作用。因此,可考虑基于LSTM 网络来反映累积效应。
为此,本文提出了基于LSTM 网络的特征解耦峰荷预测模型。模型包含时间、气象、历史峰荷3 个输入分支,从结构上对输入特征实现解耦处理。其中,气象分支仅以累积效应相关因素为输入,以有效反映累积效应。然后,简略介绍基于温度修正计及累积效应的常规方法。最后,通过实例分析,验证了特征解耦模型更适合于计及累积效应的峰荷预测。
1 特征解耦模型
1.1 模型结构设计
简单来说,要计及累积效应需要将历史气象特征作为模型输入。除了温度和相对湿度等气象特征,历史负荷特征、时间类特征同样需要作为预测输入。按照常规的模型结构来说,这些特征将会组成向量输入模型,尽管这些特征的性质完全不同,但对于模型来说都只是数字而已,仅仅数值有所不同,模型经过训练能够感知输入向量中不同维度间的差异,同时也存在以下问题:在模型训练过程中,气象特征与其余特征混在一起相互作用,模型无法单独学习气象特征,进而会影响其对累积效应的学习。因此,模型结构设计的思想是模型能够独立处理气象数据,接着将处理结果与其余因素组合进行二次处理,即从结构上将累积效应的学习过程独立出来。
显然,上述思想对模型结构的灵活性要求很高,神经网络恰好能满足该要求,同时神经网络中的LSTM 网络具有很强的时序处理能力。为此,建立具有多个输入分支的神经网络模型,其结构如图1所示,图中不同类型的因素在模型结构上实现了解耦,因此可称该模型为特征解耦模型,显然,其具有3 个分支。
图1 特征解耦模型的结构Fig.1 Structure of feature decoupling model
1)气象分支:将每日的温度与相对湿度组成二维特征向量,连接起来构成气象特征序列,将其输入LSTM 网络隐藏层,后接一个一维全连接层,即为该分支的输出。由前述可知,累积效应一般需要考虑前3 d 气象因素的影响,加上预测日的气象因素合计需要考虑4 d,因此将LSTM 网络隐藏层的步长设为4。
2)负荷分支:与气象分支类似,每日峰荷特征连接起来构成负荷特征序列,将其输入LSTM 网络隐藏层,后接一维全连接层。考虑前一个星期的峰荷影响,因此将该LSTM 网络隐藏层的步长设为7。
3)时间分支:时间特征包括年份、月份、日期类型,不同日的时间特征之间没有关联,不需要再设置LSTM 网络隐藏层,隐藏层采用全连接层即可。
然后,将3 个分支进行拼接,再输入全连接层,最终产生模型输出。
1.2 模型分析
由图1 可知,各分支在连接以前独立运行,即特征解耦模型对不同类型的输入特征分别进行处理,有利于模型更好地学习负荷与相应类型特征间的关系。就气象分支而言,该分支对累积效应涉及的特征进行单独处理,有利于对累积效应的深入学习。
从结构角度来看,这与模型融合有些类似,若将模型某一分支的输出引出,该分支即相当于一个元模型,而分支后连接的全连接层相当于融合模型[22-23]。不同的是,模型融合的元模型分别独立进行训练;特征解耦模型的分支部分是无法独立训练的,原因在于,对于各分支而言,其输入特征是已知的,但其输出标签是不可获知的。分支的训练依赖于整个模型的训练,当模型训练完成后,分支即训练完成。换而言之,特征解耦模型能将其每个分支作为一个模型,即由一个整体模型获得多个个体模型。
从学习方式角度来看,特征解耦模型的训练属于有监督学习,而其分支的训练类似于无监督学习,由此也体现了自适应性,而且分支会产生什么样的输出在模型训练完成前是不可知的。基于LSTM网络的气象分支以历史温度与相对湿度为输入,该分支的输出可认为是累积效应的一种映射,由此保证模型在峰荷预测时能够有效计及累积效应,进而提升预测效果。
一般来说,网络隐藏层数越多,模型对复杂关系的学习能力越强,但同时伴随着训练时间的延长,而且过分复杂的模型需要规模足够大的数据集作为支撑,且容易出现过拟合,因此要合理控制模型复杂度。一方面,峰荷数据集规模通常较小;另一方面,特征解耦模型将不同特征区别处理,对于任一分支而言,输入特征类型单一且维数较少,对复杂度要求低。因此,设置LSTM 网络隐藏层的层数默认为2,神经元个数默认设为128,具体地应依据训练情况进行合理调参。
2 温度修正
为了验证特征解耦模型的有效性,采用温度修正方法与其进行对比。下文对温度修正方法进行简略介绍。
首先,采用温湿指数[8]考虑相对湿度的影响,如式(1)所示。
式中:H为温湿指数;T为温度;R为相对湿度;各系数采用文献[24]中提出的系数,c1=-42.38,c2=2.049,c3=10.14,c4=-0.224 8,c5=-6.838×10-3,c6=-5.482×10-2,c7=1.228×10-3,c8=8.528×10-4,c9=-1.99×10-6。只有当空气温度较高或较低时,相对湿度的影响较大,因此使用温湿指数修正应满足T>27 ℃,R>40%。如果不满足上述条件,则不进行修正。
然后,依据累积效应对温湿指数进行二次修正[25],如式(2)所示。同时,为保证修正结果在合理范围内且满足“近大远小”的原则,修正时应满足的约束条件如式(3)所示。
式中:T′为当天的修正温度;H0为当天的温湿指数;Hi为i天前的温湿指数;k0、k1、k2、k3为相应的修正系数,具体数值采用遗传算法对数据集进行辨识获得。辨识的目标函数如式(4)所示,r(T′,P)表示修正温度T′与负荷功率P的Pearson 相关系数,约束条件参照式(3)。
3 实例验证与分析
基于2 个地级城市的实际数据集对比温度修正与特征解耦模型应用于夏季峰荷预测的效果。训练集为2014 年至2017 年夏季数据,测试集为2018 年夏季数据,迭代多步预测一个月的日峰荷变化,即多步预测的预测步数为31。所有程序基于Python 编程实现。评价指标采用平均绝对百分比误差(mean absolute percentage error,MAPE)eMAPE,见式(5)。
式中:n为预测天数;P′i为第i天的预测负荷;Pi为第i天的实际负荷。
对峰荷与气象数据分别进行最大、最小归一化处理,对年份、月份、星期、节假日等时间类离散型数据进行独热编码。对于气象数据,计算峰荷与气象因素间的相关系数,如附录A 表A1 所示,选择采用平均温度、平均相对湿度;星期数据如附录A 表A2所示,按星期一至五、星期六、星期日等3 类进行编码。
3.1 特征解耦模型配置
采用控制变量法确定特征解耦模型的结构,在保证模型学习曲线稳定收敛的前提下,以验证损失最小化为目标逐步调整模型中网络隐藏层的层数与神经元个数,其中层数可调范围为1 至4,神经元个数可调范围为2 至128(调节步长为2)。经过调参,特征解耦模型的网络隐藏层参数如表1 所示,模型的详细结构即模型所有网络隐藏层的输入输出情况如附录B 图B1 所示。为有效缓解梯度消失问题,设置所有LSTM 网络第1 层隐藏层的激活函数为softsign,其余均为默认的线性函数linear。同时,设置模型的损失函数为均方误差函数,优化器为RMSProp,其学习率设为0.001。设置最大迭代次数为1 000。为防止过拟合,附加了早停规则:当验证损失达到10 次未下降时,则停止迭代。
表1 特征解耦模型网络隐藏层参数Table 1 Parameters of hidden layers of feature decoupling model network
模型的负荷分支LSTM 网络隐藏层的时间步长由计及的历史负荷天数确定为7,气象分支LSTM 网络隐藏层的时间步长由累积效应计及天数(含预测日)确定为4,在此处进行相关验证,尝试计及不同天数的效果,具体情况如附录C 图C1 和图C2 所示。显然,当历史负荷计及天数为7、累积效应计及天数为4 时验证损失最小,证明了其合理性。
3.2 温度修正结果
基于2 个地级城市2014—2017 年的夏季数据,首先计算温湿指数,其次基于遗传算法进行优化,结果如表2 所示。两地区的修正公式参数辨识结果十分接近,说明两地区的负荷与气象的相关情况也较为接近。
表2 遗传算法优化结果Table 2 Optimization results of genetic algorithm
3.3 预测结果对比
为了验证所提特征解耦模型效果,对两地2018 年7 月和8 月的日峰荷分别进行迭代多步预测。对比之一是分别采用原始温度与修正温度,引入支持向量机(SVM)、极限梯度提升(XGBoost)、常规的LSTM 网络模型进行峰荷预测,并将预测结果与特征解耦模型进行对比。上述模型参数等信息详见附录D。预测结果如表3 所示。
表3 采用原始温度与修正温度下的预测误差Table 3 Forecasting error with original temperature and corrected temperature
根据表3 得到相关结论如下。
1)对于SVM、XGBoost、LSTM 网络模型,采用修正温度后误差均有所下降,以城市1 为例,7 月误差平均降低了7.94%,8 月误差平均降低了11.75%,验证了采用修正公式计及累积效应的有效性。
2)相较于基于修正温度获得的最小误差,特征解耦模型的预测误差平均低了22.4%,一方面直接说明了该模型的有效性,另一方面验证了采用该方法计及累积效应的可行性。以城市1 峰荷为例,特征解耦模型的预测结果与真实值的对比如图2(a)所示,预测值曲线与真实值曲线在大多数日期的重合度很高,直观地验证了该模型的可行性。
3)对于特征解耦模型,其学习曲线详见附录C图C3,训练损失与验证损失较为稳定地收敛到接近0,说明该模型的预测结果是可信的。此外,预测误差变化如图2(b)所示,预测误差较为均匀地分布于0 值两侧,未出现因迭代预测导致的误差累积增长。
图2 特征解耦模型的预测情况Fig.2 Forecasting of feature decoupling model
为了进一步验证预测效果,对比之二采用文献[8]所述温度修正公式,并利用常规LSTM 网络模型(下文简称“LSTM-修正温度2”)进行峰荷预测;采用文献[13-14]所述模型(下文简称“近因模型”“近因-湿度模型”)进行峰荷预测。预测结果对比如表4 所示。
表4 不同预测模型下的预测误差Table 4 Forecasting error with different forecasting models
从表4 可以看出,与上述几种模型相对比,本文所提特征解耦模型的预测效果最优。
3.4 特征解耦模型的输出分析
以城市1 为例,对特征解耦模型的输出进行分析。特征解耦模型的气象分支以气象特征序列为输入,旨在反映累积效应。测试集上气象分支输出与实际峰荷的对比如图3(a)所示,分支输出的变化趋势与实际峰荷的变化趋势大体一致,说明气象分支的输出对于峰荷预测具有重要意义。为计及累积效应,气象分支的输入为累积效应的相关因素,具体为预测日及其前3 d 的温度与相对湿度,其中显然预测日的温度与相对湿度最为重要。为便于探索气象分支对温度、相对湿度的处理情况,绘制训练集上气象分支输出与温度、相对湿度的分布如图3 所示。从图中可以看出,分支输出与预测日温度间的关系类似于sigmoid 函数,当温度较为舒适或温度很高时,输出变化趋势放缓;分支输出与相对湿度间也呈现了一定的规律性。结合前述,特征解耦模型的预测效果优于采用修正温度的各个模型,说明了气象分支对累积效应的相关因素进行了有效处理,亦说明了特征解耦模型相较于修正公式更适合于计及累积效应的峰荷预测。
图3 气象分支输出情况分析Fig.3 Analysis on output of meteorology branch
时间分支的输出如图4 所示,时间分支输出准确反映了月份的变化,同时准确地区分出了星期一至星期五为一类,星期六与星期日又各为一类,说明了时间分支对时间数据的处理是合理有效的。
图4 时间分支的输出情况Fig.4 Output of time branch
负荷分支的输出与实际峰荷的对比如图5 所示,分支输出较好地反映了峰荷变化的趋势,且存在为期1 d 的滞后性,这说明在负荷分支计及的历史负荷中,前一日的峰荷起着最为重要的作用。同时,8 月的输出变化趋势与实际峰荷变化趋势的相似程度不如7 月,判断这可能是导致8 月的预测误差相较于7 月更大的重要原因。综上所述,各分支的输出均呈现合理的变化规律,进一步验证了模型的有效性。
图5 负荷分支的输出情况Fig.5 Output of load branch
3.5 极端高温气象下的峰荷预测分析
近年来极端气象多发,高温数据存在超出历史记录的可能。在缺乏历史峰荷样本数据的场景下,可从以下两方面分析验证特征解耦模型的预测能力。
1)根据图3(b)可以看出,气象分支输出与预测日平均温度间呈现出类似于sigmoid 函数的规律,可见当出现极端高温天气时,峰荷功率也会逐渐出现饱和。
2)选取2018 年7 月22 日城市1 数据(测试集),手动修改当日平均温度并进行预测,特征解耦模型预测结果如表5 所示。从表中可以看出,随着平均温度均匀攀升,模型预测峰荷攀升放缓。这说明在应对高温气象时,模型可以预测峰荷攀升情况,而攀升放缓也符合前述峰荷逐渐饱和的分析。
表5 极端高温情况下特征解耦模型预测结果Table 5 Forecasting results of feature decoupling model under extreme high temperature
4 结语
本文提出了一种计及气象累积效应的特征解耦峰荷预测模型,其包含时间、气象、历史峰荷3 个输入分支,从结构上对输入特征实现解耦处理。其中,基于LSTM 网络的气象分支以历史气象数据为输入,从而保证模型在峰荷预测时能够有效计及累积效应,进而提升预测效果。
采用实际的负荷数据进行夏季峰荷预测。结果表明,相较于温度修正等常规方法,特征解耦模型取得了更佳的峰荷预测效果,而且特征解耦模型各分支的输出均具有显著的规律性,从而验证了该模型的有效性。后续工作将进一步分析研究分支输出的物理意义,从而为气象敏感负荷估算等提供依据。
附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx),扫英文摘要后二维码可以阅读网络全文。