基于低风速功率修正和损失函数改进的超短期风电功率预测
2024-04-22臧海祥赵勇凯程礼临卫志农秦雪妮
臧海祥,赵勇凯,张 越,程礼临,卫志农,秦雪妮
(1.河海大学电气与动力工程学院,江苏省 南京市 211100;2.华能国际电力江苏能源开发有限公司清洁能源分公司,江苏省 南京市 210009)
0 引言
伴随着化石能源逐渐枯竭,在节能减排新形势下,风力发电越来越受到各国的重视[1]。然而,大规模风电场群接入后,强波动性的风电功率注入将造成局部电压波动,从而影响到电能质量及电网的安全稳定运行[2]。因此,准确的风电功率预测成为解决这一问题的重要举措。超短期风电功率预测[3]是风电功率预测的一种,其时间间隔为15 min,用于预测未来0~4 h 的风电功率,在电网实时调度与控制风电机组的高效运行方面具有重要的指导意义[4]。而进一步提升超短期风电功率的预测精度,也有助于确保风电场的稳定和经济运行。
传统的风电功率预测常采用时间序列模型,如差分自回归移动平均(autoregressive integrated moving average,ARIMA)模型[5]。但这类模型仅捕获数据间的线性关系,随着数据复杂度与预测步长的增加,模型预测值易趋于均值。因此,随后的研究普遍采用非线性模型进行预测,其中,以机器学习模型居多[6]。例如,文献[7]采用了分位数回归森林模型对短期风电功率进行预测,文献[8]则采用反向传播神经网络(back propagation neural network,BPNN)结合径向基神经网络对风电功率进行组合预测。
近年来,许多深度学习方法也被用在风电功率预测领域当中,以挖掘更深层次的数据特征。例如,文献[9]中研究者利用卷积神经网络(convolutional neural network,CNN)模型融合多维的气象信息。文献[10]建立基于注意力机制的长短期记忆(long short-term memory,LSTM)网络,对历史数据中的时序特征进行提取。文献[11]结合时间卷积网络(temporal convolutional network,TCN)与LSTM 网络构建了组合结构的超短期风电功率预测模型,来获取更高的预测精度及稳定性。
当数据集充足时,上述深度学习方法的效果较好;而当数据集较小时,由于深度学习模型的参数空间更加复杂,预测过程中往往伴随着有规律的拟合误差,这些误差常分布在极值点和限幅值附近。一些研究采用误差拟合的方法进行修正,这种方法可以有效地纠正模型的内在缺陷,但对于限幅值区域(如低风速待风段),一般的修正结构仍然难以完全补偿。
此外,神经网络模型的预测精度与所采用的损失函数和预测策略密切相关。例如,文献[12]通过多任务学习方式提出了一种新型的损失函数,进一步加强了预测结果与真实值在序列形状上的联系。但这些改进方式通常适用于长序列的预测。对于短序列预测,尤其是单步预测往往难以直接应用,也无法在短序列或单步预测训练过程中引入宏观的序列间特征,导致训练过程的波动性较大。
综上所述,为进一步提升风电功率的预测精度,本文融合自注意力机制、CNN、双向门控循环单元(bidirectional gated recurrent unit,BiGRU)等算法结构,建立了自注意力卷积神经和双向门控循环单元(self-attention convolutional neural and bidirectional gated recurrent unit,SACN-BiGRU)混合模型,从功率修正与损失函数两方面对模型进行改进,并结合中国江苏省某风电场数据进行了仿真验证。
1 低风速下功率修正
1.1 低风速功率特征
风电机组的工作效率与风速呈一定比例的线性关系。在低风速下,风机的发电效率远低于正常水平。因此,当风速小于切入风速时,风机通常处于待风状态,以减少系统损耗。此时风机的功率不会随着风速等特征的变化而变化,理论功率恒定为0。
但实际上,风速的测量数据通常采用以下采样的方式获得,并且风力发电系统具有一定的滞后性。因此,在低风速待风状态下仍可能存在较小的功率输出。尽管目前风电场所收集到的数据量足以支持神经模型的训练和预测,但在这种限幅模式的转变处可能仍存在一些风电功率预测精度不足的问题[13]。如附录A 图A1 所示,零功率点附近神经网络的预测值均存在一定的拟合误差,邻近的正常功率也受到其影响向上偏移。这些异常功率同样需要进行修正,但有别于传统的待风状态,不能简单地通过判断将预测功率置零。
如果低风速区域的比例较小,这些误差并不会对预测指标产生太大影响。然而,统计数据显示,低风速区域通常占比较高。以中国江苏省某风电场为例,其中低风速样本占比超过25%(参见附录A图A2 的风速频率分布图)。因此,在模型中添加特殊的修正结构是有必要的。通过合理控制修正的范围与大小,也能够针对性地修正特征不同的两类预测功率,从而进一步提高模型的预测精度。
1.2 功率修正结构分析
风机在低风速下限幅模式的转变给模型的修正带来了困难。针对这一问题,本文在风电功率预测的主模块之外引入了一个风速预测模块,用于修正单步预测功率。独立构建风速预测模块一方面可以适用于风速预报无法获取的情况,另一方面,与气象预报提供的风速信息不同,风速预测模块的关注点不仅在预测的精度上,同时也希望通过独立的预测结构来更为灵敏可控地捕捉到风速的变化趋势,从而去判断功率所处的状态。
模块预测的风速信息被用来判断是否需要对输出功率进行修正,然后,使用特定的函数对需要修正的功率进行缩放,使低风速段的输出功率更接近真实值。一般情况下,风速在3 m/s 左右时风机待风,考虑到修正的容错率,模型采用5 m/s 作为阈值,即当预测风速低于5 m/s 时对预测功率进行修正,具体计算过程如式(1)至式(3)所示。
式中:yt-i为第t-i时刻的实际功率为第t时刻的预测功率为修正后的预测功率;V^t为第t时刻的风速预测值;k1和k2为可调参数,本文实验中k1取3,k2取1;ε为一微小量,用于避免分母为零时程序除零报错;α1为功率系数;λ为风速系数。
式(1)使用一种类Sigmoid 函数计算缩放系数,对初始的功率预测值进行修正。缩放系数由风速系数和功率系数共同作用计算获得。其中,风速系数通过加权风速预测值得到,功率系数通过对在当前区间内实际功率的平均值取倒数后加权获得。
风速预测值越高,表示功率处于待风状态的概率越低。因此,本文将风速系数作用于指数项,以控制修正的范围,避免修正结构影响到正常功率。附录A 图A3 展示了这一结果,随着风速系数的增加,缩放系数将更快地趋近于1,修正范围也随之减小。考虑到低风速下实际功率不都为0,若当前区间内的功率均值较大,即使预测风速较低,该时刻的功率也可能不处于待风状态。因此,模型进一步使用功率系数来控制缩放的力度。如附录A 图A3 所示,在相同的风速系数下,由于功率系数作用在一次项上,其可以在几乎不改变修正范围的基础上,适当调整修正功率的大小,起到查漏补缺的作用。
k1和k2是对应系数的权重参数,表示修正结构对风速预测值和功率的信任程度。增加k1,会使范围内的功率受到更严格的修正,从而增加结构误判波及正常预测功率的风险;增加k2,会使待风状态范围的判定更严谨,但可能会忽略掉某些特征不明显的待风点功率。
2 损失函数改进
多输入多输出的预测策略可以通过共享权重的方式来学习不同输入之间的相似性和相互影响,这种共享权重的机制可以增强模型对序列之间关联性的建模能力[14]。然而,当预测序列较短,特别是进行单步预测时,由于无法提前使用未来序列,模型的训练过程往往波动性较大,难以稳定收敛。
为了引入序列间关联性而不改变模型的结构,本文考虑使用预测值向前延拓的方式来构建一种新型的预测策略。假设模型预测步长为N,输入的时间序列长度为T。模型将在单次训练中共享参数,分 别 预 测 当 前 时 间 段 的 真 实 功 率{yt+1,yt+2,…,yt+N} 与上一时间段的真实功率{yt-N+1,…,yt-1,yt},并将它们拼接作为损失函数的 输 入 ,拼 接 后 模 型 的 预 测 序 列 为{}。如图1 所示,此处模型的预测步长N为3,与传统的多输入多输出预测策略相比,扩展后损失函数输入的序列长度变为之前的2 倍,但模型的预测步长保持不变,只是利用拓展后的输出构建损失函数,以进行参数更新。由于共用一套模型参数,这些输出彼此之间具有关联性,可以提取到更长尺度的序列间特征。
图1 损失函数结构Fig.1 Structure of loss function
在传统的时间序列预测中,损失函数通常被定义为距离的累加和,如均方误差、平均绝对误差(mean absolute error,MAE)等。然而,这些点损失函数是相互独立的,重复预测等同于增加训练的批数量。为解决这个问题,模型需要使用另一种替代函数,此处称为关联函数。关联函数是一种多元非线性函数,与模型本身无关。其在运算过程中不满足对加法和标量乘法的封闭性,能够保证序列间的相互依赖关系,从而在模型训练过程中以损失函数的方式引入序列间特征。值得一提的是,由于关联函数的注入独立于模型之外,可以根据需要设计算法,具有较强的解释性。同时,由于输入特征相对于预测目标有所滞后,通过保存前馈网络的参数,该方法也不会显著增加训练计算量。
考虑到传统的损失函数通常只反映预测值与真实值之间的数值差异。因此,当时间序列数据出现陡升或陡降时,模型的预测值通常会输出一个平均的结果,针对风电功率序列则表现出较强的滞后性。对于这个问题,本文在基于不同的时间尺度构建关联函数时,使用余弦相似度来衡量采样前后预测值与真实值的相似程度,并通过加权的方式对原始的数值误差进行计算,从而得到一种新型的损失函数。该损失函数不仅考虑了数值误差,还考虑了预测值与真实值之间的斜率误差,使得模型更加关注时间序列预测结果的形状及与真实序列是否匹配的问题,从而弥补了传统点损失函数的不足之处。具体公式如下:
式中:S1和S2分别为采样前、后的余弦相似度之和,此处将时序轴看作间隔为1 的实数轴和分别为向上取整和向下取整运算符;di为第t-N+i时刻下功率的绝对误差;β为可调参数,用于控制相似度对于损失函数的影响,文中取0.5;s(1,i,α2)和s(2,i,α2)为中间变量;α2为下采样的步长;L为损失函数。
3 SACN-BiGRU 预测模型搭建
3.1 模型的预测流程
风电功率预测是指对风电场未来一段时间内输出功率的大小进行预测,属于时间序列预测的范畴。预测模型的输入是一定长度的时间序列,通过学习历史数据的特征信息对未来风电功率进行单步或多步的预测,其中,神经网络预测模型可以表示为以下形式:
对应风电功率预测模型的建立总共包括3 个阶段:数据预处理、模型训练和模型测试。数据预处理的目的是筛选和归一化数据,以提高训练的稳定性和泛化能力。同时,由于模型的网络参数θ是通过随机初始化获得的,需要使用模型训练来更新网络参数,实验中为提高训练效率,通常使用小批量梯度下降的方法。最后,固定模型的网络参数进行测试验证,以分析模型的预测性能。
3.2 神经网络算法
3.2.1 CNN
CNN 由多个卷积层、池化层和全连接层组成,是一种具有多通道输入能力的网络结构。它利用局部感受野、权值共享和空间下采样技术,来减少参数数量和计算复杂度,提高泛化能力[15]。考虑到风电功率输入特征的多样性与复杂性,本文模型选择这种结构对风电数据的多维特征进行提取,以缓解模型的拟合压力。
卷积层是卷积结构的核心组成部分,使用一组可学习的卷积核对输入数据进行卷积操作。对于二维数据的卷积操作,请参见附录A 图A4。图中的卷积核相当于滤波器,对当前一定范围内的数据窗口进行内积操作。当滤波器从数据中心滑动时,类似的步骤将会重复发生,从而将二维数据映射到二维的特征图谱。同时,池化层则对卷积层的输出进行下采样,以降低特征图的空间尺度,并保留最显著的特征。
3.2.2 自注意力机制
自注意力机制是指神经网络具有将注意力集中到一部分输入(或特征)的能力,用于解决深度学习模型在处理长序列数据时的困难。现有的风电功率预测研究中往往将其搭配Transformer 架构使用[16],本文使用CNN 与自注意力机制相结合,以提高特征的捕获能力。如附录A 图A5 所示,自注意力机制采用查询-键-值(Q-K-V)架构,3 种向量均通过输入映射获得,并依据重要系数进行加权累加,若采用多头注意力机制则会将原始的输入序列分为多组进行处理,在最后进行合并以增强特征表达的性能。同时,由于自注意力机制并行计算的特点,为保持序列的顺序信息,通常需要在输入中添加相应的位置编码。相应公式如式(12)至式(18)所示。
式中:X为输入数据;WQ、WK、WV分别为对应张量的权重矩阵;dK为K的维度大小;A为注意力机制的输出向量,形式上表现为隐藏编码,其同时包含数据全局与局部的关系[17];P(·)为位置编码;xi为输入数据;l为编码数据对应的时序位置;dmodel为编码的维度;k为0~0.5dmodel-1 之间的整数值;Softmax(·)为归一化激活函数,用于分配权重。
3.2.3 BiGRU
门控制循环单元(gate recurrent unit,GRU)是LSTM 网络的一种变体结构。相比于LSTM,GRU同样能够捕获时间序列中的长期关联性,且在大多数情况下能够达到相似的效果。然而与LSTM 相比,GRU 的结构更加简单,训练效率更高,一些小数据集的研究结果甚至显示GRU 的效果略高于LSTM。因此,本文采用GRU 结构作为模型的主体部位,以取代风电功率预测研究中常用的LSTM[18]。
GRU 单元的具体结构见附录A 图A6,其主要包括两个门控机制,从左到右分别为重置门、更新门,GRU 单元通过重置门权重rj控制重置门控,通过更新门权重zj来控制更新门控。而单层的BiGRU 由两层GRU 组合而成,分别从正向与反向处理序列,并将隐藏神经元的隐藏向量拼接作为最终的输出结果。研究表明,相较于GRU,BiGRU 通常能够更好地把握全局的时序信息,使模型获得更好的预测性能[19]。
GRU 单元的计算过程如式(19)至式(22)所示。
式中:hj-1为上一隐藏节点输出;hj为当前隐藏节点输出;xj为当前的输入数据;为选择的记忆数据;σ表示sigmoid 函数变化;Wz、Wr、Wh和Uz、Ur、Uh分别为各部分的输入权重矩阵和隐藏状态权重矩阵;bz、br、bh为各部分的偏置矩阵。
3.3 模型的网络结构
风电功率序列的特征相关性较强,因此使用多特征进行训练的超短期风电功率预测模型通常比使用单特征的效果更好[20]。而卷积与自注意力机制作为两种强大的表征学习方法,它们之间存在着很强的潜在关系[21]。因此,本文考虑将二者结合用于提取多尺度的风电功率信息。
首先,模型将通过卷积对输入特征进行映射,得到对应的特征图谱,随后使用自注意力层对中间特征进行再聚合。在这个过程中,自注意力层会给特征区域分配不同的注意力权值,而BiGRU 层则通过强化后的特征信息来重新建立序列的时序关联,以此获取更精准的预测效果。为提高拟合效果,本文使用残差连接[22]与正则化等辅助优化手段,同时为了在自注意力层后保持数据的时序特征,模型将在输入端叠加位置编码,详细的单步预测模型结构如图2 所示。
图2 SACN-BiGRU 模型结构Fig.2 Model structure of SACN-BiGRU
图中:xi,j为特征数量为m的时间序列输入数据;风速预测模块的输入数据为风速相关特征,其形式与功率特征相同。考虑到预测风速的区域通常波动较大,对趋势预测的准确度要求更高,本文采用单独的风速预测模块进行拟合。在总体框架上,模型首先使用输入的功率特征获取初始的风电功率预测值,然后使用风速预测模型的预测结果对功率进行修正,以获得最终的修正预测结果。
4 算例分析
4.1 实验数据集及实验配置
本文所使用的数据集采集自中国江苏省某风电场2017 年1 月至3 月一个季度的实测数据。数据集包括风电功率和当地的相关气象数据,采样间隔为15 min,数据的具体信息如表1 所示。
表1 江苏省风电数据说明Table 1 Description of wind power data
实验的计算平台配置为Windows 10 操作系统,硬件使用Intel Core i7-9750H 和RTX 2060 6 GB。为了构建所提出的预测模型,本文选用Python 语言下的Pytorch 框架进行编程实现。
4.2 数据预处理
风电功率数据集中不仅包含风电功率,通常还会提供多维的气象信息,包括风速、风向、温度和气压等。过多的输入特征将导致模型训练过程难以拟合。为此,本文通过式(23)至式(25)使用皮尔逊相关系数(Pearson correlation coefficient,PCC)与最大互信息系数(maximal information coefficient,MIC)法来筛选特征[23],结果记录于表2。
表2 相关性分析结果Table 2 Results of correlation analysis
式中:a和b表示两类样本变量;n为样本的总数;aˉ和为两类样本的均值;FPCC为样本间PCC 系数,p(a,b)为样本变量间的联合概率;I(a,b)为互信息;FMIC为样本间MIC;n1和n2为网格分布个数;B的大小取数据量的0.6 次方。
根据相关性结果分析,本文考虑将具有最高相关性的风速和历史功率数据作为模型的输入特征。同时,由于各种特征间单位不统一,为确保模型能够快速收敛,本文也对原始数据进行了归一化处理。归一化公式如式(26)所示。
式中:xi,feature为某一类特征第i个数据;为对应归一化后的结果。
4.3 仿真结果分析
4.3.1 模型对比实验
预处理后的数据特征包括风电功率、风速(50 m 测风塔处)和风速(70 m 测风塔处),实验数据集按照8∶2 比例划分为训练集和测试集输入模型中。实验过程采用固定随机种子,学习率取0.001,运行5 次取平均值。
对比模型选取了经典的预测模型随机森林(random forest,RF)模型、时序预测应用较为广泛的CNN-LSTM 混合模型及其子模型CNN 模型与LSTM 模型。嵌入维度与网络层数为已知的经验参数,RF 模型参数通过简单寻优获得。为获取其他的模型参数,本文首先对预测的基础参数执行网格搜索,其中,批数量Nbatch={80,100,120}、时间步长Lseq={8,16,32}。固定基础参数后对模型网络参数进行网格搜索,其中,注意力头数Nheads={2,4}、卷积通道的数量Nchannels={8,16,64}、隐藏层神经元数量Nhidden={64,128,256}。实验中相同网络的参数设置完全相同,最终模型参数见附录A 表A1。
预测指标方面,本文采用MAE 指标eMAE、均方根误差(root mean square error,RMSE)指标eRMSE和决定系数R2这3 个指标对预测的准确性进行评价。计算公式如式(27)至式(29)所示,单步预测结果见表3。
表3 多种模型单步预测结果对比Table 3 Comparison of single-step prediction results of various models
式中:Yi和分别为第i个测试样本的真实值和预测值;Ntest为测试样本总数。
对比表3 中的预测指标可以发现,几种预测模型的各项指标上存在明显差异。其中,本文提出的SACN-BiGRU 组合模型在各项误差指标上较对比模型均表现出较大提升。以平均eMAE指标为例,SACN-BiGRU 组合模型的预测误差为1.16 MW,相比于平均eMAE指标第二好的CNN-LSTM 模型降低了5.2%,相比于LSTM 模型降低了9.9%。其他指标也有一定的改善,具体降低或提升的比例如下:eRMSE指标分别降低6.4%、14.4%、2.8%、4.5%,R2指标分别提升了1.9%、4.2%、0.4%、0.8%。
图3 绘制了不同模型预测结果曲线,更直观地展示了所提方法的预测效果。通过比较图3 可以看出,尽管风电功率波动性较大,但本文提出的SACN-BiGRU 模型的预测结果与真实值紧密贴合,并且在相对平稳的区间内能够持续精确的拟合。这是因为模型采用了自注意力机制和CNN 相结合的方法,能够在复杂的时间序列中找到可靠的时间依赖。此外,模型在功率波动的转折处也并未出现类似其他模型所出现的剧烈变化,表明模型具有更好的拟合效果和稳定性。
图3 不同模型预测结果Fig.3 Prediction results of different models
4.3.2 风电爬坡事件预测结果验证
风电功率爬坡事件是指风电场的风电功率输出在短时间间隔内发生剧烈的波动,其严重威胁了电力系统的供需平衡和安全调度,同时也是超短期风电功率预测的难点[24]。为验证所提方法对于风电突变点预测的有效性,本文从数据中筛选出风电功率爬坡事件,进而对这些爬坡部分功率的预测效果进行单独验证,记录于表4。其中,风电爬坡事件检测方法采用了基于趋势特征[25]的旋转门算法(具体筛选流程请参见附录B,部分筛选结果请参见附录B 图B1)。
表4 风电爬坡段预测结果对比Table 4 Comparison of ramp-up prediction results of wind power
对比表4 中的预测指标可以看出,各模型对于风电功率爬坡事件(功率突变点)的预测精度要低于整体预测精度。但本文所提的SACN-BiGRU 模型仍然在指标表现中占优,其中,eMAE预测指标分别降低10.4%、15.9%、3.4%、5.7%,精度明显提高。eRMSE指标和R2指标同样位居前列。附录B 图B2 展示了部分爬坡采样点的预测曲线,对比图B2 中多个模型的预测曲线可以看出,本文所提模型对于大多数突变点的预测误差均低于其他对比模型,表现出了较好的预测稳定性。同时,为避免基于平均值概念的评价指标掩盖关键点的预测效果,本文还引入了误差分布曲线作为评价指标。不同模型的预测误差分布曲线如附录B 图B3 所示。由图B3 可以看出,本文所提模型在功率突变点上的预测误差在0 值附近分布最为集中,其分布曲线相比于其他模型的分布曲线也更窄,这也表明本文所提模型的总体误差更小,预测效果更好。因此,本文所提方法同样适用于功率陡升陡降的突变情况,可以进一步提升对于风电功率爬坡事件的预测精度。
4.3.3 损失函数实验
为了验证新损失函数在多步预测中的有效性,本文同时进行了不同尺度的多步预测实验。实验过程中同样使用固定的随机种子,实验7 次取平均值。实验结果记录于表5 和表6。
表5 多步预测结果的MAE 指标对比Table 5 Comparison of MAE indices for multi-step predictions
表6 多步预测结果的RMSE 指标对比Table 6 Comparison of RMSE indices for multi-step predictions
从表5 和表6 可以看出,在进行不同时间尺度下的多步预测时,新的损失函数都能够有效地改善各类误差指标。特别是在1 h 预测中,平均eMAE指标相比传统的MAE 和均方误差(MSE)损失函数分别降低了5.4%、8.6%,平均eRMSE指标分别降低了3.0%、3.4%。多输出预测策略本身就能够捕获序列间的关联,但实际上对于不同的预测步长,模型对局部信息和全局信息权重的需求也不同。因此,通过使用新损失函数进行相应调整后,数据的拟合效果仍然可以得到不同程度的提升。
4.3.4 模型消融实验
为了验证SACN-BiGRU 模型各模块的有效性,本文进行了消融实验,逐一移除模型方法。其中,SACN-BiGRU1不使用新的损失函数,SACNBiGRU2不使用新的损失函数且移除了低风速修正结构,消融实验结果如表7 所示。由表7 可知,使用新的损失函数和风速修正结构在平均eMAE指标上均降低了1%,相比于基础的BiGRU 模型,增添SACN模块后,平均eMAE、eRMSE指标分别降低了7%和3%。
表7 SACN-BiGRU 模型的消融实验结果Table 7 Ablation experimental results of SACNBiGRU model
附录B 表B1 展示了不同类型模型的修正结果。由表B1 可知,本文提出的修正方法对RF、ARIMA模型等非神经网络模型也均有提升,并不只是针对神经网络模型,但由于神经网络模型对比其他预测模型已经取得了较大的提升,本文希望能够在此基础上,通过弥补模型在该情况下的缺陷来进一步提高风电功率的预测精度。图4 展示了低风速修正结构的测试效果,可以观察到修正结构很好地适应了低风速下的各种情况。在待风状态下,功率被完全下拉到0;而在其他状态下,功率则适当地被缩小,从而实现对真实功率的精确拟合。
图4 功率修正对比Fig.4 Comparison of power correction
5 结语
本文提出一种基于低风速功率修正和损失函数改进的超短期风电功率预测模型。实验结果表明,相对于CNN、LSTM、CNN-LSTM,所提预测模型的预测指标eMAE、eRMSE分别下降了5%~24%、3%~14%,有效地提高了预测准确率。并得出以下结论:
1)将CNN、自注意力机制、BiGRU 网络结合可以有效适应输入特征,稳定地捕获时间序列的长期依赖关系;
2)通过引入低风速下功率修正能够有效地弥补模型拟合的不足,进一步提高预测精度;
3)使用新型的损失函数可以在短序列预测及单步预测中提取到时间序列的序列间特征,使模型的训练更稳定,且随着预测步长的改变,依旧有着一定的优势。
本文提出的预测方法在超短期预测方面具有较好的预测效果,但并未考虑到不同季度、地区差异之间的影响,且在预测尺度上更偏向于单步预测。而如何针对性地提取时序特征应用于长序列预测,进一步提升预测精度,在未来也有着重要的研究意义。
附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx),扫英文摘要后二维码可以阅读网络全文。