APP下载

含有梯度惩罚的WGAN光伏功率场景生成方法

2022-12-15胡石峰朱瑞金

电力系统及其自动化学报 2022年11期
关键词:出力梯度神经网络

胡石峰,朱瑞金,唐 波

(西藏农牧学院电气工程学院,林芝 860000)

随着清洁能源的不断开发并网,光伏电源渗透率日益增高,而光伏能源出力的波动性和间歇性也随之给电力系统的规划和运行带来了全新挑战[1],因此,如何准确地对光伏功率不确定性进行建模是应对这些挑战的关键。场景分析法是对可再生能源出力不确定性进行建模的主要方法之一[2],该方法通过生成符合光伏出力特征的时间序列场景来表征光伏输出功率,能够将问题转换为确定性优化问题再进行求解[3]。通过使用场景分析法,调度运行人员能够更加精准地做出考虑不确定性的决策,例如随机优化调度、机组组合等[4-5],并且能得到更加稳定的优化方案[6]。

已有研究主要采用基于模型的方法,通过构建概率分布模型并从中采样得到场景。文献[7-8]利用Copula函数对风电场的不确定出力进行建模后通过蒙特卡洛抽样得到场景;文献[9-10]采用Wasserstein距离作为指标构建与可再生能源概率分布近似的场景模型,从而生成渐进最优场景;文献[11]提出了一种矩匹配(moment matching)技术用于生成满足指定统计属性的有限数量场景;文献[12]基于大气动力方程和风速降尺度方程得到风速的联合分布,再采用蒙特卡洛生成场景。然而,基于模型的方法很难捕捉到可再生能源发电的多样性,并且这类方法通常依赖统计假设,这使得在实践中很难获得机组变化的动态特性。

随着人工智能技术的深入研究及其与电力行业的结合,基于机器学习的方法如人工神经网络[13]、变分自动编码器[14]和生成对抗网络GAN(generative adversarial networks)[15]等,也被用于可再生能源场景的生成。文献[16]提出了一种基于Wasserstein距离的生成对抗网络方法WGAN(Wasserstein GANs),可生成具有时空相关性的风电、光伏机组出力场景;文献[17]将贝叶斯公式引入生成对抗网络,能够产生不同均值和方差的可再生能源场景簇;文献[18]采用深度卷积生成对抗网络,以詹森-香农JS(Jensen-Shannon)散度作为目标函数生成负荷场景;文献[19]提出生成矩匹配网络,将最大平均差异作为生成器的损失函数,用于可再生能源场景生成;文献[20]提出了一种结合长短时记忆网络的序列生成对抗网络,用于捕获复杂天气特征的风电时序场景;文献[21]将生成对抗网络生成的风、光和负荷场景应用于虚拟电厂的优化调度问题中。与基于模型的方法相比,这些人工智能方法可以潜在地捕捉可再生能源的高维和非线性特征。但是,以上方法仍然存在生成场景质量低,模型泛化能力差等问题,并且训练时收敛难和收敛慢等问题依旧未能解决。

为克服上述问题,本文引入了梯度惩罚GP(gradient penalty)项对传统生成对抗网络方法进行改进。梯度惩罚技术提高了判别器网络的Lipschitz连续性和梯度信息质量,能够对权重系数进行自适应修正,从而起到改善现有生成对抗网络方法收敛难和收敛慢的作用。实验研究证明,本文所提方法能够生成多样性的高质量光伏功率场景,并且具有良好的泛化能力。通过对比实验可知,使用梯度惩罚的WGAN在收敛速度和性能指标上均优于其他先进方法。

1 改进的生成对抗网络模型

1.1 传统生成对抗网络

GAN是Goodfellow提出的一种强大的无监督生成式模型[22]。生成对抗网络基本结构如图1所示,该结构受博弈论中“零和博弈”的启发演化而来,包含生成器和判别器两个深度神经网络。其中,生成器用于捕捉实际样本数据的分布规律,并依照规律生成新的数据样本;判别器为二分类器,用于数据的辨别,即判断输入数据来源于真实数据还是生成器的生成数据。在模型训练过程中,生成器与判别器之间形成一个动态的“博弈”过程,最终实现纳什均衡,即生成器的生成样本与真实样本数据的分布极为相近,判别器难以识别样本的来源,对于输入的样本判断为真或假的概率都基本接近1/2。

图1 生成对抗网络基本结构Fig.1 Basic structure of GANs

为了便于分析,本文令x作为光伏历史出力数据,其分布用Pdata表示,该分布是一个未知的、难以建模的分布。假设随机噪声变量z是从某个已知分布PZ(如高斯分布)中采样得到的。为了使GAN能进行博弈训练,分别定义生成器G(·;θg)和判别器函数D(·;θd),θg和θd分别是两个神经网络的权重。方便起见,本文有时会省略θ。

在训练过程中,将一批噪声z~PZ送到生成器之中,输出的生成样本为G(z;θg)~Pg。同时,来自真实数据x或生成数据G(z;θg)的一批样本被送到判别器,该判别器目标是识别数据来自何处。根据不同的数据源,判别器的输出可以表示为

式中:preal为判别器对真实样本的判别概率;pfake为判别器对生成样本的判别概率。

在明确了生成器和判别器的目标之后需要分别定义一个损失函数来更新它们的神经网络。对于给定的判别器,生成器希望增大判别器对G(z)的概率输出pfake,因为较大的判别器输出意味着样本更加真实。对于给定的生成器,判别器则要在最小化pfake的同时寻求preal的最大化。因此,这两个神经网络的损失函数可以分别定义为

式中:LG与LD分别为生成器和判别器的损失函数;E为样本的期望值。在生成器和判别器之间建立一个博弈关系,使两个网络可以同时训练,其博弈模型目标函数可以表示为

式中,VGANs(G,D)为对抗网络的价值函数。

1.2 改进的生成对抗网络WGAN-GP

传统GAN的目标函数可等价于求解真实样本数据分布Pdata和生成样本分布Pg的JS散度。然而,因Pdata和Pg均为高维空间中的低维流形,它们之间的重叠约可忽略不计,JS散度为一常数。这将导致判别器无法准确衡量样本分布之间的距离,在训练中会出现梯度消失使网络训练困难的问题,从而影响生成场景的准确性[23]。

本文提出的WGAN-GP光伏场景生成方法采用Wasserstein距离直接衡量Pdata和Pg的分布特性差异,其计算方法为

式中,W(Pdata,Pg)两个分布的Wasserstein距离。就模型训练而言,这种方法可以处理因JS散度而引起的训练不稳定的问题。此外,引入该梯度惩罚项能够增强模型的Lipschitz连续性并且提高模型收敛速度。其中,梯度惩罚项可用公式描述为

式中,x̂=tx+(1-t)G(z),t~U[0,1]。

据式(6)和式(3),判别器的损失函数[24]可改写为

式中,λ为梯度惩罚系数。

采用WGAN-GP能够缓解梯度消失的问题并能自适应的进行权重修正,提升判别器回传的梯度信息质量,从而使所提方法在训练过程中更加稳定,提高模型的收敛能力和收敛速度,在保证样本多样性的基础上生成更高质量的样本,并提高了模型的泛化能力,有效缓解了过拟合问题。

2 基于WGAN-GP的光伏场景生成

2.1 数据集说明

本文采用美国可再生能源实验室的实际数据集进行仿真和分析。以华盛顿州某光伏发电站3年的出力曲线作为数据集,功率曲线的时间分辨率为5 min,每天包括288个采样点。本文模型的训练集取随机选择的80%的采样点作为输入样本,其余的20%作为测试集。所提方法采用PyTorch深度学习框架,计算机硬件配置为 Intel(R)Core(TM)i9-10900K CPU@3.70GHz,GPU为RTX3090。

2.2 模型结构与参数设置

本文针对光伏出力的特点设计了WGAN-GP的两个神经网络结构,分别如图2和图3所示。图2为判别器的神经网络结构,包括3个卷积神经网络和1个全连接神经网络,其中卷积层用于提取光伏出力曲线的动态特征信息,而全连接层则用于判别概率。图3展示了生成器的网络结构,包括1个全连接层和3个反卷积层,其中全连接层从随机噪声中采样,反卷积层则通过学习真实分布重构光伏场景。卷积层和反卷积层均采用步长为2、大小为3×3的卷积核进行卷积计算,能够提高网络的表达能力,充分提取光伏出力特征。神经网络中神经元的所有权重值均由中心正态分布初始化得到,标准差取0.02。除输出层外,以整流线性单元ReLU(rectified linear unit)函数作为生成器的激活函数,以带泄露的整流线性单元(leaky-ReLU)函数作为判别器的激活函数。

图2 判别器神经网络结构Fig.2 Neural network architecture of discriminator

图3 生成器神经网络结构Fig.3 Neural network architecture of generator

3.3 训练流程

将WAN-GP应用于光伏出力场景生成,其训练流程大致如下。

步骤1将历史样本进行归一化处理,并将每576个采样点的光伏出力时序数据重塑为24×24的矩阵。

步骤2分别从Pdata和PZ中进行小批量采样获得真实样本x和随机噪声z,并将噪声送入生成器生成样本。

步骤3将生成样本和真实样本数据x送入判别器。计算带有梯度惩罚的判别器损失函数,并采用Adam优化算法更新判别器网络的权重。重复ncritic次步骤2和步骤3。

步骤4计算生成器损失函数然后利用Adam优化算法对网络权重进行更新,若训练还未结束,返回步骤2,进行下一轮训练。

步骤5达到设定的训练次数,则训练结束,提取WGAN-GP中的生成器模型。

在本文的实验中,参考文献[16,24]中让生成器与判别器交替训练来提高模型的综合性能,设定判别器与生成器的训练次数之比为5∶1,即ncritic=5。更加详细的伪代码见算法1。

算法1:基于WGAN-GP的光伏场景生成Require:学习率α;梯度惩罚系数λ,小批量大小m,Adam优化器超参数 β1,β2;Epoch设定为WRequire:初始化生成器和判别器的权重参数θg、θd1:for w=1,2,…,Wdo 2:for t=1,2,…,ncriticdo 3:for i=1,2,…,mdo 4:采样得到真实数据x~Pdata,随机噪声 z~PZ以及一个随机数ε~U[0,1]5:x͂← G(z)6:x̂← εx+(1- ε)x͂ 7:L(i) ← D(x͂)-D(x)+ λ(||∇x̂D(x̂)||2-1)2 8:end for 9:θd←Adam(∇ωL(i),θd,α,β1,β2)10:end for 11:从噪声分布中采样的到{}m1 m∑i=1 z(i)m~PZ12:θg←Adam(∇θ i=1 m-D(G(z)),θg,α,β1,β2)13:end for 1 m∑i=1

3 算例分析

3.1 光伏时序场景生成

本文使用历史数据训练WGAN-GP模型验证其能高效地学习到光伏出力特征并精确地构建机组的不确定性场景。训练集的训练进程如图4和图5所示,本文设定训练次数Epoch为300,其中一个Epoch表示所有训练样本经过神经网络前后各传递一次。

图4 判别器损失值随训练过程的变化Fig.4 Changes in loss values of discriminator with training

图5 判别器对样本的输出Fig.5 Output from the discriminator on samples

图4展示了随着训练进行真实数据分布和生成样本分布之间的距离变化。由图可以看出,训练初期判别器损失值为7.69,当训练到第8个Epoch时,损失值迅速下降,此后逐渐收敛至0,意味着真实样本分布和生成样本分布之间重合度逐渐变大,两样本分布的距离减小,此时WGAN-GP收敛。

图5表示判别器对输入样本的判别概率,由图可以看出,同样在训练初期判别器对于样本的输出有较大差异,很容易区分出输入样本的来源。当训练次数达到30次Epoch时,判别器对输入样本的概率均趋近于0.5,此时模型达到纳什均衡状态,说明生成样本已逼近真实的历史数据。

训练完成后,使用WGAN-GP随机生成时间长度为3 d的场景样本,并与测试集的真实样本进行比较,其中测试集样本如前所述没有用于模型的训练。为了证明所提WGAN-GP方法的优越性,本文将WGAN-GP与其他2种先进的场景生成方法WGAN和GAN进行对比,对比结果如图6所示。由图可知,采用WGAN-GP生成的场景能够很好地捕捉光伏发电模式变化的多样性,例如大峰值、日夜变化等。与测试集的对比可以说明本文所提方法不是单纯的模仿历史数据,而是精确捕捉了真实光伏出力的特性,具有很强的泛化能力。此外由上述3种场景生成方法的生成场景曲线可以看出,WGAN生成的场景在黑夜时间段精度明显降低,而GAN生成的场景与真实场景差距较大,本文所提方法则没有上述问题,场景生成曲线与真实样本拟合度较高,因此本文所提方法在生成时序场景方面优于其他方法。

图6 由3种方法生成的光伏出力场景及真实场景Fig.6 PV output scenarios generated by three methods and real scenario

本文进一步分析了3种方法生成样本与真实样本数据的时间序列特性,分别计算它们的自相关系数R(τ),即

式中:S为随机时间序列;μ和σ分别为该序列的均值与方差。自相关系数R(τ)能够描述一组时间序列前后数据的相关关系。利用R(τ)可以从不同维度分析时间序列的数据特性,从而评价生成样本的质量。从图7所示的由3种方法生成的光伏出力相关性系数可以看出,WGAN-GP方法生成样本的自相关系数曲线与真实样本的自相关系数曲线基本重合,可以说明WGAN-GP生成的场景与历史数据具有十分相似的时间相关性,能够代表光伏电站的实际运行情況,且所提方法在时序特性上优于WGAN和GAN方法。

图7 由3种方法生成的光伏出力的相关性系数Fig.7 Correlation coefficients of PV output generated by three methods

除了比较单个时间序列的随机场景,本文通过核密度估计方法计算测试集历史样本和不同方法生成场景的累积分布函数CDF(cumulative distribution function),验证本文所提方法生成的场景能够还原光伏功率的长期统计特性。

对于任一实数x,其核密度估计的概率密度函数计算公式为

式中:xi为来自未知分布的随机样本;n为样本大小;K(·)为核平滑函数;h为带宽。进一步计算CDF,有

生成样本与真实样本的累计分布函数计算结果如图8所示。从图中可以看出WGAN-GP生成场景和真实历史样本的CDF几乎相互重叠,表明生成的样本不仅能学习历史数据的出力特征,还能学习到正确的统计分布规律,所提方法具有捕捉正确边际分布的能力。通过与其他方法的对比可知,本文所提生成场景方法在长时间统计规律上明显优于WGAN和GAN方法。

图8 生成样本与真实样本的累计分布函数Fig.8 Cumulative distribution functions of generated and real samples

3.2 不同方法的收敛性对比

为了进一步证明所提方法在收敛性上优于WGAN和GAN,本文采用在深度学习领域广泛使用的Fréchet起始距离FID(Fréchet inception distance)和最大平均差异MMD(maximum mean discrepancy)作为评价指标评价生成数据的优劣[25]。

FID可表示为

式中:μg和μdata分别为生成场景与真实场景的均值;Σg和Σdata分别为协方差矩阵;Tr为矩阵的迹。FID数值越小说明两者的均值和协方差越接近,模型的性能越好,生成数据的质量越高。

MMD是在希尔伯特空间对真实数据和生成数据差异的一种度量,可以衡量两个分布的相似性。MMD距离越小,表示Pg与Pdata越接近,生成的场景越逼近真实场景。MMD距离可表示为

式中,K为核函数。

3种方法的FID对比如图9所示。由图9可以看出,WGAN-GP在Epoch为20之前FID下降速度极快,达到稳定后其值始终低于GAN和WGAN,最终收敛结果比原始GAN和WGAN分别小60%和34%。在图10所示3种方法的MMD对比指标中,WGANGP训练结束后MMD指标仅为GAN的31%,显著低于GAN,同时也低于WGAN。综上,通过对FID和MMD的分析可知,本文所提出的WGAN-GP光伏场景生成方法能够生成逼近真实数据流形的光伏出力场景,且收敛速度优于GAN和WGAN方法。

图9 3种方法的FID对比Fig.9 Comparison of FID among three methods

图10 3种方法的MMD对比Fig.10 Comparison of MMD among three methods

4 结论

本文提出了一种基于WGAN-GP的光伏功率随机场景生成方法。该方法是一种数据驱动方法,不需要任何关于概率分布的假设,也不依赖任何采样技术,可以为光伏等清洁能源出力的不确定性建模提供新的理论指导。本文的主要结论如下。

(1)本文引入梯度惩罚项以改进WGAN,提高了模型的训练稳定性,克服了现有方法存在的收敛难和收敛慢的问题。

(2)实验结果表明WGAN-GP能够学习历史数据的分布规律,生成高质量的光伏出力场景。在与测试集的对比中,生成的场景不论在时间序列特性还是统计特性上都表现优异,证明该模型具有良好的泛化能力。

(3)通过与其他先进方法的对比可以看出,WGAN-GP在时序特性和统计特性上优于WGAN和GAN方法,对于FID和MMD指标上的提升均超过30%,收敛速度最快,明显优于现有生成对抗网络方法。

致谢:

本文得到西藏自治区自然科学基金的资助,谨此致谢。

猜你喜欢

出力梯度神经网络
一个改进的WYL型三项共轭梯度法
一种自适应Dai-Liao共轭梯度法
神经网络抑制无线通信干扰探究
一类扭积形式的梯度近Ricci孤立子
风电场有功出力的EEMD特性分析
基于神经网络的拉矫机控制模型建立
要争做出力出彩的党员干部
复数神经网络在基于WiFi的室内LBS应用
风电场群出力的汇聚效应分析
基于支持向量机回归和RBF神经网络的PID整定