基于改进贝叶斯深度学习的光伏功率概率预测
2022-04-14韩坤
韩坤
(中国大唐集团科学技术研究总院有限公司,北京 100040)
0 引言
作为增长最快的可再生能源之一,太阳能并网由于其可变性和不确定性给电力系统带来了巨大挑战。作为促进太阳能在电力系统中集成的有效途径,概率预测的价值在最近十年越来越得到人们的认可。虽然目前概率预测在电力系统中的使用很有限,但已经进行了大量的研究来促进概率预测的应用,并且已经提出了许多方法。
当前光伏电力系统中使用的大多数预测都是确定性的。一般而言,确定性预测或点预测仅为每个时间点提供一个单一值,并且通常无法解释与预测相关的不确定性。概率预测明确考虑了不确定性信息,这些信息通常采用概率分布的形式。根据是否使用显式参数形式,概率预测可以分为参数方法以及非参数方法。参数方法通常计算成本较低,因为在参数估计之前先对预测分布形状进行了假设。最普遍的参数化方法之一是通过预定义的预测分布将点预测转换为概率预测。如文献[3]建立了一个具有四种不同预测分布的预测分布池,选择pin⁃ball损失最小的分布作为最佳预测分布。非参数方法是无分布的,它们的预测分布是通过观察或场景推断出来的。非参数概率预测方法主要包括基于分位数回归的方法、高斯过程、模拟预测器和模拟集成方法等。其中基于分位数回归的方法和模拟预测器因其简单而更受欢迎。同时还有基于贝叶斯神经网络的概率预测方法,这种网络通过将权重用概率分布的形式表示,使模型学习数据随机特性的能力得到提升,同时也不会依赖于预先设置的参数。
本文依据光伏功率的两类输入数据特性,以不同方法对其进行预处理,将预处理结果送入贝叶斯网络,以此改进其网络结构。从仿真结果可知,本文方法有良好的光伏功率概率预测效果。
1 改进贝叶斯神经网络
1.1 贝叶斯神经网络
如图1所示,贝叶斯神经网络与传统的深度神经网络的结构是相似的,也是由输入层、隐藏层、输出层三个层次构成。但与其他类型的神经网络不同的是其具有概率层,而概率层的权值服从概率分布。
图1 贝叶斯神经网络概率层结构
在图1中,表示隐藏层的输入,为隐藏层的输出;w和b分别为第个神经元的权重和偏置,其中权重服从形式为(w|,)的概率分布。
贝叶斯神经网络所特有的概率层使网络能够表达不确定性,其在特定输入下,具备多种不同输出的可能。所以贝叶斯神经网络本身可当成无穷个子网络的融合,与融合神经网络相似。不过与一般神经网络进行简单融合不同,贝叶斯神经网络的各子网络并非彼此毫无关联,在实际的训练过程中,每一轮训练均可以做到对所有子网络进行优化。而在预测过程中,可通过在同一测试集上多次实行前向传播,让预测的最终结果来源于多个不同的子网络,所以贝叶斯深度网络模型拥有良好的正则化效果,比一般的神经网络能够更好的抑制过拟合。
1.2 网络结构改进
光伏功率受诸多因素的影响,而不同类型的因素对光伏功率的预测造成的影响程度亦不一样,复杂的输入数据特性给功率预测带来较大的困难,其中输入数据根据特性大致可以分为两类,即复杂气象因素和历史运行数据。根据两类数据本身的特点,本文从输入端对贝叶斯神经网络进行改进。
针对复杂气象因素,本文利用堆叠自动编码器(图2)良好的提取数据特征表示的能力,对复杂多维气象因素进行关键特征量提取,达到对复杂气象因素自动降维的目的,减少输入噪声,突出关键特征。
图2 自动编码器网络结构
光伏功率历史运行数据为典型的时序数据,需要时序模型来对其进行处理。本文利用1维卷积神经网络(1D CNN)对时间数据特征挖掘与提取的优势,充分提取时间序列数据的关联信息,学习光伏功率的趋势变化,1D CNN工作原理如图3所示。
图3 自动编码器网络结构
如上所述,本文通过将不同类型的输入数据先行送入合适的网络结构中进行处理,随后再将处理后的形成的特征数据喂给贝叶斯深度网络,达到改进贝叶斯深度网络的目的。
2 基于改进贝叶斯深度学习的光伏功率预测
2.1 光伏特征输入特征构建
如前文所述,本文在贝叶斯深度网络的输入前端加入堆叠自动编码器和1DCNN网络作为整个预测模型的预处理模块。其中复杂气象数据送入堆叠自动编码器进行预处理,提取复杂气象数据中与光伏功率强相关性数据,同时达到的输入降维的目的;将光伏功率历史运行数据送入1DCNN网络,提取时序数据的关联特征。同时,本文还将与当前光伏功率紧密相关的前一时刻光伏功率直接送入概率层。由此,光伏功率预测的特征输入由此三个部分构成,于概率层进行汇合连接,使贝叶斯深度网络的结构得到改进,能够更好地适应不同特性的输入数据。
2.2 概率预测评价标准
本文采用了两种常用的概率评分方法。一个是弹球(pinball)失分,可以综合表示可靠性和锐度,另一个是Winkler评分,可以表示预测区间的锐度和无条件覆盖度。
pinball失分是对任何分位数∈(0,1)的加权绝对误差度量,可表述为:
对于(1-)×100%置信水平,Winkler得分定义为
式中,U和L分别是预测区间的上界和下界,S=U-L是区间宽度。如果实际功率值落入预测区间,那么Winkler分数仅取决于预测区间宽度。否则,由于惩罚因子,分数会很高。分数越低,表示预测效果越好。
3 仿真验证
3.1 数据集
本文数据集取自澳大利亚昆士兰大学露西亚校区的平板光伏系统的昆士兰大学中心(UQCen⁃tre),该楼布置在建筑物屋顶的1806块多晶硅太阳能电池构成,装机容量为433.44 kW,如图4所示。原始数据集是2012年和2013年完整的2 a、每天24 h和1 min采样周期的数据。因为光伏功率具有间歇性的特性,所以数据集实际只提取07:00—18:00时间段内的功率数据。
图4 昆士兰大学中心(UQ Centre)光伏系统
为了平衡数据量以及数据自身特征的保留情况,本文对原1 min采样周期的原始数据进行了重采用,每15 min抽取一个数据,是时间尺度由1 min扩为15 min,最终的光伏功率数据点总数为32320(15 min)。
3.2 预测效果
为了测试本文所述网络的实际可行性和优越性,本文分别在80%和90%两种置信水平下进行了光伏功率概率预测,并在80%置信水平下,与正态分布法和持续区间预测法进行了对比验证。
(1)80%置信水平下预测情况。如图5所示。
图5 80%置信水平光伏功率概率预测
(2)90%置信水平下预测情况。如图6所示。
图6 90%置信水平光伏功率概率预测
(3)预测对比。如图7所示。
图7 不同算法风电功率预测区间对比
从图5和图6可知,基于改进贝叶斯深度网络的光伏功率概率预测与确定性功率预测相比,其可以及时响应光伏功率的波动情况,对下一预测点功率可能出现的波动给出一个范围上下限,且准确率较高。
为了验证本文方法的优越性,基于pinball指标和Winkler指标,将本文所述改进贝叶斯深度网络和正态分布法及持续区间预测法进行了对比仿真。从表1的pinball指标和Winkler指标可知,本文所提方法的预测效果更好。
表1 风电概率预测性能对比
4 结语
为克服光伏功率点预测的缺点,本文以具备概率层的贝叶斯深度网络为基础,依据数据特性,通过堆叠自动编码器和1DCNN分别对气象因素和历史运行数据进行特征提取,从而改进贝叶斯深度网络,使其具备适用不同输入特性的能力。最终以弹球(pinball)失分和Winkler评分两种概率预测评分标准为依据,与正态分布法及持续区间预测法进行对比验证可知,本文方法能更准确的响应功率波动,预测效果更好。