考虑风-光-荷不确定性的数据驱动型机组组合模型
2022-02-26石立宝翟放
石立宝,翟放
(清华大学深圳国际研究生院电力系统国家重点实验室深圳研究室,广东深圳 518055)
0 引言
相较于经济调度问题,机组组合(UC)问题在电力系统发电计划编制中应用更加广泛。UC 问题包含机组启停优化和经济调度2 个基本问题,综合考虑了机组启停成本、机组启停时间约束、爬坡约束乃至网络安全约束。由于存在时间和空间上的双重优化,UC 问题的优化难度相对较大,是电网优化调度领域研究的重点问题之一。UC 中不确定性的来源有风电和光伏出力、机组和线路故障、电价和负荷波动,不确定性UC 问题的主要建模方法分成2大类,即随机优化的UC(SUC)和鲁棒优化的UC(RUC)。其中,基于概率方法的SUC 模型常利用蒙特卡罗法生成相应的不确定性场景,有研究基于风电概率分布生成风电场景[1-2],还有研究则从负荷预测误差服从正态分布出发建立了负荷不确定性的场景[3]。随机优化可提供一个相对准确的优化结果,但场景数量和求解精度需要进行一定的平衡。除此之外,SUC 模型很容易忽视极端场景对调度的影响,而且基于概率方法建模所要求的信息量很大,不利于多种不确定性的分析。
随着电网量测技术的进步和可再生能源穿透率的提高,电网调度侧积累了大量发电和负荷数据,针对电力大数据的应用研究已比较广泛[4-6],特别是针对数据驱动下UC 问题的研究方法已有许多新的进展[7-10]。这些数据驱动下的UC 问题优化模型可以分成数据驱动下的SUC 模型、数据驱动下的RUC 模型以及分布式鲁棒优化模型。相较于传统的随机优化模型,数据驱动的SUC 模型能够基于不确定量的预测结果以及实测数据构造更为准确的数学模型,从而提高随机优化方法的准确性,进而增强调度方案的实用性。已有学者对如何利用数据驱动方法构造更准确的概率分布模型进行了细致的研究。其中,数据驱动的SUC 模型多通过采用非参数模型、随机过程模型或人工智能方法生成场景来描述随机量。数据驱动下的SUC 模型相较于传统SUC 模型,虽然一定程度上提高了结果的安全性和经济性,但仍存在实用性低、求解复杂等问题。
本文提出了一种数据驱动下的两阶段机组组合模型。首先,采用非参数狄利克雷过程高斯混合模型(DPGMM)对风、光、荷等数据的概率分布进行拟合,并考虑随机量之间的相关性,使用变分贝叶斯推断(VBI)方法对该模型进行参数估计和采样;接下来,建立数据驱动下的两阶段机组组合模型,在场景法的基础上采用传统数学优化方法并结合商业求解器对该模型进行求解;最后,将所构建的优化模型在IEEE-30 节点算例系统上进行仿真验证分析。
1 数据驱动下风-光-荷不确定性建模
1.1 非参数狄利克雷过程高斯混合模型
随机过程可以简单地理解为随机分布的分布。换句话说,从狄利克雷过程(DP)中每次抽取的样本是一个分布,而不是一个随机向量[11]。作为一种随机过程,狄利克雷过程在贝叶斯推断中有着广泛的应用,通常用来描述随机变量分布的先验知识,即随机变量按照一个或另一个特定分布来分布的可能性有多大。它被称为狄利克雷过程则是因为边缘分布为狄利克雷分布。DPGMM 是一个基于断棒过程表达的DP 非参数贝叶斯模型,它可以提供无穷多个组成成分来分析变量的概率分布。给定一个D维的随机变量x=[x1,x2,…,xD],其联合概率密度分布(PDF)为[12]
传统高斯混合模型(GMM)中高斯成分的个数对模型的整体表现影响很大,实际应用中靠观察数据集后由人为指定,成分个数设置不合理,模型的表现会显著下降。DPGMM 中高斯成分的个数不再依赖于人为指定,而是直接从真实数据中学习得到,相较于GMM 具有很大优势。在考虑不确定性因素的相关性方面,DPGMM 同GMM 一样依赖于协方差矩阵对相关性进行刻画。由于具备自我学习的能力,当概率分布模型与设定的Copula 函数形状差距较大时,DPGMM 对变量拟合的表现将超过Copula函数。
(2)循环开始,令φ(q)为潜在变量W和数据集X真实的后验分布和基于VBI 方法近似的变分分布φ(q) 的Kullback-Leibler(KL)散度,即φ(q) =Εq(W)[lnp(W,X)]-Εq(W)[lnq(W)](式中:E表示期望运算)。如果φ(q)未收敛,则转到步骤(3),否则转到步骤(5)。
(5)循环结束,返回最优的q*(W)。
1.2 数据驱动下的两阶段UC模型
1.2.1 目标函数通过对数据驱动下风-光-荷的不确定性建模和抽样,可以得到风电、光伏和负荷的出力场景。因此,本节建立了一个数据驱动下的两阶段UC 模型,其中第1 阶段先优化机组的启停计划,第2 阶段优化机组的出力。因此,目标函数表达为
相较于机组出力,机组的启停需要在第1 阶段进行优化,到了第2 阶段再针对不同场景优化机组的出力,而总成本函数则由启停成本和期望成本构成。基于S个风-光-荷出力场景,期望成本表达为
需要说明的是,第2 阶段各机组出力优化结果与不同场景相关联,最终总成本为期望成本,因此,不同于确定性的机组组合模型,这里无法给出针对第1阶段得到的处于开启状态机组所对应时刻的具体出力值。
1.2.2 第1阶段约束条件
2 求解方法
在利用场景法的基础上,上述模型已转化为一个混合整数线性调度运行优化模型,因此本节采用传统数学优化方法对该模型进行求解,其中求解软件为MATLABTM环境下YALMIP 工具箱,调用Gurobi商业求解器(9.1.1 版本)进行求解。由于DPGMM模型可以有效地对数据进行滚动处理,因此该UC模型可以实现数据驱动和滚动优化,其求解流程如图1所示。
3 算例分析
图2 IEEE-30节点算例系统Fig.2 IEEE-30 node test system
3.1 基于DPGMM 的风-光-荷不确定性建模案例
本节以美国国家风电数据集提供的风电数据[13]、美国国家太阳能辐射数据库[14]提供的太阳辐照度和光伏出力数据以及纽约市电力系统独立运营商提供的负荷数据[15]为基础,分别给出基于DPGMM 模型的单变量不确定性及不确定性相关性建模案例。
首先,选取某风场2006 年6 月10 日、11 日的风速数据并基于DPGMM 模型进行拟合,每5 min 记录1 个风速数据并同Gamma 分布、Weibull 分布、Lognorm分布和一、二、三、四阶GMM进行比较。
为研究方便,风速数据已进行归一化处理。6月10 日、11 日风速概率拟合对比分别如图3、图4所示。
图3 6月10日风速概率拟合对比Fig.3 Fitting curves of the wind speed probability on June 10th
图4 6月11日风速概率拟合对比Fig.4 Fitting curves of the wind speed probability on June 11th
为了量化比较各概率模型的有效性,选取对数似然函数值(lnL)和卡方拟合优度(GoF)2 个指标进行比较。需要注意的是,lnL值在概率分布模型中越大,代表模型对数据的拟合度越高;而GoF值则刚好相反,模型的GoF 值越小其拟合程度越高。6 月10日和6 月11 日风电场1 风速拟合的lnL值和GoF 值对比结果分别见表1、表2。
表1 不同概率模型对风电场1的风速拟合lnL值Table 1 Wind speed fitting lnL values of wind farm 1 made by different probability models
表2 不同概率模型对风电场1的风速拟合GoF值Table 2 Wind speed fitting GoF values of wind farm 1 made by different probability models
光伏电站的功率大小与太阳总辐射(GHI)紧密相关,该指标是指太阳照射在地面上某一处水平面上的总辐射能量。基于GHI 值,可以方便地计算出太阳能电站的出力[16-17]。选取2006 年8 月21 日的GHI 数据,基于DPGMM 模型的GHI 概率拟合对比如图5所示。负荷则选取纽约市某节点2006年9月1日的数据进行拟合,对比结果如图6所示。
图5 8月21日GHI概率拟合对比Fig.5 Fitting curves of GHI probability on August 21st
图6 9月1日负荷概率拟合对比Fig.6 Fitting curves of the load probability on September 1st
从以上结果可以看出,在单个不确定因素建模方面,DPGMM 模型的优化结果明显好于Gamma 分布、高斯分布等传统概率分布模型。
在不确定性相关性建模方面,选取临近的2 个风电场,其风速三维直方图如图7 所示,由图7 可以看出,2个风电场风速间的相关性很高。
图7 风电场1,2的风速三维直方图Fig.7 3D histogram of the wind speed in wind farm 1 and wind farm 2
基于DPGMM模型,可以得到2个风电场风速联合概率密度(如图8a 所示),其lnL值为420.49。与此同时,应用Copula 理论进行拟合,其最优结果为Frank Copula,Copula 参数为16.81,Kendall 相关系数为0.78,lnL值为279.19,相较DPGMM 模型小了很多,其拟合出的概率密度图(如图8b所示)也与直方图相差较大。而当不确定性因素增加到3个以上时,Copula函数则需要引入藤Copula,其处理思路和求解方法也很复杂。选取4个临近风电场的风速数据(2006 年6 月11 日),基于R 藤Copula 和C 藤Copula 理论,在R 语言Vine Copula 包中优化得到该风电场的Copula 概率密度,其lnL值分别为657.44和626.82,而基于DPGMM 模型得到的lnL值为847.60,显然,DPGMM的拟合效果更好。
对于Copula 理论来说,其相关性的表达较为明确,但随着随机量的增加,藤结构的数量将非常庞大,计算相对复杂。除此之外,选择不同的藤结构对于最终的结果也不尽相同,这实际上增加了应用难度。在DPGMM 模型中,虽然相关性描述依赖于线性矩阵,但多个线性矩阵的描述结果并不一定比基于Copula 理论的计算结果差,而且基于DPGMM的方法利于滚动更新,可操作性更强。
3.2 不同风光穿透率和负荷波动率下的调度结果
以新能源穿透率为20%、负荷波动率(负荷波动占总负荷比重)为10%为例,求解出机组的启停计划(见表3,表中:0 表示停机;1 表示开机)。针对不同的新能源穿透率和负荷波动率,其优化后的成本见表4。
表3 优化求解后的机组启停计划Table 3 Startup and shutdown schedule of the units after optimization
表4 新能源穿透率和负荷波动率对调度总成本的影响Table 4 Impacts of new energy penetration level and load fluctuation rate on the total dispatch cost美元
优化结果显示,当新能源穿透率上升时,相同负荷波动率下调度总成本有所下降,其主要原因是低成本的新能源替代了传统火力发电;而当负荷波动率增加时,相同新能源穿透率下调度总成本均有所增加,其主要原因则是负荷波动导致弃风和弃光成本增加。
4 结论
本文提出了一种数据驱动下的两阶段UC 模型,其中采用DPGMM 和VBI 方法来描述风电、光伏和负荷的不确定性,并进行拟合和参数估计;在此基础上运用Gurobi 商业求解器来进行求解。通过算例仿真分析发现:与采用已有的单一概率分布模型(如Gamma 分布、Weibull 分布等)以及GMM 拟合模型比较,DPGMM 模型在拟合数据概率上具有更好的表象,而在考虑变量相关性描述中相较于Copula模型的表现更优;此外,当新能源穿透率提高时,系统调度总期望成本有所下降,而负荷波动率提高时,调度总期望成本相应增加。
需要指出的是,本文所采用的DPGMM 模型仅讨论了风电和负荷的空间相关性,且仅刻画了线性相关关系,未来将对风电和负荷的时空相关性和非线性相关性建模展开研究。