光伏发电出力的条件预测误差概率分布估计方法
2021-02-21贺世勇
贺世勇
摘要:太阳能光伏发电对地表太阳辐射强度非常敏感,其输出具有很强的随机性,对电网的调频、调峰和备用影响很大。随着光伏发电并网容量的不断增加,光伏发电的随机性给电力系统调度运行带来的风险日益凸显。对光伏发电进行更准确的预测,可以为电网调度决策提供可靠依据,对保障电网安全稳定和系统优化运行具有重要意义。
关键词:光伏发电;Copula;点预测;概率性预测;条件预测误差;
引言
光伏发电出力的可预测性较低,相比点预测而言,光伏发电出力的概率性预测能够提供更多的信息,有利于电力系统的安全经济运行。提出了一种基于Copula理论的光伏发电出力的条件预测误差分布估计方法。采用Copula函数对光伏实际出力与点预测的联合概率分布进行建模,实现了任意点预测对应的光伏实际出力的条件概率分布的估计。针对天气状况,采用聚类的方法按天气类型将历史数据进行分类,针对每类天气类型的光伏预测误差分别进行建模以提高预测误差估计的准确度。
一、概述
目前对光伏功率预测已有一些研究,其主要原理是根据未来天气情况结合太阳辐照的规律以及光伏板的布置情况对光伏板接受的辐照进行预测,进而估计光伏板的功率。光伏功率预测方法主要包括时间序列预测法、回归模型预测法和神经网络法等。目前对光伏功率预测的研究大多集中在点预测(即确定性预测)上,即给出某一预测时刻的一个确定值。而受氣象因素影响,光伏发电有着较强的随机性,当光伏输出功率因天气变化波动较大时,确定性的点预测很难达到理想的精度。此外,点预测中所包含的信息有限,无法表达预测结果的不确定性,调度运行中单纯基于光伏点预测无法决策系统需要预留的备用等,在未来大规模光伏发电接入的形势下,该方法难以适应电力系统优化运行的需要。与点预测不同的是,概率预测提供了比较全面的预测信息。通过概率预测能够得到下一时刻所有可能的光伏出力情况及其对应的概率。因此,概率预测更有助于将电力系统运行中的风险控制在合理水平下。然而,当前国内外对光伏概率预测的研究十分有限,与风电概率预测相比,光伏发电概率预测尚处于起步阶段。
二、天气因素对光伏发电出力条件预测误差的影响
1.通过聚类分析处理天气类型的影响。由于仅通过单一模型实现不同种类天气状态下光伏发电出力的准确预测非常困难,因此目前在光伏发电预测的研究中,大多数预测方法都需要先将光伏出力按天气类型进行聚类,然后在不同天气类型下采用不同的模型或具有不同参数的同一模型进行预测。天气类型可以通过云量、气温、太阳辐照等多种气象因素的综合情况进行分类。国家气象局的标准将天气状态划分为33种类型。鉴于分类太多会导致分类算法过于复杂且每类天气类型样本数过少,因此多数光伏发电预测方法会将这33种专业天气类型合并为具有代表性的若干典型天气类型,例如晴天、多云、阵雨、大雨等。光伏预测中常用的聚类算法有K-means 法、自组织特征映射法(SOM)等。采用K-means法对光伏出力数据进行划分。
2.光伏出力点预测模型。为了分析不同天气情况下光伏出力预测误差的差别,采用光伏预测中广泛使用的人工神经网络模型对光伏出力进行虚拟预测与验证。验证数据取自国际电气电子工程师学会能源预测工作组(IEEE Working Groupon Energy Forecasting)举办的2014年第二届全球能源预测竞赛中太阳能预测(solarpowerforecasting)环节。预测的目标光伏电站位于南半球某地,光伏板为固定式。所给数据包括光伏板的小时级历史出力数据以及与历史出力相对应的12个天气相关因素的值,进行预测时需根据给定的未来各个相关因素预测值的基础上估计未来光伏的各小时出力。研究中建立了基于反向传播(BP)人工神经网络的光伏日前出力点预测模型。通过反复测试,选取为大气外太阳辐照、地表太阳辐照、温度作为神经网络输入变量,输出变量为光伏的预测出力,每一个量均为从待预测日06:00到21:00共16h的数据。即输入变量共有48(=3×16)个,输出变量有16个,神经网络共含有1个隐层,隐层神经元个数为16个。神经网络的训练数据集共包含365d,测试数据集共包含30d。训练采用MATLAB中内嵌的Levenberg-Marquardt方法,输入层到隐含层采用sig moid函数,隐含层到输出层采用线性函数。
3.不同天气类型下光伏出力预测误差的实证分析。以上述预测竞赛中2015年6月至2016年6月的数据为例分析天气类型对于光伏出力预测误差的影响。首先根据光伏点出力点预测算法得到光伏各日出力预测值,然后利用k-means法根据所给的地表辐照对各日的天气类型进行分类,将不同天气类型下的光伏发电出力预测值与实际值作散点图,其中的出力预测值和实际值均作了标幺化处理,每张子图的横坐标表示光伏出力的预测值,纵坐标表示光伏出力的实际值。用定量的指标——光伏出力预测值与实际值之间Kendall秩相关系数描述这一差异,则4种天气类型下的结果分别为0.8997,0.7964,0.6983,0.6463,差异非常明显。因此,在用Copula理论对光伏发电出力的条件预测误差进行建模时必须考虑天气状态的不同对预测误差分布的影响。具体而言,应在进行条件预测误差之前,先将全部的光伏历史数据(包括出力、天气相关因素)按照天气类型进行归类,然后分别对每一天气类型建立条件预测模型。
三、光伏发电出力的条件预测误差概率分布估计流程
综合前述内容,可以将天气影响光伏发电出力条件预测误差分布的估计流程总结如下。
1.利用means等聚类算法将光伏发电历史数据按照天气类型划分为若干类(设共有N类)。光伏历史数据中应包含出力实际值与点预测值,其中点预测值可以通过神经网络算法或其他确定性预测方法进行虚拟预测得到。将每类天气中的历史出力实际值记为ak,t,历史点预测值记为βk,t,其中 [1,N]表示天气类型, [1,T]表示所属时段,T为历史数据的时段总数。
2.对每种天气类型下的历史出力实际值αk,t和历史点预测值βk,t分别进行统计,得到光伏出力实际值的边缘分布FXK和预测值的边缘分布FYk。
3.求出每种天气类型下历史出力实际值αk,t和历史点预测值βk,t之间的Kendall秩相关系数,按照所述方法对各类型Copula函数进行参数识别,并找到拟合优度最佳的Copula函数。
4.利用神经网络算法或其他预测方法得到未来光伏出力的点预测值p^。
5.利用已完成建模的Copula函数,通过式计算在已知点预测p^条件下的预测误差的条件概率分布。
四、预测误差概率分布估计的精度评价
采用概率预测中采用的评价方法评价所提出方法对光伏出力预测误差概率分布估计的精度。由于概率预测得到的结果并不是一个数值而是一个概率分布,因此无法采用通常的误差评价指标进行评价。概率预测的主要评价维度包括预测的校准性(calibration,评价预测概率分布的形状与实际概率分布的近似程度)、锐度(sharpness,评价预测概率分布的集中程度)等。
结语:
总之,光伏发电功率的准确预测对保证系统的安全稳定、促进电网的优化运行具有重要意义。概率预测比确定性预测包含了更为全面的信息,有助于在合理风险水平下安排运行计划。
参考文献:
[1]王萍.浅谈光伏发电出力的条件预测误差概率分布估计方法.2019.
[2]刘利群.关于光伏发电出力的条件预测误差概率分布估计方法.2020.