基于动态时间规整的风电功率爬坡滚动修正模型
2021-08-23徐思卿姜尚光柯德平
杨 健,徐思卿,姜尚光,柳 玉,柯德平,徐 箭
(1.国家电网有限公司华北分部,北京市 100000;2.武汉大学电气与自动化学院,湖北省武汉市 430072)
0 引言
大气动力学的复杂性增加了对短时风电功率大幅度变化(即爬坡)预测的难度,一般风电功率序列预测方法往往在爬坡段存在较大误差。这给维持系统有功平衡与频率稳定,如常规机组的调节深度和备用容量的预留问题[1-2]带来了挑战,也对系统的辅助服务,如需求响应参与度[3]、爬坡控制策略制定[4]和预警提示[5]提出了更高的要求。
目前风电爬坡预测(wind power ramp forecasting,WPRF)方法主要有2种:一种是基于风电功率的序列预测,即采用自回归模型[6]、支持向量机[7]、随机森林[8]、神经网络[9]等预测方法进行常规风电功率序列预测,然后基于不同爬坡特征识别爬坡事件;另一种是基于爬坡事件特征量的事件预测,例如文献[10]采用高斯混合模型拟合WPRF爬坡特征的概率分布,考虑到爬坡特征的随机依赖性,基于Copula理论对每个爬坡特征分别进行概率预测。事件预测方法可以提供风电爬坡事件特征量的信息,首先分析爬坡特征量的特征及其影响因素,然后结合气象特征的分析,确定爬坡事件发生的本质原因[11],从而提高爬坡预测的准确性。从准确预估系统供需平衡的角度看,这些方法的预测精度尚有进一步提升的必要[12]。
相比于爬坡预测方法和功率序列预测误差的研究[13],目前对爬坡事件的预测误差与机理研究十分稀少,且传统方法大多采用均方根误差(RMSE)或平均绝对误差(MAE)作为误差评价指标。然而,RMSE只能离散直观地给出横向误差的差异,较低的指标并不能有效反映WPRF的准确度[12]。与此同时,系统决策者更关心爬坡特征,尤其是爬坡幅值和爬坡率的误差。文献[14-16]分析了爬坡率的预测不准确性对运营商的安全约束调度和辅助服务,如风险量度、储能系统、财务惩罚的消极影响。由此可见,对WPRF误差的研究需要构建新的评价指标。
已有研究对WPRF误差的修正均基于相似性理论,或只考虑风电功率的相似性,或只考虑爬坡事件的相似性,而没有充分挖掘气象背景与爬坡事件特征量预测误差的直接关系。例如,文献[17]基于元组向量扭曲方法对爬坡事件进行相似性匹配;文献[18]首先对历史爬坡数据进行灰色关联分析和相似性分析,然后给出风电功率的修正量,从而有效地减小误差,提高了预测的精度。由于爬坡事件是小概率事件,基于风电功率序列相似的波动性分析方法,会降低爬坡事件匹配的准确度;而风电功率的突变是大气复杂运动的结果,与数值天气预报(numerical weather prediction,NWP)气象数据的有效结合将有助于挖掘到爬坡事件的规律与本质。
针对上述现状,本文提出一种基于动态时间规整(dynamic time warping,DTW)的风电爬坡滚动修正模型。首先,采用PRAA(parameter and resolution adaptive)算法对爬坡事件进行检测,获取爬坡特征量,并建立爬坡特征量预测误差向量矩阵;其次,用相关系数表征线性相关关系、互信息量表征非线性相关关系,找到与误差向量矩阵具有较高相关关系的有效气象指标;然后,基于DTW算法[19]匹配与未来有效气象指标相似的历史有效气象指标,从而获得修正模型中相应的误差向量矩阵,并对预测爬坡事件进行修正。本文的特色是建立爬坡特征量预测误差集与综合气象指标集的直接映射关系、构建新的评价指标,来进一步提高爬坡事件预测的精度。以中国华北某风电场实际数据为例进行仿真分析,证明了该修正模型的可行性与有效性。
1 研究思路与理论基础
1.1 基本思路
为了提升爬坡事件预测精度、更好地服务于电网运行,本文提出将NWP与爬坡特征量直接相结合的爬坡事件滚动修正模型。该模型主要具有以下4个特征:①充分考虑单个爬坡事件的特性,通过爬坡幅值、爬坡持续时间和爬坡率等指标,完整地表征爬坡事件;②分析已有相似性研究的不足之处与风电爬坡事件发生的自然原因,直接建立爬坡特征量预测误差集与综合气象指标集的映射关系,提高修正过程的针对性与结果的准确性;③考虑NWP气象数据的连续变化性与因果性而进行滚动预测,与建立大量的历史匹配数据库相比更加有效;④结合实际调度与辅助服务市场的需求,构建新的评价指标,使爬坡事件预测更具有信息价值。图1描述了本文所提方法的基本思路。
图1 整体思路的基本框架Fig.1 Basic framework of overall idea
1.2 DTW算法特点和原理简介
DTW是一种计算2个时间序列相似度的算法,尤其适用于长度不同和信息不对齐(即不同节奏)的时间序列,在音频信号处理领域有广泛应用。如图2所示,由于重要信息在时间断面上是不对齐的(例如峰值点mA和mB),利用每个时间断面上时间序列lA和lB在数值上的差异(例如距离)之和将无法准确地表征2个序列的相似度。不难想象,如果能将序列lB在水平方向上进行适当的扭曲和拉伸,即相当于图2中用斜线把lA和lB的点进行某种配对后再进行距离计算,则可以克服上述基于时间断面配对计算距离的缺点,从而更加准确地表征时间序列的相似性。
图2 DTW基本原理示意图Fig.2 Schematic diagram of DTW fundamental principle
上述配对过程要遵循一定的规则,且存在海量的配对组合方式,其中必有一种最优组合方式使得所计算的距离之和最小,即代表了2个时间序列的相似度。目前一般采用动态规划方法计算该最优的配对组合方式,原理简述如下:设时间序列lA长度为r,序 列lB的 长 度 为t,其 中lA={a1,a2,…,au,…,ar},lB={b1,b2,…,bv,…,bt}。在lA和lB中,au和bv之间的欧氏距离d(u,v)可用如下公式计算:
如果从图2中的起点(边界)开始搜索最优配对组合(用图中折线表示则是最优路径),且遵循如下规则:①搜索下一个配对点时只能朝着时间发展的方向,即单调性要求;②下一个配对点只能和当前点相邻,不能跨越搜索,即连续性要求。则从起点到任意(u,v)的最小累积距离φ(u,v)一定满足如下递归公式:
显然,当u=r,v=t时,式(2)的解即为序列lA和lB的最优配对方式,相应的最小累积距离即可反映其相似性[20]。
如果上述lA和lB分别表示历史爬坡事件发生时和预测爬坡事件发生时的有效气象指标,例如气压的时间序列,则通过上述DTW算法可以建立以有效气象指标时间序列相似性为纽带的预测爬坡事件和历史爬坡事件之间的关联关系,从而修正预测爬坡事件。
2 爬坡事件特征量预测误差修正模型的建立
2.1 基于PRAA爬坡事件检测
准确的风电爬坡事件检测,一方面可以为基于预测数据库的风电爬坡事件后处理[17-18]和优化调度安排提供技术手段,另一方面为基于历史数据库的爬坡特征量及相关性统计[6]奠定了基础。两者对常规电源的安排与旋转备用的预留均具有指导意义。
旋转门算法(swing door algorithm,SDA)常用于对数据库进行数据压缩[21]。该方法通过构造多个有宽度的三角形或者平行四边形,对符合条件的点数据进行压缩,附录A图A1为三角形法则的SDA。PRAA[22]在SDA的基础上进行改进,对选取压缩精度参数有更强的自适应性,可提高爬坡趋势的判断和检测效率。PRAA计算方法如附录A所示。
在本文中,定义有效爬坡事件持续时间小于等于4 h,且向上爬坡事件功率变化量大于额定功率的20%,向下爬坡事件功率变化量大于额定功率的15%。通过PRAA得到历史数据库中实际风电序列和预测风电序列以及未来数据库中的所有有效爬坡事件集合,作为下一阶段误差修正的输入数据。
2.2 有效气象指标检测
根据历史气象数据与爬坡事件数据,可以定量分析各气象指标与爬坡特征量预测误差的关联程度。本文通过挖掘各特征量之间的线性与非线性相关关系[23],来建立爬坡特征量预测误差与综合气象指标间的映射关系。
设2.1节中检测到的历史爬坡事件数据集为HWPRE=[hWPRE,1,hWPRE,2,…,hWPRE,m],其中m代表 历史爬坡事件的总个数,将爬坡率RRR、爬坡幅值RRM和持续时间RRD作为爬坡事件的特征量,则每个爬坡事件预测误差可由特征量误差矩阵RFE=[ΔRRR,ΔRRM,ΔRRD]来表示。计算每个爬坡事件的特征量预测误差,构建误差向量矩阵A如式(3)所示。
与这些历史爬坡事件相对应的气象数据表示为WH=[wH,1,wH,2,…,wH,q],其中q为气象指标(例如气温、气压和湿度等)的总数,则列向量wH,j包含了第j个气象指标在各个爬坡事件发生期间的平均变化率。因此,基于矩阵A和WH可以计算表征第i(i=1,2,3)个爬坡特征量预测误差与第j个气象指标之间的线性相关性系数ρij[24],如式(4)所示。
式中:aj为第i个爬坡特征量预测误差向量(即A阵的第i列);cov(·)为向量之间的协方差函数;D(·)为向量的方差函数。ρij的绝对值范围是[0,1],绝对值越大,说明第j个气象指标与第i个爬坡特征量预测误差的线性相关性越强。
互信息量是信息论中一种量度2个随机变量间非线性关系的指标[25]。因此,除上述线性相关性系数以外,本文还拟采用互信息量来量度爬坡特征量预测误差中所包含的气象指标信息,计算方法如下:
式中:x和y分别为第i个爬坡特征量预测误差和第j个气象指标的随机向量;p(x)和p(y)分别为x、y的边缘概率密度;pC(x,y)为x和y的联合概率密度。Iij愈大,则第j个气象指标对第i个爬坡特征量预测误差的影响愈大。值得说明的是,式(5)所包括的联合概率密度和边缘分布,均可基于爬坡事件和气象历史数据通过数值计算得到。
在二维坐标平面上可逐个描点绘出所有气象指标与某个爬坡特征量预测误差的线性相关系数和互信息量,绘点愈远离原点,说明所对应气象指标与该爬坡特征量预测误差的关联程度愈大。在爬坡率、爬坡幅值和持续时间3幅绘图中均远离原点的气象指标将构成与爬坡事件特征量预测误差强相关的有效气象指标集。
在利用各气象指标在爬坡事件发生期间的变化率识别出有效气象指标集合后,可以建立历史爬坡事件特征量预测误差与各有效气象指标在爬坡期间的时间序列之间的映射关系,如附录B图B1所示,其中Whs,ij(t)表示第j个有效气象指标在第i个爬坡事件发生期间的时间序列,q表示有效气象指标的总数。因此,建立了上述基于历史数据的映射关系库后,可以通过前述基于DTW的气象指标时间序列相似性计算来匹配并矫正预测的爬坡事件。
2.3 爬坡事件特征量预测误差的相似性匹配
假设利用2.1节的检测方法从未来风电功率预测时间序列上检测到的预测爬坡事件集为FWPRE=[fWPRE,1,fWPRE,2,…,fWPRE,t],其中t代表预测爬坡事件的总个数。对应这些爬坡事件发生期间的有效气象指标时间序列预测结果可以表示如下:
式中:wF,ij(t)表示第j个有效气象指标在第i个预测爬坡事件发生期间的时间序列预测值。因此,本文所提的基于DTW进行爬坡滚动修正的主要步骤如下。
步骤1:取WF(t)中对应于第i个预测爬坡事件和第j个有效气象指标的分块wF,ij(t),利用DTW算法计算其与附录B图B1中WHS(t)第j列中各个序列的最小累积距离,并以此为依据对各历史爬坡事件(特征量预测误差)进行相似度由高到低的排序。
步骤2:事实上当wF,ij(t)中下标j从1取到q时,重复步骤1的计算过程,可以得到q种历史爬坡事件与第i个预测爬坡事件相似度的排序。
步骤3:在q种以有效气象指标时间序列为依据的排序中,本文取相似度排序均靠前的N个历史爬坡事件作为与第i个预测爬坡事件强相关的事件,并用它们特征量预测误差的平均值来修正预测爬坡事件对应的特征量:
管理员可以查看和修改个人信息,包括工号、姓名、性别、出生日期、工作部门、电话、住址等。 可以修改个人登录密码。可以退出系统功能。
式 中:ΔRRRF,i、ΔRRDF,i、ΔRRMF,i分 别 为 对 第i个 预 测爬坡事件的爬坡率、爬坡持续时间和爬坡幅值的修正值,很显然它们均是上述N个强相关历史爬坡事件的特征量预测误差的平均值;RRRF,i、RRDF,i、RRMF,i分别为修正后的第i个预测爬坡事件的爬坡率、爬坡持续时间和爬坡幅值;上标“-”表示对应变量修正前的值。
步 骤4:取i=1,2,…,t,并重 复 上述 步 骤1至3,可以实现对所有预测爬坡事件特征量的修正。
从理论上讲,修正后的爬坡率、爬坡持续时间和爬坡幅值三者应相互关联(即爬坡幅值等于爬坡率乘以爬坡持续时间)。如果出现修正后三者严重冲突而不满足关联关系的现象,则可初步判断修正失效。在实际应用时,如果三者基本能满足关联关系,可以仅取其二(例如本文取爬坡率和爬坡幅值)进行修正。考虑到本文研究所关心的是爬坡事件的特征量,因此修正后的爬坡事件简化为倾斜直线表示,直线斜率等于爬坡率,直线首尾幅值差则等于爬坡幅值,直线的中心时刻与原始预测爬坡事件的中心时刻重合。值得注意的是,这样简化处理修正后爬坡事件并不能保证爬坡事件首尾与原始时间序列衔接。
2.4 修正误差评价指标
如前所述,爬坡率、爬坡持续时间和爬坡幅值三者中,只需对其中二者进行修正。此外,调度人员关心爬坡幅值对系统平衡与备用容量的影响且运营商关心爬坡率对爬坡预警等辅助服务的决策价值。因此,本文选取对爬坡幅值和爬坡率进行修正,并利用如下指标评价修正效果:
式中:RRMC和RRMR分别为修正后和实际爬坡幅值;ΔR1为修正前爬坡幅值预测误差;ΔR2为修正后爬坡幅值预测误差;RRRF、RRRC、RRRR分别为预测、修正后、实际爬坡率;ΔR3为修正前爬坡率预测误差;ΔR4为修正后爬坡率预测误差。若ΔERM>0和ΔERR>0同时满足,说明修正后的爬坡幅值预测误差和爬坡率预测误差相比于修正前均有降低,此次修正有效。因此,为评价修正模型的有效性,采用如下有效率指标I进行统计分析:
式中:ND为有效修正次数;NND为无效修正次数。
3 算例分析
3.1 爬坡事件特征量预测误差集统计
本文采用PRAA算法对全年的历史风电功率序列进行检测,获取每一个爬坡事件的特征量,同时统计分析爬坡特征量的预测误差。由于篇幅限制,附录B表B1仅展示其中具有典型代表意义的10个上爬坡事件和10个下爬坡事件的特征量及其预测结果。
根据统计结果并结合附录B表B1可以看出,误差主要有3种情况:①预测结果为爬坡事件,然而实际功率并未表现出爬坡现象;②预测爬坡率为正(或负),但实际爬坡率为负(或正);③预测与实际的爬坡方向相同,但爬坡率误差较大或功率幅值相差较大。
3.2 有效气象指标检测分析
本文所使用NWP数据库中包含的气象指标有风速、风向、气压、气温和湿度(这几个指标均为15 min内均值),还有瞬时风向和瞬时风速。利用3.1节介绍的方法分别计算爬坡率、爬坡持续时间和爬坡幅值的预测误差与各个气象指标的线性相关系数以及互信息量,并将计算结果集中绘制于图3。从图3中可以看出,越靠近原点的点说明该气象指标对爬坡特征量预测误差的影响越小;越远离原点说明特征量预测误差越有可能是由于该气象指标的突然变化或极端情况造成的。因此,根据图3中各点的实际分布情况,本文选择风速、风向、气压和气温作为与爬坡特征量预测误差有强相关性的有效气象指标。
图3 爬坡事件特征量预测误差与NWP气象指标的互信息量-相关系数Fig.3 Mutual information-correlation coefficient of forecasting error of ramp event characteristic quantity and NWP meteorological indices
3.3 模型修正结果及性能评估
以本算例的数据为基础,选取过去10天的历史风电功率(实际和预测)数据和NWP数据来建立历史爬坡特征量预测误差与有效气象指标在各历史爬坡事件发生期间的时间序列之间的关联关系库(图3),并基于未来1天的风电功率时间序列预测和NWP预测结果、利用2.3节所述方法对该日内的预测爬坡事件的特征量进行修正。很显然,这种“10+1”的修正方式是滚动进行的,可以利用本算例中风电场的全年数据进行修正效果测试。图4展示了某日的修正效果,具体的修正数值结果见附录B表B2。
图4 风电功率曲线与修正功率曲线Fig.4 Curves of wind power and correction power
由图4和附录B表B2可见,无论是上爬坡还是下爬坡,修正模型都可以有效改善爬坡幅值预测误差和爬坡率预测误差。修正后,上爬坡的幅值误差降低13%,下爬坡2的幅值误差降低37.5%;上爬坡的爬坡率误差降低12%,下爬坡1的爬坡率误差降低53.7%。从图4中的风电功率曲线整体发展变化过程可以发现,下爬坡1的幅值误差和下爬坡2的爬坡率误差虽然没有明显降低,但是整体走势在时间误差允许内更加贴和实际曲线。由此表明,通过与相近NWP气象数据结合进行滚动修正一方面可以减小幅值和爬坡率预测误差,另一方面有利于判断风电功率发展方向的变化。
根据上述方法,去除2018年中限电等异常数据后,对全年预测爬坡事件进行滚动修正。由于爬坡持续时间的修正量在绝大多数情况下较小,均在1 h以内,这导致爬坡率的预测误差修正效果与爬坡幅值非常接近(如果爬坡幅值修正有效,则爬坡率修正一般也是有效的,反之亦然)。限于文章篇幅,以下结果均只针对爬坡幅值误差进行分析,爬坡率情况类似。图5给出了上爬坡事件和下爬坡事件修正前、后的幅值误差分布概率柱状图。
图5 上爬坡事件和下爬坡事件预测误差分布概率柱状图Fig.5 Histograms of probability distribution of predicted error for uphill and downhill events
通过观察上、下爬坡事件幅值预测误差在修正前后的分布情况可以看出:①上、下爬坡事件中较高幅值误差在修正后均大幅向幅值误差较小的方向移动;②修正后幅值误差比修正前的幅值误差分布更加集中于0附近;③修正模型对上爬坡事件比较敏感。这些均说明修正后的幅值预测误差一方面减小了系统对快速可调发电容量的需求,另一方面提高了预测作为辅助决策信息的有效性和实用性。
最后,通过概率统计的方法再次验证修正模型的有效性。本文统计了全年中具有典型大气条件月份的修正效果统计。其中春季和冬季是风力充足时期,气候变化程度也比较大;夏季和秋季相对来说风力变化比较稳定。因此,选择1月份、7月份和10月份进行误差修正分析,统计结果如附录B表B3所示。
统计结果显示:修正模型在气候变化较小时的误差修正效果更佳;修正模型对上爬坡比较敏感,下爬坡的修正效果要比上爬坡好,说明结合气候特征确实有助于挖掘爬坡事件的本质。因此,修正模型在统计概率上是具有优势的,在大部分情况下能够有效降低幅值误差。附录B图B2对比了幅值预测误差在修正前后的核概率密度分布图形。可以发现:修正后的爬坡幅值预测误差出现在较小值(例如20 MW)以内的概率要明显大于修正前的结果。综上所述,误差修正模型基于爬坡特征量与NWP气象指标数据的直接结合,有助于挖掘爬坡事件的本质特征,提高爬坡事件预测精度。
4 结语
为了满足决策者对爬坡事件特征量预测精度的要求,本文提出了将NWP气象数据与WPRE特征量相结合的滚动爬坡修正模型,完成了以下几方面的工作。
1)建立了爬坡事件特征量预测误差的向量矩阵,计算了其与各气象指标之间的线性相关性系数和互信息量,从而确定了有效气象指标集。
2)建立了历史爬坡事件特征量预测误差与历史有效气象指标时间序列间的映射关系库,作为特征量预测误差修正模型的基础。
3)提出了基于DTW的有效气象指标时间序列相似性计算的预测与历史爬坡事件匹配方法,并据此完成了预测爬坡事件特征量的修正。
以中国华北某风电场的实际数据为例验证了修正模型的可行性与有效性。如前所述,本文目前的研究工作仍不能保证修正后爬坡事件在首尾上与原始时间序列相连续,而这对基于连续时间序列的经济调度计算而言是非常重要的。因此,这一点也将是本文研究工作在未来的延拓和探索方向。