APP下载

考虑分布式电源规模化接入的区域电网日电量预测

2022-10-21刘科学周辛南陈雪敏燕鹏飞

可再生能源 2022年10期
关键词:电量分布式配电网

刘科学,周辛南,陈雪敏,刘 岩,燕鹏飞,刘 梅

(1.国网冀北电力有限公司,河北 石家庄 050000;2.国网冀北电力有限公司计量中心,河北 石家庄050000;3.华北电力大学,北京 102206;4.北京清软创新科技股份有限公司,北京 100085)

0 引言

分布式电源具有清洁高效、就地平衡等诸多优点,是我国未来电网发展的方向。在客观资源条件、政策推动的共同作用下,我国各地区分布式电源都呈现高速发展。分布式电源能够在配电网终端自由安装,从而实现用户的自发自用,其剩余电量可以返送至配电网,实现能源的高效消纳和利用。随着以风电和光伏为代表的分布式电源迅速发展,给配电网的智能化发展带来了新的机遇和挑战。配电网潮流方式的变化对配网运行可靠性提出了更高的要求。文献[1]从顶层设计角度剖析了分布式发电、微网与智能配电网的发展与挑战。研究结果显示,分布式电源能够充分地消纳当地的分布式能源,但须注意接入的比例。当接入规模过大时,会给电网安全稳定造成较大的不利影响。当较大规模的分布式电源接入电网后,一旦系统发生短路,会使短路后的电流进一步增大,导致电压波动和线路过载,危及设备安全,给包括母线和断路器等常规设备的选型和制造带来了更多技术难题。另外,由于分布式电源负荷功率多变,会给电能质量带来一定不利的影响,配网无功功率须要经常调节,给调控运行造成了更多困难。文献[2]分析了美国、日本等发达国家在分布式电源方面的进展,并提出了几种经典分布式电源控制方法。欧美部分地区在分布式电源渗透率达到30%的情况下,会对配电网的净负荷产生巨大影响。分布式电源发电往往与当地的天气条件息息相关,气象的频繁变化无疑对配电网的负荷形态产生较大影响,也对配电网调度与运营商的策略制定带来挑战。文献[3]提出了一种基于需求相关性分组预测的主动配电网分布式电源规划方法,将发电成本、线路损耗和储能运行寿命纳为目标函数,建立了多目标优化模型。综上所述,考虑分布式电源规模化接入对配电网产生影响的情况下,对区域电网电量进行精准预测有利于电网进行合理的规划和调控,降低电网运行成本,提高系统的性能。

目前,国内外专家学者对电量预测已做了大量的研究。从时间尺度上,电量预测可以分为短期、中期和长期预测。从预测方法上,有传统和人工智能两大类。传统类预测方法有统计法、时间序列法和回归分析法[4]~[7]。文献[4]提出了一种基于离散傅里叶变换的灰色预测方法,采用离散傅里叶变换将电量负荷序列分解为各种频率分量,再对其进行组合重构。对低频分量采用灰色模型预测,对高频分量加以单独处理,并进行合并作为最终预测结果。文献[5]提出了基于小波分析的月度电量预测方法。通过小波变化提取出电量时域和频域的信息,对提取出的月售电量序列的增长特性子序列和平稳波动子序列分别进行预测,将两种子序列预测结构进行小波重构,获得最终预测结果。文献[6]提出了K-L信息量法和ARIMA误差修正的月度电量预测方法。通过相关性分析对影响电量的特征进行回归建模,计算拟合误差并构建新的非平稳序列,结合ARIMA模型对序列进行修正。人工智能类预测方法有传统机器学习、神经网络及组合法[8]~[12]。文献[8]将Lasso回归、随机森林、集成学习、支持向量机等多种机器学习以综合加权的方式组合在一起,对月度售电量进行预测。文献[9]提出了基于改进鸟群进化算法的极限学习机模型,对分布式电源中的分布式光伏出力进行了有效预测。文献[10]提出了一种基于深度学习的风力发电功率预测方法,能够对未来时段的风电功率进行精准预测。文献[12]提出了一种面向电力系统的连续多日高峰负荷预测方法,将树模型通过串行与并行方法有效结合,并使用了粒子群算法搜索模型超参数。上述文献主要是针对分布式电源或者电力负荷进行预测,忽略了分布式电源规模化发展背景下电量的变化趋势。

随着我国对分布式能源的需求越来越大,配电网中接入分布式电源的比例也越来越高,因此大范围的能源配置和优化调度不可避免。分布式电源的规模化接入使用户的用电形态产生了较大变化,这种接入方式带来的波动性与随机性对日电量预测产生了较大影响。日电量的准确预测是保证系统稳定与市场交易的重中之重,不仅为调度提供重要的数据参考,也是电力市场交易模式下供需双方的重要依据[13]~[16]。本文结合多维度的关键外部数据,提出了一种采用Adaboost集成学习框架;以LLSVM为基学习器,提升模型的预测能力与泛化效果;对分布式电源规模化接入后的区域电网日电量进行有效预测。本文针对分布式电源规模化接入的工作日、节假日的电量情况,使用冀北电网实际数据,验证了所提算法的有效性。

1 区域电网日电量影响因素

1.1 分布式电源规模化接入对日电量的影响

并网发电的分布式电源中,有一部分具有可调度特性,运行管理人员可以对该部分分布式电源进行合理管控。这种类型的分布式电源对区域电网的冲击较小。然而,分布式电源中的绝大部分属于不可调度电源,这种电源以分布式光伏与分布式风电为代表。该类型分布式电源的功率输出具有不确定性和随机性的特点。分布式光伏与分布式风电的随机性如图1所示。

图1 分布式电源的随机性与波动性Fig.1 Energy form of distributed generation

从图1中可见,分布式光伏在中午时段出力最大,夜晚时段出力接近于零;分布式风电的不确定性更为突出,输出功率的峰值往往出现在夜晚时段,其功率曲线波动较大。另外,分布式电源还具有即插即用以及局部消纳的特性,大量分布式电源并网产生的能量在配电网局部消纳,这种能量消耗形式改变了负荷变化趋势,无疑对区域电网的日电量产生影响。

本研究以冀北公司的配电网为例,图2所示为分布式电源规模化接入后区域电网形态。随着接入配电网中分布式电源的容量逐渐增大,传统的日电量预测方法并没有计及规模化分布式电源接入对其造成的影响,现有日电量预测的方法往往也只考虑需求侧变化对其产生的影响。为了更深入分析日电量曲线形态,本文对相关影响因素进行综合考虑,在考虑其他因素的基础上,分析分布式电源规模化接入对电量预测精度的影响。

图2 分布式电源规模化接入的区域电网Fig.2 Regional power grid interconnected with large-scale renewable energy

1.2 其他因素对日电量的影响

分布式电源出力具有不确定性和随机性特性,因此地区电网电量变化规律会受到分布式电源规模化接入的影响。同时,负荷侧的历史电量表征地区用户的用电行为特征,未来电量趋势的变化与历史电量特性有着密切的联系。另外,地区的天气因素以及节假日用电特征都会对地区电量产生影响。由于天气因素中的温度、风速、光照条件、露点等具有波动性和随机性,因此气象环境的变化是影响分布式电源出力和电量预测的重要因素。节假日信息特征对区域电网日电量变化趋势也有着较大的影响,节假日和工作日电量的变换规律截然不同。工作日电网日电量曲线呈周期性变化,模式较为单一,而节假日日电量曲线变化规律不太明显,具有时间和事件触发的随机波动性。

2 核函数支持向量学习机

最小二乘支持向量机 (Least Squares SVM,LSSVM)最早是由Suykens J A K等人提出的,它在 支 持 向 量 机(Support Vector Machine,SVM)的基础上利用最小二乘线性系统构造损失函数,使计算过程大为简化。LLSVM采用结构风险最小化准则,在小样本电量预测中具有较好的泛化能力和预测效果。假设一个n维向量的样本集(x1,y1)…(xl,yl),有l个 样 本 数,通 过 非 线 性 映 射φ(x)将包含历史电量数据、分布式电源出力特征、天气特征以及节假日特征等样本数据,从原空 间Rn转 换 到 特 征 空 间 φ(x)=[φ(x1),φ(x2),…,φ(xl)],并在这个高维度空间中进行最优决策函数的构造。

式中:w为权重向量;T表示转置;b为偏差量。

根据风险结构最小化准则,原LSSVM优化问题可进一步转化:

式中:L为损失函数;c为惩罚因子;ei为第i个样本的预测偏差;e为所有样本的预测值与目标值的总误差;yi为样本目标值。

此时,可利用常规的拉格朗日乘子法求解优化问题。

定 义 核 函 数K(xi,yj)=φ(xi)φ(yj),其 中K(xi,yj)表示满足Mercer条件的对称函数。

3 基于LLSVM-Adaboost区域电量预测模型

AdaBoost算法是一种集成学习技术框架,针对同一个训练集训练不同的基学习器,然后把这些基学习器集合起来,构成一个更强的最终学习器。LLSVM-Adaboost电量预测模型结构如图3所示。以LLSVM为基学习器,通过Adaboost集成算法串行训练多个LLSVM基学习器,并调整样本分布和每个基学习器的权重系数。对于训练过程中预测误差大于设定阈值的样本,增加其权重,反之降低其权重;最后,对每个基学习器的预测结果进行加权整合,得到最终的预测结果。

图3 LLSVM-AdaBoost电量预测模型结构图Fig.3 Structure diagram of LLSVM-Adaboost electric quantity prediction model

假 设 有n个 观 测 数 据D={(x1,y1),(x2,y2),…,(xn,yn)},包 括 电 量 历 史 数 据、分 布 式 电 源 历 史出力数据、气象数据以及节假日信息。给定LLSVM为基础学习器模型的情况下使用Adaboost算法,在算法起始阶段,赋予所有观测数据相同的权重值1/n,基学习器的数目设定为T。对于电量预测问题,首先确定Adaboost集成算法的基学习器,并设置基学习器数量为T,对训练数据集的权重进行初始化。使用带有初始权重分布的训练集,训练第一个基学习器LLSVM,计算训练集在基学习器f1上的预测误差率 ε1。根据预测误差率表现来更新训练样本的权重W,使基学习器f1预测误差率较高的样本点权重变高。在基学习器f2中,这些预测误差率较高的点能够受到更多的重视,然后基于调整权值后的训练集来训练基学习器f2。如此重复进行,直到基学习器数达到事先设定的数目T,最终将这T个基学习器通过集合策略进行整合,得到最终的强学习器。

LLSVM-Adaboost的算法流程描述如下。

(1)输入

输 入 训 练 集D={(x1,y1),(x2,y2),…,(xn,yn)}、基学习器 ΓLLSVM、训练轮数T、…;数据权值初始化:W1=(w11,…,w1i,…,w1n),w1i=1/n,i=1,2,…,n。

(2)过程

for t=1,2,…,T do

①使用带有权值分布Wt的训练集训练基学习 器:ft=ΓLLSVM(D,Wt)。

②计算训练集在ft(x)上的线性预测误差率:

其中,Zt是归一因子,使样本集的权重和为1:Zt=

(3)输出

最 终 预 测 器:f(x)=ht*(x)

其 中,ht*(x)是 所 有ln(1/αt),t=1,2,…,T的 中 位 数对应序号t*对应的基学习器。

上述流程中,D为训练集;n为样本数量;T为基学习器的数目;W为样本权重值;Wt为第t个基学习器的样本权重;ft为第t个基学习器;ft(xi)为第i样本在第t个基学习器上的预测值;yi为第i样本的实际电量值;εt为第t个基学习器的预测误差率;eti为在第t个基学习器中第i样本的相对预测误差;αt为第t个基学习器的系数,

4 算例分析

采用冀北电网管辖的分布式电源发电量数据,对日电量预测算法进行验证。由于该辖区内分布式电源渗透率较高,且分布式电源所带来的功率变化较大,因此可以较好地判断算法预测的准确性。采用冀北电网2017年1月-2018年12月的全部电量数据作为训练数据,采用2019年的数据作为测试数据。

4.1 模型输入数据构造

输入数据包含负荷侧电量历史数据、分布式电源发电量历史数据、天气数据、经济数据等。负荷侧电量历史数据选取预测日前一天的电量数据。分布式电源发电量历史数据选取预测日前一天的数据。天气因素中包含环境温度、湿度、风速、露点、天气类型等,选取预测日当天对电量影响较大的天气因素。通过日历信息来提取节假日因素特征,用1表示工作日,用0表示节假日,并采用独热编码,将离散数据连续化。如果节假日特征中有两类信息,将类别1编码为01,将类别2编码为10。表1为模型的输入数据类型及变量特征。

4.2 电量预测模型设计

本文通过建立LLSVM-Adaboost集成学习模型来实现区域电网日电量的预测,在建立模型之前须要对超参数进行初步的筛选。首先确定基学习器LLSVM的超参数设置,而核函数的选取及参数设置对LLSVM模型的预测性能至关重要。常见的核函数有线性核函数、多项式核函数、径向基(RBF)核函数和sigmoid核函数。为了简化模型,减少模型训练时间,适应日电量预测的需要,选用性能较好的RBF核函数。RBF核函数用于LLSVM中须考虑惩罚系数c和核函数带宽 σ两个参数。惩罚系数c取值越大,拟合非线性的能力越强,对误差项的惩罚程度也越大,可能会导致模型过拟合。核函数带宽σ越小,支持向量越小;σ越大,支持向量越大。支持向量的个数影响训练和预测的速度。确定集成学习框架Adaboost模型的超参数中,基学习器类型、基学习器的最大迭代次数和学习率是影响Adaboost模型性能最为重要的3个超参数。本文已将LLSVM作为基学习器,LLSVM通过非线性变换实现了低维输入向量到高维特征空间的映射,对具有非线性和随机波动性的电量序列数据具有较为出色的预测效果。基学习器的最大迭代次数和学习率的设定会影响到模型的训练效果。最大迭代次数值越大,模型的复杂度越高,越容易出现过拟合现象;最大迭代次数值越小,越容易欠拟合。Adaboost中的学习率为梯度收敛速度,该值过大,容易错过最优值;该值过小,则收敛速度很慢。最大迭代次数和学习率之间存在着一种权衡关系,须对二者的数值进行合理的设置。采用网格搜索法对上述重要的超参数进行寻优,是一种穷举搜索方法,将各个参数可能的取值进行排列组合,列出所有可能的组合结果,生成矩阵;然后将各个组合用于LLSVM-Adaboost训练,并使用交叉验证对各组合的表现进行评估;最后筛选出使LLSVM-Adaboost预测模型性能最佳的超参数组合(表2)。

表2 LLSVM-Adaboost电量预测模型的超参数设定Table2 Hyperparameter setting of LLSVM-Adaboost electric quantity prediction model

续表2

4.3 评价指标

为了对结果进行分析,本文采用的误差指标包含平均相对误差 (MAPE)和均方根误差(RMSE):

式中:n为样本数量;ai和bi分别为i时刻的实际电量值和预测电量值。

4.4 实验结果

首先展示典型日的预测结果。往往在每年的夏季迎来高峰负荷,该场景的预测电量对电力系统的规划、交易最具有参考意义,将显示全年的极端运行状况。为了验证本文所提模型在地区电网日电量预测中所表现出的有效性和优越性,使用了长短期记忆神经网络(Long Short-Term Memory,LSTM)和LSSVM算法作为对比,3种模型均采用相同的输入数据。为了体现3种模型对比的公平性,每个模型在训练过程中都经过参数寻优,并以最优的模型进行日电量预测。图4给出了3种模型的夏季典型日的电量预测曲线。

图4 3种模型夏季典型日的电量预测效果图Fig.4 The electric quantity prediction effect of the three models on a typical day in summer

从夏季典型日的预测曲线可以直观看出,LSSVM-Adaboost算法的预测曲线与真实值最为贴合,且波动不大,曲线较为平滑,具有良好的预测效果。具体的日预测误差统计结果如表3所示。

表3 日预测误差统计Table3 Statistical table of daily forecast error

从表3中的日预测误差统计结果可以看出,LSSVM-Adaboost算法的预测精度比另外两种算法有较大的提升,这在一定程度上表明本文预测算法的有效性。由于一天的预测结果存在偶然性,本文同时计算了2020年1-10月的预测结果,均以日为单位,统计RMSE超过1kW和MAPE超过2%的天数,以验证模型的预测稳定性。统计结果如表4所示。

表4 年度预测误差统计Table4 Statistical table of year forecast error

从2020年的预测结果可以看出,在综合预测指标下,LSSVM-Adaboost算法仍具有较大的优势。通过LSTM算法和LSSVM算法预测结果的对比,能够较为直观地显现出基于Adaboost集成学习的核函数向量学习机具有更为出色的性能表现。从预测误差指标超标特性来看,在1-10月共274d里,LSSVM-Adaboost的预测稳定性优势明显,其RSME和MAPE超标占比只有5.1%和3.3%。LSSVM的RSME和MAPE指标分别为39.8%和17.5%;LSTM的两项指标分别为57.3%和67.2%。与该两种算法相比,LSSVM-Adaboost的最大误差MAPE分别降低了14.2%和63.9%。这说明LSSVM-Adaboost算法在长时间的预测尺度内具有良好的稳定性。

为了更加全面地说明预测结果的稳定性,统计2020年误差分布结果如图5所示。

图5 误差分布曲线Fig.5 Error distribution curves

从误差分布的角度来看,LSSVM-Adaboost的误差分布更加靠近中心零点,呈现中间高,两侧低的分布规律。这说明本文的预测方法具有较高的稳定性,而且预测精度较高。LSTM和LSSVM的曲线形状类似,说明其预测稳定性也较好,但是曲线分布较宽,说明预测精度不如本文所提出的模型。LLSVM模型的误差分布曲线不规律,最大误差偏大,预测稳定性较差。

为了进一步研究分布式电源接入电网对电量预测的影响,设置了两种不同预测场景,分别是考虑分布式电源接入数据和不考虑分布式电源接入数据的电量预测场景,构建了两种不同的电量预测模型。采用两种电量预测模型进行电量预测对比,来具体刻画分布式电源并网接入对地区日电量预测的影响。表5给出了考虑分布式电源和不考虑分布式电源预测场景下,分布式电源出力对地区电量预测的影响。从表5中的数据可见,在考虑分布式电源接入数据的情况下,本文所提模型对地区日电量预测的精度更高。这说明分布式电源接入电网对地区日电量预测会产生一定的影响。

表5 考虑和不考虑分布式电源接入预测场景下,LLSVM-Adaboost模型对地区电量预测的效果Table5 Effects of PSO-Informer model on regional electric quantity prediction under different permeability prediction scenarios

5 结论

本文提出了一种针对分布式电源规模化接入区域电网的日电量预测方法,分析了分布式光伏与分布式风电所带来的随机性与波动性。本研究基于日电量、全用户的大数据分析方法,结合分布式电源出力、气象、环境等关键外部数据,建立符合冀北电网实际的电力市场量化分析模式,找出影响电量波动的关键要素,量化影响程度,确定影响未来电力市场走势。预测模型采用LSSVM为基础预测模型,并使用Adaboost算法对基学习模型LLSVM进行集成学习。算例验证结果表明,本文所提出的模型预测性能优越,对于预测区域电网日电量具有良好的使用效果。

猜你喜欢

电量分布式配电网
储存聊天记录用掉两个半三峡水电站电量
物联网智能燃气表电量自补给装置
浅析分布式发电对电力系统的影响
配电网FTU配置优化方法研究
10千伏配电网线损原因与管理策略探析
关于城市10kV配电网自动化实施的探讨
基于预处理MUSIC算法的分布式阵列DOA估计
分布式并联逆变器解耦电流下垂控制技术
家庭分布式储能的发展前景
10kV配电网现状及智能化改造