基于画像的工业园区需求响应潜力评估
2024-01-19范宇辉姜婷玉黄奇峰
范宇辉,姜婷玉,黄奇峰,鞠 平
(1.河海大学能源与电气学院,江苏省南京市 211100;2.国网江苏省电力有限公司营销服务中心,江苏省南京市 210019)
0 引言
目前,受节能减排目标、煤炭等一次能源价格上涨等多种因素制约,以火力发电为主的电力系统正在向以可再生能源发电为主的电力系统过渡。高比例可再生能源渗透的电力系统的显著特征是波动性强,故需要更多的备用容量来保证电力系统的可靠性[1]。然而,煤炭占发电比例的下降意味着发电侧的备用容量减少,使得需求侧的调控资源变得更加重要。主动参与电网调节的需求侧资源能够有效缓解电源侧和电网侧的调节压力,从而实现电力系统的供需平衡,确保其稳定性[2]。
在需求响应(demand response,DR)中,工业用户是最主要的需求侧资源,占据了参与用户的95%以上[3-5]。目前,针对工业用户DR 潜力评估的研究已取得一定的进展。文献[5]通过潜在电力成本节约来代表工厂的可调潜力,并将其描述为关于实时电价和工厂配置的函数。文献[6]设计出灵活性资源响应潜力评估框架与评估指标,并构建了刻画灵活性资源与电网互动的时序潜力评估模型。文献[7-8]构建了包含错时潜力、轮休潜力和避峰潜力的多时间尺度工业负荷控制潜力指标体系,并分别提出基于信息熵和灰靶理论的量化模型。然而,上述文献均不能直观描述各个时段可用的响应容量大小,不能为实时发生的需求响应事件提供直接参考。文献[9]基于工厂中常见的可调控资源模型,建立工业用户综合DR 能力评估模型和方法,并将综合DR 能力描述为响应容量和响应成本之间的关系曲线。文献[10]基于主成分分析法挖掘小样本用户用电特性与响应特性,实现了基于小样本数据的大规模DR 潜力推演。文献[11]综合考虑了用户可调节能力和响应度以识别重点响应资源,并针对用户响应行为的不确定性采用灵敏度法进行潜力测算。但是,文献[9-11]并未考虑到调度时段对用户用电行为和响应特性的影响,且文献[11]对于各类型负荷的可调节能力建模过于简单。文献[12-16]将用户分成工业、商业和民用负荷,分类较笼统,且都是在最大负荷基础上乘以不同类型用户及措施的削峰系数来计算DR 可削峰容量,未能挖掘负荷上调潜力,且未能具体结合每个用户的用电特性及响应特性。文献[17]建立了全卷积网络数据集重构模型以遴选高可调节潜力工业用户,并考虑调控成本测算工业用户的可调节潜力,但对工业设备的建模过于理想化,并未考虑不同生产设备的差异性。文献[18]利用响应前后净负荷包络域期望量化用户响应能力,以考虑居民响应行为的不确定性,但局限于单一种类负荷的用户参与度。
在此背景下,本文提出一种基于画像的工业园区DR 潜力评估方法。首先,采用k均值聚类算法得到典型工业用户在不同用电计划下的日负荷曲线,并对其用电行为进行画像;其次,根据用电计划的类别,有针对性地采用季节性求和自回归滑动平均(seasonal autoregressive integrated moving average,SARIMA)模型对调度时段的负荷情况进行超短期预测,以避免影响工业用户的正常生产安排;最后,根据工业园区响应潜力评估框架,综合考虑工业用户的用电计划与用电设备的功率调节特性,聚类确定典型工业用户所属类别以及各类别负荷在园区的占比,将典型工业用户的可调容量扩展,得到所在类别的可调容量。
与现有方法相比,本文所提方法的创新性体现在:1)针对单个用户的日负荷曲线进行基于最大相关最小冗余(maximal relevance and minimal redundancy, mRMR)准则特征集的聚类,能够把控其每日用电模式;2)在日负荷曲线聚类的基础上,训练对应类的SARIMA 模型预测调度时段的负荷情况,能够把控用户在对应时段的用电行为,并减小用户用电模式改变带来的预测误差。调度时段在本文中的体现就是实时的负荷预测结合潜力评估。因此,无论何时发生DR 事件,本文方法都能提供对应时段的响应潜力;3)根据各类可调节负荷的生产机理得到其调节特性,并结合负荷预测结果对调度时段内典型用户的DR 潜力进行定量评估,能够准确得到其上、下可调节容量,并根据园区内用户聚类结果扩展得到园区DR 潜力,减小计算负担。
1 工业园区响应潜力评估框架
已有研究将工业用户对DR 事件的参与度描述为补偿价格与响应成本的博弈问题[9,18-19],而忽视了用户的生产随调度时间变化的特性,导致仿真结果与实际情况偏差较大。
本文中的DR 潜力定义为用户当前的用电功率与其需求量可快速调节的上、下限之间的距离,即上、下调节的旋转备用容量。文章研究聚焦于工业用户的生产计划和生产设备的功率控制特性,将工业用户的生产调度纳入考虑,设计了工业园区响应潜力评估方法。为准确把握工业用户在调度日的生产安排,首先,在调度中心根据数年历史数据对各个典型工业用户的日负荷曲线分别进行聚类,并训练与日负荷曲线簇类对应的负荷预测模型。其次,在每个调度日前,各典型用户提交当日用电计划(即日负荷曲线的类别),并上传至调度中心,调度中心使用对应类别的模型实时滚动预测未来4 h 的基线负荷,并根据典型用户所拥有生产设备的功率调节特性计算其4 h 内的调节潜力。最后,使用聚类算法将典型用户的可调节潜力按照各类型工厂在园区的占比,计算得到各个调度时段的园区可调度容量。整体评估框架如图1 所示。
图1 工业园区DR 潜力评估框架Fig.1 Assessment framework for DR potential of industrial park
2 基于最优特征集的调度日用电行为画像
画像是建立在大数据的基础上,以真实历史用电数据为对象,通过定性或定量的方法从数据中构建一个标签化的用户模型。本文旨在挖掘典型用户数据的价值,并尽可能全面、细致地勾画出一个用户在用电特征日间差异方面的信息全貌。
某工业用户日负荷曲线的时间序列平稳性检验如附录A 图A1 所示。可以发现,工厂用电行为呈现明显的日周期性,且图中P值(即原假设的拒绝域的面积)小于0.05,故用电数据是平稳序列,可以通过SARIMA 模型进行负荷预测。然而,有一些调度日的用电数据高出常值,故仅靠负荷预测无法准确把握其用电特征。本文通过对工业用户的用电行为进行画像,反映其在各个调度日用电规模的差异,便于调度人员和典型用户确定每日用电计划所属类别,并对原始特征集进行降维以减小计算负担。
基于画像的工业园区DR 潜力评估体系考察的是工业用户在不同类型调度日的用电情况。首先,使用聚类算法得到典型用户用电日的最优聚类数;然后,采用原始特征集实现了日负荷曲线的初步降维;最后,运用聚类分析、统计分析等方法对原始特征集进行进一步分析,并基于mRMR 准则对用电特征进行最终降维,实现对工业用户各类调度日用电行为画像结果的呈现。
本文采用文献[20]所提出的用户画像方法对用户的用电行为进行聚类分析、最优特征集选取和特征量化。需要注意的是,本文采用mRMR 准则选取特征集[21]。因此,在选取标签阶段标签之间的差异会被最大化,在打分阶段也就不会出现得分相近的情况。
3 考虑负荷预测的典型工业用户DR 潜力评估
工业用户的DR 潜力不仅与其可调节负荷特征相关,还受参与DR 意愿的影响[22]。对此,本文假设用户在不影响工业生产的前提下,将尽可能配合DR 调度。因此,在潜力评估时,出于最大限度确保工业生产正常进行的目的,将典型用户的基线负荷预测值引入旋转备用容量的计算。
3.1 预测算法
因工业负荷的用电行为具有明显的日周期性,本文采用SARIMA 模型对工业用户进行跨度为4 h(16 个采样点)的超短期负荷预测,以便进行用户的DR 潜力评估。SARIMA 模型基于求和自回归滑动平均(autoregressive integrated moving average,ARIMA)模型,被广泛应用于时间序列数据的分析,特别是对于受季节性变化(如年、季、月、星期等)或其他因素引起的周期性变化的数据。该模型具备灵活性,能够方便地利用更多的历史数据来进行模型的实时调整。SARIMA 模型是一种短时预测模型,其关键在于对数据进行适当处理,并将去除趋势和季节性后所产生的残差作为分析的关键要素。该模型的突出优势在于其能够提供较高的短时预测精度,对于实际决策和规划具有重要意义[23]。SARIMA 模型在电力系统中被广泛应用于预测负荷时间序列[24-25],其公式如下[26]:
式中:yt为工业电力负荷时间序列;L为滞后算子;S为季节性序列的变化周期;d、D分别为非季节和季节性差分次数;ϕp(L)、θq(L)、ΦP(L)、ΘQ(L)分别为自回归(AR)、移动平均(MA)、季节性自回归(SAR)、季节性移动平均(SMA)的滞后算子多项式;εt为高斯噪声序列。
3.2 旋转备用容量计算
3.2.1 典型可调节负荷功率控制特性
根据文献[18]的工业负荷功率控制特性建模,可以得到如下3 类典型工业负荷的功率调节范围。
1)电解铝(AL)
式中:PAL为电解铝的功率;分别为电解铝直流压降的最大值、最小值;REC、E分别为直流侧等效电阻、反电动势。
2)矿热炉(SAF)
其中
3)多晶硅(PCS)
3.2.2 可调节负荷备用容量
对典型可调节负荷式(2)—式(6)进行抽象和推广,即可得到单个用电设备的旋转备用容量,与其用电量的预测值和功率上、下限有关,计算公式如式(7)、式(8)所示。
式(7)、式(8)表示当可调节负荷处于功率上、下限之间即处于正常运行状态时,可以提供旋转备用容量,备用容量的值等于功率预测值与功率上、下限的距离。
将单个可调节负荷的公式进行扩展,即可得到工业用户的旋转备用容量公式。由于缺乏设备层面的用电监测数据,默认工业用户的可调节负荷在调度时段均工作在额定状态。单个工业用户的旋转备用容量与其用电设备构成以及调度时段的负荷曲线有关,计算公式如式(9)—式(11)所示。
式(9)表示在调度时段,工业用户的用电设备构成为数目待定且额定运行的可调节设备以及功率确定的不可调节负荷。确定可调节负荷数目和类型后,即可计算出工业用户的可调节潜力。
4 工业园区调节潜力评估
上文得到了典型工业用户在调度时段的可调节潜力。根据本文所提出的工业园区响应潜力评估框架,为得到对应时段园区内的可调节潜力,还需要采用聚类的方法,将典型用户的调节特性推广到整个园区。
4.1 谱系聚类
本节聚类的目的是分别查找出与各典型工业用户用电特征相似的用户,并且要注意区分这些典型用户,避免将代表不同可调节负荷的典型用户归纳到同一簇类。显然,这些典型用户的特征值在特征空间中并不一定是聚类中心,并且聚类的紧密度指标难以采用自动化方式进行把控。
基于此,本文采用谱系聚类方法对园区内的工业用户进行聚类。 谱系聚类又称层次聚类(hierarchical clustering),通过在不同层次上对数据集进行划分,形成树形的聚类结构。该方法的优点是能够很好地体现类的层次关系,且无须预先确定聚类数,应用于大样本也有较好的效果,便于人工确定聚类深度。
由于同一类工厂的生产规模存在差异,需要对数据进行预处理。聚类具体步骤如下:
步骤1:将各工厂的日负荷曲线归一化,然后计算各个特征,作为聚类的依据。
步骤2:计算类间距离矩阵,本文采用欧氏距离作为样本间的相似性量度。
步骤3:初始化n个类,将每个样本视为一类。步骤4:在距离矩阵中选择距离最小的两类,合并为一个新类。
步骤5:计算新类到其他类的距离,得到新的距离矩阵。
步骤6:重复步骤4、5,直至最后合并为一个类。
步骤7:人为划定聚类深度,以恰好区分各典型可调节用户为宜。
4.2 分类潜力评估
在得到工业用户聚类结果、明确各类型可调节负荷所对应的工业用户后,可以根据式(12)由调度时段各类典型可调节负荷在园区的占比估算出可调节负荷的用电功率,进而根据式(13)得到各类典型可调节负荷的总调节潜力。
这种基于聚类和比例放大的评估方法,虽然牺牲了部分准确度,但保护了典型用户以外所有用户的隐私。除此之外,评估过程中只需要预测典型用户的负荷,显著降低了调度中心的计算负担。评估过程的业务流程如附录A 图A3 所示。
5 算例分析
在MATLAB 上对一个典型工业园区电网进行仿真。该工业园区由85 个工业用户组成。典型可调节负荷有电解铝负荷、矿热炉负荷以及多晶硅负荷。3 类工业负荷的模型参数[27]如下:
1)电解铝工厂:每条槽线额定功率为105 MW,功率标幺值调节范围为[0.843,1.144]p.u.,其他负荷为65 MW。
2)矿热炉工厂:每台矿热炉额定功率为76 MW,功率标幺值调节范围为[0.866,1.225]p.u.,其他负荷为50 000 MW。
3)多晶硅工厂:每根硅棒额定功率为1.529 6 MW,功率标幺值调节范围为[0.896,1]p.u.,其他类型负荷为26.8 MW。
5.1 最优特征集选取分析
以某电解铝工厂为例,选定最大聚类数为20,不同k值对应的聚类准则值如表1 所示,因轮廓系数的计算公式要求至少存在两个类,故k=1 时无准则值。可以看到,k=2 时聚类准则值最大,故最佳聚类数取2。
表1 不同k 值对应准则值Table 1 Criterion values corresponding to different k
确定最佳值后,采用k均值算法对样本进行聚类分析,得到两类日负荷曲线如附录A 图A4 所示。聚类中心如附录A 图A5 所示。结合聚类结果可以得到所有特征的互信息值,如附录A 图A6 所示。所有特征间相关系数如表2 所示。
表2 特征间相关系数Table 2 Correlation coefficients between features
根据文献[20]的原始特征集并采用遍历法,解得原始特征集f={日用电量,日最大负荷,日最小负荷,日平均负荷,日峰谷差,谷电系数,日负荷率,日峰谷差率,峰时耗电率,平时段用电百分比}={1,0,0,0,0,1,0,0,0,0},解码得到所选特征编号为1、6,对应特征为“日用电量”与“谷电系数”。
5.2 用户用电行为画像
上文基于用户的日用电曲线数据,进行了数据预处理和分析,并采用聚类算法对用户的日用电曲线进行分组。通过这一步骤,成功提取了每个用户的最佳特征集。然后,根据文献[20]所提出的计分公式进行得分计算,以评估每一类用户在不同标签方面的表现。这一得分计算的结果以柱状图的形式呈现,以展示每一类用户的用电特性画像,如图2所示。
图2 典型工厂用电行为画像Fig.2 Portrait of electricity consumption behavior for typical plants
综合附录A 图A5 和图2 可以发现,A 类和B 类用电计划的用电高峰时段基本一致,均为13:00—21:00,两者区别主要体现在峰时段用电量,其中,A类用电计划整体负荷量较低,B 类用电计划显著高于前者。因此,两类用电计划的标签可分别归纳为低耗能生产日和高耗能生产日。
5.3 基于负荷滚动预测的用户DR 能力评估
以某电解铝工厂的A 类用电计划为例,以24 h(96 个采样点)作为周期,在某日12:00 对未来4 h 的负荷进行预测,得到预测结果如图3(a)所示。随后,根据式(9)—式(11)可计算出该工厂在调度时段内的可调节容量,如图3(b)所示。本文预测模型采用Q 检验方法校验模型拟合结果的残差,设定的置信水平为95%。
图3 典型工厂调度时段预测结果Fig.3 Forecasting results of typical plant during dispatch periods
5.4 工业园区工厂聚类及DR 能力评估
采用谱系图聚类方法,分别查找出与3 个典型工厂(图中编号分别为1、2、3,分别对应典型电解铝、多晶硅、矿热炉工厂)同类型的工厂,如图4 所示,图中不同颜色对应不同类型的用电行为。由图4 可知,在这个深度(距离)下,3 类典型可调节负荷能够被明显区分,且能够兼顾聚类的准确度。
图4 工业园区各工厂用电特征谱系图Fig.4 Spectrum of electricity consumption features of each plant in industrial park
得到3种典型工厂的集合Sx(x=AL,PCS,SAF)后,根据式(12)可得各类工厂在园区的负荷占比,如图5(a)所示。进而,根据式(13)得到各类典型可调节负荷的总调节潜力,如图5(b)所示。最后,将所有类型可调节负荷的上、下调节能力分别相加,得到工业园区的总调节潜力,如图5(c)所示。参与响应前用户会与调度中心沟通,因此,响应前后的负荷对于调度中心是可知的,在获取数据时将响应前后的负荷作差即可得到DR潜力的真实值。计算结果显示,16 个采样点评估输出的平均绝对百分比误差(mean absolute percentage error,MAPE)为1.632 7%。
图5 DR 能力评估结果Fig.5 Assessment results of DR capability
5.5 所提评估方法的合理性与有效性分析
5.5.1 分类训练预测模型分析
本文采用典型可调节用户不同用电计划的数据集作为训练集进行负荷预测,与直接采用历史数据的预测效果对比如附录A 图A7 和表A1 所示。表中,RMSE 表示预测结果的平均方均根误差值,可以看出分类预测方法的误差更小。事实上,由于用户每天的生产安排存在差异,使用相近生产计划下的历史数据训练模型的预测效果显然更好。此外,在本文评估框架中,典型用户还可上传每日启停设备安排以及设备运行状态(满载、半载等),进一步提升分类预测和分类评估的准确度。
5.5.2 预测模型时效性分析
本文的评估框架表明,典型用户的负荷预测模型需要定期更新。模型预测误差随模型更新时间变化如附录A 图A8 所示。可以看出,随着时间的推移,由于工业用户的生产设备或用电特征发生变化,原有模型在预测当前负荷时会产生不可避免的误差,尽管某些往期模型的误差足够小,但总体来看,使用本季度的模型最为稳妥且误差最小。因此,有必要每个季度对模型进行更新。
5.5.3 本文评估方法与传统方法的对比
为验证本文评估方法的合理性与有效性,将评估结果与常用的负荷曲线弹性分析方法(以下简称传统方法)的评估结果进行比较。传统方法通过使用负荷指标进行降维聚类,以确定用户的典型用电模式,并在此基础上获取用户的典型日负荷曲线。然后,结合负荷所在行业的DR 降负荷率和用户负荷的实际峰谷差约束,确定单个用户的DR 削峰容量。最后,对所有用户的削峰容量求和,得到园区整体的削峰容量。
由于传统评估方法仅能够评估削峰潜力,故只以本文方法评估园区下调容量,评估结果如附录A图A9 所示,效果对比如表A2 所示。从上述图表可以发现,本文的评估方法相较于传统方法在评估准确度方面有较大优势,这是由于本文考虑了工业园区的可调节负荷构成以及负荷随时间的变化,本文的评估结果能够较好地贴合真实的调节潜力,并且随着调度时段的改变,误差没有太大的波动。而传统方法则较为粗略,并未考虑用户的用电计划以及用电设备是否可调节,而是以固定的DR 降负荷率代表各个用户的调节潜力。因此,其评估结果是一条不随时间变化的直线,当调度时段发生变化时,评估效果难以保证。在运算时间方面,本文方法相较于传统方法略长,这是由于本文方法需要调用SARIMA 模型对典型用户进行超短期负荷预测,但本文的运算时间相较于调度的时间尺度仍可以忽略。
6 结语
本文提出一种用于评估支撑工业园区孤网运行的工业负荷响应潜力的分析评估方法。设计了基于用户画像和SARIMA 模型负荷预测的评估架构,并考虑各类型用电设备的功率调节区间,以减小DR事件对工业生产的影响;在此基础上,采用谱系图作为工业用户聚类的方法,通过典型用户在调度时段的旋转备用容量计算园区内各类型用电设备的总可调节容量。算例分析表明,本文所提方法可以在0.5 s 左右有效评估园区总体可调节容量,能够满足日内调度的时间要求。基于实测数据的准确性分析表明,本文方法的平均绝对百分比误差小于2%,而传统负荷弹性分析方法的误差高于5%。相比之下,本文采用方法的准确性更高。本文模型实现了综合考虑用户生产计划和用电行为的工业用户可调节潜力的分时段分析,有助于实现需求侧资源可调节能力的自动化普查,提升工业园区孤网的运行可靠性,推进可调节资源池的建设。
附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx),扫英文摘要后二维码可以阅读网络全文。