APP下载

智能配电网指标的精确预测模型及工具

2024-03-11杨馨淼迟福建张雪菲

电器工业 2024年3期
关键词:供电变量预测

王 哲 杨馨淼 迟福建 张雪菲 张 媛 吴 倩

(1.国网天津市电力公司 2.北京科技大学天津学院 3.国网天津市电力公司经济技术研究院 4.天地电研(北京)科技有限公司)

0 引言

面对新型电力系统建设要求、分布式电源与多元化负荷的迅猛接入,基于大数据对配电网指标进行精准预测十分重要。文献[1]提出了大数据算法进行可靠性预测;文献[2]基于历史统计数据的横向预测模型和考虑相关因素影响的纵向预测模型,形成了灰色组合预测模型进行所研究指标的预测评估;文献[3-6]根据解释结构模型进行指标预测分析;文献[7-8]均采用最小二乘法进行量测控制;文献[9-10]应用系统动力学开展仿真研究。

目前上述预测方法对各指标的影响因素挖掘的深度和广度仍不太足够,得到的指标预测结果偏差约为7%~9%。若能结合历史数据对未来年份的指标进行精确预测,将为智能配电网的规划决策提供时间窗口更加合理的量化数据支撑,也更符合智能配电网精准投资的发展理念。本文提出的指标精确预测方法先后采用了专家法及鱼骨图模型、偏最小二乘法-变量投影重要性分析法、基于系统动力学模型的效益仿真模型,全方位挖掘指标的影响因素,实现主要影响因素的定量筛选和降维,预测结果的偏差在3%以内,大大提高了预测的精度。

1 预测流程及方法

1.1 预测流程

智能配电网指标预测流程可概括为3个阶段:确定指标后,先利用专家法和解释结构模型筛选指标的各维度;然后使用偏最小二乘法-变量投影重要性分析法厘清各影响因素的作用大小,去除效果可忽略不计的因素;最后采用系统动力学仿真模型进行历史指标计算和结果验证,验证合格后的模型可用于进行指标未来年份的预测。指标预测流程如图1所示。

图1 指标预测流程

专家法作用机理是收集领域相关的专业知识,通过问卷调查、访谈、小组讨论等方式提供其专业意见和知识,回答研究问题,将专家提供的信息进行整合和分析以形成定性结论或建议。解释结构模型(SEM)的作用机理为建立通过路径系数表示变量之间关系的模型,使用统计方法估计模型中的路径系数等参数,再将模型与实际数据拟合,评估模型的拟合度以确定模型的准确性;可了解不同变量之间的相互关系、直接效应和间接效应。

PLS有一个与主成分分析(PCA)类似的降维过程,关注的是响应变量(指标)与解释变量(影响因素)之间的关系;通常与变量投影重要性分析法(Variable Importance in Projection,VIP)结合使用,以评估解释变量的贡献和重要性。其作用机理是通过偏最小二乘回归模型来建立响应变量与解释变量之间的关系,使用VIP 值评估解释变量的重要性以选择最相关的解释变量,有助于简化模型并提高预测或解释性能。

系统动力学仿真模型专注于建模随时间变化的系统行为,在研究动态系统、过程控制和长期趋势分析方面很有优势;能够处理系统中各组成部分之间的滞后效应和积累效应,对于难以用线性模型描述的系统特别有用。其作用机理是基于系统的动态关系和历史数据来模拟系统行为。通过验证模型与历史数据的一致性,可确保模型的可信度。一旦验证通过,模型便可用于进行未来年份的预测,对辅助决策、优化系统均能起到重要的作用。

1.2 确定影响维度及影响因素

影响配电网指标的维度众多,首先采用文献整理法和专家讨论法相结合的方式绘制指标的影响维度鱼骨图,并对影响维度的作用关系层级进行梳理。

本阶段采用文献整理和专家讨论方式绘制鱼骨图,总结影响指标的维度。

1.3 筛选主要影响因素

此阶段使用偏最小二乘法-变量投影重要性分析法(Partial Least Square and Variable Importance in Projection,PLS-VIP) 选择主要的影响因素,即通过计算变量的VIP值准确测量解释变量(影响因素)对目标变量(指标)影响的重要程度。偏最小二乘回归(Partial least squares regression,PLSR)是通过投影分别将目标变量和解释变量投影到一个新空间以寻找两者之间的线性回归模型,具体步骤如图2所示。

图2 PLS-VIP方法步骤图

1)标准化矩阵X和Y:利用最大最小值方法进行数据归一化,建立解释变量(影响因素)矩阵X和目标变量(指标)矩阵Y。

2)解释性检验和LOO交叉检验确定潜在变量个数的实现步骤如下:① 建立初始模型以包含所有的影响因素。② 建立偏最小二乘回归模型,捕获响应变量与解释变量之间的关系。方法是通过将解释变量与响应变量的协方差最大化来创建潜在变量(也称主成分);每个主成分都与响应变量和解释变量之间的权重向量相关联,权重向量用于将原始的解释变量投影到主成分空间中。③计算变量的VIP 值,通过计算各解释变量对主成分的贡献度以衡量解释变量的重要性;VIP 值高的解释变量对模型的贡献大,反之贡献小。④开展解释性检验以评估每个潜在变量对总方差的贡献程度,根据方差比例选择解释性检验的阈值(例如90%)。⑤按照其对总方差的贡献程度排序,从初始模型中逐步选择VIP 值大于设定阈值的潜在变量,计算已选择潜在变量的总方差贡献。⑥后续每一步均将下一个最重要的潜在变量添加到模型中,再次计算已选择潜在变量的总方差贡献比例;当已选择的潜在变量总方差贡献比例超过了预定的解释性检验阈值时,停止选择潜在变量。⑦使用已选择的潜在变量构建模型,并使用LOO交叉检验来评估模型的性能;每次LOO交叉检验时,将一个潜在变量从数据集中移除,然后使用剩余的潜在变量进行模型拟合;使用拟合的模型对被移除的潜在变量进行预测,并计算预测误差,本文使用均方根误差(RMSE)进行性能度量。⑧重复以上步骤,计算代表模型平均性能的LOO交叉检验得分,根据交叉检验得分选择潜在变量的数量,以最小化LOO-CV得分。

3)选择具有最低LOO-CV得分的潜在变量数量,即可获得预测性能最好的模型。

综上,通过结合解释性检验和LOO交叉检验,选择适合的潜在变量数量使模型既能够解释足够的方差,又能提供良好的预测性能。选择具有最高信息价值潜在变量数量的同时,也避免了过度拟合。

将筛选后的潜在变量映射为原影响因素,这些影响因素即为主要影响因素,作为系统动力学模型的输入变量。

1.4 结果验证及指标预测

系统动力学(System Dynamics)模型基于因果回路图和系统栈流图对内部组成要素(或称变量)的勾稽关系进行分析,用数学方程对变量之间的数量关系进行量化,最终借助软件完成仿真计算和结果验证。

其中,建立动力学模型方程是该方法的核心,用于定量描述系统动态的时间行为。系统动态时间行为通过状态(水平)变量、速率变量、辅助变量和常量之间的函数关系反映。状态变量(Level variable,L)能够最终决定系统行为,变量状态与时间呈线性关系,当前时刻的值由上一阶段的值与时间变化量累加所得。速率变量(Rate variable,R)是直接改变状态变量数值的变量,能够反映状态变量输入输出的速度。辅助变量(Auxiliary variable,A)的值是借助系统中的其他变量推算获得,不受时间序列的影响。常量(Constant variable,C)是不随时间改变的量。外生变量(Exogenous variable,E)的值随着时间变化,这种变化不是由系统内的变量引起。变量之间具有明确物理关系的,应直接将这种明确的物理关系转化为数学变量方程—因为物理关系可以明确描述变量之间的能量传递、信息传递,使得模型能够准确地反映系统的动态行为和复杂特征。另外,模型方程的建立还可借鉴已有研究中的成熟公式和参数,根据历史数据进一步检验及校正。

为保证预测结果的精度,本文约定如果检验平均相对误差小于3%,则属于可接受的误差范围。否则,需要修改模型参数重新验证。

主要步骤为:

1)基于主要影响因素初步确定系统的变量以及边界条件。

2)设计系统的因果关系图和栈流图。

3)确定系统动力学模型中各状态变量、速率变量和辅助变量,建立变量的方程式,构建系统动力学仿真模型。

4)使用历史年数据进行模型仿真验证,考察仿真结果与真实值的吻合程度,即开展有效性验证以确定所建立系统模型的可信度。

5)使用经过有效性验证的系统模型进行指标未来年份的预测。

2 案例计算

2.1 确定影响维度及影响因素

以配电网某区域供电可靠率这项指标为例,说明预测模型的具体应用。

(1)绘制维度鱼骨图

借助专家法和鱼骨图分析法,对指标起重要作用的维度进行梳理,形成如图3所示鱼骨图。

图3 区域供电可靠率指标鱼骨图

基于此,得到如表1所示的指标影响因素的初选结果。

表1 指标影响因素初选结果

2.2 筛选主要影响因素

使用PLS-VIP对指标的影响因素VIP值进行计算,筛选出的主要影响因素见表2。

表2 指标主要影响因素筛选结果

2.3 结果验证及指标预测

(1)因果关系图与栈流图

选择HB某地区电网为系统边界,系统因果关系图如图4所示。

图4 因果关系图

所涉系统变量如表3所示。

表3 系统动力学模型变量

系统栈流图如图5所示。

图5 系统栈流图

(2)系统动力学方程

系统模型方程的建立参考了历史统计资料,以HB某区域2010~2020年历史数据为输入数据,建立区域供电可靠率指标的系统动力学方程。

状态变量方程:

式中,IvLT(t)为状态变量区域供电可靠率t时刻的值;LT(t0)为区域供电可靠率t0时刻的值;rateLT(t)为区域供电可靠率变化的速率;inlowLT(t)为区域供电可靠率的输入速率,与4P_MRWC、7P_DAU、9P_DTF、10P_DTF、14P_DPS、15P_AM、16P_CVQR、17P_10LCR及19UMEL有关;outflowLT(t)为区域供电可靠率的输出速率。

速率方程:

式中,rateLT(t)为区域供电可靠率的变化速率;IvLT(t)为t时刻区域供电可靠率;exo(t)为外生变量IGS。分析得出函数g[]近似为线性函数。

辅助方程是在反馈系统中描述信息的运算方程,为:

式中,aux(t)为辅助变量4P_MRWC;IvLT(t)为t时刻区域供电可靠率;aux*(t)为除辅助变量aux(t)之外的其他辅助变量;exo(t)为外生变量18PSP、21RGDP、22R_PSP、23R_RGDP等的值。分析得出函数f[]近似为线性函数。

(3)模型结果验证

将GDP初始值设定为14013.4亿元,人口设定为6589万人,地区电网投资初始值为19.73亿元。系统的输出指标是区域供电可靠率,图6为该地区2010~2020年区域供电可靠率预测值与实际值对比图。

图6 2010~2020年区域供电可靠率预测值与实际值

经计算,区域供电可靠率指标平均相对误差为2.54%,小于3%,属于可接受的误差范围之内。相对偏离度小于3%的变量数量占95%以上,因此,模型行为的仿真性良好。

(4)指标预测

进一步根据2010~2022 年该省GDP增长率历史数据、地区人口增长率历史数据、电网投资历史数据、提升可靠性投资占比合理推演得到2023~2025年GDP增长率、地区人口增长率、电网投资、提升可靠性投资占比时间序列数据,使用Vensim PLE软件填写各表函数。

针对2023~2025年的指标值进行仿真计算,指标的预测值见表4。

表4 区域供电可靠率指标预测值及相对偏差

预测结果的相对偏差均在1%,表明所提指标预测方法具有良好的预测精确度。

3 结束语

与现行预测方法相比,本文提出的指标预测方法从指标影响因素选取、主要影响因素筛选到指标预测建模仿真均进行定量计算,充分考虑了指标的内外部影响因素和时间累计作用,具有较高的预测精度。将此预测结果运用到电网规划工作中,能够提供更加合理的量化数据支撑,使规划工作更加符合实际情况,有利于落地实施。

猜你喜欢

供电变量预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
抓住不变量解题
也谈分离变量
战洪魔保供电
不必预测未来,只需把握现在
SL(3,3n)和SU(3,3n)的第一Cartan不变量
2050年澳大利亚或实现100%可再生能源供电
2050年法国或实现100%可再生能源供电