APP下载

基于Huber回归的配网自动化应用成效分析

2023-02-14赵云云陈黎丽陈佳鹏何伟谊陶思思

电力科学与工程 2023年1期
关键词:用户数配电关联

赵云云,陈黎丽,陈佳鹏,何伟谊,陶思思

(广东电网有限责任公司 佛山供电局,广东 佛山 528000)

0 引言

通过配网自动化,可实现正常运行状态下的配电系统监测、保护、控制和配电管理,以及故障停电发生后的故障点快速定位、故障区域快速隔离、非故障区域快速复电[1-3]。

面对用户对供电可靠性要求的日益提升,电网公司大力推进配网自动化建设。随着自动化覆盖率大幅提升,进一步加强配网自动化全过程精益化管理成为迫切需要。

随着智能电网技术的快速发展,配电网的智能化水平也在持续提高,电网运行过程的状态监控及数据采集技术也日趋成熟。通过数据分析建模,精准地发掘可以提升自动化应用成效的核心影响因素,对于自动化业务管控策略的优化、配网自动化建设投资效益的提高、故障自愈功能的充分发挥、支撑快速复电具有重要意义。

目前,基于现代数据科学(如多元回归、神经网络等机器学习算法)的电网数据分析算法及应用受到关注[4]。

现阶段,关于配网自动化实用化成效分析评估方面的相关研究,或侧重定性讨论的方法,或只关注特定的自动化相关领域,如具体配电网拓扑结构、自动化投资领域等。这些研究所采用的方法主要有层次分析、模糊综合评价等;但是,这些方法的主观性较强、所考虑的领域相对片面,所以导致评价结果可能存在失真的情况,难以深入挖掘不同业务过程领域之间指标特征的内在联系及影响。

文献[5]定性探讨了配网自动化规划效益的评估。文献[6]采用模糊综合评价法对某配网自动化建设项目的社会效益进行了评价。文献[7]考虑配网自动化终端设备的运维检修问题,采用层次分析法计算了各设备的综合评分与评价等级。

总体而言,现有的相关研究因采用数据汇总、数据对比等较为粗糙的相关分析方法,只定性探讨了自动化项目的投资效益、社会效益等,在分析配网自动化应用成效指标时,对多领域过程指标的协同作用考虑不足、对相关历史数据的挖掘程度不足,因此难以获得有针对性、足够客观的分析模型。

鉴于此,本文研究思路是:首先,从配网自动化规划设计、建设投运、运行维护等环节提取业务过程关键要素指标,以自动化减少用户停电率为配网自动化应用成效的评价指标,构建业务特征指标集;然后,基于历史数据,通过计算皮尔逊线性相关系数筛选特征指标;依托指标数据,采用Huber回归算法构建关联模型,计算得到业务过程指标对配网自动化应用成效评价指标关联系数的估计值,进而根据关联系数值计算各业务过程指标的影响权重。

1 业务特征指标选取

目前,在配电自动化设备全生命周期管理中,存在“建未建好,建而未投,投而未用,用而无效”等问题。这些问题影响了配电自动化整体实用化水平,主要体现在:在规划设计环节,自动化开关布点不足、布点不合理;在建设投运环节,自动化终端未充分接入主站、自愈线路比例不高;在运行维护环节,自动化遥控功能未最大化应用、部分终端在线不稳定、自动化开关正确动作率有待提升。

针对配网自动化管理现状主要存在问题,为梳理制约自动化实用化水平提升的相关影响要素,从当前业务指标的统计口径、采集周期、数据质量等维度入手,选取以下自动化业务过程指标作为初始自变量指标:自动化区块平均用户数、自动化区块平均线路长度、自动化开关动作准确率、馈线自动化终端在线率、自动化开关覆盖率、自愈可用率、自愈成功率、配电自动化理论最小自愈率、自愈线路覆盖率。以自动化减少用户停电率作为配网自动化应用成效的评价指标。

用上述反映自动化关键管控要素的业务特征指标构建配网自动化应用成效分析模型的业务特征指标集,指标设置如图1所示。

图1 业务特征指标集Fig. 1 Business characteristic index set

2 配网自动化应用成效分析模型

针对初步构建的配网自动化应用成效分析模型的业务特征指标集,收集电力企业的配网自动化业务过程指标及应用成效指标的历史数据。基于历史数据,采用皮尔逊线性相关系数对自动化业务过程指标及应用成效指标两两之间的关联性进行量化。在此基础上,进一步筛选用于构建关联模型的有效业务过程指标组合。

结合指标历史数据特征,采用标准化或非标准化方法对数据进行预处理,并构建Huber回归算法关联模型。根据拟合优度系数的大小对关联模型有效性进行评估;依托最终的关联模型计算各业务过程指标对应用成效指标的贡献度。

各自变量的贡献度采用如下方式计算:分别计算各自变量指标值的单位变化所导致的因变量指标变化值,进而对全体自变量的该变化值进行加权平均,最终得到相应的贡献度。

图2为配网自动化应用成效分析建模流程图。

图2 自动化应用成效分析建模流程图Fig. 2 Flow chart for the automation application effectiveness analysis modeling

2.1 基于指标关联度确定自变量指标组合

使用历史数据计算出各业务过程指标和应用成效指标两两之间的皮尔逊相关系数,以此来表征关联程度;再结合业务分析需求,从初步确定的业务特征指标集中凝练筛选核心指标,用于后续关联模型的构建。具体计算公式为:

式中:x1, … ,xn,y1,… ,yn为2个指标的样本数据点。

皮尔逊线性相关系数的取值范围为[–1,1]。该指标的绝对值接近0,则表明指标间的线性关联程度弱;接近1,则表明2个指标之间的线性关联程度越强;小于0,则表明2个指标之间具有相反的线性变化趋势;大于0,则表明2个指标之间具有相同的线性变化趋势。

本文结合生产运行实际情况,对初步确定的9个业务过程指标进行关联程度分析校验,选取皮尔逊线性相关系数绝对值大于0且符合业务分析需求的业务过程指标,构建最终用于关联模型分析的业务指标组合。

2.2 采用Huber回归算法构建关联模型

Huber回归算法是鲁棒回归算法的一种,具有模型结果不容易受离群值影响的特点,适用于数据异常的回归模型,在诸多实际业务领域具有广泛的应用。本文算法考虑建立如下模型:

式中:Y为自动化减少用户停电率;X1,… ,Xd为所选的全体自动化业务过程指标;ζi为第i个自动化业务过程指标对自动化减少用户停电率影响的关联系数(待确定);ζ0为反映配电网自身所具有的基准自动化减少用户停电率;ε为随机误差以及关联模型中没有出现但对自动化减少用户停电率Y有影响的自变量指标。

对式(2)中的等号左右两侧同时求期望,可消去不可观测项ε,得到下述模型E(Y)=ζ0+ζ1Y1+…+ζdYd。式中:E(Y)为自动化减少用户停电率的平均值。计算该式中各关联系数的Huber回归估计值,即为通过解如下的带非线性约束条件的规划问题:

式中:

Hε(x)为 Huber误差函数,可用于控制潜在离群值的影响。λ为事先给定的调节系数,可用于控制Huber回归模型的正则化程度。

2.3 关联模型评估及关联系数分析

按照如下公式计算模型拟合优度系数:

若R2≥ 0 .6,则表明所构建的关联模型较为准确,模型已经挖掘出自变量和因变量间的关联性。若R2<0.6,则需要选取更多业务过程指标作为自变量指标并重新构建关联模型,或根据业务实际继续选用所得的关联模型。阈值设置为0.6。该值可根据数据质量结合业务实际确定。

2.4 影响因素指标对因变量的贡献度

基于所构建的关联模型,分别计算各自变量指标值的单位变化所导致的因变量指标变化值;然后再对全体自变量的该变化值求和,进而计算各自变量的变化值与总和的比例;以此作为自变量对因变量贡献度的度量指标,公式为:

3 算例分析

以某区域电网所辖5个管理单位的配网自动化业务过程指标及自动化应用成效指标的历史数据为例进行分析。

各管理单位的用户数和线路长度数据如表1所示。

表1 用户数和线路长度算例数据Tab. 1 Number of users and example data of line length

3.1 指标关联分析

选取自动化区块平均用户数、自动化区块平均线路长度、自动化开关动作准确率、馈线自动化终端在线率、自动化开关覆盖率、自愈可用率、自愈成功率、配电自动化理论最小自愈率、自愈线路覆盖率共9个业务指标;以自动化减少用户停电率作为因变量。

分别计算业务指标与因变量指标间的皮尔逊线性相关系数,结果如表2所示。从表2可以发现,自愈线路覆盖率的相关系数为0,无需考虑;自动化区块平均线路长度、自动化区块平均用户数、配电自动化理论最小自愈率、自动化开关覆盖率、馈线自动化终端在线率、自动化开关动作准确率、自愈可用率、自愈成功率8个自动化业务过程指标相关系数绝对值均大于0,可以被选取用于构成后续关联模型的自变量指标组合。

表2 自变量与因变量的线性相关程度Tab. 2 Correlation between independent and dependent variables

3.2 基于Huber回归算法的自动化应用成效分析

基于历史数据,使用Huber回归算法构建关联模型,挖掘前述8个业务过程指标对自动化减少用户停电率的影响规律。所得关联模型的拟合优度系数为0.803 4,这说明精度已经满足要求。

各自变量的关联系数具体如表3所示。对自动化减少用户停电率的贡献度如表4所示。

表3 Huber回归关联模型的关联系数Tab. 3 Correlation coefficient of Huber regression correlation model

表4 Huber回归关联模型的影响权重(贡献度)Tab. 4 Influence weight (contribution) of Huber regression correlation model

3.3 关联模型结果分析

由表4可以看到,自动化区块平均用户数及自动化区块平均线路长度这2个自变量的影响权重排名前二。这表明自动化减少用户停电率的主要影响因素为“自动化区块平均用户数”及“自动化区块平均线路长度”。再结合表3中这2个指标的关联系数通过计算可以发现,自动化区块平均用户数及自动化区块平均线路长度系数每减少 0.5,将可以分别增加 6.5%、5.5%的自动化减少用户停电率。

通过以上分析可知:该区域可着力优先改善这2个指标,即通过减少自动化区块平均用户数、自动化区块平均线路长度,提高自动化减少用户停电率。另外,自动化开关动作准确率对自动化减少用户停电率的影响权重也相对较大,所以需要加强对自动化开关动作不正确原因分析,提高配电自动化开关故障隔离能力。配电自动化理论最小自愈率的影响权重最小。相比于影响权重最大的指标自动化区块平均用户数而言,进一步改善配电自动化理论最小自愈率,对自动化减少用户停电率的作用相对不明显。

4 结论

针对现有配网自动化业务管控及应用成效分析方法存在适用场景较狭窄、分析方法的精细程度不足、主观经验性影响较大等缺陷,本文提供了一种基于Huber回归的配网自动化应用成效分析模型。

(1)针对自动化减少用户停电率这一配网自动化应用成效关键评价指标,分析挖掘配网自动化规划、建设、运维等环节关键业务指标对应用成效指标的作用规律和贡献程度。

(2)采用Huber回归算法构建关联模型,可以摆脱对历史数据质量及业务过程指标量级处理有较高要求的限制,提高了配网自动化应用成效分析模型的客观性及稳健性。

(3)通过关联模型中配网自动化业务过程指标的权重系数对应用成效指标的影响进行反馈,将配网自动化业务过程指标用于自动化减少用户停电率贡献度的分析评价。

本文基于关系模型实现对自动化应用成效目标值的预测,可为优化配网自动化业务协同管控、提升配网自动化实用化水平提供管理决策依据。

猜你喜欢

用户数配电关联
江苏省通信业2021 年主要指标完成情况
10KV变压器配电安装柜中常见问题分析
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
江苏省通信业2019 年主要指标完成情况
“一带一路”递进,关联民生更紧
10kV及以下配电线路运行维护
配电自动化技术在配电系统中的应用分析
试论电力系统配电自动化及其对故障的处理
奇趣搭配
智趣