基于PCA-SOM 的低压配网运行态势评估方法
2020-07-09粟世玮尤熠然张思洋
粟世玮 尤熠然 张思洋 吴 昶 熊 炜
(1.三峡大学 电气与新能源学院,湖北 宜昌 443002;2.梯级水电站运行与控制湖北省重点实验室(三峡大学),湖北 宜昌 443002)
随着我国智能电网稳步深入发展,配电网智能化已成为当务之急[1],但由于低压配网存在设备冗杂,自动化水平低等问题[2],不仅阻碍了配电网智能化发展,同时也给配网运行态势评估增加了难度[3].目前,针对配网运行态势方面已有广泛研究.文献[4-7]分别从不同层面和方法构建多层次的评估指标体系,虽然利用专家打分或者现场调研等方法构建的指标体系层次全面但是存在依赖专家经验,或者忽略了评估指标之间影响且未考虑不同指标在配网中重要程度差异的问题,容易造成指标体系主观性较强等缺陷,无法构建科学客观的指标体系,进而无法客观进行配网运行态势评估;文献[8-11]利用多种测度、区间数模糊评价以及蒙特卡洛算法等方法进行配电网运行态势评估.以上方法侧重于对配网运行态势的评估算法进行创新及改进优化,评估过程各有优劣且对配网运行态势也有较为精确的把控和评估,但都忽略了现有SCADA 等数据采集系统存在数据精度和异常数据等问题,且配网运行态势评估易受异常数据影响,造成评估误差进而可能对配电网发出错误的控制信号.总之,在现有针对低压配网运行态势评估的研究中,大都存在以下两个问题:建立评估指标体系时过于依赖专家经验,缺乏客观性;忽略了配网运行数据的异常问题,缺乏精确性,无法客观精确评估低压配网运行态势.
因此,本文提出一种基于PCA-SOM 的低压配网运行态势评估方法,采用改进的主成分分析法(PCA)进行特征提取出最能反映配电网运行态势的指标变量并构建层次分析评估指标体系;其次对所构建指标体系进行评估中所需的配网运行数据进行基于自组织神经网络(SOM)的数据清理;然后对各层次评估指标建模并计算权重;最后通过单项指标值及权重,逐层计算上层评估得分,找出配网运行薄弱环节.总之,通过对某地区实际配网进行配网运行态势评估的结果表明,所述方法科学合理、精确可靠,具有实际应用意义.
1 基于改进主成分分析的特征提取
在低压配网运行态势评估中,配网态势影响因素多导致评估指标数目众多,且没有统一方法来筛选评估指标.多数研究通过调研分析及专家意见来建立配网态势评估指标体系[12],其方法主观性较强且无法筛选出评估指标间在某个层面上具有重叠的信息属性,即难以准确评估配网运行态势.
因此,本文将采用基于改进主成分分析的特征提取算法来筛选评估指标,该方法能将引进的众多评估指标归结为几个综合指标,使构建的指标体系更加简单合理,提取出最能反映配网运行态势的指标变量,其步骤如下:
1)选取若干配网态势评估指标参量,对各评估指标进行量化,构建评估指标量化矩阵,并消除量纲:
依据协方差原理,对指标变量进行标准化变换后,变量协方差矩阵即为其相关系数矩阵.
2)计算评估指标参量矩阵
解上述相关系数矩阵,并求出矩阵特征值及特征向量,按照特征值大小排序λ1≥λ2≥λ3≥…≥λp,其中对应于每个特征值λi的特征向量为αi,‖αi‖=1.然后计算累计方差贡献率(CPV):
所述累计方差贡献率反映了变量线性变换后包含的信息量,当因子越重要时,其值也就越大.
3)监测指标的特征提取
求取主成分载荷:
其中:λ1,λ2,…,λm为矩阵的特征值;α1,α2,…,αm为特征向量.
然后计算各评估指标变量的重要度:分析选取的m个主成分,计算主成分中指标参量的重要度H,其计算公式如下:
然后将求出的评估指标参量的重要度H归一化,重要度H越大代表相关性越强,即该评估指标在众多评估指标中越有代表性,最后得到配网运行态势评估的关键指标参量.
2 基于自组织神经网络的数据清理
低压配网结构复杂,设备繁多,自动化水平较低,导致现有的SCADA 等系统上传的运行数据存在采集困难、精度较差、数据不完整等缺点[13].因此,在对低压配网运行态势进行评估时,亟需对异常数据进行辨识和清理.且由于配电网运行的数据繁杂,直接进行数据清理的工作量太大,所以需基于改进主成分分析的特征提取出评估所需的指标参量后,再针对计算指标参量所需的配电网运行数据进行辨识和清理.本文提出一种基于自组织神经网络的数据清理算法,其核心是强化学习技术[14],采用竞争性学习进行样本训练,能够更精确且迅速地辨识并清理异常数据.
2.1 自组织神经网络基本原理
自组织神经网络算法训练过程采用竞争性强化学习,步骤如下:首先编号样本矢量,计算与权重之间的欧式距离;然后将权重和最相似的神经元构成匹配单元,最后得到神经元特征图谱,若神经元之间的距离越近,则说明相似度越高,即其中数据也就越准确,训练过程如图1所示.
图1 自组织神经网络学习训练过程
2.2 自组织神经网络模型建立
基于自组织神经网络的数据清理算法的模型建立步骤如下:首先归一化输入矢量及神经元对应的内星向量:
式中:j=1,2,3,…,m;j为神经元编号;X为输 入 矢量.
然后每当获得任意输入矢量时,都将其与全部神经元对应的内星向量进行对比,然后将最相似的内星向量列为竞争神经元,若两个向量之间相似,其点积取最大值如下:
变换上式得到:
即欧式距离最小:
式中:Wj和Wj*分别为j和j*号神经元的内星向量.
最后当匹配单元向输入单元进行调整时,匹配单元的量会随距离时间减小,利用
拥有权值Ab(s),神经元的更新公式为:
式中:t为训练样本的指数;X(t)为输入向量;s为步长指数;β(s)为单调递减的学习系数;u为输入向量的匹配单元指数;f(u,b,s)为步长为s时神经元u和神经元b之间距离的临近函数;T为训练样本的大小.
3 配网运行态势指标计算
3.1 关键评估指标建模
由所述改进的主成分分析法以及层次分析构建的低压配网运行态势评估指标体系见算例分析4.1.在此,先对评估指标体系进行建模,其中间层为:安全性、可靠性、优质性、经济性;其指标层单项指标为:三相负荷不平衡程度、变压器负载率、运行故障概率、供电可靠性、电压合格率、低压统计线损率.针对以上6个配网态势评估单项指标建模如下:
1)安全性指标
三相负荷不平衡程度:指配网三相中电压或电流的幅值差超过合理界限,其值越小表示配网运行越健康,计算公式如下:
式中:PA,PB,PC分别代表配网中变压器低压侧出线端三相A,B,C的负荷.
变压器负载率:指配网供电平均输出功率与变压器额定容量之间的比值,在合理范围内其值越小表示配网运行越健康,计算公式如下:
式中:Wt指t时间内配电网台区的供电负荷;S为变压器容量.
2)可靠性指标
运行故障概率:指配网平均故障次数,其值越低表示配网运行越健康,折算到一年的运行故障概率计算公式如下:
式中:λt为统计时间内的故障概率;8 760 h为一年的小时数;t为统计的小时数.
供电可靠性:指配网不间断向用户配送高于合格率电能的能力,其值越高表示配网运行越健康,计算公式如下:
3)优质性指标
电压合格率:指电压在界限内的时间与总时间的比值,电压合格率越高表示配网运行越健康,计算公式如下:
式中:t0为电压越限时间;t为统计时间.
4)经济性指标
低压统计线损率:指线路损耗占供应电能的百分比,线损率越低表示配网运行越健康,计算公式如下:
式中:P1为供电量;P2为售电量.
3.2 单项指标评分方法
本文采用模糊隶属度评价函数来确定指标层各单项指标的评分公式[15].其中指标分为3类:正向指标、逆向指标、区间指标,如图2所示(图中x为单项指标值,xi为被考察因素,即为单项指标值的分段点,y为评估得分,yi为xi在[0,100]中所在位置,即为指标值对应的评估得分).将大区间分成4段小区间,然后根据每个小区间中指标取值所占比例来判断该区间内的曲线斜率,以此划分各个单项指标的模糊隶属函数图,然后确定区间取值的分段函数.
图2 模糊隶属度评价函数图
3.3 评估指标权重确定
利用AHP-Delphi法确定各单项指标权重如下:
1)确定两两判断矩阵,其中aij表示因素i和因素j之间的相对重要性之比,得到判断矩阵A如下:
2)计算判断矩阵A的最大特征值和特征向量,首先计算A中每行元素乘积的n次方根:
则W=(W1,W2,…,Wn)T为矩阵相应特征值的特征向量,且所求最大特征值对应的特征向量W归一化后即为评估指标的重要度排序.
3)为验证重要度排序是否合理,对于任意k=1,2,…,n,判断矩阵各元素aij应满足:aij=aik/ajk,且为度量判断矩阵是否具有一致性,需进行一致性检验:CR=CI/RI,当CR<0.1时,则认为P的一致性检验满足要求.式中:CI为一般一致性指标;RI值见表1.
表1 平均随机一致性指标
4 算例分析
4.1 构建运行态势评估指标体系
在低压配网运行态势评估中,评估指标的数量过多会影响评估的效率和精度,同时也会对数据清理算法带来不便.因此,利用基于改进主成分分析(PCA)的特征提取算法进行指标提取和删除冗余指标变量能够提高评估效率.
首先,预选取影响低压配网运行态势的若干个单项评估指标见表2.
表2 配网运行态势评估指标
然后,对预选取指标进行基于改进主成分分析的特征提取,构建量化矩阵并计算特征值和方差贡献率,求取主成分载荷并通过公式(4)计算得到各单项评估指标重要度,结果如图3所示.
图3 单项评估指标重要度
将各单项评估指标重要度归一化到[0,1],本文选取重要度大于0.5的单项评估指标,筛选得到6个低压配网运行态势评估单项指标,并对其建立层次分析指标体系如图4所示.
图4 低压配网运行态势评估指标体系
4.2 异常数据辨识与清除
针对广西省某地区配网进行评估,首先根据现场监测数据进行编号并将向量归一化;然后通过计算欧氏距离来获得相似向量并建立6×6大小的竞争层网络,通过对自组织神经网络进行重复学习训练后,将原始数据归入36个神经元当中,并进行数据辨识及清理.
本文选取3 972组配电网实时监测数据,对监测数据进行自组织神经网络学习训练,得到监测数据的神经元分类(如图5所示)以及神经元之间的欧氏距离(如图6所示).
图5 监测数据的神经元分类图
图6 神经元之间的欧式距离图
如图5所示,3 972组监测数据被分到其中34个神经元中,每个神经元中包含了一定量的监测数据.由神经元之间的欧式距离图,神经元之间的颜色显示为黄色-橙色-红色-黑色,颜色越深代表临近神经元之间的欧式距离越远,则说明该神经元的监测数据不健康,需要进行清理.如图可知,3号神经元,15号神经元和33号神经元与临近的神经元之间颜色过深,说明欧氏距离远,需将其进行清理,需要剔除的异常数据编号见表3.
表3 配电网运行异常数据
4.3 实际配网运行态势评估
1)确定评估指标权重.根据3.3中AHP-Delphi法计算6个单项评估指标权重,计算所得权重见表4.
表4 各指标的权重结果
求得各个单项指标权重后,向上层计算指标体系中间层的指标权重,然后整理可得低压配网运行态势评估指标体系的权重因子见表5.
2)计算评估评分评级并对比.由4.2中的基于自组织神经网络异常数据辨识和清理的算例分析可知,3号、15号、33号神经元中数据异常,需进行清除.选取剩余任一神经元中的数据与15号神经元中的数据进行对比评估,并结合单项指标模型,单项指标评分公式以及权重因子进行计算,最终得出该地区的低压配网运行态势综合评估得分对比见表6.
表5 指标权重因子表
表6 评估结果比对
通过表6能够得出该地区的配网运行态势整体评分为71.70分.其中,由应被剔除的15号神经元数据的评估得分较29号神经元的评估得分高,且在优质性方面远高于正常数据的评估得分.经过调查分析,该地区电压合格率一般,特别是低电压现象较为普遍,达不到合格水平,证明了使用未经清理过的异常数据进行评估时有较大偏差,进而证明基于自组织神经网络的数据清理算法进行数据辨识和清理能够有效提升配网运行态势评估的精度,真实反映配电网的实际运行态势.
5 结 论
本文提出了一种基于PCA-SOM 的低压配网运行态势评估方法,首先提出改进的主成分分析法来构建运行态势评估指标体系,采用Delphi法计算评估指标权重,从安全性、可靠性、优质性和经济性方面对配电网进行全方面综合评估.其次,考虑了异常数据对配网运行态势评估的影响,提出了一种自组织神经网络的数据清理算法对配电网运行异常数据进行辨识及清除.总之,根据实例分析表明,本文提出的基于PCA-SOM 的低压配网运行态势评估方法建模简单,收敛速度快且精度较高,不仅构建了客观合理的评估指标体系,而且能有效降低因异常数据带来的评估误差,最终形成了一套科学有效的低压配网运行态势综合评估方法.