APP下载

基于BR-SOM聚类算法的配电网短期负荷预测

2021-12-09王沛王翰林徐文涛路洁牛文浩

微型电脑应用 2021年11期
关键词:特征向量权值聚类

王沛, 王翰林, 徐文涛, 路洁, 牛文浩

(国网宁夏电力有限公司, 宁夏 银川 750002)

0 引言

随着经济水平的快速发展,各工业领域对用电量的需求也持续上升。为充分满足电力系统内各用户端对电力使用需求量的增长,需对电力负荷进行准确预测,从而提前做好电力供应准备[1-3]。其中,短期负荷预测在当前电力网络调度过程中发挥了重要作用,实际预测误差将会直接影响全网系统的发电与供电预期安排[4-5]。考虑到当前大部分电力用户都对供电能力提出了越来越高的标准,需达到稳定、经济、高质量的多方面要求,在电网实时运行过程中会产生大量数据,并且存在多维度信息交错的特征,为了对这些数据进行高效分析,需选择具备优异聚类性能的模型[6-8]。以传统数据挖掘模型进行分析时无法达到可视化的效果,严重制约了挖掘深度信息的过程[9-10]。

以神经网络方法进行处理时会造成过拟合的结果,因此有学者重新设计了随机权重神经网络来消除传统神经网络需要进行梯度训练的缺陷,实现训练速率与泛化性能的大幅提升[11-14]。毛力[15]综合运用结构风险最小理论以及最小二乘向量机对神经网络进行了优化。此外还有研究人员利用权重神经网络构建了特征映射网络(SOM),通过对特征提取过程进行优化的方式来消除主观盲目性产生的影响,从而适应更大范围维数陷阱的条件,显著提升了聚类分析性能,同时也获得了更精确的模型预测结果[16]。根据以上研究结果,本文采用贝叶斯正则化方法构建SOM聚类算法,之后对其进行有效性验证。

1 模型算法

1.1 SOM聚类算法

自组织特征映射网络(SOM)作为一种高效自学习网络,可通过非线性拟合的方式计算出多维数据的统计特征,同时还可以确保初始高维数据达到良好的拓扑性,由此实现可视化的效果。首先按照输入与输出2种结构层对SOM模型进行分类,再以权重向量完成各层神经元的连接,结构如图1所示。

图1 二维SOM结构

1.2 贝叶斯权值调整

为获得更高精度的SOM聚类分辨性能,本文进行权值调节的过程中加入了正则化方法并考虑了惩罚因子的影响,由此实现参数优化的效果,能够显著控制权值过度拟合的问题,最终通过以上处理方式获得理想的聚类优化结果。

从整个算法流程考虑,权值优化是一个重要环节,对实际聚类性能存在显著影响,通常根据神经元权值计算得到惩罚因子,再对其进行贝叶斯正则化转换处理来实现权值调节的过程,从而得到以下优化结果,如式(1)。

wj(t+1)=wj(t)+αM(t),(j∈β(t))

M(t)=(m1(t),m2(t),…,mk(t),…,mn(t))

(1)

其中,mk表示对M进行调节的修正函数,根据这2个参数来得到包含各分布特征的目标函数,再利用以下表达式进行求解,如式(2)。

mk(t)=δEk(t)+δEw(t)

(2)

其中,Ek表示神经元在t时的经过修正后的权值。

各项超参数都是以随机方式得到,按照以下式子计算出最大后验概率对应的目标函数mk,如式(3)。

(3)

其中,λ表示修正系数。

1.3 算法流程

利用SOM来完成贝叶斯正则化的计算如下所述。

1) 初始化网络

设置初始学习率、神经元邻域范围以及最大迭代次数T;之后设置了判断学习结束的条件,考虑到收敛准则受到多种因素的共同影响,需为其确定一个最大长度。

2) 竞争学习

对t时刻的各节点之间的欧式距离进行计算。按照随机选择参数的方式构建训练样本集Xi,以距离最近输出节点作为最佳节点wj,构建计算式,如式(4)。

(4)

3) 修正值的优化

综合运用Xi和神经元j确定最佳超参数,再通过校正处理形成新目标函数。

4) 更新权重

通过M计算出神经元j和BMU中的每个节点权重,计算式如式(5)。

wj(t+1)=wj(t)+αΔwij(t),(i∈β(t))

(5)

其中,wj表示t时j节点对应的权向量;a属于取值介于0-1范围内的训练速率,以较缓慢的速率减小至0,通过式(6)进行计算。

Δwij(t)=xi-wj(t)

(6)

5) 迭代时先判断是否符合设置参数条件,计算式如式(7)。

(7)

6) 在结果未达到最大训练长度的情况下,应调整邻域半径,同时按照迭代的形式进行处理。直至两次学习得到的权重误差低于容许误差时,学习结束。

输出层拓扑属于一种由二维网格组成的结构,该层内存在紧密关联的节点与邻域节点,能够根据各自的特点开展学习,因此相邻节点将会形成相近的权重,并达到与相近输入节点的良好匹配性。

2 数据集分类

本文采用贝叶斯正则化的方式构建SOM聚类算法,选择流程计算并确定以待测日和历史日数据为数据库。如图2所示。

图2 SOM聚类流程

总共设置了5个UCI数据集并验证算法的可行性,这些数据集分别为Iris、Zoo、Wine、Balance-scale与Glass,本次测试的数据属性及对其进行分类的结果,如表1所示。

表1 UCI数据集

评价算法效果时,同时考虑了聚类准确率以及凝聚度指标。

3 实验

3.1 特征向量权重计算

本文选择宁夏某地区的电网作为测试对象,从中选出负荷样本数据。为保证所有维度都能够满足负荷特征向量比较的要求,需先通过归一化方法预处理,最终获得的特征参数如表2所示。

表2 特征指标

在传统Relief算法基础上经过适当优化后计算获得特征向量权值,经过适当选择确定训练和测试样本,之后计算得到训练样本的Relief权重。利用以上程序总共运行3次获得基本一致的结果,再计算得到权重均值。通过计算获得由12个特征权重共同组成分布状态,结构如图3所示。

图3 各特征权重分布图

通过分析可知,4、8、10、12这些特征向量的权重值都达到了0.6以上,并且编号10峰时耗电率会明显改变日负荷走势的状态。

将优化后的特征向量表示为T。通过改进后的Relief算法对电力系统负荷特征向量实施筛选,最终确定5个,大幅降低了特征量的数量。采用上述5项负荷特性指标得到日负荷曲线变化曲线,同时准确反馈特定点信息,达到简化负荷描述的效果。

3.2 准确率检验

总共测试了3个存在显著特征的用户负荷(A类为高校用户,B类为家庭用户,C类为商业用户),对其进行归一化,结果如图4所示。

图4 用户负荷曲线

完成参数的初始赋值后,再通过SOM神经网络开展5次聚类,每次都按照同样的分类方式进行,由此获得平均准确率,如表4所示。

表4 SOM聚类结果

由图4和表4测试结果可以看出,三类用户的用电负荷在上班时间明显处于高峰值,这符合实际情况。SOM算法准确率均在97%以上,验证了本文模型的准确性。

4 总结

通过改进后的Relief算法对电力系统负荷特征向量实施筛选,最终确定5个,大幅降低了特征量的数量,达到简化负荷描述的效果。

测试了存在显著特征的三类用户负荷平均准确率,SOM算法准确率均在97%以上,验证了本文模型的准确性。

猜你喜欢

特征向量权值聚类
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
一种融合时间权值和用户行为序列的电影推荐模型
克罗内克积的特征向量
CONTENTS
基于K-means聚类的车-地无线通信场强研究
一类特殊矩阵特征向量的求法
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
基于权值动量的RBM加速学习算法研究
基于高斯混合聚类的阵列干涉SAR三维成像
基于多维度特征权值动态更新的用户推荐模型研究