APP下载

基于机器学习的电网监控通信网络运行态势感知方法

2022-08-19孙向聚

工业加热 2022年6期
关键词:态势聚类向量

孙向聚,郝 婷,宋 曦,王 雪

(1.国网甘肃省电力公司信息通信公司,甘肃 兰州 730050;2.国网甘肃省电力公司,甘肃 兰州 730050)

良好的网络运行状况是电网管理的重要指标。随着电网结构的日益复杂和通信协议的多样化,管理人员在面对复杂的电网数据时无所适从。针对这种情况,网络运行态势感知方法应运而生[1]。然而,随着电网信息交换频繁和异常事件的发生,对电网的安全高效运行提出了新的挑战。有关专家对电网监控通信网的运行情况做了大量的研究。例如,刘红军等[2]优先对网络度量标准进行度量,将静态经济收益设定为网络状态转移的判定准则,采用演化博弈论构建复制动态方程,动态再现不同攻击方的对抗行为,预测各种攻击行为的变化情况,设定符合当前攻击的防护措施,进而完成网络安全态势感知。程家根等[3]优先分析网络安全态势的主要特点,使用RBF神经网络获取网络运行态势对应的非线性映射关系,同时利用遗传算法进行寻优,实现网络运行态势感知。

由于上述已有方法没有删除电网监控通信网络运行数据的冗余特征,导致感知结果较差,平均计算时间和迭代次数上升。为了解决上述问题,提出一种基于机器学习的电网监控通信网络运行态势感知方法。

1 方 法

1.1 电网监控通信网络运行数据特征提取和分类预测

决策树是机器学习中使用次数比较多的学习分类算法[4-5],由多个不同的节点组成,分别为根节点、叶节点、中间节点。其中,一种类型的节点代表一种分类结果。

设定T为电网监控通信数据训练数据集,主要通过特征向量和分类结果对训练集中的通信数据样本进行描述。其中,(A1,A2,…,An)代表分类对象属性,同时全部分类结果共同建立的集合可以表示为{C1,C2,…,Cm}。为了实现中低压配电网智能化,减少人为操作故障次数,快速定位故障, 针对属性Ai而言,操作故障值域可以表示为D(Ai)。另外,值域不仅可以是离散分布的,同时也可以是连续分布的。

针对给定训练集T而言,将不同的故障属性取值和分类结果放置在[0,1]区间内进行量化处理,同时采用神经网络进行训练与定位故障,获取属性Ai和分类结果之间的数学关系模型C(X),利用式(1)给出具体的表达形式:

C(X)=F(A1,A2,…,An)

(1)

式中:F为电网运行数据的权值。

针对给定的电网监控通信网络而言,以上描述是通过权值和阈值进行描述。所以,借助电网通信数据的具体权值和阈值分类特征Ai对不同分类结果之间的具体关系进行分析。在Ai中加入决定强度概念DS(Ai)。其中决定强度DS(Ai)就是属性Ai对分类结果的决定程度。利用式(2)给出对应的计算结果:

(2)

式中:C(X)为属性Ai偏导数对应的绝对值;∂为阈值。其中,决策强度的计算是通过分类结果C(X)和属性Ai两者共同实现的,为电网监控通信网络设备的现有状态评估和检修提供依据。

通过式(3)获取电网监控通信网络运行态势对应的激活函数f(x):

(3)

式中:μ0为任意常数;x为偏导数的取值范围;th为运行时长。

针对单隐含层前馈神经网络,能够准确推算出电网输出对网络输入的偏导数,具体的计算式如下:

(4)

式中:O1为输出层不同神经元的网络输出;Ii为输入层神经元的网络输入。

以下给出基于神经网络的决策树建立过程:

1)数据预处理

监控子站内部设备主要包括中压开关成套设备及其智能终端等,所以电网数据预处理主要包含数据筛选以及属性取值的量化处理等终端操作。在量化处理过程中,按照某种顺序将属性和分类结果设定在区间[0,1]内。

2)神经网络训练

通过给定的样本对网络进行训练[6-7]。

3)建树算法

选择强度最大的属性作为拓展属性,详细的操作流程为:

(1)考虑到电网监控通信终端存在着分散、数据量多、距离长,架设有线通信不经济的问题,对于已经给定的例子集合,选取决定强度最大的属性Ai作为扩展属性。

(2)将属性Ai取值相同的例子划分到同一子集中。

(3)针对含有不同类的子集,假设分类精度低于预测精度,建立建树算法。

(4)假设子集为同一类型,标记对应分支的种类,然后返回值调用处。

在上述分析的基础上,电网监控通信网络交换数据包括上行的检测数据、图像数据、视频数据和下行的控制命令,需要采用方差过滤器将电网数据集中的冗余特征和无利用价值的特征删除,进而采用基于神经网络的决策树算法完成电网监控通信网络运行数据特征提取和分类预测[8-9]。

1.2 电网监控通信网络运行态势感知

通过K-means算法进行电网监控通信网络运行态势感知,详细的操作过程如下所示。

优先给出K-means算法的详细操作步骤[10-11]:

(1)优先确定聚类数量k,设定输入数据向量组为X;同时在n个数据向量中随机选择k个向量,将其作为初始聚类中心。

(2)计算各个向量到k个初始聚类中心的欧式距离,同时获取距离最小值中的向量所在的聚类中心。

(3)假设聚类中的数据向量存在明显变化,则对聚类中心进行重新计算,该系统通过将储能电机工作电流多次聚类,得到电网设备的启动及工作波形,实时监测母线三相电压、电流值等具体数据,实时监控电网监控通信网络运行态势。

(4)重复步骤(2)和步骤(3),直至各个聚类中心不再发生任何变化或者中心距离低于设定的阈值。

通过步骤(4)能够获取平方误差函数E,具体的计算公式为

(5)

式中:k为聚类数量;xi为数据向量;mi为第i个聚类的平均值向量;xj为数据向量组。

通过K-means算法对电网监控通信网络运行数据进行预处理[12-13]。聚类效果的好坏需要通过轮廓系数取值大小进行判定,选取合适的轮廓系数能够更好实现凝聚度的分离和结合。其中,轮廓系数的取值越大,则说明聚类效果越好,从而对整个电网监控通信网络的状态进行评估。以下给出轮廓系数的详细计算过程:

(1)计算凝聚度,如式(6)所示:

(6)

式中:aij为凝聚度;xij为向量点;xik为除了xij外的向量点。

(2)计算分离度bij:

(7)

式中:xkl为聚类中除了Xi簇中的点。

(3)针对向量xij,需要获取轮廓系数计算公式:

(8)

式中:sij为轮廓系数。

另外,轮廓系数还能够表示为式(9)的形式:

(9)

(4)计算全部向量点对应的轮廓系数,选取轮廓系数平均值s整体轮廓系数,具体计算式如下所示:

(10)

式中:n为向量点总数。

针对态势因子向量选择最佳k值,进行数据分析的主要目的需要确保数据的一致性。其中,需要特别注意的是:以电网监控通信网络运行数据为初始数据,所以在实际运行过程中并没有任何异常情况的出现。

传统的K-means算法对初始条件十分敏感,即聚类结果可能会随着初始聚类中心的变化而发生改变[14-15]。为了有效解决这一问题,需要对K-means算法进行改进,经过改进后的K-means算法操作流程如图1所示。

图1 改进的K-means算法的电网监控通信操作流程图

针对研究项目背景,对电网监控通信网络运行态势感知,考虑到骨干网无法组建精准的模型函数,需要借助机器学习完成电网监控通信网络运行态势感知。

(11)

(12)

(13)

2 实例测试

为了验证所提基于机器学习的电网监控通信网络运行态势感知方法的有效性,需要进行实例测试。

以某电力工程中的调度项目为例,其依据《电力监控系统安全防护规定》(国家发展改革委2014年14号)、《电力监控系统安全防护总体方案》(国能安全[2015]36号)《电力监控系统安全防护管理规定》(Q/HNLCJ-YG04-2018)。在安全Ⅲ区建立系统,在接通安全Ⅰ区的 EMS系统方面,从Ⅰ区到Ⅲ区的单一传输规定,采用正向隔离装置进行网络安全防范;网络发令客户端通过调度数据网直接访问,要求客户端进行防火墙设置,满足并符合网络安全管理要求。通信网络应采取保密、完整的措施,以确保本系统数据传输过程的安全。通过 VPN、 VLAN等,可以构建虚拟专网,为数据机密性和完整性提供一定的安全性。在每个前端系统的出口网络上建立两个不同方向的连接,以保证双路由的备份,如图2所示。

图2 电力工程调度项目的电网监控通信网络

针对所提方法的感知性能进行测试分析,优先分析所提方法的真实电压相角和预测到电压相角两者之间的差值变化,具体实验结果如图3所示。

图3 所提方法的电网监控通信网络运行态势感知性能测试分析

分析图3中的实验数据可知,所提方法获取的感知结果和真实值基本一致,说明所提方法具有较好的感知性能。

以下实验测试对比分析三种不同方法的感知性能,具体实验结果如图4所示。

对图4中的实验数据进行详细分析可知,文献[2]方法和文献[3]方法感知性能明显不如所提方法。由此更进一步验证了所提方法能够更好实现电网监控通信网络运行态势感知。

以下实验测试分别从平均计算时间、平均迭代次数以及电压相角最大绝对误差三方面进行研究,利用图5、图6和表1给出具体的实验测试分析结果。

图4 不同方法的电网监控通信网络运行态势感知性能测试分析

图5 电压相角最大绝对误差

图6 平均计算时间

表1 同方法的平均迭代次数测试分析

分析图5、图6以及表1中的实验数据可知,所提方法的电压相角最大绝对误差、平均计算时间以及平均迭代次数明显低于文献[2]方法和文献[3]方法。主要是因为所提方法采用方差过滤器删除数据集中的冗余和无相关特征,避免其他因素对感知性能产生影响,全面提升整个方法的感知性能,使所提方法的各项性能达到最优状态。

3 结 语

为了获取更好的电网监控通信网络感知性能,提出一种基于机器学习的电网监控通信网络运行态势感知方法,采用决策树递归特征消除算法,采用方差过滤器将电网数据集中的冗余特征和无利用价值的特征删除,选取合适的轮廓系数,通过误差预测值对态势因子进行误差修正,能够大大减少平均计算时间和迭代次数,获取更加理想的感知结果。

猜你喜欢

态势聚类向量
一种傅里叶域海量数据高速谱聚类方法
历史虚无主义的新近演化态势与特征
向量的分解
基于知识图谱的k-modes文本聚类研究
一种改进K-means聚类的近邻传播最大最小距离算法
聚焦“向量与三角”创新题
2019年12月与11月相比汽车产销延续了增长态势
汇市延续小幅震荡态势
基于模糊聚类和支持向量回归的成绩预测
向量垂直在解析几何中的应用