APP下载

多源数据分析的电力信息物理系统安全态势预测研究

2022-11-11彭翠红

能源与环保 2022年10期
关键词:系统安全态势预测

彭翠红

(咸阳师范学院,陕西 咸阳 712000)

在经济建设中,电力一直是一种最基础、最必要的能源,人类生活与工业生产中提供的所有服务都离不开电力,它支撑着社会的稳定与国家经济的发展。构建智能电网能够加速开发清洁能源,优化调整能源消费结构。当前世界各国都在建设、发展智能电网,我国也已经启动了构建智能电网的项目。随着智能电网建设中信息化、自动化等方面的推进,电网的服务和运行模式都将发生很多重大改变。其中随着大量控制、计算、通信、传感设备的接入,电力系统逐渐发展为电力信息物理系统。要构建智能电网,最基础的就是做好电力信息物理系统的安全工作。其中电力信息物理系统的安全态势预测问题就是一个重点研究项目。通过对电力信息物理系统的安全态势预测问题进行研究,能够提升电力信息物理系统对电力网络的监控能力。各国都将电力安全态势预测问题作为电力领域中的重点研究问题,进行了大量研究。其中于群、李浩、屈玉清在电网安全态势感知问题的研究中,通过深度学习模型实现了电网安全态势预测[1]。

本文在此电力信息物理系统的控制中心上,设计了一种基于多源数据分析的电力信息物理系统安全态势预测方法,对系统采集的设备参数进行分析,以此预测系统的运行安全态势,为电力系统的稳定运行提供帮助。

1 系统及安全态势预测原理

1.1 电力信息物理系统

电力信息物理系统是通过通信技术、计算机控制技术等有机融合而成的,能够通过数据共享、数据分析、设备控制等,实现电网的快速感知、智能控制、实时调度等功能。系统主要由通信网络、分布式计算设备、控制中心、电源和电荷、输配电网络等构成。电力信息物理系统的组成如图1所示。

图1 电力信息物理系统Fig.1 Power information physical system

在通信网络中,主要由专用网络、有线网络和无线网络三类组成,在非关键设备的连接中应用普通有线网络,在关键设备中应用专用的有线网络,降低传输时延,无线设备如传感器等应用无线网络。为提高系统的算力,应用基于云计算等技术的分布式计算设备,实现强大的存储和计算功能。控制中心是系统的核心,其可实现信息采集、修正系统模型、仿真计算分析、发布控制指令等。

1.2 安全态势预测原理

电力信息物理系统依赖于电力网络能量信息及网络信息的交互体系。在物理层的网络中接入了各类用电设备,如电锅炉、电转气等,在信息层网络中通过采集各设备的关键参数、处理并分析相关数据,发出对物理层设备的控制指令,以此实现对电力信息物理设备的调度。在电力信息物理系统运行时,根据采集的设备参数,分析系统的运行状态,当部分参数不能满足安全运行的条件时,即由正常状态运行转换为紧急状态运行,此时,系统发出指令,切除发生故障的能源设备,或调整多个能源设备的协调供电,维持电力系统的稳定。

对电力信息物理系统态势安全进行预测,就是通过采集电力系统中多设备的运行状态参数,如电网电压、电网频率、信息网数据延时等,对参数进行分析,判定系统的运行状态,当参数出现异常时,可预测到系统出现安全威胁。电力信息物理系统安全运行主要受到电网、多类型负荷及关键设备运行状态的影响,例如,连接的热力系统或燃气系统等,出现能源供应设备故障、供需不平衡或信息传输设备故障时,整个电力信息物理系统的运行状态e会发生相应的变化,如果协调恢复能力不足,可能面对系统进入紧急状态甚至失控。

2 安全态势预测方法

2.1 安全态势数据挖掘

根据深度学习、最大均值差异算法和迁移学习,构建电力信息物理系统安全态势数据挖掘网络,实施安全态势数据的挖掘[2]。在电力信息物理系统安全态势数据挖掘网络的构建中,首先构建安全态势数据的深度神经网络挖掘模型,并通过安全态势源域数据对模型进行训练,将训练结果作为安全态势源域分类[3]。通过最大均值差异算法分析安全态势数据目标领域和源领域之间的数据分布差异,获取对应的数据分布距离。接着通过最大均值差异算法调整深度神经网络挖掘模型的原始网络结构,获取新的目标领域网络,并选择性迁移原始网络结构训练所获得的参数[4]。当数据分布距离低于所设置的阈值a,表明安全态势数据目标领域和源领域之间的数据分布较为相近,此时不需要调整网络,可以直接利用该目标领域网络。当数据分布距离高于所设置的阈值a,但低于设置的另一个阈值b,在目标领域网络中加入新的隐藏层,或对旧的隐藏层进行替换,使目标领域模型能够对新知识进行学习。当数据分布距离高于所设置的阈值b,表明安全态势数据目标领域与源领域之间的数据分布差异太大,这种情况下会出现负迁移现象,表明需要对目标领域网络进行更换[5]。其中两个阈值的设定需要根据实际挖掘经验来决定。在电力信息物理系统安全态势数据挖掘网络的构建中,知识迁移的过程具体如图2所示[6]。

图2 知识迁移的过程Fig.2 Process of knowledge transfer

通过最大均值差异算法分析安全态势数据目标领域和源领域之间的数据分布差异时,使用的公式具体如下:

MMD(X,Y,Z)=

(1)

式中,MMD(X,Y,Z)为这一再生核希尔伯特空间中安全态势数据目标领域Y和源领域Z的距离即数据分布差异;m为安全态势数据目标领域数据集大小;n为安全态势数据源领域数据集大小;k(xi,yi)为xi这一目标领域数据与yi这一源领域数据的内积,也就是二者的径向基核函数;k(xj,yj)为这一目标领域数据与这一源领域数据的内积;k(xi,yj)为这一目标领域数据与这一源领域数据的内积[7]。

就此实现安全态势数据目标领域和源领域之间数据分布差异的计算。

2.2 数据预处理

挖掘的电力信息物理系统安全态势数据是一种多源数据,因此基于多源数据分析技术中的多源数据预处理技术实施安全态势数据的预处理,以实现安全态势数据的多源数据变换、异构数据集成[8]。其中多源数据变换的处理方式包括多源数据平滑、多源数据缩放、多源数据泛化[9]。多源数据平滑能够清除安全态势多源数据中无关紧要的数据和噪声数据,使用的处理方法为Vondrak多源数据平滑方法,具体公式如下:

(2)

式中,yi为第i个安全态势源数据;yi为第i个安全态势源数据平滑值;aij为第i个安全态势源数据和第j个安全态势源数据的平滑度;bij为第i个安全态势源数据和第j个安全态势源数据的逼近度;n为正整数[10]。

分别对各数据进行平滑处理,剔除处理后与大部分数据偏差较大的数据,即可完成多源数据平滑处理。多源数据缩放主要是对范围较大的同一属性值进行处理,使其落到一个特定的、较小的区间,具体公式如下:

(3)

式中,Xscaled为数据缩放结果;Xsta为数据指定缩放范围;Xmax为安全态势某属性数据的最大值;Xmin为安全态势某属性数据的最小值。

多源数据泛化能够对某属性数据原始概念层中的细节信息进行抽象,将其提升到较高的概念层。具体数据泛化过程如下:①输入安全态势某属性数据的数据表;②设置泛化参数ω;③对数据表的隐私保护阈值T进行计算;④枚举数据表中的全部策略,在策略的枚举中将策略值大于阈值T的策略直接过滤,生成剩余策略的策略空间;⑤对于生成的策略空间,通过ω-近似Skyline实施过滤,获取候选策略空间;⑥实施候选策略空间的Skyline,获取推荐策略集;⑦输出推荐策略集及其对应的泛化。

异构数据集成主要是对安全态势数据的文本数据、XML数据、CSV数据、Hbase数据等实施数据集成处理,使用的工具为bigdata。

2.3 安全态势预测

通过bagging和支持向量机集成构建一种电力信息物理系统安全态势预测模型,通过2个步骤实现安全态势预测,训练样本集构造和通过模型实施预测。使用滑动窗口对训练样本集进行构造,使离散的多源安全态势数据集变得线性相关。训练样本集构造的具体过程如图3所示。

图3 训练样本集构造的具体过程Fig.3 Specific process of training sample set construction

将图中每次训练预测的结果作为一个训练样本集,从而获得多个训练样本集。通过bagging和支持向量机集成构建电力信息物理系统安全态势预测模型,该模型由10个并列的v-SVMv-SVM子模型构成。利用该模型进行安全态势预测,具体步骤如下。

(1)将bagging算法的迭代最大次数设为10。

(2)将v-SVM选定为弱学习算法。

(3)通过bagging算法构建v-SVM预测子模型。

(4)对v-SVM预测子模型序列集合参数实施初始化处理,用下式表示预测子模型序列集合为A=(A1,A2,A3,…,A10),A10是第10个预测子模型的序列。初始化的集合参数包括子模型的核函数参数与序列参数。

(5)在训练样本集中有放回的、重复、随机抽取一半训练样本,将抽取样本作为10个预测子模型的对应预测样本实施训练。

(6)通过训练获取10个预测子模型的新序列集合为:B=(B1,B2,B3,…,B10),B10是第10个预测子模型的新序列。

(8)整合10个安全态势预测值,整合后的结果即为集成预测模型的安全态势预测结果。整合方式为取10个结果的平均值作为最终安全态势预测结果,公式具体如下:

(4)

式中,X′为10个结果的平均值。

通过以上步骤实现电力信息物理系统安全态势预测。

3 应用效果分析

3.1 数据来源

某电力公司的电力信息物理系统安全态势数据作为数据集,采集该电力公司连续9周的电力信息物理系统网络连接数据,数据条数为52 638条数据。数据中具体包括4种类型的网络攻击,分别为非法进入攻击、特权非法获取攻击、漏洞扫描检测攻击、拒绝服务攻击。各种攻击类型的具体攻击方式见表1。挖掘的每条数据中共包括35个特征属性,在每条数据中加入一个类型标记属性,使每条数据拥有36个特征属性。对挖掘的实验数据集实施预处理,将其作为测试本文方法性能的实验数据。

表1 各种攻击类型的具体攻击方式Tab.1 Specific attack modes of various attack types

分别对本文方法的3种指标进行测试,3种指标具体如下:均方根误差、均方误差、平均绝对误差,3种指标的值越小,表示本文方法的电力信息物理系统安全态势预测结果越准确。

3.2 安全态势预测结果分析

应用本文方法对该电力公司电力信息物理系统未来1周、未来1个月、未来3个月进行安全态势预测,预测结果的均方根误差数据、均方误差数据以及平均绝对误差数据具体见表2—表4。

表2 均方根误差数据Tab.2 Root mean square error data

表3 均方误差数据Tab.3 Mean square error data

表4 平均绝对误差数据Tab.4 Average absolute error data

测试结果表明,利用本文方法进行安全态势预测后,未来1周安全态势预测值的均方根误差、均方误差、平均绝对误差数据最小;未来1个月安全态势预测值的3种测试数据居中;未来3个月安全态势预测值的3种测试数据最大。但3种数据整体差异较小,且整体安全态势预测值的均方根误差、均方误差、平均绝对误差均较小,表明本文方法的安全态势预测结果较为精准。

3.3 应用效果分析

为验证本文方法应用后的性能,以电力信息物理系统发生安全威胁后的响应时间为指标,将应用本文方法前与应用本文方法后的系统作为实验对象进行测试,重复进行5组,每组10次,得到结果见表5。

表5 应用前后的系统响应时间Tab.5 System response time before and after application ms

由表5可知,应用本文方法前,系统的响应时间平均为1 399.2 ms,而应用本文方法后,系统的响应时间平均为516.2 ms,这表明本文方法能够快速运算确定系统的安全态势,并及时地发出控制指令,能够提升系统控制的实时性。

4 结语

当今的电力信息物理系统安全问题频发,其安全态势预测问题引发了全球的关注,掀起了一股热潮。在该问题的研究中,应用了多源数据分析技术对电力信息物理系统安全态势多源数据进行了预处理,并设计了一种集成化的安全态势预测模型,实现了较为精准的电力信息物理系统安全态势预测。研究结果对智能电网的构建有一定意义。

猜你喜欢

系统安全态势预测
无可预测
历史虚无主义的新近演化态势与特征
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
地铁车辆车门系统安全互锁回路异常处置思路解析
2019年12月与11月相比汽车产销延续了增长态势
汇市延续小幅震荡态势
国际金价能否延续上涨态势
提升电力系统安全稳定性的有效措施探究