APP下载

电网安全风险防控监督平台创新研究

2023-11-27国网重庆市电力公司陈莉波李虹果秦煜森周统刚

电力设备管理 2023年18期
关键词:超平面向量电网

国网重庆市电力公司 陈莉波 李虹果 秦煜森 周统刚 王 宇

目前,电力系统不断提高对安全督查管理重要性的认识,将其和电力系统日常运行维护紧密结合起来,有效发挥安全监控效能。电网安全督查的技术革新主要聚焦在三个方面:一是通过构建作业现场可视化安全监控中心,对每日电力施工现场作业情况及电网运行线路等情况进行实时监控,并通过完善安全监控工作机制,确保提高安全管理和应急处置水平;二是通过加强对安全监察数据信息管理,不断优化和改进安全监控流程;三是加强安全督查大数据的建设,构建相应的模型,搭建安全督查违章数据库,做好数据管理系统的应用、设计、开发和推广,从而构建完善强大的安全督查信息网络[1]。

针对当下电网企业安全风险防控监督方面评估不合理、预测不准确的问题,本文提出了以主成分分析法和支持向量机为核心的电网安全风险防控评估模型,并以此为基础建立电网安全风险防控监督平台。电网安全风险防控监督平台的架构包括接口层、数据层、系统层、功能层、接入层五部分,各部分建立了与之匹配的功能。同时,本文从电网安全防控措施的及时性、规范性、真实性、系统性、完整性五维度建立电网安全风险管理因子指标体系,用于对电网安全风险防控措施分类和评价。

1 电网安全风险综合防控监督平台

电网安全风险综合防控监督平台的框架结构由接口层、数据层、系统层、功能层、接入层五部分组成[2]。接口层是电网安全风险综合防控监督平台与国网现有安全风险监督平台、经法系统、e基建等电网信息管理联通的门户,通过接口层从电网各信息平台收集、汇总安全风险相关的数据内容;数据层负责对接口层获取的数据进行整理、分析,是电网安全风险综合防控监督平台统一的数据统计与访问模块。在获取到各电网信息平台的相关数据后,根据数据性质,按照设定好的分类标准,将数据归类为作业计划数据、风险辨识和评估数据、安全风险应对方案等。

系统层是电网安全风险综合防控监督平台的核心,对数据的分析应用、平台各项功能的实现、平台运行的稳定都有赖于系统层代码的构建。系统层共设置了三类系统,负责三个方向的功能实现,分别是安全控制系统、异常处理系统、日常管理系统。安全控制系统负责应用安全控制、主机系统安全控制、网络安全控制、边界安全控制以及数据安全控制五项功能目标的实现;异常处理系统负责信息异常处理、系统异常处理、网络异常处理三项功能目标的事项;日常管理系统负责用户管理、日志管理、运行参数管理以及数据统计分析等功能的实现。

功能层是电网安全风险综合防控监督平台功能行使的模块,功能层的工作包括两个方向,一是信息获取,二是风险管控成效评估。“信息获取”功能的发挥是基于风险督查理论,依据安全风险防控督查资料,在对所需信息进行提炼和分析后,从及时性、规范性、真实性、系统性、完整性五个维度提取安全风险管理因子,共提取20项电网安全风险管理因子,形成电网安全风险管理因子指标体系。风险管控成效评估是在电网历史数据资料基础上,设定合适的数据模型,将电网安全风险因子指标数据输入到模型中,分析电网安全风险管控措施对安全风险水平的成效关系。在模型对安全风险的成效评估的准确性、合理性达到预期水平后,确定模型参数,从而构建起安全风险综合防控评估模型。

接入层将具体的电网安全风险与对应的防控措施相匹配。在功能层对电网安全风险进行管控成效评估后,以评估结果为参考,与实际的防控措施管控成效相对比,分析实际成效与评估结果的差距。接入层实施以提升管理水平为目标的事后督查溯源机制,建立“查、分、改”三步溯源法:对照违章问题清单,梳理管理失控的要点;追溯作业前置的管理环节缺失与管理要求执行偏差,分析具体成因并形成报告;以问题原因为单位,差异化制定管理整改和提升措施。

2 电网安全风险综合防控评估模型

采用主成分分析法对输入指标数据降维,提取主成分因子,消除多重共线性。再将主成分因子数据作为输入值,采用支持向量机模型进行训练、拟合和评估预测。

2.1 主成分分析法

主成分分析法(Principal Component Analysis,PCA)的原理是,将数量较多的指标通过降维的方式转变为少数几个主成分指标,所有主成分指标都是对原有指标彼此独立的线性组合。

2.1.1 主成分的确定

通过寻找数据标准化线性组合中方差最大的线性组合,确定第一主成分X1,X2,…,Xp。通过标准化操作构造第一主成分如下:Z1=φ11X1+φ21X2+…+φp1Xp,其中:Z1即为第一主成分,φ11,φ21,…,φp1是第一主成分的载荷,并且。首先要对各个指标维度的数据进行中心化处理,使得各指标的均值为0;在此基础上,对指标数据按照如下的关系方式进行拟合,并确定相应系数值:zi1=φ11Xi1+φ21Xi2+...+φp1Xip,可以转化为如下的最优化问题:

通过求解上述目标函数的最优解,依次确定第一主成分Z1、第二主成分Z2……直到第n主成分Zn。其中,第一主成分的得分最高,其他主成分得分依次减少,Z1,Z2,…,Zn的各主成分之间互不相关。在数据集中存在多个数据变化的方向,其中在向量空间上数据变化最快的方向就是载荷向量,可定义为φn=(φ11,φ21,…,φpn)T。载荷向量可以看作一个特定的线性组合方向,将n个数据点x1,x2,…,xn投影到该方向上,即可得到主成分的分值z11,z21,…,zn1。

2.1.2 主成分的选取

数据集中的每一类指标作为主成分分析中的一类成分,其中一部分是主成分,将主成分的方差加总,计算其占所有成分指标方差总和,即可得到方差解释比率(Proportion of Variance Explained,PVE)已中心化的数据集总方差为:,通过对上述总方差计算变形,得到第m个主成分的方差解释比率:,并计算第m个主成分的PVE为:

一共有min(n-1,p)个主成分,其和为1。对主成分数量的确定,一是能够依据具体研究方向的经验判断,二是也可以通过交叉验证法等方法进行。

2.2 支持向量机

支持向量机(Support Vetor Machine)方法是一种以监督学习的方式针对数据进行分类的学习方法,也可以用于回归和预测。支持向量机的原理是利用核心函数进行基础学习,通过学习构建出一条超平面进行数据分类。支持向量机对线性数据和非线性数据都可以通过构造超平面实现对数据分类,通过以下几个部分阐述支持向量机原理。

2.2.1 最大间隔分类器

定义为X=(X1,X2,…,Xp)的数据点,其p维空间的超平面定义为:β0+β1X1+β2X2+…+βpXp=0,如果β0+β1X1+β2X2+…+βpXp>0,那么X位于超平面的一侧。如果β0+β1X1+ β2X2+…+βpXp<0,说明X位于超平面的另一侧。超平面若存在则不止一个,从所有的超平面中,选取间隔最大的超平面作为分类的依据,则超平面的两侧的数据分属两类。假设在训练数据集中存在一个超平面,所有的数据到超平面都有一个或者数个垂直距离,其中最小的那个垂直距离就是间隔。以间隔最大的超平面对数据进行分类,就是最大间隔分类器。

2.2.2 支持向量分类器

通常,分割超平面并不存在,在这种情况下根据超平面进行分类的最大间隔分类器就失效了,但可以使用“软间隔”进行推广。只要存在一种决策界面能够保证大部分的观测点落在正确的一侧,则认为可以接受此决策边界,这个界面就是支持向量分类器。超平面通过求解下述最大化问题得到:maxβ0,β1,…,βp,ε0,ε1,…,εnM,满足,,,其中:C是非负的调节参数;M是间隔的宽度;ε是松弛变量。

2.2.3 支持向量机

如果数据的决策边界是非线性的,在支持向量机的分类器是对线性函数分类的条件下,模型的分类结果是不能够满足要求的。因此为了扩大支持向量机的特征空间,采用核函数的方法对支持向量机进行修正。支持向量机的形式如下:,其中:K表示的是核函数,能够将数据从更低的维度向更高的维度转换;S是支持向量的数据集合,是衡量支持向量机中各数据间的距离差异。在自由度为D的条件约束下,采用多项式的方式表达的核函数可以表述为:,径向核函数为:,γ是一个正常数。

对测试观测值与训练观测值的差异进行判断,往往采取欧几里得度量法,也称为欧式距离测量法。如果测试值x*=(x*1…x*p)T与训练值xi的距离差异非常大,就会导致的计算结果也会相应变大,进而K(x*,xi)就会变小。这说明了xi对f(x*)的作用不明显。换言之,径向核函数的计算方法并不是一种全局的算法,实际上是一种局部的算法。也就是说,在模型中训练的观测值数据一定欧式距离范围的观测的进行才会影响类别划分。

3 模型实证分析

在实证分析环节,首先采用主成分分析法对电网安全风险管理因子指标进行分类,简化指标体系,提取主成分指标;其次,将主成分指标以及电网安全风险综合防控成效的历史数据,输入到支持向量机模型进行训练模拟,最终构建电网安全风险综合防控评估模型。基于KMO和巴特利特检验(KMO取样适切性量数0.802、近似卡方532.764、自由度45、显著性0.042)的所示的电网安全风险管理因子指标体系,搜集2018—2022年的指标数据,使用SPSS平台进行主成分分析。主成分的分析主要包括适宜性检验和主成分提取两个环节,在确定好主成分之后,构建支持向量机的算法机制,并构建相应评估模型。

主成分分析的适宜性检验:KMO和巴特利特检验的适宜性检验结果表示,指标样本的KMO值为0.802>0.7,根据Bartlett球形度检验的原理,对模型分析结果进行检验,其检验方式为卡方检验,检验值为532.764,通过了检验要求。P值为0.042小于0.05。由检验结果可知,选取的指标样本适合进行主成分分析。一般要求指标的提取率在60%以上,才能保证提取的指标信度较高。20项指标书中有18项指标的提取率在80%以上,说明提取的结果比较满意,指标的信度非常高。

主成分提取:以主成分分析法对电网安全风险管理因子指标体系的20项指标进行主成分提取。总共提取到6个主成分,6个主成分的特征值分别是5.439、3.867、2.814、2.737、1.910、1.467,特征值大于1的6个主成分可以解释原始指标的信息91.17%的信息。这说明原有的20项指标之间具有较强的相互关联性,而通过主成分分析法提取的六个主要指标通过对其他指标的线性组合,形成简练且较为全面的表述原有信息。

基于支持向量机构建评估模型:基于上文的SVM算法原理,通过MATLAB编程进行机器学习。由于指标体系中指标的完成需要基于期间的各类项目数据得出,考虑到项目周期的时长,采用年度数据进行训练。由于输出预测数据仅为电网安全风险防控成效的数据,是低纬度的预测变量,选择MATLAB中的firstsvm函数进行。fitrsvm支持使用内核函数映射预测变量数据,并支持通过二次编程实现目标函数最小化。

综上所述,本文以电网安全风险防控为主题进行了两方面的创新:一是构建了电网安全风险防控监督平台的框架结构,并制定了各功能层的作用;二是基于主成分分析及支持向量机理论,建立了电网安全风险防控成效评估模型。模型基于历史数据进行迭代训练,对电网安全风险防控成效评估的准确率可以保证在90%以上,平均误差为5.62%,能够满足成效评估工作开展的要求。研究成果对于完善电网安全风险防控机制、优化防控措施成效评估及预测、提高电网安全防控监督平台建设具有极大的参考价值。同时,由于电网安全防控监督历史数据存在缺失,电网风险防控管理因子覆盖有所不全,研究还存在进一步加深的空间。

猜你喜欢

超平面向量电网
向量的分解
穿越电网
全纯曲线的例外超平面
涉及分担超平面的正规定则
聚焦“向量与三角”创新题
以较低截断重数分担超平面的亚纯映射的唯一性问题
向量垂直在解析几何中的应用
电网也有春天
向量五种“变身” 玩转圆锥曲线
分担超平面的截断型亚纯映射退化性定理