基于改进SVM的智能电网调控系统实时风险评估与预警技术
2022-01-27田家英陈艳霞
王 宁, 田家英, 董 宁, 韩 盟, 陈艳霞
(1. 中国农业大学 信息与电气工程学院, 北京 100083; 2. 国网北京市电力公司 a. 电力科学研究院, b. 电力调度控制中心, 北京 100031)
随着社会信息化水平的不断提高,电网智能化也逐步成为重要的发展趋势[1].高度集成和智能化的电网调控系统为电网的稳定运行提供了重要保障,但同时也伴随着一些潜藏的风险,尤其在调控系统通信与数据安全等环节较为薄弱[2-3],因此,有必要深入研究电网调控系统的实时风险评估和预警技术.
殷加玞等[4]提出了一种基于全概率风险度量的电力系统备用风险评估方法,对源荷双侧预测误差所引起的电力系统备用缺额风险进行了评估;商皓钰等[5]针对包含风电和光伏等新能源的电力系统提出了一种运行风险评估模型,并全方位考虑风险指标,从而有效提高电网的运行安全性;何晓峰等[6]针对连锁故障对电力系统带来的安全风险,在完善连锁故障模型的基础上,引入多种系统级的风险评估指标,并从宏观层面评估了目标系统运行风险.
但上述研究较多偏向于电力系统整体,而针对电网调控系统实时运行风险的评估与预警研究较少.因此,基于改进的支持向量机技术,本文提出了一种智能电网调控系统实时风险评估与预警方法.其将系统数据信息输入卷积神经网络(CNN)以得到数据特征,并将其估值输入支持向量机(SVM)分类器完成风险等级的划分,从而采取相应的预警措施.
1 改进SVM模型
所提算法基于传统CNN,分别从全联通层、汇聚层、激活层、卷积层以及嵌入层5个部分对该模型进行了优化[7].首先,针对数据集对每个词的嵌入进行训练,并作为特征输入CNN模型完成迭代训练.同时在其他网络参数共同训练作用下,将得到新的训练特征作为SVM分类器输入继续训练,并输出最终结果[8].
1.1 原始SVM算法
支持向量机是一种基于线性模型的经典机器学习算法,其输入空间通过非线性变换成为高维特征空间,以求解最优的线性界面.通常维数越高,计算复杂度越高,而在SVM算法中引入核函数解决了这一问题,降低了计算复杂度.
线性可分样本为(Xi,yi),i=1,2,…,n,Xi为样本矩阵,yi∈{-1,1}为样本标签.在多维空间中,线性判别函数的一般形式为h(X)=αX+b,则分类面可表示为αX+b=0.对其进行归一化,并用等比的方法来调整系数矢量系数α和b,因此,分类曲面问题可描述转化为
s.t.yi[(αXi)+b]-1≥0
(1)
根据描述的优化问题可得到最优决策函数为
(2)
式中:sgn()为符号函数;ϑi为每个样本的拉格朗日乘数;B为分类阈值.
基于SVM基本思想,将非目标问题通过非线性变换转化为高维空间的线性问题进行求解;而核空间理论通过非线性函数将数据从低维空间映射到高维空间,因此,分类问题可转化为属性空间,向量内积可以用核函数K(Xi,Xj)代替,则优化问题表示为
(3)
相应的决策函数为
(4)
1.2 基本CNN算法概述
CNN是一种典型的人工神经网络,该网络将上一层输出作为下一层神经元输入.通过多层卷积运算,完成从输入层到输出层的逐层非线性变换[9-10].通常CNN结构包含嵌入层、卷积层、池化层和全连接层,如图1所示.
图1 CNN的网络结构Fig.1 Network structure of CNN
其中,嵌入层是一个矩阵,将样本中的数据状态向量按从上到下的顺序排列;然后通过卷积层的卷积运算得到多个特征映射,并输入池化层减小输入数据的大小;最终池化层连接到一个或多个全连接层,并输出数据特征量.
CNN具备空间采样、局部连接和权值共享三个显著特征.CNN中局部链接的神经元结构会明显影响神经网络结构参数大小,卷积操作后得到的特征数据可用于训练与分类,但却存在计算量大的缺点[11-12],因此,对于卷积特征数据需要进行降维处理.空间采样方法作为常用降维方法,不仅降低了上隐层的计算复杂度,且增强了对时移的鲁棒性[3].此外,CNN的权值共享网络结构使其更接近于生物神经网络,避免传统机器学习算法中复杂的特征提取与数据重构过程.
1.3 深度神经网络结合支持向量机模型
所提技术中采用CNN网络改进SVM,以得到深度神经网络结合支持向量机模型(CNN-SVM)[13-14].将CNN输出的数据特征输入SVM分类器完成数据分类,并判定其风险等级,继而进行风险预警,其模型结构如图2所示.
图2 CNN-SVM模型结构Fig.2 Model structure of CNN-SVM
CNN-SVM模型的第1层是数据输入层;第2层用于数据预处理;第3层为5个并行的CNN模型,每个模型均由一个双卷积组成,即卷积层与最大池化层的组合.为了充分考虑每个数据前后时刻的信息,提取不同大小的局部特征,从而改变窗口长度,于是将5个卷积结构的大小设置为5×100、6×100、7×100、8×100和9×100.经过卷积层的处理后,模型分类特性更为优越,且每个并行的CNN模型均连接一个Flatten层,进而完成多维数据降维处理.
在长度为l的窗口中,卷积核K完成卷积运算后的输出特征为
oi=σ(ωXi∶i+l-1+d′)
(5)
式中:Xi∶i+l-1为滤波器滑动窗口内输入矩阵X的信息;ω为权重矩阵;d′为偏置因子;σ()为激活函数.神经网络中有众多激活函数,如Sigmod函数、Tanh函数等,所提模型中采用Tanh函数.之后,采用两个全连接层,一个是对以前的数据进行特征加权,另一个是提取输出的特征.输出向量具体计算表达式为
U′=δ(ωU+b)
(6)
式中,U与δ()分别为上层输出向量和高级激活函数Leaky ReLU.通过引入包含非线性因素的Leaky ReLU函数,在增强模型表达的基础上去除冗余数据,最大限度地保留数据特征.此外,为了加快特征数据的收敛速度并防止过拟合,设置了批量标准化层.
最终,电力数据在滑动窗口中被转换成固定长度的向量U″,然后用Softmax函数对提取的特征U″进行处理,输入SVM分类器进行训练,并输出分类结果.
2 系统实时风险评估与预警技术
随着“大运行”体系建设的推进,智能电网调控业务高度集约,接入厂站数据量急剧增加.对智能电网调控系统的数据交互实时性、业务响应及时性、运行可靠性与健壮性提出了更高的要求,因此,采用CNN-SVM模型评估系统实时风险并作出预警.
2.1 系统实时风险评价指标体系
智能电网调控系统的硬件架构是由大量服务器搭建构成的,服务器的健康与否直接影响系统整体安全.而负责发、输、变、配电业务的调控系统也同等重要,其健康度同样关乎系统安全,尤其是调控过程中数据传输质量对系统业务所产生的干扰不容忽视,故这也是系统安全的又一个影响因素.因此,系统实时风险评价指标体系中包含了服务器、业务与数据质量3种状态因素.该评估系统结构如图3所示.
系统实时风险评估体系采用层次分析法(AHP)自下而上分层计算,结合专家经验确定的指标权重和各个评价标准得到系统实时风险等级.
系统评价指标体系主要由3层构成.第1层为CPU、网络I/O等,通过监测系统获取运行数据.在该层次中,对定量指标如CPU使用率等进行量化评定.而进程、网卡状态等指标则经常进行定性评定,通常优先级较高.若存在风险,则分值为0;若不存在风险,则进行定量指标评定.
图3 系统风险评估架构Fig.3 Architecture of system risk-assessment
第2层为中间层,主要构建包含进程、硬件健康度等在内的数据指标.在该层,根据第1层指标的分数与专家权重计算系统风险状态值.系统部分指标的评价等级和评分标准如表1所示.
表1 部分指标的评价等级和评分标准Tab.1 Evaluation grades and scoring standards of some indicators
第3层为最顶层,可以直接影响调控系统安全的风险数据指标,如Scada应用状态等.该层次结合前两个层次定性定量指标的计算方法依次向上层指标计算,直至得到系统实时风险分值.
2.2 基于CNN-SVM的系统实时风险评估与预警
将电网业务数据流、服务器工作状态等输入实时风险评估系统,并利用CNN-SVM不断深入分析系统数据,根据计算得到的风险分值进行相应预警,整个过程如图4所示.
电网调控系统实时风险评估流程主要包括:数据采集、风险识别、风险评估及定级、风险预警等.其中,采集的数据主要有6个输入指标:磁盘I/O、网络I/O、网络连接数、进程占用CPU、进程占用内存及线程个数.将采集数据输入CNN进行特征提取,并结合AHP计算系统的实时风险值;然后将系统风险值输入SVM,并结合动态的系统信息,完成风险等级的划分,其分为完好、正常、异常、崩溃4个等级;最终根据系统风险等级采取相应的预警措施,保证系统的安全、稳定运行.
图4 电网调度系统风险评估及预警流程Fig.4 Flow chart of risk-assessment and early-warning of power grid dispatching system
3 实验结果与分析
为验证所提方法的可行性与有效性,模拟实际运行场景,搭建如图5所示的电网调控系统闭环仿真测试系统.
图5 系统配置图Fig.5 System configuration diagram
系统由3台双网工作站构成.在实验中,智能电网调度控制系统为D5000,其基础平台为V3.0,金仓数据库管理系统为V7.0,凝思安全操作系统为V4.2.
3.1 系统并发能力测试
典型场景并发规模测试中,输入数据规模为:厂站数642个、通道数1 712条、模拟量44万(441 070)点、状态量82万(829 104)点、遥控量5万(52 300)点、遥调量1 800点,数据量为遥测量达到2 000点/s、遥信变位10点/s、带SOE的遥信变位5点/s.
在线并发用户数根据实际场景确定,由最初的10户逐渐增至100户.根据接口分析及日志数据整理编写测试用接口脚本,创建测试的使用变量,这些测试变量驱动接口动态链接库完成测试活动,并收集测试动态链接库返回的数据.分析这些数据可以得出,系统是否可对用户请求做出正确的响应,从而记录响应时间.最终计算开始时间与结束时间得出系统的响应时间,并计算整个测试过程中系统的正确响应测试和错误响应测试,得出系统的错误率.调度系统并发能力测试结果如图6所示.
图6 并发用户数与传输响应时间及CPU利用率的关系曲线
从图6可以看出,系统响应时间随着并发用户数的增加而增长,两者成正相关关系.当并发数到80时,系统正确响应时间显著增加至20 s,超过专家经验评价所得的响应时间临界值;CPU平均利用率也跃升至60%,临近日常状态CPU占用率的异常指标.当并发数达到100时,绝大部分并发用户响应超时并呈现较高错误率,且CPU平均利用率处于异常状态.因此调控系统的合理并发用户数应小于80户,此时测试性能最佳.
3.2 风险评估精度分析
为消除评价等级差异对评估精度造成的影响,实验针对所有等级的风险评价精度、召回率和F1值进行了计算,并将所提技术与文献[5]进行对比,结果如表2所示.
表2 不同评价等级的测试结果Tab.2 Test results of different evaluation grades %
由表2可以看出,当系统处于异常或更优的状态时,各个风险等级的分类精度均在0.90以上,召回率和F1值也表现较好.因此可以排除评价等级间的差异对系统评估误差的影响,且所提技术的分类精度、召回率和F1分数的均值分别为92%、86%、90%,均优于对比方法.但当风险等级处于崩溃状态时,所提技术的性能出现了明显下降,如分类精度仅为84%.由于数据量急剧增加,对系统造成了较大压力,响应时间增长且错误率上升,因此系统整体分类性能降低.而相比文献[5]中技术的分类准确率为71%,所提技术仍具有较明显的优势.
3.3 风险预警可靠性分析
智能电网调控系统对可靠性要求极高,因此不光要保证风险预警的准确性,还应保证风险预警系统的可靠性.通过故障模拟,将所提CNN-SVM技术用于实时风险评估,利用故障数据验证实时风险评价系统的可靠性.系统风险等级分为完好、正常、异常和崩溃4种,其中完好和正常状态说明系统运行风险较低,因此本实验验证系统在异常和崩溃状态下的预警可靠性,文中采用正评率评估系统可靠性,其计算表达式为
(7)
图7 可靠性验证实验结果Fig.7 Experiment results for reliability verification
从图7中可以看出,当系统数据不超过600 MB时,应用所提技术所得的PΩ值不低于90%,且文献[5]所得PΩ值大约为88%.当系统数据超过700 MB时,PΩ值急剧下降,且应用文献[5]技术的下降幅度更大.最终,应用本文所提技术系统的PΩ值未低于60%,符合要求;而文献[5]仅为52%,已失去准确预警的性能.文献[5]采用运行风险评估模型,其技术较为传统,在处理海量数据时效果不佳.综合来看,所提技术的预警可靠性更优,且全面考虑了各个影响因素,并利用CNN-SVM进行分类处理,提高了调控系统的稳定性.
4 结 论
调控系统作为电网的核心,其安全稳定地运行至关重要.为此,本文提出了一种基于改进SVM的智能电网调控系统实时风险评估与预警技术,构建出了一个包含各种影响因素的风险评估体系,并利用CNN模型获得影响因素的特征.计算系统实时风险值,同时输入SVM分类器模型完成风险划分.基于构建的电网调控系统对所提技术进行实验的结果表明,并发用户数小于80户时,系统测试性能最佳.即使当系统处于崩溃状态,其评估可靠性也未低于60%,满足系统实际运行的要求.在接下来的研究中,将考虑更多的影响因素,如天气变化等,以实现智能电网调控系统更高可靠性的风险评估和预警.