APP下载

基于深度学习的电网调控系统异常检测 与多阶段风险预警

2021-11-29瑾,

沈阳工业大学学报 2021年6期
关键词:数据量预警调控

王 瑾, 裴 亮

(1. 南京大学 软件学院, 南京 211102; 2. 国电南瑞南京控制系统有限公司 电网分公司, 南京 211106)

随着智能电网的日益完善,电网调度在计算机技术、通信以及控制技术的加持下更加智能化.其不仅能够直接采集电网数据,对电网状态进行监视,还可以实时为各级运行调度人员提供辅助分析,进行决策控制[1-2].但海量多源监测数据对精细化的调度控制提出了新的挑战,尤其对于电网运行过程中的异常风险预警与处理,亟需精细化、实用化的处理方案[3-4].

针对智能电网调控系统异常告警与控制,目前已取得较多的研究成果.汪伟等[5]在研究在线监测评估技术的基础上,提出了在线监测评估的软硬件架构,并进行实际应用.王钰楠等[6]通过制定归一化的风险指标和线性评估方案,实现了网络状态实时运行风险的有效评估,其不仅保证了分析准确性,更提高了计算效率.李存斌等[7]提出了一种将替代数据法与多重分形去趋势波动相结合的方法以确定电力负荷风险阈值,有效解决了传统风险预警阈值设定时对动态性能的需求.但现有研究大多只针对系统异常检测或风险评估展开,对电网运行状态所处阶段涉及较少,在评估过程中对不同电网阶段的分析不够全面[8].

本文提出了一种电网调控系统异常检测与多阶段风险预警技术,其利用随机森林(RF)算法完成异常检测,并采用人工神经网络(ANN)模型对系统异常状态发展趋势进行预测[9],便于运维人员采取风险预警措施.

1 电网调控系统架构

电网调控系统由数据采集管理层、在线监视管理层、高级应用管理层以及可视化展示层4部分组成,其架构如图1所示.

图1 电网调控系统的架构Fig.1 Architecture of power grid control system

由图1可知,数据采集层的任务包括主站端、调度数据网以及变电站端的数据采集管理;经过数据整合与预处理后,通过数据总线上传至监视管理层,进而监视所有设备的数据采集指标.在线监视管理层的任务除了包括主站端、调度数据网和变电站端的监视管理外,还需对各项数据进行实时监控与分析,并实时推送异常告警,以便及时发现、排除隐患[10].高级应用管理层主要负责提高系统的风险预测准确率和实时性,通过健康度评估、风险预测控制以及异常智能检测3方面实现[11].可视化管理层则在上述分析的基础上,将系统运行状态和异常检测结果等信息进行全面的展示,能够实现对所有应用功能的完全统一呈现,从而实现对设备健康度的实时监控.

2 基于RF的异常检测

通过对电网调控系统运行状态的分析可知,基础软件环境、网络环境、数据处理环境以及软件模块自身的故障均会对系统稳定运行造成极大影响[12-13].为提升电网调控系统的运行稳定性、降低故障发生频率,在全面考虑系统健康状态的前提下,利用RF算法实现异常检测.

2.1 系统异常类型

对于电网异常状态,故障发生集中点主要在3个方面:高级应用层,如调用的函数库、应用服务等;数据处理层,如前端事务调用、数据库服务等;基础设备,如数据库主机、前置服务主机等.根据电网调控系统运行过程中得到的日常异常类型汇总进行健康状态评估,其中数据质量健康度在电网调控系统中最为关键,主要体现在越限、状态估计合格率以及跳变率等方面[14].

在系统健康状态评估过程中,首先需要基于底层指标的评价结果结合专家经验权重进行加权求和,以得到上一层健康度,并以此逐层往上进行推算,最终得出系统整体健康度.

系统健康状态量主要包括:二值型和数值型两类,前者0或1分别对应异常或正常两种状态,如数据库表结构正确性表示;而数值型则通过0~100的分段函数将健康度指标量化,如CPU占用率表示等;健康度阈值设置为80%,即整体健康度小于该数值时将进行告警.

2.2 随机森林

RF的基本块是一个决策树,以递归形式分割K维特征空间,直到划分P个类型.在二叉决策树的情况下,树的每个节点将K维空间分成两个分区,重复执行拆分直到实现P大小的分区.

为了缓解决策树过拟合问题,RF算法从多个决策树聚合决策,即每个树从训练数据的随机样本中学习,且树的每个节点处的最优分割从训练数据特征的随机样本中选择.此外,根据多数票机制,生成最终的样本类型.

2.3 异常检测

电网调控系统的异常检测主要是针对系统运行中已经产生但运维人员难以发现的异常状况发出告警,同时对异常完成初步的剖析、诊断以及相应的类型划分,为后续的异常预警提供依据[15].由于RF算法具备较高的数据使用率、建模快且学习精度高等优势,所提技术将其引入.基于RF算法的电网调控系统异常检测过程如图2所示.

由图2可知,异常检测首先基于所采集到的历史数据,通过RF异常检测算法训练风险阈值,以完成初始异常检测模型的建立;然后通过输入相关实时数据,计算系统健康度得分进行系统状态判断.最终对检测模型进行实时更新以匹配运行状态,从而提高检测的准确度和实时性.

3 风险预警技术

在系统状态实时监测的基础上,本文提出了一种基于ANN的风险预警技术.通过分析系统的历史状态数据来预测其发展趋势,并针对可能出现的异常状况采取预防性措施.基于深度学习的风险预警流程如图3所示.

图2 基于RF算法的异常检测流程Fig.2 Flow chart of anomaly detection based on RF algorithm

图3 风险预警技术的处理流程Fig.3 Flow chart of treatment of risk pre-warning technology

在电网调控系统中,首先通过随机森林算法进行异常检测,然后结合当前的系统状态,利用ANN学习预测异常点后续的发展趋势.参数一旦超过安全阈值,系统会发出告警,而调控人员也会采取相应的防御措施.

3.1 系统运行状态分析

由于电网调控系统的数据量较大,当面对不断增加的数据流时,其数据处理能力的衰减是一个缓慢的变化过程,如图4所示.对于异常数据的检测,可将采集数据转换为数据健康度并乘以适当的权重作为整体健康度评估指标.数据健康度α可表示为检测到的异常数据量x与对应阶段数据量(x1或x2)的比值,轻风险阶段数据量为x1,拐点区域数据量为x2,崩溃区α直接记为100%.

系统在3个压力区中的运行状态分别表述如下:

1) 轻压力区.随着系统实时数据变化量的增加,轻压力区的系统性能影响较小,系统稳定系数始终为1.

图4 系统稳定性拐点模型Fig.4 Inflection point model of system stability

2) 拐点区.继续加大数据量压力,系统运行状态进入拐点区,系统仍能维持稳定运行一段时间,即电网故障持续时间小于阈值时,系统仍可稳定运行.

3) 崩溃区.当数据量达到系统处理极限时,系统性能急剧下降甚至崩溃,稳定系数接近于0,此时系统不可用.

3.2 人工神经网络

ANN由一个输入层、2个隐藏层、一个输出层构成.网络中每个节点间连接均带有一个相关的权重和一个将输入映射到已知输出的函数.其中输入层共设置20个节点,两个隐藏层各5个节点,输出层3个节点.单个节点的计算表达式为

(1)

式中:bj为可学习的标量偏差项;xi为输入;oj为输出;ωij为连接权重;δj为非线性激活函数.ANN将多个节点组合在多个级联层中,实现任意复杂的分类和回归函数.激活函数有多个选择,所提技术中选择双曲正切函数.

在训练过程中,首先初始化网络权值ωij,通常使用随机系数.该网络每次处理一个训练样本,将网络的预测输出与真实值进行比较,并调整节点连接权重以最小化训练误差.ANN分类器对噪声数据具有较强的容错性,能够学习任意复杂的决策边界.

4 实验结果与分析

为模拟系统实际运行场景,搭建电网调控系统闭环仿真环境,验证其异常检测及风险情况下的预警能力.系统测试平台应用场景如图5所示.

搭建系统由4台双网工作站构成,其中两台工作站模拟220 kV以上站端实现调控信号传输,两条工作站互为主备,包含网络通道及2 M通道共738条,通道模式包含了2 C、4 C两种连通方

图5 系统配置图Fig.5 Diagram of system configuration

式,模拟220 kV以上厂站和转发通道;另外两台工作站模拟220 kV以下站端实现调控信号传输,两条工作站互为主备,包含一平面及二平面通道共974条,通道模式为2 C连通方式,用以模拟220 kV以下的地级调度站.

4.1 评价指标

本文共使用3项评价指标进行系统测评,相关说明如下:

1) 系统稳定系数.当实时数据量达到一定压力时,系统并非瞬间崩溃,而是能先稳定运行一段时间,即有一定稳定运行裕度的时长.因此可以定义系统稳定系数为系统维稳时长除以数据量峰值持续时长,其中,数据量峰值持续时长为发生异常时系统接收数据量持续某一峰值的时长;维稳时长为系统在数据量峰值状态下,仍能正常稳定运行的时长.

2) 准确率.为有效评估异常检测模型的性能,使用检测率(ACC)和误报率(FPR)指标进行评估,其计算表达式为

(2)

(3)

式中:M为所有异常样本数;N为所有正常样本数;m为检测出的样本数;f为将正常样本误判为异常的正常样本数.

3) 平均绝对百分比误差(MAPE)可以定义为

(4)

式中:yt为预测变量在t时刻的值;y′t为预测算法得到的预测值.

如前文所述,每一层健康度由底层数据健康评价指标和系统稳定系数进行加权求和求得,经逐层推算最终得出系统整体健康度.依据专家经验,底层数据健康度和系统稳定系数权值分别取0.7和0.3.

4.2 异常检测性能分析

电网调控系统中包含厂站、断路器、刀闸、线路等对应的变化数据,异常检测率、误报率与并发用户数的关系如图6所示.其中用电行为模式数据参照文献[16]设置,并发用户由10人逐渐增加到100人.

图6 异常检测率、误报率与并发用户数的关系Fig.6 Relationship among anomaly detection rate,false alarm rate and concurrent user number

由图6可以看出,随着并发用户数的增加,误报率不断增长,而检测率持续下降.当并发数到达80时,误报率约为8%,检测率下降至84%,处于系统运行的拐点区.当并发数到达100时,绝大部分并发用户响应超时,误报率接近20%,且检测率低于80%,低于系统运行的最低指标.

为了论证所提异常检测方法的性能,将其与文献[5]、文献[6]、文献[7]进行对比分析.在3个阶段的检测准确率对比结果如表1所示.

表1 多阶段异常检测性能对比结果Tab.1 Performance comparison results of multi-stage anomaly detection %

由表1可以看出,相比于其他方法,所提方法在3个阶段的检测率最佳,分别为94.53%、88.79%和80.12%.由于所提方法综合考虑了系统异常的各种情况,并利用RF算法进行分析,保证检测的正确率.虽然当数据量增加,检测性能有所下降,但整体检测率不低于80%.文献[5]利用在线监测评估技术实现异常检测,但缺乏相应的分析算法,整体性能不佳.尤其当系统处于崩溃区时,检测率低于70%.文献[6]和文献[7]在轻压力区表现较好,但难以应对数据量陡增的情况,整体性能有待提升.

4.3 风险预警性能分析

当调控系统处于不同的阶段,其风险预警措施也不相同.由于数据量达到一定值后,可能会出现响应时间长、窗口信息丢失等问题.此外,当调控系统处于崩溃区时,系统也会直接发出预警并采取措施,故仅对系统的轻压力区和拐点区进行实验分析.

1) 轻压力区.在轻压力区,系统裕量较大,CPU使用率较低,能够处理大量的检测数据.此时系统预测误差对比结果如图7所示.

图7 轻压力区的预测误差对比结果Fig.7 Comparison results of prediction error in light pressure area

由图7可以看出,在轻压力区,所提技术的预测误差小于1%,优于其他对比技术.其结合RF算法和ANN模型进行风险评估,能够较为全面地检测系统运行状态,因此具有理想的预测效果.文献[5]利用在线监测评估技术,文献[6]通过制定归一化的风险指标与线性评估技术,文献[7]的多重分形去趋势波动,均能够得到较好的预测效果.但数据量增加到60点/s时,MAPE均超过3%,且分析大数据时整体效果不佳.

2) 拐点区.在拐点区,系统CPU使用率较高,且存在数据信息延迟等情况,因此预警性能有所下降.此时系统状态的预测误差对比结果如图8所示.

由图8可以看出,拐点区的MAPE较轻压力区有所增加.当数据变化量达到85点/s后,系统出现严重卡顿,此时MAPE陡增.尤其是文献[7]方法,MAPE超过32%,其利用替代数据法并结合多重分形的方法实现风险预测.因为算法本身较为复杂,所以当数据量急剧增加时,会导致系统崩溃.由于所提方法采用RF算法完成异常检测,利用ANN预测系统运行状态进行风险评估,因此其能够较好地处理海量数据,整体性能较为理想,MAPE不超过10%.

图8 拐点区的预测误差对比结果Fig.8 Comparison results of prediction error in inflection point area

5 结 论

随着可再生能源不断接入电网,更多不确定因素对电网的安全、稳定运行造成极大影响,为此,本文基于深度学习提出了一种电网调控系统异常检测与多阶段风险预警方法.利用RF算法进行系统异常状态的检测,并根据检测结果利用ANN模型预测系统的发展趋势.若超过健康度阈值,则发出预警.实验结果表明,所提技术在3个阶段的异常检测率分别为94.53%、88.79%和80.12%,轻压力区的MAPE小于1%,拐点区MAPE不超过10%,均优于其他对比方法,其不仅提高了系统运行维护效率,还保障了系统的安全、稳定运行.

由于本文考虑的系统异常类型大多为确定性的,而对于台风等自然灾害造成的突发性异常状况并未深入分析,因此在接下来的研究中,将更多地考虑不确定性因素影响,提高风险预警技术的普适性.

猜你喜欢

数据量预警调控
楼市调控是否放松
miR-142-5p通过CCND1调控胆囊癌细胞的增殖和转移
碘-125粒子调控微小RNA-193b-5p抑制胃癌的增殖和侵袭
预警型智能包装在食品安全中的应用和设计
超级秀场 大风预警
基于大数据量的初至层析成像算法优化
高刷新率不容易显示器需求与接口标准带宽
如何调控困意
电力营销数据分析中的数据集成技术研究
预警个啥