湖南电网云上综合智能告警准确率提升方法
2022-03-03龚禹生洪权李振文吴晋波张若宸
龚禹生,洪权,李振文,吴晋波,张若宸
(1.国网湖南省电力有限公司电力科学研究院,湖南 长沙410007;2.国网湖南省电力有限公司,湖南 长沙410004;3.北京科东电力控制系统有限责任公司,北京100000)
0 引言
随着电网的全面建设提升,电网运行特性也发生了重大变化,更强调调度运行模式的转变,不断提高调度创新能力,尤其是需要提升对跳闸等事故处理的智能化、在线化水平,有力保障大电网安全稳定运行[1-4]。
各级调控中心需要实现调控一体化的运行管理模式,并建立相应的设备监控支撑功能。告警系统对保障电网安全运行起着举足轻重的作用[5-7],从现场应用来看,调控云平台对调度自动化系统的智能化应用起了较大作用[8],但云上综合智能告警准确率还处于较低水平,主要体现在以下几个方面:一是硬件配置不足,调控云平台接收的数据量过大,现有数据采集与处理服务器难以承受如此密集的数据量;二是调控云平台告警程序还不够完善,对于某些跳闸信息匹配成功率不高,未能达到现场应用级别的要求;三是省、地公司之间数据传输通道不稳定,对数据质量有比较严重的影响。许多学者也在此方面进行了深入研究,文献[9]针对综合智能告警无法有效区分机组跳闸和人工停机而造成误告警的问题,采用一种人工合成停机信号的方案,优化机组诊断逻辑。文献[10]提出了一种云边协同技术,解决了集中计算带来的调控云网络带宽占用过大、数据时效性不强的问题,缓解了调控云中心的计算、存储压力,对于基础数据的传输起了较大的作用。文献[11]针对500 kV主变压器告警逻辑、误推图等情况进行分析并提出改进建议。
为了解决云上综合智能告警准确率较低的问题,本文从调控云数据平台结构、云上综合智能告警优化措施、示范应用以及问题分析4个方面展开分析,明确湖南地区相应的解决方案。结果显示,规范化、标准化地应用本文的策略能够有效提升云上综合智能告警准确率。
1 调控云数据平台结构
1.1 电网模型架构
调控云平台在遵循调控云结构化设计的基础上,设计适用于实时应用计算的电网模型结构,从模型数据平台获取全省电网模型采用存量下载、增量同步的方式,实现电网模型从模型数据平台到实时数据平台Ⅲ区,再到实时数据平台Ⅰ区,全过程实现自动流转。通过模型数据平台与D5000模型间的ID映射,实现模型数据平台、实时数据平台、D5000系统间的模型关联。
1.2 实时数据采集
省调及各地调实时数据云端汇集,为大电网广域浏览和各类在线分析决策应用提供基础数据。如图1所示,D5000系统侧原始报文分组转发方式,选取结果源链路上送实时数据。实时数据平台侧,采用分布式并行采集模式,支持多源处理;支持采集点表免维护;可动态扩容,满足海量数据采集需求。
图1 实时数据平台
1.3 实时数据服务
基于分布式实时数据库的处理架构按照地域范围和量测数据量将全网模型分成由多节点组成的分布式数据处理集群,各节点分别进行实时数据处理。实时云平台部署Ⅰ区数据处理服务器、数据采集服务器、数据库服务器、Ⅲ区数据交互服务器,共计12台服务器。智能告警应用部署于Ⅲ区,通过反向隔离装置获取Ⅰ区的电网运行数据及设备事件信息,根据拟定的判断逻辑实现故障跳闸事件的判定,生成告警文本等进行展示[12-15]。为了提升云上综合智能告警研判准确率,并提高调控云平台基础数据可靠性,对云上综合智能告警和OMS中人工填报的数据进行匹配后,对误、漏告警数据进行分析,并对源端数据的参数进行结构化、规范化、标准化治理。
2 云上综合智能告警优化措施
2.1 程序研判体系优化
2.1.1 10 kV线路告警研判优化
平台原方案采取“开关分位”&(“本间隔保护动作”‖“本间隔事故总”)作为遥信判据。根据湖南地区运行数据,在10 kV这一电压等级中,一方面站端事故总合成逻辑不完善,由于“事故总”合成信号中将非保护动作信号引入合成逻辑,导致正常分合断路器时误发“事故总”信号,触发故障跳闸推送,导致误告警较多。另一方面湖南电网老旧设备较多,远动机老化容易漏发信号,导致跳闸“事故总”难以准确触发,且短时间内难以全部整改完成,会产生漏告警。综合分析运行数据后,现阶段由“事故总”造成的误告警数量较多,因而暂对由“事故总”误告警逻辑进行优化。
因此10 kV线路跳闸匹配逻辑修改为“开关分位”&“本间隔保护动作”作为遥信判据, “本间隔事故总”和“全站事故总”仅作为关联显示,并在地市公司同时开展事故总台账排查工作,提高10 kV线路跳闸研判的准确率。
2.1.2 重复告警研判优化
针对线路跳闸存在首末端变电站均告出的情况,以线路名称+编号的双重命名为匹配关键字进行合并,仅推出一端变电站告警。
由于部分厂站省、地调名称命名方式不统一,如“某某站”“某某变”均为统一厂站,程序中则以厂站名(不区分“站”“变”的命名方式)、设备双重命名为匹配依据进行合并处理。
2.1.3 新增母线跳闸研判功能
母线关联多个断路器,因此无法参照线路、变压器等采用“单一开关分位&本间隔保护动作”的研判方式。考虑以母线跳闸保护动作信号作为触发,同时以同厂站、同电压等级的其他设备跳闸信息为辅助,二者结合作为母线跳闸的研判判据。当母差保护区内动作时,会首先出现母联分闸信号,系统会首先判断为母联跳闸,不会出现漏报的情况。
2.1.4 滑窗技术实现故障研判策略
目前调控云程序对于跳闸研判采用固定周期计算,每1 min启动一次计算,选取时段为当前时刻前5 min的1 min数据进行研判,将程序研判基于固定时刻触发,每次按照固定周期划分计算区间,会造成某次跳闸信息被划分到两个计算周期,造成重合闸动作情况研判错误,或者分闸信号无法与保护信号进行关联导致漏判。
考虑程序运行内存中滚动缓存2 min的原始信号,以1 min为间隔启动计算,每次计算选取缓存内1 min的断路器分闸信号作为研判触发,确保与该分闸信号关联的保护动作信号也在缓存中,以此实现计算原始信号的重叠,解决事故信息跨固定时间间隔的问题,如图2所示。具体步骤如下:
图2 变时间窗技术研判策略
1)计算周期1 min。
2)保持缓存2 min的原始信号,每周期滚动增加1 min的新数据、删除1 min的旧数据。
3)缓存2 min的告警研判结果,每周期滚动增加1 min的新数据、删除1 min的旧数据。
4)每次计算,进行研判的分闸信号的动作时间,处于缓存信号的中间位置,保证此分闸信号能够关联到其他分合闸、保护信号。
5)判断完成后,从缓存中删除关联的分合闸信号。
6)每周期,从缓存中清除旧的原始信号和告警研判结果。
2.2 基础数据治理
拓扑着色数据表示设备的带电状态,利用拓扑着色可以有效地过滤如现场试验操作引起的跳闸误告警。各地区在核查调控云智能告警误告、漏告数据过程中,发现在部分出线开关为手车开关的线路中,现场试验时已断开手车的刀闸,但调控云智能告警未能通过拓扑着色将试验误发的告警进行过滤。
地调D5000系统图形编辑器在对手车开关进行节点入库时,将手车开关中的断路器连至了母线,刀闸连至线路。当刀闸断开时,由于与断路器相连的母线仍带电,所以拓扑程序将断路器判断为带电,误发信号无法通过拓扑进行过滤。对手车开关拓扑采用了一套检测及整改方案。
1)存量模型。查看母线、手车开关上,可以看到设备连接点号。如果点号顺序为母线—断路器—刀闸,则需要进行调整
2)增量模型。对节点入库规则进行更改,增加判断手车节点号是否正确的判断逻辑,在厂站图点节点入库进行提示,如果手车开关连接错误会出现告警。
3)整改方案。选中有问题的手车,属性编辑器的“旋转角度”填写180°,将手车首尾的连接线重新连接正确,将手车首尾连接线重新拖到首尾端。
2.3 数据传输提升措施
2.3.1 主备调机数据同步策略
目前调控云Ⅲ区仅支持固定的某一台服务器接收地调拓扑文件,当主备调机服务器运行状态切换时,只有主调机服务器在接受拓扑文件,而切换中的备机服务器因缺少拓扑文件会导致误报、漏报。由于主备服务器切换时间约为4~8 h,会造成比较严重的误、漏告警情况。
设计一种主备机文件数据同步工具,工具部署在固定接收地调文件的服务器上,当检测到文件传输到主服务器上时,自动将文件同步传输到其他服务器,确保每台服务器上拓扑文件的一致性,进而确保每台服务器上的智能告警程序都能获取最新的拓扑着色信息。
2.3.2 数据传输通道监视
在调控云平台运行过程中,由于数据输送量大,会发生传输通道断链等情况,影响基础数据的质量,但采用人工监视通道的方式效率很低,因此针对可能发生的三种情况,采用不同的监视方法。
1)e文件链路监视。地调每分钟上送以时间戳命名的心跳文件(如cs_heartbeat20210620_080100.txt),程序自动获取系统当前时间并检测是否接收到该时间心跳文件,如果出现中断,调控云平台会自动发出告警信号,并标注相应断链时间。
2)拓扑文件监视。针对拓扑文件每5 min进行一次监控,由于地调拓扑文件都自动带有时间戳(以某地市公司为例,5月29日8:00的拓扑文件名称为cd_202105292000_breaker),出现时间中断的情况时,调控云平台会自动发出告警信号,并标注相应断链时间,某地市公司出现拓扑文件断链的页面,在图中会呈现红色告警信号。
3)数据库监视。数据传输到调控云平台的过程中会出现数据堵塞的情况,导致部分地调基础数据在调控云中丢失,因此针对数据库也采用了相应监视软件,每5 min对基础数据进行检查,如果在此周期内无数据上送数据库中,则平台也会自动发出告警信号。
3 应用成效及展望
通过采取程序研判体系优化、基础数据治理和数据传输提升等三大措施,有效提升了云上综合智能告警的研判准确率。根据统计,每个统计周期的10 kV及以上主设备跳闸情况和云上告警误、漏告警情况如图3所示。可以看出,云上告警研判准确率从1季度的86.07%升至4季度97.06%,事故跳闸告出率从1季度的81.78%升至4季度93.76%,有效提升了云上综合智能告警的总体水平。
图3 云上告警准确率统计
云上告警研判准确率=1-误报数/云上告警总数×100%。
事故跳闸告出率=1-漏报数/真实跳闸数×100%。
如图4所示,消除了由于手车开关拓扑着色错误、重复告警、主备调机切换导致拓扑文件丢失等情况,并加强了地调至省调实时云平台之间链路的监视。
图4 1—6月手车开关拓扑治理情况
现阶段还存在如下问题:1)省调实时云服务器配置不够,处理压力过大,造成遥测数据堵塞,保护信号与分闸信号入库延时过大,导致程序匹配失败;2)双重化名称填写不规范,研判过程中无法触发关键字匹配,导致漏告警;3)程序会根据断路器拓扑着色来判断是否进行研判,只有在断路器前5~10 min为带电状态时,程序才会对上送的分闸信号进行研判,当线路试送前,断路器为不带电状态,导致试送跳闸时分闸信号会被程序滤除,不会与保护信号关联,导致漏告警。
针对上述问题,拟通过以下方式解决:1)增配省调控云平台实时云服务器,提升省调端数据处理能力,降低由于通道阻塞造成的漏告警;2)组织地市公司开展双重化名称排查工作,确保每个分闸信号和保护信号中双重化命名一致且正确,并在每半月的云上综合智能告警核查中进行排查;3)设计云上综合智能告警结果与OMS交互的功能,如出现OMS中进行填报而云上综合智能告警没有研判的情况,则把OMS填报结果导入云上综合智能告警中,并加强对地调填报信息的规范与管理,保证基础数据的可靠性。
4 结语
本文在调控云平台建设的大背景下,分析云上综合智能告警准确率较低的问题并给出治理措施,进一步优化了调控云平台的告警信息功能,提升了平台数据的可靠性。通过数个月的运行,验证了提出的方案能解决相关问题,验证了方案的有效性。