基于语义分析的设备监控告警信息知识图谱构建研究
2020-09-08
(国网浙江省电力有限公司温州供电公司,浙江 温州 325000)
0 引言
近年来,随着多元融合的高弹性电网建设持续推进,电网规模不断扩大,SCADA(数据采集与监控)系统中上窗告警信息也越来越多。为帮助监控人员快速、准确掌握故障处理的关键信息,为故障(异常)处理提供辅助决策,亟需借助AI(人工智能)技术完善多元化故障判别处理决策手段。文献[1]提出了一种监控告警信息综合处理技术,提升了调控人员的整合感知能力。文献[2-3]对告警信息智能化辨识和缺陷判断提出了优化策略,具有一定的指导意义。在AI 领域,知识图谱技术可以模拟调控中心的“指挥大脑”,对设备监控知识进行提炼、萃取、关联、整合,形成知识模型,让机器具备认知能力,从而形成调控知识引擎[4]。文献[4-5]对知识图谱在电力调度的应用进行了初步探索。文献[6]提出了一种智能调控领域的知识图谱构建方法,判定识别准确率较高,有效降低了人工处置风险。文献[7]提出了一种面向电网故障处理辅助决策的知识图谱应用框架,并综述了解决思路与关键技术。文献[8-9]提出了一种故障处置预案知识图谱构建方法,对关联技术进行了阐述,提升了辅助决策水平。
目前,在设备监控故障诊断、缺陷判断等方面尚无相对完善的知识图谱构建辅助策略。本文提出了一种面向电力设备监控告警信息处理辅助决策的知识图谱构建方法,在构建电网设备知识谱图的基础上,将基于改进BM(Boyer-Moore)算法的语义分析技术和结线分析方法相结合,对告警信息进行智能化解析、判断和分析,形成故障简报,为监控人员故障诊断、缺陷判定等提供决策依据。
1 设备监控知识图谱构建
知识图谱是一种阐述实体语义联系的网络表述。实体和关系的知识抽取作为核心步骤,经历了从逻辑规则到深度学习的多个阶段。典型的实体抽取方法有隐马尔可夫模型、BiLSTM 等[10-11]。本文构建的设备集中监控分析知识图谱包含基础数据层、图谱构建层、信息解析层和推理决策层4 个环节,如图1 所示。
图1 设备集中监控处理知识图谱总体框架
2 故障告警信息文本预处理
2.1 图谱基础元件
在SCADA 系统获取的告警信息中,结构化数据主要包括主变、断路器、线路、母线、保护装置和交直流设备等设备及其拓扑结构。本文将传统电网拓扑结构转化为基于三元组(SPO)表示的图谱数据库[12]。三元组形式是知识图谱表征的一种常用方式,其表达式为:
式中:E 为实体集合;R 为关系集合;S 为三元组集合。结合告警信息中关键词信息设计业务逻辑图谱,如图2 所示。
图2 Neo4j 业务逻辑谱图(部分)
本文构建的业务逻辑图谱实质是从监控现场运行规程、调度管理规程、故障处置预案等语义文本数据中获得的知识,需借助NLP(自然语言处理)进行知识学习解析。
2.2 告警信息语义解析
当电网设备发生故障(异常)时,SCADA 系统会上送相关联的告警信息,如事故分闸、保护动作、开关油压低、重合闸闭锁、开关油泵启动、保护重合闸动作、控制回路断线等关键信息。
在知识图谱的基础上,将基于改进BM 算法的语义分析技术与结线分析方法相结合[7],对告警信息知识进行智能化字符解析,形成可供决策系统辨识的结构化表示,从而进行查询匹配与判断分析。
2.2.1 语义分析模型
将告警信息按照如下五元组结构进行解析[13]:
式中:V 为故障告警信号场景,对应SCADA 系统中变电站参数M1;D 为电气设备名称,对应设备参数表M2和断路器参数表M3;O 为二次设备,包含保护类Op,断路器类Ok和重合闸类Or,分别对应参数M4P,M4k,M4r;集合A 为保护类二次设备的动作属性;集合B 为保护和断路器的动作行为。
2.2.2 关键字符匹配算法
对于告警信息文本与语义的关键字符匹配,本文采用BM 算法。定义文本匹配度函数为:
式中:告警信息文本T=(ti)n,1≤i≤n;待匹配关键字段P=(pk)m,1≤k≤m,m<n。
满足式(4)则表示存在关联字符,关联长度为h+1。
为降低双字符匹配容错率,提高匹配准确度和处理速度,在BM 算法基础上进行改进,得到双字符串的匹配度计算公式[13-14]:
式中:m 为P 的总字符数;hmax为双字符串最大关联度,0≤hmax≤m 且hmax∈N*。
根据改进BM 算法策略[15],以告警信息文本T=“芙雁变洋芙周蒲线开关油压低重合闸闭锁”、动作行为关键字段P=“重合闸”、m=3 和n=18 为例阐述改进BM 算法(斜体表示匹配失败),匹配过程如表1 所示。共需4 次匹配,具体流程如下:
(1)将关键字段P 与告警信息文本T 左对齐开始依次匹配。关键字段P3与告警信息字符T3不匹配,继续查看T4;因字符T4在关键字段P 中不存在,继续查看后续字符T5;因字符T5与关键词中的P1不一致,将关键字段P 向右移动m+2=5 位。
(2)由于关键字段P 的尾字符P3与告警信息文本T 的字符T8不匹配,且后续字符T9在关键字段P 中不存在,字符T10的匹配模式亦同。因此,结合匹配规则将关键字段P 向右移动m+2=5 位。
(3)由于关键字段P 的尾字符P3与告警信息文本T 的字符T13不匹配,后续字符T14与关键字段P 中字符P1相同,将关键字段P 向右移动m=3 位。
(4)第4 次匹配成功,根据改进BM 算法,关键字符P 经过3 次移动、8 次匹配操作完成检索。
通过将告警信息T 与语义库中关键词P 进行算法匹配,可以得到该告警信息对应的变电站、设备名称和保护类型等关键信息。
2.2.3 告警信息解析过程
首先,将告警信息文本与SCADA 系统中M1,M2和M3的名称匹配,确定告警发生的厂站、设备名称或断路器;其次,与二次设备O 的模版M4p,M4k,M4r匹配,确定该告警信息文本中断路器或保护装置所对应的基本设备;然后,根据集合来判定告警信息的保护动作属性;最后,利用集合来判定保护或断路器的动作行为,具体判别流程如图3 所示。
图3 告警信息解析匹配流程
3 知识推理引擎
在告警信号经字符解析出关键信息后,结合电网运行和保护控制的先验知识诊断故障情况。在运行与控制逻辑、规则的基础上,结合系统拓扑和结线分析原理、保护的类型和属性、跳闸原则,可构建以下3 种告警信息之间的关联关系[12]。
3.1 电气设备和断路器关联的建立
结合文献[16-17]的解析模型建立告警信息关联关系,利用结线分析规则,其动作判据:定义S(si)n为故障失电子系统集合;T(ti)n为端点号集合;C(ci)n为断路器集合,ci作为di直接相连的跳闸断路器。
设备故障区域内的电气设备和断路器的关联式为:
式中:Sys(x,y)为设备所属子系统一致性判定函数;tj,di为Sn,T,C 内任一元素;CK(ci,tj)为端点与断路器关联判别函数。
假定故障范围的所有断路器遥信均在分位,若tj为设备di与断路器ci的共有端点,则ci为di在当前状态下的关联断路器,表示第j 台断路器位置为分位。
表1 改进BM 算法匹配过程
若di不为线路时,cj为跳闸断路器。若满足以下条件,则cj为di的跳闸断路器:
式中:EFlag(ti)为带电标志函数,EFlag(ti)=1 表示该元件不带电。
3.2 保护类告警信息关联建立
保护类告警信息可以根据解析后的二次设备集合O 进行判定,主保护的判定规则为含关键词“瓦斯”“差动”“高频”;结合保护装置的动作属性A,可对“零序”“距离”等类型保护进行确定。
因110 kV 线路故障跳闸的告警信息上窗信号中包含关键词为“保护动作”“重合闸”,将符合所有主保护动作判定规则的告警信息的动作表示为集合APj{fej},给出了差动主保护规则解析式:
将符合所有重合闸动作判定规则的告警信息的动作表示为集合ACr={frr},给出了涉及110 kV线路故障跳闸的重合闸规则解析式:
式中:R(ci)为驱动断路器ci跳闸的保护类告警信息ri的集合;paci,pbci,pcci为ci跳闸的相别。
3.3 保护与断路器告警信息关联建立
对于某一故障设备di,通过式(6)、式(7)可推导相关断路器,告警信号中涉及断路器动作的表述可表示为:
式中:R(ck)为驱动断路器ck跳闸的保护类遥信告警rk的集合。
基于结线分析的逻辑判断知识推理具备对保护动作情况分析、重合闸情况分析和故障相别判断分析的能力。
4 告警信息故障诊断总流程
结合本文构建的告警信息知识图谱框架及语义解析、推理引擎方法,给出了基于自然语义分析的设备故障诊断处置流程,如图4 所示。
图4 基于知识图谱的设备故障诊断流程
5 基于知识图谱的设备故障诊断应用
对于电力系统中非结构化数据的文本告警信息,通过自然语义识别技术提取关键词后,进入基于知识图谱的设备监控故障处置流程。本文以浙江某地厂站110 kV 洋芙周蒲1119 线线路故障跳闸为例,SCADA 系统窗口上送告警信息为:
(1)“2020-03-30 T 15:58:42 芙雁变洋芙周蒲1119 线保护动作 动作”。
(2)“2020-03-30 T 15:58:42 芙雁变洋芙周蒲1119 线开关油压低重合闸闭锁 动作”。
设备监控故障诊断流程中的关键内容如图5所示。
电网设备线路跳闸告警信息上窗后:
图5 设备监控电网故障诊断处置案例
(1)通过语义解析筛选芙雁变、洋湾变的故障间隔名称、保护动作、重合闸动作等信息,将设备名称及拓扑关系与设备实体图谱进行匹配,判别告警信息非误发信号。
(2)利用故障诊断的关联业务逻辑图谱,进而获得当前线路的属性与运行状态。
(3)进入逻辑关系判别,告警信息与业务逻辑关系匹配,且无断路器拒动、误动发生。
结合芙雁变与洋湾变各侧的开关、线路、保护设备的厂站线路关系,得到故障诊断结果:线路故障发生于洋芙周蒲1119 线,故障相别为A相,重合成功。结合告警信息所关联的知识图谱节点,生成110 kV 线路故障跳闸简报,以供设备监控人员对故障的诊断决策。
6 结语
为了实现对电网监控系统海量告警信息的智能化辨识和分析,本文提出了一种面向电力设备监控告警信息处理辅助决策的知识图谱构建方法:
(1)将基于改进BM 算法的自然语义分析和结线分析方法相结合,实现对故障告警信息的智能化解析,实现海量实时告警信息的筛选、过滤和智能判别。该方法可为故障诊断提供辅助决策。
(2)多维度设备感知信息有利于降低监控人员对关键信息的误报漏报率,帮助监控人员快速、准确掌握故障处理的关键信息,减轻视觉疲劳,提高告警处置的正确性和电网运行的安全性。
(3)为故障异常诊断后的智能化汇报、缺陷判断等应用奠定框架基础,从知识图谱现有技术和趋势出发,为集中监控智能分析平台的应用拓展提供了理论指导。