APP下载

基于事件知识图谱的变电站监控事件处理方法研究

2021-10-13鲍晓宁王德清林冠雄蔡嘉炜

机械与电子 2021年9期
关键词:图谱检索标签

鲍晓宁,余 薇,王德清,秦 琳,林冠雄,蔡嘉炜,莫 薇

(1.国网福州供电公司,福建 福州 350009;2.国网福建省电力有限公司,福建 福州 350003)

0 引言

在大数据和人工智能(artificial intelligence,AI)时代,各种来源的大量数据不断地从人类生活中产生。在电力领域,随着海量测控装置以高频采样速率对电力系统设备、线路和潮流等状态进行实时采集与传输,产生了海量深度间接知识[1]。

电网系统通常是一个非常复杂和庞大的系统,目前电网系统中存在着数千种不同类型的基本设备[2-3]。在我国,自2016年以来,国家电网大力开展数据中心建设,打造现有电网向下一代智能电网的转变数据支撑。截至2018年1月,某省级电网运行数据总存储容量为560.48 TB,其中常态结构化数据为209.50 TB,非结构化数据254.86 TB,实时测量数据72.02 TB,在线应用数据24.10 TB。在如此巨大数据量的情况下,为了揭示电力物联网中设备、网络等物理实体与虚拟载体之间的关联关系,需要通过知识图谱等语义分析方式对电网单元进行切割、定义与关联,以便进行深入分析,做出更全面、更准确的判断[4]。

本文旨在利用AI增强标记系统构建面向变电站关键事件的知识图谱模型,以方便变电站管理、搜索、运维与检修,整个模型构建过程分为数据收集、标记、分析和应用,采用数据库管理系统实现半自动化关联[5-6]。

本文所开发的知识图谱系统,有助于增强现有电网系统的稳定性和可靠性,并将变电站设备事件利用信息共享给多用户群体。与传统的知识图谱构建方法相比,整个构建过程更加透明和易于实现。在此基础上,设计了一种基于图形处理器单元优化的优先搜索算法,用于输出知识图谱中存在的任意2个节点之间的内部连接,增强检索效率。

1 知识图谱和标签技术

知识图谱是建立在语义网络上的庞大知识体系,是大数据时代新兴的大型知识管理和智能服务技术[7]。知识图谱捕捉并呈现了某一领域概念之间复杂的关系,连接了碎片化的知识,在这些应用中起着至关重要的作用[8]。

标签系统和标签生成技术是生成特定知识图谱的关键技术,标签指特定对象组现有特征的摘要[9]。一般来说,业务实体通过多维标签反映其属性。对变电站设备而言,其标签描述包括设备类型、电压等级、面积、线路和日常运行状况等方面。在此基础上,可以提出基于多标签系统对具有相似属性的设备进行分类[10]。

当前电网中存在的设备以网络结构的形式存在,这些网络结构很容易用知识图谱来解释。因此,知识图谱不断发展,已成为电网网格数据的有效管理工具。可视化的知识图谱能够辅助海量信息的理解。在知识图谱中,知识以实体-关系-实体三重映射体系的形式存在,实体与实体之间的关系以节点和边的形式呈现。基于标签辨识与实体互联技术,知识图谱架构如图1所示,主要步骤包括采集数据、知识抽取、知识表示、知识融合、模型构建及高级应用。为了解决变电站网络中的知识孤岛问题,挖掘事件中的共指关系、因果关系和时序关系,提高电网数据中心的事件序列关联度与信息挖掘价值。

图1 知识图谱架构

2 构建变电站设备画像系统

2.1 构建标签系统

基于我国变电站的主要业务,构建了变电站设备装置标识系统。对应于各变电站设备装置的时空断面图,根据设备的历史和当前运行状况,各装置未来可能的位置、检查、管理和维护状况,以及各厂家的设备额定容量,设计了贴标系统。网格设备标识系统的层次关系如图2所示。

图2 电网知识标签类型

对于从变电站收集的每个数据块,可以分配3个级别的标签,即事件标签、型号标签和决策标签。事件标签是最低级别的标签,其代表变电站设备的关键事件表征行为;型号标签表示生成决策标签最匹配的决策模型;决策标签表示面向设备运维的操作指令。生成贴标系统的基本规则包括:

a.标准规则。为每个级别生成标签的标准必须在不同的数据块之间保持一致。

b.连接规则。子代总数相当于父节点总数;否则会出现划分不完整与父-子节点不匹配情形。

c.划分规则。划分概念不能兼容,从属概念不能并行。

基于标签系统的上述3个基本规则,根据提取源、数据关联关系和提取逻辑确定最终标签。生成规则的难度和复杂性随着标记级别的增加而逐渐增加。

标签系统有4种更新策略:

a.更新策略。不同标签的更新周期不同。一般来说,特定标签的更新周期可以是实时的、每月的或3个月的,更新周期取决于标签类型。

b.更新条件。该策略根据数据块的属性建立标签更新触发机制。对于每个标签,标签更新是在不同情况下触发的。

c.更新权限策略。权限策略根据原始数据的分类级别确定标签更新授权优先级序列。

d.回收策略。基于标签消除机制,删除无用的标签,避免浪费资源。

在利用知识图谱构建变电站事件模型时,每1块电网数据都需要遵循以上4种策略。对于具有多个标签冲突的数据块,将重新访问上述4条规则,以确定该特定数据块的最高优先级标签。

2.2 数据处理

变电站设备画像的构建涉及到大量设备之间的连通性信息。需要高效的数据处理框架/技术来支持数据存储、分析和知识图谱构建过程。本文提出了一个包括基础数据层、预处理层和分析层组成的3层数据处理框架,如图3所示。

图3 数据处理框架

a.基础数据层。变电站设备画像所需的基础数据根据来源类型由2部分组成,即变电站系统数据和第三方数据。其中,电网数据主要包括设备台账数据、设备运行数据和设备管理数据。设备台账数据由存储变电站设备的型号、生产状况和额定等级等组成。设备运行数据是存储设备在运行过程中的电压、电流、有功功率、无功功率和事件。设备管理数据包括与设备操作和维护相关的工作操作票、检查报告和维护报告数据。为了进一步扩大和标注变电站设备数据,需要同时考虑电网外部能源生产、消费和环境数据之间的关系以及第三方数据,如国民经济数据或国家气象环境数据。基础网格数据和第三方数据都由结构化数据、半结构化数据和非结构化数据组成。

b.预处理层。变电站设备数据的预处理步骤包括采集、清洗、集成、降维和特征提取。

数据采集是指对设备和运行、运维数据的统一访问监督控制,其主要数据来源包括数据采集中心、能量管理系统、用户采集系统和配电自动化系统等。

数据清洗步骤包括如遗漏填充、异常消除、噪声平滑和校正聚合不一致数据等任务。

数据集成对来自多个系统的数据进行模式集成、数据实体识别和拼接处理,并对数据进行总结、聚合、概括和规范化。

在大规模网格数据分析复杂内容数据需要大量时间和计算机资源的情况下,数据降维平衡了数据处理的效率和价值。具体的数据分析工具包括立方聚合、数据压缩和数据块降维等处理。

数据特征提取过程采用2种基本的AI技术,即主成分分析方法和线性判别分析方法。主成分分析方法将原始数据投影到高维中,利用矩阵乘法减少数据维数。在此基础上,使用带有标签信息的线性判别分析方法进一步处理减少的数据集。线性判别分析方法是一种有监督的数据化简方法,对知识图谱的数据检索和数据管理有很大的帮助。数据处理的最终目的是提高数据管理水平和数据检索效率。

c.分析层。分析层是实现变电站设备知识图谱的核心层,包括策略模型块和数据分析块。策略模型块包括行为模型、漏斗模型、生存模型和分布模型。数据分析块包括分类分析、比较分析、关联分析和综合分析。

2.3 使用知识图谱可视化变电站设备关系

考虑到当前数据库中存在大量的非结构化数据,由于变电站设备数量巨大,相应电网设备知识图谱的规模较大,需要基于知识网络可视化相应的图谱。变电站设备与事件的知识图谱以图形网络的形式显示设备之间的连接,并提供设备特定的事件信息。用户可以交互浏览知识图谱,选择特定设备进一步探索信息或查询构造。

由于设备之间的关系错综复杂,通过观察数据库表很难发现这些关系。因此通过可视化知识图谱可以帮助员工解决知识孤岛问题,增强变电站设备知识资源的连通性。同时,还可以帮助工作人员在概念层面浏览电网设备知识,发现不同类型设备之间的潜在联系,从而更好地理解电网的复杂性。

2.4 变电站知识图谱检索与推荐

知识图谱根据用户的需要能够对变电站相关知识事件进行检索。当设备发生故障时,搜索页面可以自动带出当前设备的相关故障信息。此外,基于可能的行动保护方案产生决策建议。由于变电站结构复杂,利用传统数据库技术查询操作速度极慢。知识图谱可以显著提高知识检索效率,使检索结果更加全面准确。可以系统地理解用户的查询意图,直接返回准确的答案。基于网格知识图谱,可以开发知识智能检索系统。在知识图谱构建框架中,基于图形处理器单元的广度优先搜索策略,通过Neo4j数据库进行知识搜索。数据网络遍历的时间复杂度只有O(n),能够大幅提升检索效率。

3 实验结果

为了反映所提出的知识图谱构建技术在变电站系统知识检索任务中的效率和有效性,本文针对如图4所示的变电站实际网络进行检索性能分析。

图4 变电站实际网络结构

对于变电站内外部复杂设备及其产生的事件行为,分别采用传统数据库方法与知识图谱方法进行设备关联路径检索,其检索可行性与效率如表1所示。

表1 知识图谱与传统方法检索结果对比

对于被搜索的复杂设备节点关系,由于搜索路径过长, 采用传统方法可能导致搜索失败。在知识

图谱方法中,由于采用基于图谱的关系网络存储结构化数据,克服了传统关系数据库在处理关系网络时的低效率。表中列出的结果表明,对于相同的搜索结果,所提出的知识图数据库管理系统具有更高的效率。而对于传统关系型数据库管理系统无法处理的较为复杂的搜索问题,知识图系统能够返回更精确的路径。

4 结束语

在变电站事件日常管理中,将产生海量电力大数据信息。传统的数据管理系统和方法效率与准确度降低,在知识检索和数据分析层面存在严重缺陷。

因此,本文提出了基于集成AI技术和GPU的电网知识图谱,提出的知识图谱构建过程一般分为3个步骤。首先,使用数据分析工具对原始网格设备信息进行预处理,生成多个关系表。然后,提出一种数据迁移模型,以半自动的方式将网格设备信息从关系表传输到Neo4j图形数据库。最后,基于Neo4j数据库,利用构建的知识图谱揭示电网设备信息可视化,并实现电网设备信息搜索功能。在数据可视化领域,该方法能够生成更清晰的设备信息、参数及运行状态。

所提出的知识图谱算法能够在较短的时间内直观地显示搜索路径,增强了电力系统的稳定性和可靠性,对变电站事件信息的共享、利用和分析具有很大的帮助。在未来,电网流量计算、状态估计、线损计算以及拓扑分析等功能将陆续将进入到知识图谱中,带来更高的电网经济效益。

猜你喜欢

图谱检索标签
绘一张成长图谱
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
专利检索中“语义”的表现
标签化伤害了谁
科学家的标签
杂草图谱
国际标准检索