电网知识图谱的构建与应用
2021-07-21林冠强李惠松
林冠强 李惠松
[摘 要]面向越来越复杂的电网领域,采用智能化技术构建了新型电网知识图谱(Knowledge Graph—KG),结合大数据和云计算的多元化服务需求,分析知识图谱在电网中的应用。针对知识图谱共建、共享需求,设计出知识图谱框架与本体库,提出切实的知识识别与关系抽取的实用化方法,为大规模知识图谱构建提供实用化技术支持,改善电网业务文件数字化自动提取水平和电网知识检索技术,降低专业要求,同时提升电网知识图谱构建效率。
[关键词]电网领域;智能化技术;知识图谱;知识识别;关系抽取
[中图分类号]TP18 [文献标志码]A [文章编号]2095–6487(2021)04–00–02
Construction and Application of Power Grid Knowledge Graph
Lin Guan-qiang,Li Hui-song
[Abstract]Facing the increasingly complex power grid field, intelligent technology is adopted to construct a new power grid knowledge graph (KG—Knowledge Graph), combining the diversified service requirements of big data and cloud computing, and analyzing the application of knowledge graph in the power grid. In response to the requirements of co-construction and sharing of knowledge graphs, a knowledge graph framework and ontology library are designed, and practical methods of knowledge identification and relationship extraction are proposed, which provide practical technical support for large-scale knowledge graph construction. Improve the digital automatic extraction level of power grid business documents and power grid knowledge retrieval technology, reduce professional requirements, and improve the efficiency of power grid knowledge map construction.
[Keywords]power grid field; intelligent technology; knowledge graph; knowledge recognition; relation extraction
2012年,为了进一步改善网络搜索的质量与速度,美国Google公司首次提出了知识图谱(Knowledge Graph—KG)这一说法,其中涉及三个方面:实体、属性和关系。实体通常为客观存在的事物,属性通常用来表达事物的特征,关系通常用来实现实体之间或者实体与属性之间的互联。实际上,KG为语义网络,KG中前两个方面对应语义网络的节点,而后一个方面对应语义网络的边。针对各种数据形式,KG构建方法为:抽取,融合,表示,验证与推理(图1)。数据来源有结构化数据、半结构化数据和非结构化数据,抽取方法有三类,属性抽取、关系抽取和实体抽取。依据不同的领域,KG主要分为两大类:通用领域和专业领域。前者涵盖面广,包含的信息量丰富,然而专业性不高;后者具有一定的针对性,从而实现数据的深度挖掘。
随着电网的不断发展和完善,产生了大量的电网数据,通过利用这些数据,有利于提高电网的智能化水平。目前,电网提出能源物联网的概念,关键是建立满足电网需要的智能化电力知识平台。本文基于知识图谱技术,结合KG技术和电网知识,形成电网专业KG,抽取电网装置的运行信息、管理数据和文献信息等數据,构建电网KG。把电网中各方面的知识进行深度的融合,智能挖掘电网中的有用信息,引导和拓展新的电网发展方向。
1 电网KG构建
由于电网没有建立统一的知识平台,甚至每个部门设置了不同的信息库,使得电网生产、运行和服务等各个环节均形成了大量的信息,例如,电流、电压和频率的变化,开关状态的改变,电表信息。电网信息化的持续发展,产生的电网数据量越来越多,所需时间越来越短。然而,这些数据输出没有统一的格式,不仅含有结构化数据,也存在各类非结构化数据,包括文本、音视频。KG中针对多源数据来说,结构化数据通常能够直接进行知识融合;半结构化数据需要采用筛选的办法,消除干扰数据,进行知识抽取,从而规范数据,形成结构化数据;非结构化数据通常为文本信息,知识抽取过程比较复杂,包括实体识别、属性抽取和关系抽取三个方面。
电网KG构建,能够把电网各种数据重新进行整合,从而方便数据的管理与查找,形成真正意义的电网智能化。为了构建电网KG,首先需要全面获取电网术语,通过这些术语形成电网专业KG基础。术语抽取采用形式化方法,根据电力相关的置信度,分析该术语的可靠性。然而,如果该术语使用的概率比较小,会降低术语的重要性,增加该术语的统计难度。进一步设置电网专业词典,有利于理解相关专业术语,增进电网知识学习,促进电网发展,如图2所示。
通过电网专业词典能够查找相关信息,有助于理解这些专业术语,降低KG的构建难度。这些术语来源包括论文数据、百科数据和其他数据,然后初步构建术语语义图,依据置信度进行排序,基于语义相似度的词条进行匹配,最后基于隶属度的定义抽取。电网专业词典是KG基本数据,对于词典中数据的量和质要求非常高,量不足使得覆盖面不广,质不高使得定义不准确,均难以达到实际效果。然而,整个电网存在的设备仪器众多,专业术语庞杂,同一设备可能存在多个定义名称,提高了专业词典的抽取难度。因此,专业词典确定过程中,需要进行人工确认,进一步限制了词典中数据的量和质。目前,随着电力物联网的建设,采用大数据和云计算等先进技术,以及人工智能的普及,使得电网KG的构建成为可能,基本涵盖了电网的各个领域,包括变压器本体、输电线路、配电物联网、柔性交流系统、网络控制、信息安全等。
2 电网KG应用分析
近些年,电网得到大力发展,信息化普及程度较高,积累了大量运行数据,具有非常高的资源与需求价值,为电网KG的构建提供了前提条件。电网KG的应用领域涉及多个学科,主要分为应用层和感知层,应用层分为配电物联网和新一代智能电表,配电物联网的应用组件分为停电管理、电能质量监测和自动无功补偿,其中停电管理含有网络发令和一体化电网平台;电能质量监测含有电能监控和电力参数测量;自动无功补偿含有环网接线和配电网无功补偿系统。新一代智能电表支撑技术分为即插即用、边缘计算和非介入式电荷分解,其中即插即用含有实时性测试和模块化测试;边缘计算含有流数据处理和计算迁移;非介入式电荷分解含有数据处理、事件检测、特征提取和负荷识别。感知层可以分为智能终端和能源路由器,智能终端的支撑技术分为输电类终端和配电类终端,前者主要为交换机,后者主要为网络设备;能源路由器的支撑技术为路由器,包括交换机设备、背板总线、信息外网和局域网交换机。
通过这些学科的知识挖掘发现,未来电网发展的热点领域有人工智能、网络安全、云计算、大数据、物联网、区块链和芯片,因此,该KG的建立,能够有效指导电网的发展。电网专业词典和KG的构建,以及和现代科技的强力结合,给电网研究指明了方向。這种智能化信息化方式,极大提高了电网的运维水平和管理效率,节约了大量的人力物力和财力成本,使得电网决策更加科学合理。未来电网在配电物联网、新一代智能电表、输电物联网、电力金融、负荷分解、电能质量监测、线路监测、配电终端、电能计量、停电管理和用电安全等方面,将更多地融合可视化、虚拟现实、语音识别、安全性和隐私、机器人、推荐系统、自然语言处理、多媒体、机器学习、物联网、信息检索、人机交互、数据库、数据挖掘、计算机视觉、计算机图形学和人工智能等技术。
采用人工智能技术,形成电网KG,结合电网的应用领域与人工智能的应用领域进行分析,深入数据挖掘,得到以往的数据研究情况,判断以后的研究方向。目前采用的技术有:循环神经网络技术、交叉创新笛卡尔智能分析技术和长短期记忆网络技术等。依照数据采集数量,建立某个领域的研究模型。
3 结束语
电网KG的构建和应用,有利于解决电网专业知识碎片化的问题,聚焦现代智能技术,从各类数据库出发,开展电网KG构建,研发云数据中心KG管理平台。在此基础上,开发基于知识图谱智能分析模块,为电网建立大规模、共享型的KG资源,提供知识计算服务,从而充分发挥大数据和KG的价值。
参考文献
[1] 俞阳.基于知识图谱的电力知识平台关键技术研究[D].南京:东南大学,2018.
[2] BIZER C,LEHMANN J,KOBILAROV G,et al.DBpedia-a crystallization point for the web of data[J].Web Semantics:Science,Services and Agents on the World Wide Web,2019,7(3):154-165.
[3] 郭云峰,韩龙,皮立华,等.知识图谱在大数据中的应用[J].电信技术,2015,1(6):25-29.
[4] WANG J Z,DU Z,PAYATTAKOOL R,et al.A new method to measure the semantic similarity of GO terms[J].Bioinformatics,2017,23(10):1274-1281.
[5] 傅质馨,李潇逸,袁越.泛在电力物联网关键技术探讨[J].电力建设,2019,40(5):5-16.
[6] ZHAO L,ZHANG Q.Mapping knowledge domains of Chinese digital library research output,2014–2019[J].Scientometrics,2020,9(1):51-87.
[7] 蒋玮,周颖,陈舒淇,等.电网基建工程数据挖掘及知识图谱构建技术研究[J].电力信息与通信技术,2021,19(2):15-22.
[8] 武斌,张宾,周晶,孙博,等.知识图谱在电力领域的应用与思考[J].科技经济导刊,2020,28(16):33.