APP下载

基于知识图谱的二次设备测试自动配置方法

2022-06-16叶远波李端超王志华王骏东

电力系统保护与控制 2022年12期
关键词:信息点图谱准确率

叶远波,李端超,谢 民,王志华,王骏东

基于知识图谱的二次设备测试自动配置方法

叶远波1,李端超1,谢 民1,王志华2,王骏东2

(1.国网安徽省电力有限公司,安徽 合肥 230022;2.武汉凯默电气有限公司,湖北 武汉 430223)

随着智能变电站的发展,二次设备更新换代频繁且智能化程度不断提升,以往采用手动测试配置的方法已难以满足工作需求。提出一种基于知识图谱的二次设备自动配置方法。首先,模拟常规测试核心流程,构建基于测试任务的信息点、基于设备厂家的信息点检索路径以及基于测试配置信息类型的命名实体知识三类知识图谱。然后,根据测试设备及测试功能,利用所构建的知识图谱检索需配置信息点,确定设备厂家并基于子图匹配信息路径。采用改进的BERT模型计算配置信息点与描述文本之间的相似性,从而完成映射配置。此外,还加入了端口地址配置数据字符串校验。实验仿真结果表明,基于知识图谱的二次设备测试自动配置方法合理有效,并具有极高的准确性。

二次设备测试;知识图谱;BERT模型;文本向量;路径推理

0 引言

随着智能变电站快速推进,变电站二次设备呈现出种类数量急剧增加、自动化程度明显提升、安全要求不断加强的特点[1-5],为变电站二次设备测试的发展带来了机遇与挑战。智能电子设备IED(Intelligent Electronic Devices, IED)基于统一的数字化标准规约IEC61850实现通信[6]。同样,二次设备测试也基于IEC61850规约解析IED文件实现测试配置[7]。

目前在变电站二次设备测试时,检测人员需要根据应用功能种类与测试策略配置对应事件、信号、数据等信息点,基于不同被测装置及应用业务的测试方案故障参数已经预制完成,通过模拟故障设置测试参数并监测保护装置动作情况,从而验证保护效果及装置参数设置准确与否[8-9]。

信息点配置是整个检测过程的关键环节,即在导入全站系统配置SCD(Substation Configuration Description)文件后,根据出厂配置信息文件(ICD文件),基于IED输出端口地址配置数据及接口文本描述等信息特征,实现待检测智能电子设备IED的模拟数据集与实例信息虚链接一一映射,但因为ICD虚端子的dU或dAI描述没有统一规范,所以大多采用手动配置的方法。变电站设备繁多,人工配置测试导致效率低下、配置耗时耗力、测试周期长、人员经验及工作状态差异明显,易出现缺项漏项,出错后纠错的工作量也很大。

针对这一问题,已有相关学者对于信息自动配置方案进行了探讨。文献[10]通过子模版匹配SCD文件的方式实现继电保护测试配置的实例化,为二次设备测试提供了新思路,但是该方案的可扩展性及泛化性有待提升。文献[11]提出基于SCD文件的专家系统完成检修二次信息的匹配,实现智能变电站测试中安措票的配置,但是分类较为简单且耗时较长。文献[9]及文献[12]均提出了基于利用自然语言处理技术实现二次设备自配置,文献[6]采用TextCNN对智能录波器配置文件进行文本分类实现端口地址映射,这种方法对于长本文效果较好,但对于短文本具有局限性,且未考虑其他端口地址数据;文献[12]利用词向量表示技术计算虚端子语义相似度实现链接匹配,能够得到较好的匹配效果,但采用分词表示的方法在词向量表示上未考虑文本的全局语义信息,仍有提升空间。通过以上讨论可以发现,二次设备自动配置方案主要基于两种思路:一是利用模板等先验知识进行匹配,准确性高但泛化性低;二是利用配置信息相似性进行分类或相似度计算,适应性强但均为单设备配置。

知识图谱作为一种模拟人类思维方式的多源异构实体及关系表征大数据技术[13],可解释性及数据存储结构性能优越[14-15],已在数据检索、推荐系统、知识推理等方面得到广泛运用[16],同时在电力领域的数据运维、电力文本表征及电网动态辅助决策等方面做出了初步研究探索[17-20]。大量投运变电站的SCD可作为知识数据蒸馏样本基础,且知识图谱技术能够很好地表征IED文件中的文本、字符等多源异构数据。因此,本文提出基于知识图谱的二次设备测试自动配置方法,将先验知识匹配与配置信息相似性计算两种配置方式的优势相结合,利用知识图谱多跳路径匹配进行配置信息查询及抓取,并采用改进BERT模型计算配置信息相似度,从而实现准确高效的多设备多任务二次设备测试自动配置。

1 二次设备测试配置文件信息解析

智能变电站二次设备测试配置需根据测试任务映射对应数据集参数信息点,不同测试任务的信息需求具有差异性,在确认目标信息需求的基础上,通过IED输出端口地址配置数据与文本描述信息映射对应信息点,即可实现测试信息配置。SCD文件解析示意图如图1所示,配置所需端口地址配置数据与文本描述信息均存储于SCD文件中,该文件描述了智能变电站中各IED的数据模型、配置信息及相互间逻辑链接关系,所有装置在SCD文件中均表现为一级IED节点及其节点内嵌套的各层子节点信息,遵循IEC61850规约[21],IED结构主要包含访问点、逻辑设备、逻辑节点、数据属性、数据信息等。IED之间通过虚端子链接,主要包含采样值(SV)与通用对象变电站事件(GOOSE)信息,解析配置文件即明确IED的SV与GOOSE的信息关系,由于SCD数据嵌套复杂性及SV与GOOSE信息关系的隐晦性,故通过匹配端口地址配置数据与文本描述完成信息关系映射与信息配置。

图1SCD文件解析示意图

Fig. 1Schematic diagram of SCD file parsing

本文采用元素树方式遍历SCD文件的嵌套数据,以各设备IED节点为初始节点,按照IED层次结构深度优先为原则访问其各层子节点的属性及元素,然后通过字典列表的形式存储端口地址配置数据、文本描述及对应嵌套路径,如此既获得了匹配需要的关键信息,又保留了信息获取路径,为构建二次设备测试自动配置知识图谱奠定数据基础。

2 知识图谱构建

智能变电站二次设备测试配置需要依次明晰三个内容,首先是确定完成某种任务功能测试所需要配置的全部信息点,随后是根据不同设备厂家的IED数据格式清楚对应信息的层次路径及描述特征,最终基于信息特征判断配置信息点的映射关系正确性。基于以上配置逻辑与流程,本文设计的二次设备测试自动配置知识图谱数据模型及架构共包含三类,如图2所示,分别是基于测试任务的信息点知识图谱、基于设备厂家的信息点检索路径知识图谱、基于测试配置信息类型的实体命名知识图谱。接下来针对不同部分知识图谱构建进行介绍。

图2二次设备测试自动配置知识图谱数据模型及架构

Fig. 2Data model and architecture of knowledge graph for automatic configuration of secondary equipment test

2.1 测试任务信息点

智能变电站中需要测试的二次设备包括继电保护装置、合并单元、智能终端、智能录波器等多种设备,不同二次设备相对应的测试内容截然不同,且同种设备在不同状态下的测试内容也具有一定的差异性。例如继电保护装置测试具有变压器、线路、母线等多种位置场景,测试内容包含定值设置、采样精度、动作信息、开入开出量等,所需配置的信息点包含SV输入、GOOSE输入及输出端口地址配置数据、保护功能压板、保护动作元件、保护动作相别及保护动作时间等。

针对该部分内容,在二次设备测试规定文件及厂家测试配置信息中已做出了对应说明。本文采用模板匹配的方式对文件进行抽取、匹配、融合并进行人工校验,构建的二次设备继电保护测试的部分信息点知识图谱数据示例如图3所示。

图3 部分信息点知识图谱数据示例

2.2 设备厂家信息点检索路径

二次设备测试信息配置工作具有重复性及经验性,对应信息点在SCD文件中的位置在一定程度上相对统一,故而可通过寻找相似信息路径的方式来配置信息。

本文以2.1节图谱中的信息点为核心及出发点,在解析的字典中以深度优先的检索方式进行匹配,查找到对应信息则保存由IED节点至该信息点的检索路径,对同类信息的路径进行统计、筛查,保留路径相似度较高的路径作为检索路径。

但这种方法也存在一定的漏洞,例如二次设备厂家主要有南瑞、许继、四方等,各厂家间IED层次嵌套具有一定区别,不同版本设备信息表征方式同样可能具有差异性,且存在设备配置端口地址配置数据与描述信息规范性不足的问题。

针对以上问题提出两种解决思路:一是对不同厂家设备构建不同的信息点检索路径以解决厂家不同的问题;二是信息点检索采用多路径检索,因为通过观察解析保存的字典信息发现,一般前几层的嵌套信息路径基本统一,在逻辑节点后的从属层信息路径及内容才会出现差异,多为版本差异造成,因此通过保留多个相似度较高路径作为备选路径。

2.3 测试配置信息命名实体

当完成信息点确认及厂家信息点路径检索后,便到达二次设备配置的最终环节,即确认最终的测试点信息点与数据集的映射关系,也是整个配置环节中最关键的步骤。端口地址配置数据与文本描述信息虽然在格式上存在较大区别,但同一厂家设备信息逻辑上具有强关联性,相同实体命名及表述基本统一,因此挖掘其实体命名规律对于信息自动配置具有重要作用。

基于处理SCD文件获得的字典列表数据,抽取厂家、端口地址配置数据及文本描述三类信息,链接实体以{厂家,端口地址配置数据,文本描述}形成三元组,初始抽取结果存在大量冗余数据,一类是完全重复的数据,另一类是由于区分同类数据不同实体而给端口地址配置数据增加的无实意编号。

本文将三元组中端口地址配置数据信息中的数字量信息删除,仅保留字母字符串量信息。然后以厂家与文本描述的融合信息构建索引,统计每类索引中端口地址配置数据的种类及个数,按照统计结果将三元组进行转化,仅保留同类索引中相同端口地址配置数据的一个三元组。此外,将相同三元组的统计个数以属性值性质嵌入,从而实现将大量冗余实体消歧并融合,最终形成厂家、文本描述、端口地址配置数据表述的简化子图,基于测试配置信息类型的部分命名实体知识图谱数据示例如图4所示。

图4 部分命名实体知识图谱数据示例

3 基于知识图谱的配置自动推理方法

3.1 基于改进BERT模型的文本相似度匹配算法

短文本相似性不是直接计算两个原始文本,需将源文本转换为计算机可以理解和处理的数据,而计算机更善于处理向量模式数据,所以一般将文本聚焦于向量空间中进行度量,常见的模型有词袋模型和词嵌入。词袋模型通常与词频-逆文本频率联合使用,常见的有向量空间模型、浅语义分析、隐含狄利克雷分布等,词袋模型较为简单但具有一定的限制性,没有考虑词序、稀疏性、复杂性问题,对于处理本文较短的电力描述信息难以挖掘足够的语义信息。词嵌入常见的如Word2Vec、TextCNN、BERT模型等[22],在泛化性及语义信息理解上有了极大的提升。本文选取目前应用最为广泛的BERT模型为基础模型,考虑文本较短的情况,故而采用基于字向量的BERT模型对文本进行分布式嵌入。BERT模型基础结构如图5所示。

图5 BERT模型结构

将初始向量采用注意力机制求解,采用Softmax函数归一化为概率分布,如式(4)所示。

考虑基于字向量的文本嵌入模型对于电力领域词汇特征提取有一定的局限性,缺乏一定的先验知识与背景信息,对于专有词汇的表征可能会出现一定偏差。因此本文提出在字向量基础上融合二次测试专有词汇的词嵌入向量,从而丰富描述短文本的特征表征信息。

基于获得的文本向量,采用应用最为广泛的余弦相似度度量文本相似度,如式(10)。

求得的距离与相似度成反比,距离越小则相似度越大,与给定配置信息点距离最小的短文本描述即为所要匹配映射的配置信息描述。最终改进BERT模型处理流程如图6所示。

图6 改进BERT模型处理流程

3.2 多图分级推理的信息配置模型

二次设备测试配置本质上是一项信息检索匹配任务,任务具有很强的程式性与逻辑性,模型需要协调信息配置顺序,强调配置结果准确率,同时兼顾配置效率,在考虑以上因素的基础上本文提出多图分级推理的信息配置模型来实现二次设备测试的自动配置,具体流程如图7所示。

图7 配置具体流程图

图8 检索路径匹配子图模板构造

基于编辑距离计算字符串相似度公式为

4 算例结果与分析

4.1 实验数据

为了验证本文所提模型及方法在二次设备测试配置任务中的有效性,本文选取许继、南瑞、平高三个厂家的设备进行测试,重点研究保护、测控、智能终端及合并单元典型测试任务[25],抽取各厂家已配置成功的测试设备映射关系IED数据5 000条作为配置样本。样本按厂家随机分成5份:选择其中4份作为训练集,构建知识图谱并训练文本向量;1份作为测试集,且测试集不分厂家随机打乱,利用测试集衡量算法及模型效果。部分数据样本如表1所示,可以看出文本描述与配置信息点相似度很大,但在描述上也具有一定区别。端口地址配置数据大部分字符串具有一定解释性,例如“PIGO”表示跳闸,“PROT”表示保护,但同样两个闭锁重合闸配置信息点端口地址配置数据却完全不同,是因为厂家命名区别,且存在例如“Amp1”“Ind90”等释义难以确定字符串,但其在描述上具有高度相似性,这也是本文选择主要以文本匹配信息点的原因之一。

表1 部分样本示例

4.2 评价指标

本文测试数据均为配置完成数据,因此检索结果具有唯一性,即通过最终基于本文所提方法的配置数据判断检索结果。匹配成功则为正确,匹配失败则为错误,匹配失败则继续匹配,至多匹配5次。将一个信息点匹配作为一次匹配任务,通过建立准确度(ACC)和平均倒数排名(MRR)作为匹配结果的评价指标[26],以评估任务路径匹配与文本相似度匹配效果,如式(15)、式(16)所示。

4.3 实验环境及参数

本次实验环境为Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10 GHz 八核,NVIDIA Corporation GP102 [GeForce GTX 1080 Ti],Ubuntu 16.04 操作系统,采用python语言编程,改进BERT模型基于TensorFlow深度学习框架构建。模型中各参数设置如表2所示。

表2 模型重要参数设置

4.4 实验设置及结果分析

4.4.1路径检索方法验证

本文提出的二次设备测试配置方法首先要寻找到所要匹配的配置信息在IED文件中的嵌套位置,即检索位置路径。通过在1图谱中匹配配置信息点可极大减少依靠经验的重复性工作,实验中发现构建每类任务的配置信息点虽然具有一定的工作量,但是构建完成后可一直使用,能够提升配置准确率,减少操作失误,单次检索时间小于0.001 s。此外,基于2图谱关系抽取,可自动确定待测试设备厂家,实现对设备厂家快速分类并为后续子图匹配及信息匹配奠定基础。以上两项任务在实验中均未发生匹配错误的情况,验证了其逻辑合理并处理高效。

基于图谱2的子图匹配方式与关系型数据库两种方式检索路径的时间复杂度如表3所示,可以看出子图匹配的方式能够极大地减少时间支出,且检索逻辑清晰明了,相比较而言通过关系型数据库查找相对复杂一些,对于配置人员来说难度极大。

表3 不同数据库检索路径时间复杂度对比

为了验证路径检索结果性能,本文通过设置单次任务1~4条最相似路径分别在测试集进行路径匹配,抓取路径下所有待匹配文本描述与端口地址配置数据,所获得数据中含有映射正确的待匹配信息点数据则为正确,计算指标结果如表4所示。

表4 不同数量相似路径下检索结果对比

从表4中可以看出,基于路径检索获取待匹配信息完全能够满足任务需求,只匹配最相似路径便可获得95%以上的准确率,并且在匹配两条最相似路径时准确率又得到了0.32%的提升。通过观察结果发现,设备版本变化带来的IED文件嵌套格式变化波动不大,随着后续匹配路径的数量增加,准确率上升趋势减缓,这也说明了信息匹配路径具有极大相似性,同时验证了本文所提路径检索方法有效。

4.4.2改进BERT模型性能评估

为了评估本文提出的基于字向量并融入关键词向量的改进BERT文本嵌入式表示模型,选取VSM、Word2Vec以及考虑细粒度、多头注意力机制及关键词的BERT模型进行比较,待匹配文本数据基于路径检索正确情况下所获得的数据,结果对比如表5所示。

表5 不同文本匹配模型结果对比

从上述各方法匹配的结果来看,采用融合多头注意力机制、字粒度、关键词的BERT模型取得了最高的准确率及平均倒数排名,实验1采用传统向量空间模型VSM,准确率仅达到82.2%,而实验2~6准确率均达到了90%以上,原因在于VSM对于数据依赖性较强,过于机械化,而实验2~6属于深度学习模型,生成的表示向量具有一定的语义特征,更能够反映真实文本含义。同时,在相同的BERT模型下,实验5相较于实验4在指标上分别获得了1.1%准确率提升和1.2%的平均倒数排名提升,说明针对二次设备测试配置短文本采用字粒度能够获得更好的词义表示向量。此外,本文融合基于关键词的词粒度BERT模型语义表征向量在评估结果中取得了最优效果,相对于未考虑关键词的实验5提升了2.5%的准确率以及2.2%的平均倒数排名,两项指标均达到了98%以上,甚至前5平均倒数排名达到了98.9%的极优性能,说明考虑领域关键词相当于对深度学习BERT模型增加了一部分先验知识,起到对描述文本向量表征的补充作用。

4.4.3自动配置方法评价

本文所提出的二次设备测试自动配置方法主要由两个关键环节组成。一是图谱匹配获取信息点路径抓取待匹配输出端口地址配置数据及接口文本描述数据;二是在抓取的数据中基于改进BERT进行相似度计算得到匹配数据并校验。下面将各环节结合为整体进行评估,考虑不同的最相似路径抓取数量、文本相似度匹配模型及是否加入字符串校验因素,以最终匹配准确率及用时作为评价指标,实验设置10轮,每轮实验设置配置100个测试任务,耗时为每轮任务平均耗时,实验结果如表6所示。

表6 不同文本匹配模型结果对比

观察表6可发现,16个实验设置互为对照,从实验结果可以对路径抓取、模型改进、校验成效三个方面实验结果进行综合讨论。首先,实验1~4、实验5~8、实验9~12以及实验13~16四组实验在模型及是否校验统一的情况下,抓取路径数量与耗时成正比增加,不难理解,抓取数量增加则意味着所要进行的相似度计算规模也相应扩大,从而造成时间成本的增加。实验4比实验1耗时增加了近4倍,虽然牺牲了时间但换取了准确率的提升,当抓取数量从1升至2时,四组对比实验准确率均上升了3%左右。在抓取数量从2升至3及从3升至4时,准确率提升较小,甚至出现了准确率下降的情况。依据配置错误实验结果发现,抓取路径增多直接带来待匹配数据量成倍增加,由此加大了匹配难度,带来相似度计算性能下降,又因为版本变化带来路径变化的情况较少发生,出现三种或四种路径的情况较少,所以出现了路径数量为2时准确率提升较大,后续增加路径数量提升较少的情况。

实验1~4与实验5~8互为对照,同样实验9~12与实验13~16互为对照,这两组对照的变量为模型,通过观察实验结果不难发现,改进BERT模型比基础BERT模型在准确率上有较大提升,两组8个实验对比准确率平均提升了4.7%,再一次说明了本文所提改进模型的有效性,同时,改进模型带来的时间成本增加在2 s左右,在可接受范围内,在实际应用时,可根据任务环境选择模型。

实验1~8与实验9~16在是否进行字符串校验的变量因素上形成互为对照,由于增加了编辑距离计算过程,所以造成了一定的时间成本增加,每轮平均耗时增加4.9 s。但从准确率上来说,增加字符串校验对于准确率的提升具有一定积极作用,平均提升1.3%的准确率。

通过对上述对比试验讨论,证明了路径检索方法、改进BERT模型及字符串校验在二次设备测试配置中具有显著作用。此外,从整体上看,实验16准确率达到了98.3%,再次直观验证了本文所提二次设备自动配置方法切实有效。

5 结论

本文考虑到二次设备测试人工配置效率低且易出错的问题,提出了一种基于知识图谱的二次设备自动配置方法,结论如下:

1) 通过构建二次设备测试知识图谱,将IED文件与测试任务、测试设备、配置信息点、信息路径建立知识关联,在此基础上实现了自动抓取待匹配信息点的端口地址配置数据及文本描述,从而为信息映射匹配奠定了基础。实验证明,路径检索准确率至少可达到95%以上。

2) 以BERT模型为基础,在字向量BERT模型基础上融合二次测试专有词汇的词嵌入向量,有效增加了文本相似度识别过程中的先验知识,准确率平均提升了4.7%,最高可达到96.7%。增加了端口地址配置数据字符串校验环节以解决文本描述无法确定映射数据的情况,进一步将准确率提升约1.3%,有效地实现信息点与文本描述的映射匹配。

3) 通过设置多变量对照实验,配置准确率最高达到98.3%。并对路径抓取、模型改进、校验成效进行综合评估,实验发现,增加校验环节及采用改进BERT模型对于准确率提升均有较大作用,且耗时上不会有较大影响。增加最相似路径抓取数量对于提升待匹配数据中配置映射准确率有一定效果,但在整个配置环节中准确率并非随着路径数量增加而线性增加,因为路径数量增加带来的待匹配描述文本数量成倍增加,由此带来的耗时增加及可能的相似度计算准确率下降仍需纳入工作考量。

[1] HE Yuqing, CHEN Yuehui, YANG Zhiqiang, et al. A review on the influence of intelligent power consumption technologies on the utilization rate of distribution network equipment[J]. Protection and Control of Modern Power Systems, 2018, 3(2): 183-193.

[2] 张巧霞, 王广民, 李江林, 等. 变电站远程运维平台设计与实现[J]. 电力系统保护与控制, 2019, 47(10): 164-172.

ZHANG Qiaoxia, WANG Guangmin, LI Jianglin, et al. Design and implementation of substation remote operation and maintenance platform[J]. Power System Protection and Control, 2019, 47(10): 164-172.

[3] 李宝潭, 赵丹, 李宝伟, 等. 智能变电站在线防误系统关键技术的研究[J]. 智慧电力, 2020, 48(6): 73-78, 111.

LI Baotan, ZHAO Dan, LI Baowei, et al. Key technologies of online error prevention system in smart substation[J]. Smart Power, 2020, 48(6): 73-78, 111.

[4] 钱平, 杨松伟, 张永, 等. 面向智能变电站信息流可靠性分析方法研究[J]. 电测与仪表, 2021, 58(10): 106-111.

QIAN Ping, YANG Songwei, ZHANG Yong, et al. Research on reliability analysis method of information flow in intelligent substation[J]. Electrical Measurement & Instrumentation, 2021, 58(10): 106-111.

[5] 范卫东, 董金星, 冯晓伟, 等. 智能变电站二次操作校核方法研究[J]. 电测与仪表, 2020, 57(13): 40-46, 54.

FAN Weidong, DONG Jinxing, FENG Xiaowei, et al. Research on checking method of secondary operation in smart substation[J]. Electrical Measurement & Instrumentation, 2020, 57(13): 40-46, 54.

[6] 吴在军, 胡敏强. 基于IEC 61850标准的变电站自动化系统研究[J]. 电网技术, 2003, 27(10): 61-65.

WU Zaijun, HU Minqiang. Research on a substation automation system based on IEC61850[J]. Power System Technology, 2003, 27(10): 61-65.

[7] 陈德辉, 须雷, 赵希才. 智能变电站自动化与保护核心 IEC 标准的进展与分析[J]. 电力系统自动化, 2019, 43(21): 229-239.

CHEN Dehui, XU Lei, ZHAO Xicai. Progress and analysis of intelligent substation automation and protection core IEC standards[J]. Automation of Electric Power Systems, 2019, 43(21): 229-239.

[8] 诸源胜. 智能变电站二次设备一体化测试系统的研制及应用[D]. 广州: 华南理工大学, 2020.

CHU Yuansheng. Development and application of integrated test system for secondary equipment of the intelligent substation[D]. Guangzhou: South China University of Technology, 2020.

[9] 陈旭, 张弛, 刘千宽, 等. 基于深度语义学习的智能录波器自配置方法[J]. 电力系统保护与控制, 2021, 49(2): 179-187.

CHEN Xu, ZHANG Chi, LIU Qiankuan, et al. Automatic configuration method of intelligent recorder based on deep semantic learning[J]. Power System Protection and Control, 2021, 49(2): 179-187.

[10] 张晓莉, 刘慧海, 李俊庆, 等. 智能变电站继电保护自动测试平台[J]. 电力系统自动化, 2015, 39(18): 91-96.

ZHANG Xiaoli, LIU Huihai, LI Junqing, et al. Automatic test platform in smart substation for relay protection[J]. Automation of Electric Power Systems, 2015, 39(18): 91-96.

[11] FAN Wen, LIAO Yuan. Wide area measurements based fault detection and location method for transmission lines[J]. Protection and Control of Modern Power Systems, 2019, 4(1): 53-64.

[12] 范卫东, 冯晓伟, 董金星, 等. 基于历史数据语义相似度的智能变电站虚端子自动连接[J]. 电力系统保护与控制, 2020, 48(17): 179-186.

FAN Weidong, FENG Xiaowei, DONG Jinxing, et al. Automatic matching method of a virtual terminal in intelligent substation based on semantic similarity of historical data[J]. Power System Protection and Control, 2020, 48(17): 179-186.

[13] SINGHAL A. Introducing the knowledge graph: things, not strings[J]. Official Google Blog, 2012.

[14] WANG Xiang, WANG Dingxian, XU Canran, et al. Explainable reasoning over knowledge graphs for recommendation[C] // Proceedings of the Thirty-Third AAAI Conference on Artificial Intelligence, AAAI, 2019, Honolulu, USA: 5329-5336.

[15] JI Shaoxiong, PAN Shirui, CAMBRIA E, et al. A survey on knowledge graphs: representation, acquisition and applications[J]. arXiv preprint arXiv: 2002.00388, 2020.

[16] 饶子昀, 张毅, 刘俊涛, 等. 应用知识图谱的推荐方法与系统[J]. 自动化学报, 2021, 9(3): 2061-2077.

RAO Ziyun, ZHANG Yi, LIU Juntao, et al. Recommendation methods and systems using knowledge graph[J]. Acta Automatica Sinica, 2021, 9(3): 2061-2077.

[17] DAI Renchang, LIU Guangyi, WANG Zhiwei, et al. A novel graph-based energy management system[J]. IEEE Transactions on Smart Grid, 2019, 11(3): 1845-1853.

[18] 刘广一, 王继业, 李洋, 等. “电网一张图”时空信息管理系统[J]. 电力信息与通信技术, 2020, 18(1): 7-17.

LIU Guangyi, WANG Jiye, LI Yang, et al. “One graph of power grid” spatio-temporal information management system[J]. Electric Power Information and Communication Technology, 2020, 18(1): 7-17.

[19] 乔骥, 王新迎, 闵睿, 等. 面向电网调度故障处理的知识图谱框架与关键技术初探[J]. 中国电机工程学报, 2020, 40(18): 5837-5848.

QIAO Ji, WANG Xinying, MIN Rui, et al. Framework and key technologies of knowledge-graph-based fault handling system in power grid[J]. Proceedings of the CSEE, 2020, 40(18): 5837-5848.

[20] 余建明, 王小海, 张越, 等. 面向智能调控领域的知识图谱构建与应用[J]. 电力系统保护与控制, 2020, 48(3): 29-35.

YU Jianming, WANG Xiaohai, ZHANG Yue, et al. Construction and application of knowledge graph for intelligent dispatching and control[J]. Power System Protection and Control, 2020, 48(3): 29-35.

[21] APOSTOLOV A. Efficient maintenance testing in digital substations based on IEC 61850 edition 2[J]. Protectionand Control of Modern Power Systems, 2017, 2(4): 407-420.

[22] GUTIÉRREZ L, KEITH B. A systematic literature review on word embeddings[C] // International Conference on Software Process Improvement, Springer, Cham, 2018: 132-141.

[23] DEVLIN J, CHANG M W, LEE K, et al. Bert: pre-training of deep bidirectional transformers for language understanding[J]. arXiv preprint arXiv: 1810.04805, 2018.

[24] LI Yujian, LIU Bo. A normalized Levenshtein distance metric[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(6): 1091-1095.

[25] 陈桂芳, 董秀成, 郑永康, 等. 基于长短期记忆网络的继电保护测试故障诊断研究[J/OL]. 电力系统保护与制: 1-9[2021-12-20]. https://doi.org/10.19783/j.cnki.pspc. 210624.

CHEN Guifang, DONG Xiucheng, ZHENG Yongkang, et al. Fault diagnosis of a relay protection test based on a long short-term memory network[J]. Power System Protection and Control: 1-9[2021-12-20]. https://doi.org/10.19783/j. cnki.pspc.210624.

[26] YU Y, LI Y, SHEN J, et al. STEAM: Self-supervised taxonomy expansion with mini-paths[C] // Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 2020: 1026-1035.

Automatic configuration method of secondary equipment test based on a knowledge graph

YE Yuanbo1, LI Duanchao1, XIE Min1, WANG Zhihua2, WANG Jundong2

(1. State Grid Anhui Electric Power Co., Ltd., Hefei 230022, China; 2. Wuhan Kemov Electric Co., Ltd., Wuhan 430223, China)

With the development of smart substations, the replacement of secondary equipment is frequent and intelligence is increasingly improved. The former manual test configuration method finds it difficult to meet the work needs.An automatic configuration method for secondary equipment based on a knowledge graph is proposed. First, the core process of conventional testing is simulated to build a knowledge graph based on three types of data, test task information points, information point retrieval paths of equipment manufacturers, and named entity knowledge of test configuration information types. Then, from the test equipment and testing capabilities, the information points needed to be configured are retrieved by the constructed knowledge graph, the device manufacturer is determined and the information path is matched based on the subgraph. The improved BERT model is used to calculate the similarity between the configuration information points and the description text to complete the mapping configuration. In addition, a string verification of port address configuration data is added. The simulation results show that the method based on the knowledge graph is reasonable and effective and has high accuracy.

secondary equipment test; knowledge graph; BERT model; text vector; path reasoning

10.19783/j.cnki.pspc.211193

2021-08-30;

2021-12-21

叶远波(1973—),男,硕士,教授级高工,研究方向为电力系统继电保护;E-mail: 13905608638@139.com

王骏东(1996—),男,通信作者,硕士研究生,研究方向为电力知识图谱。E-mail: 1825893405@qq.com

This work is supported by the Science and Technology of State Grid Corporation of China (No. 5212002000AR).

国家电网公司科技项目资助(5212002000AR)

(编辑 魏小丽)

猜你喜欢

信息点图谱准确率
中医药知识图谱应用现状分析及痴呆痰瘀互结证知识图谱构建探索
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
绘一张成长图谱
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
一种基于模板的配电终端信息点表自动生成方案
运用“三讲”模型来讲题
补肾强身片UPLC指纹图谱
主题出发,以生为本