APP下载

基于知识图谱嵌入和补全的电梯故障预测

2022-02-15侯靖琳仇润鹤薛季爱蒋学芹

计算机工程与设计 2022年1期
关键词:三元组图谱电梯

侯靖琳,仇润鹤+,薛季爱,王 晨,蒋学芹

(1.东华大学 信息科学与技术学院,上海 261620;2.上海市特种设备监督检验技术研究院, 上海 200062;3.数字化纺织服装技术教育部工程研究中心,上海 261620)

0 引 言

随着“智慧城市”和“智慧电梯”的发展需求,电梯运行系统故障预测问题已受到广泛关注和讨论。李娟等从宏观上设计电梯故障预测平台技术标准框架[1];朱明等根据环境对电梯故障率的影响建立电梯故障预测模型以及诊断方法[2];徐斌等将预警平台分3层构建并分别对故障数据进行预处理和挖掘以及结果预测[3];张翼等根据电梯部件的特征值及变化趋势进行故障的预测[4];曾梦琦提出将数据立方体与Apriori思想结合的方法来进行故障预测[5]。但电梯故障数据存在的数据重复驳杂、数据关系薄弱等问题还需解决,目前已有学者提出基于知识图谱进行故障预测工作,如方冰等提出基于规则驱动的故障预测方法[6],但该方法是对装备故障进行的预测,目前基于知识图谱预测电梯故障的方法还未被提出。而王鑫等对知识图谱的数据模型进行分析[7],为知识推理、嵌入和补全提供支持。故本文对电梯故障的知识图谱进行更深层次的应用,针对电梯故障预测需求,提出使用规则推理、知识图谱嵌入[8]和知识图谱补全[9]实现电梯故障预测的方法,将电梯故障预测转化为知识图谱补全任务以实现故障预测,为完善电梯的故障预测平台提供保障。

1 电梯故障预测模型及知识图谱构建

1.1 电梯故障预测模型

图1是基于知识图谱的电梯故障预测的模型,将原始的电梯故障数据进行简单的整理并收集到普通的数据集合,通过直接映射或R2RML规则映射成为知识图谱三元组,结合本体层形成知识图谱。将电梯故障预测转化为知识图谱补全任务,并考虑一种混合的电梯故障预测方法,即组合传统规则推理方法与知识图谱嵌入方法进行电梯故障预测,鉴于两种方法在预测中的效率和准确度,选择以知识图谱嵌入为主要的预测方法,传统的规则推理为辅助预测方法,如图1所示,知识图谱嵌入技术在构建知识图谱之后经Trans系列翻译模型实现三元组的向量表示,通过ProjE模型实现知识图谱补全任务;规则推理方法则通过构建规则实现推理预测。

图1 基于知识图谱的电梯故障预测模型

1.2 电梯故障知识图谱构建

电梯故障知识图谱的构建过程主要包含知识的提取、融合以及加工等步骤,从半结构化的数据如表格数据中提取三元组结构化信息,通过融合将三元组的实体间的歧义消除,以得到一系列基本的表达,之后通过知识加工初步构建出电梯故障的知识图谱。

知识图谱的基本元素用描述两个实体之间关系的三重事实表示,即(头实体h,关系r,尾实体t),并将其存储到资源描述框架据库中。电梯故障知识图谱如图2所示,该图展现对于电梯故障知识图谱模式层和数据层的构建。知识图谱分为模式层和数据层,其中模式层主要表现电梯故障信息中概念本体与本体之间的上下位关系以及本体与属性的类型定义,数据层则是模式层中本体和关系的实例化,即实体和关系,如,数据层的电梯A是模式层中本体电梯ID的一个实例化的实体,数据层中实体电梯A的属性类型由模式层电梯ID及其属性来定义。模式层定义数据层中大部分概念,将相应已经提取、融合、加工的数据进行规约映射入数据层即可得到相应的三元组。之后对于电梯故障预测的具体操作则针对数据层进行,如图2中虚线所示的故障预测,通过本文提出的方法可实现对相应电梯进行故障发生的预测。

图2 电梯故障知识图谱

2 基于知识图谱嵌入和补全的电梯故障预测

2.1 传统规则推理的电梯故障辅助预测

本文提出一种传统规则推理的电梯故障辅助预测方法——针对关系的规则。该方法中的规则库是根据电梯运行经验和应用中典型的输入输出制定,而库中的规则对知识图谱的推理进行扰动和影响。规则可采用事件-条件-动作模型进行相应的表述,输入变量为 [C1,C2,C3,C4,C5,…], 输出变量为E,即,电梯日常运行中运行速度C1、温度C2、湿度C3、载重量C4、曳引机振动值C5等输入的变量值对于电梯故障即输出变量E的影响强度较大,且在 [C1,C2,C3,C4,C5,…] 处于某范围时较易出现某故障即输出变量E,则输出变量E的值计算如下

(1)

其中,C=ω1·C1+ω2·C2+ω3·C3+…,ωi为相应权重,输出变量E为故障现象或描述,规则中将输入变量根据日常统计进行加权平均得到相应的输出变量,之后将数据集中相应的环境实体和故障实体进行输入和输出的匹配,具体规则根据日常统计进行编写,之后规则引擎通过匹配和推理完成预设条件下的动作执行,其基本结构形式为:

Rule<规则名>[<参数…]

When(Event)

If<[C1,C2,C3,C4,C5,…]>then

End-rule[<规则名>]

通过以上规则库中的规则,并设置相应的区间,可通过规则引擎的推理进行相应的故障匹配,从而进一步发现实体间隐含关系,如,同一厂商、同一年份中列装的电梯,根据其中一个电梯曾出现故障现象时检测到的运行速度C1、温度C2、湿度C3、载重量C4、曳引机振动值C5以及层站C6等这类电梯的状态值和相应的电梯故障,可进行知识推理,当某电梯A出现类似状态值的情况时,推理出可能出现故障的电梯系统或者原因,其规则可表示如下:

Rule[<电梯注册代码(ID)>、<制造单位>、<电梯历史故障状态>、<电梯历史故障记录>、<电梯当前的状态>]

When(Event(elevator_a))

If<[C1,C2,C3,C4,C5,…](elevator_a)≈[C1,C2,C3,C4,C5,…](elevator_a)>then

End-rule []

其中,Event(elevator_a)表示电梯A的故障现象, [C1,C2,C3,C4,C5,…](elevator_a) 表示电梯A的输入变量数组,E(elevator_a)表示电梯A的输出变量;电梯B同理。

根据上述规则,经过推理可在此知识图谱上加入一个新的事实三元组(电梯A,发生,故障现象)。添加规则后进行的故障推理预测如图3所示。

图3 添加规则后进行推理预测

由于传统规则推理不仅要求日常数据的统计,更要求投入较大人力资源进行规则库的编写,且规则库维护成本高,故本文在基于知识图谱进行的电梯故障预测的实现方面,将传统规则推理作为辅助预测的方法进行设计,可降低维护频率和故障预测对于人力资源的依赖。为提高准确率,同时减少对人力资源的消耗和依赖,将知识图谱嵌入方向作为主要切入点,以传统规则推理为辅助,通过主辅两种方法进行电梯故障预测。

2.2 知识图谱嵌入和补全的电梯故障链接预测

知识图谱可以有效地表示结构化数据[10],而知识图谱三元组对于故障预测的兼容可通过知识图谱嵌入技术实现。由此,知识图谱嵌入的电梯故障链接预测是将知识图谱三元组进行向量化,将实体和关系转化为连续的向量空间,从而简化操作,同时保留知识图谱的原有的结构。主要方法上,本文从知识图谱嵌入和补全方向对电梯故障预测进行实现,将故障预测问题转化为知识图谱补全中链接预测任务中的实体预测问题,即对于未知是否故障或未知故障原因的电梯实体,预测该电梯实体的尾部实体是某个故障或故障原因实体。该方法要求将知识图谱所构成的三元组进行向量化表示,之后进行知识图谱补全任务的实现。

2.2.1 TransE模型进行向量化表示

对于每个事实三元组 (h,r,t), TransE模型[11]将实体和关系表示为同一空间中,把关系向量r看作为头实体向量h和尾实体向量t之间的平移即h+r≈t,即通过平移不变性可得到其它头、尾实体与之相同的关系的向量表示[12]。TransE模型有较多变体,但由于本文对于电梯故障知识图谱进行链接预测的实体多为一对一,且TransE本体模型的参数较少,计算的复杂度低,故本文选择TransE本体翻译模型进行知识图谱嵌入,实现三元组的低维稠密向量表示,即,对于给定的事实,用本文中的知识图谱进行演示, (h,r,t) 分别代表三元组(电梯A,发生,门系统故障)中的头实体、关系和尾实体,经过TransE训练可以得到 (h,r,t) 的低维向量h,r,t,且h+r≈t,其模型如图4所示,正确的三元组向量满足这种关系,而不满足这种关系的则视为错误的三元组向量h′,r,t′。

图4 TransE模型

TransE损失函数为

(2)

其中,γ是常数,表示正负样本之间的间距, d(h+r,t) 表示L1或L2范数, [x]+表示x的正部分,S和S′表示h,r,t和h′,r,t′的集合。

2.2.2 ProjE模型进行知识图谱补全的链接预测任务

根据电梯故障预测中电梯实体与某故障实体间关系未知的本质,将电梯故障预测任务视作在两个实体之间进行知识图谱补全的链接预测任务,通过ProjE模型实现知识图谱补全的链接预测[13],预测出知识图谱中缺失的故障部分,使电梯故障知识图谱趋于完整。同时,使用ProjE模型将知识图谱补全问题转化为一项排名任务[14],并优化候选故障实体列表的总体分数,为得到候选实体总体分数,提出一个组合运算符,该运算符从输入数据中创建目标向量,使用候选向量嵌入投影函数将候选实体分别投影到相同的目标向量上,将候选向量嵌入投影函数视作排名分数函数,该排名分数函数显示相似度得分标量即候选故障实体列表的总体分数,之后对候选实体总体分数进行排名并接纳排名靠前的实体。

为简化描述,此处仅给定两个输入嵌入,同时将预测任务视为排名问题,其中排名最高的候选者是正确的实体。为了生成这种排名列表,将每个候选项投影到由两个输入嵌入的通过组合运算符定义的目标向量上,得到排名分数。

其组合运算符定义为

e⊕r=De·e+Dr·r+bc

(3)

其中,De和Dr分别是全局实体和关系的k×k对角矩阵,bc是组合偏差,e表示实体向量,r表示关系向量。

使用该组合算子,可将候选向量嵌入投影函数即排名分数函数定义为

R(e,r)=g(Wc·f(e⊕r)+bp)

(4)

其中,f(·)和g(·)表示稍后定义的激活函数,Wc表示候选实体矩阵,bp表示投影偏差, R(e,r) 代表因变量为向量e和r的排名分数函数,其值表示Wc中某些候选实体与组合输入e⊕r之间的相似性。

可将ProjE视为具有组合层和投影(即输出)层的神经网络,如图5所示,图中给定示例“电梯A”的头部实体和“发生”关系,即(电梯A,发生,?)和两个候选项,此处任务为计算每个尾部实体的排名分数。TransE模型进行嵌入,形成实体和关系向量矩阵,“●”节点表示来自实体嵌入矩阵WE的行向量,“■”节点表示来自关系嵌入矩阵WR的行向量;“▲”节点表示作为对角矩阵的组合运算符。

ProjE模型选择ProjE_pointwise排名方法,通过对函数R(e,r) 中的g(·)和f(·)使用激活函数实现排名分数的计算,该方法分别将sigmoid和tanh作为g(·)和f(·)的激活函数。g(·)和f(·)的激活函数部署后,第i个候选实体的排名分数函数为

(5)

3 实验训练及测试结果分析

采用本文提出的基于知识图谱嵌入和补全技术的故障预测方法进行实测电梯数据故障预测的实验训练及测试。根据提出的故障预测方法,将本次实验分为三元组向量化表示和故障预测两个阶段进行。

3.1 实验设置

实验数据主要来源于上海市特种设备监督检验技术研究院,数据包含故障实体及其属性、故障现象和原因等。本实验以电梯故障及故障原因等实体为侧重点,训练数据包含故障电梯实体69 560条,故障部件实体46条,故障描述实体1363条。在TransE模型的三元组向量化表示阶段,将故障实体和关系根据其特有的属性在TransE模型中进行向量化表示,实体向量和关系向量的维度设置为100。随后将生成的实体矩阵和关系矩阵各3/4分为训练组、1/4分为测试组。

故障预测阶段使用ProjE模型对已向量表示的三元组进行训练,即进行实体预测的任务,使用Adam作为具有默认超参数设置的随机优化器[15]:β1=0.9,β2=0.999。在训练时,对ProjE中的所有参数应用一个L1正则化器,并在组合运算符的顶部应用一个dropout层,以防止过度拟合。ProjE中的超参数是学习率lr,嵌入大小k,最小批量大小b,正则化器权重α,丢失概率pd和否定候选采样py的成功概率。对于实体预测任务,设置实验参数见表1。在ProjE模型中使用sigmoid和tanh作为g(·)和f(·)的激活函数,得出的排名分数函数即为式(5)。

图5 用于实体预测的ProjE模型

表1 实体预测任务参数设置

3.2 实验训练过程

在通过TransE模型进行向量化表示阶段,将电梯故障知识图谱中的实体和关系三元组导出三元组文件以train命名,文件中以(头实体,尾实体,关系)形式排列,并为三元组中实体和关系进行id编号,输出为entity2id.txt以及relation2id.txt文件,文件中记述实体与关系相对应的id值。将上述3个文件输入TransE模型进行训练,如图6所示,打开cpp代码文件,编译并运行TransE模型。

图6 TransE训练代码局部

编译完成后如图7所示,生成一个2.3 M的exe可执行文件,自动运行可执行文件进行三元组的向量化表示,并迭代设定好的循环次数以避免误差。

图7 编译并运行TransE

如图8(a)、图8(b)所示,三元组经TransE模型运算导出实体矩阵WE文件和关系矩阵WR文件,矩阵文件中向量维度与实验设置一致。

图8 实体矩阵和关系矩阵文件

向量化表示阶段完成之后,将两个实体矩阵文件放在指定Elevator文件夹中并进行ProjE训练实验,在Bash中输入运行指令进行训练,其参数与实验设置相对应,并进行若干次迭代,最终使用测试组对训练所得模型进行检验。

3.3 实验测试结果

对于电梯故障预测,通过对知识图谱中的所有实体进行排名来预测给定三元组 (h,r,t) 的缺失h(或t),实验采用均值秩(Mean Rank)和HITS@k两个指标来评价该预测方法的性能。均值秩衡量正确实体的平均等级,而HITS@k衡量在前k个元素中是否出现正确的实体(类比为召回率)。滤波后的均值等级和滤波后的HITS@k会忽略结果中的所有其它真实实体,而仅查看目标实体,即排除真实实体对预测排名的干扰。

本次实验使用实体预测任务评估该模型,并使用实验程序ProjE_sigmoid.py、数据集和在之前相关工作中建立的指标确定其性能。其训练结果见表2,实验结果显示使用ProjE进行电梯故障实体预测训练在过滤后的均值秩为76,HITS@10为86.6%。实验结果表明,对于目标实体的平均预测次数为76,同时HITS@10表示在预测排名完成后排名前10位的预测实体中出现目标实体的平均概率为86.6%,可对电梯故障预测和维保提供参考。

表2 实验预测结果

4 结束语

本文提出基于规则推理和基于知识图谱嵌入的预测方法,将电梯故障预测视作知识图谱补全任务,旨在通过改进的组合模型实现电梯故障预测,利用TransE进行向量转化,通过ProjE模型对电梯故障进行预测训练及测试。实验结果表明,将知识图谱应用到电梯故障预测任务中是可行的。

应用知识图谱嵌入并辅以传统规则推理的方法进行电梯故障预测平台的搭建,可实现搭建电梯的安全预警平台,建立电梯安全预警及维修保障机制,以减少维保资源的浪费、提高电梯设备的维保质量和效率。

猜你喜欢

三元组图谱电梯
中医药知识图谱应用现状分析及痴呆痰瘀互结证知识图谱构建探索
特征标三元组的本原诱导子
绘一张成长图谱
关于余挠三元组的periodic-模
一个时态RDF存储系统的设计与实现
被困电梯以后
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
电梯不吃人
被困电梯,我不怕