露天矿山设备故障知识图谱框架及辅助决策系统研究
2022-06-30刘光伟付恩三
刘光伟,付恩三,2
(1.辽宁工程技术大学,辽宁 阜新 123000;2.应急管理部信息研究院,北京 100029)
露天矿山穿孔、爆破、采掘、运输、排土等生产环节需要大量工程设备参与其中,某一生产环节的关键设备出现故障,势必影响露天矿山的生产运行[1-3]。矿山工程设备发生故障时,露天矿山调度人员需将故障设备协调各部门调离现场,维修人员快速准确判断故障原因并采取恢复措施。由于露天矿山大部分设备为国外进口,设备发生故障后,需要与厂家进行协商沟通,维修周期长,时效性差,使得矿山生产成本增加,矿山经济效益也会受到影响,给露天矿山接续生产带来困难[4-6]。
目前,知识图谱研究正处于热点研究的兴起阶段,部分学者已将知识图谱应用与露天矿山设备故障诊断方面,如东北大学的田凤亮[7]等通过建立一种露天矿卡车故障的NLP 技术挖掘与分析的方法,来分析卡车故障的原因;神华胜利北电露天矿的刘喜等[8]对露天矿自卸卡车的电动轮故障进行分析。因此,基于露天矿山设备故障处置决策的全流程场景和需求,构建露天矿山工程设备故障处理领域知识图谱及辅助决策系统,将知识图谱与露天矿山设备领域知识有机结合,实现设备故障问题追踪,异常信息超前预警,完成维修人员主动管理、超前优化、超前处置和预测性维护,形成基于语义网络的判断方法和操作逻辑,通过知识查询、链接和推理进行智能辅助决策,提升露天矿设备事故处理能力、精准挖掘设备潜在故障风险,最终实现设备故障风险预知预判的目标,为露天矿山工程设备故障处理提供相应的辅助决策。
1 露天矿山设备故障知识图谱架构
知识图谱本质上是实现对各类事物之间的相互关系进行描述[9]。通常采用三元组[10]知识表示方法。露天矿山设备故障知识图谱架构如图1。
图1 露天矿山设备故障知识图谱架构
露天矿山工程设备故障处理系统图谱有5 层结构,具体如下:
1)设备数据层。露天矿山所有与测量、穿爆、采掘、运输、排土等工艺环节相关的设备故障处理所涉及到的各类结构及非结构化数据,作为图谱构建的基础信息数据,涵盖数据包括:感知实时数据、基础数据、操作手册等。
2)图谱实现层。从基础信息数据中提取相关知识,凝练形成结构化的知识图谱网络。
3)数据分析层。露天矿工程设备运行过程中接收到的实时设备工况数据进行解析和结构化表示;
4)推理决策层。通过构建各类逻辑库、知识库和历史库,实现对故障设备的分析研判;
5)综合展示层。基于知识图谱构建结果,系统界面提供综合展示、数据查询、辅助决策、知识检验以及知识指引。
根据露天矿山的知识图谱和业务数据,将露天矿山设备故障分析流程分成数据获取、数据映射、模型训练、模型运行、图谱管理应用,最终实现图谱的交付应用。
2 设备故障知识图谱构建
2.1 设备知识图谱构成
露天矿山构建工程设备故障处理知识图谱,主要包含露天矿山设备故障事件、概念模型任务事件、业务逻辑事件、故障案例事件以及模型方法事件,这5 类核心要素构成露天矿山设备故障处理的综合本体,定义的五类要素之间的语义关系可以表示为:Equipment failure Ontology ={Open-pit mine equipment failure events,Conceptual model events,Business logic events,Failure case events,Model inference graph,Relation}。其中:①Open-pit mine equipment failure events:露天矿山设备故障事件;②Conceptual model events:概念模型任务;③Business logic events:业务逻辑事件;④Failure case events:故障案例事件;⑤Model method event:模型方法事件;⑥Relation:表示露天矿山设备故障事件、概念模型事件、业务逻辑事件、故障案例事件以及模型方法事件之间的语义关联关系[11-12]。
1)设备故障事件。设备故障事件,主要包含露天矿山设备中各零部件实体、各实体之间的连接关系、层次关系以及各实体的属性,一个设备故障事件本体可表示为:Open pit mine equipment failure events={Failure concept,Failure device name,Failure time,Failure location,Event Relation}。其 中:①Failure concept:故障概念;②Failure device name:故障设备名称;③Failure time:故障时间;④Failure location:故障地点;⑤Event Relation 故障事件之间语义关联关系的定义,如故障设备引发、故障设备并发等。
2)概念模型任务。概念被称为本体,是对实体图形的抽象,比概念图像更适用于人类的思维方式[13-14],也可用于规范和提炼设备大数据层面的各种事实表述,但对规则、逻辑以及案例的判断需要首先从概念层面上进行运算,进而再传递至相应的实体图谱进行具体信息的;而概念数据本身则是对有关设备数据概念层级关联、属性关系和关联关系的统一表述,把一个设备概念模型的本体描述为:Conceptual model events= {Data Concept,Data Property,Data Relation}。其中:①Conceptual model events:所有设备数据概念的集合;②Data Property:设备数据本身属性的定义;③Data Relation :设备数据之间语义关联关系的定义。
3)业务逻辑事件。通过业务逻辑图谱从设备事故处理预案、设备运行细则、事故处理说明书等文献中提取得到的知识点,包括设备通用的运行方法、事故分类、处理特点等内容,在重大事故出现时,可以从图谱网络的知识路径上实现相应信息检索和推理。业务逻辑事件本体表示为:Business logic events={Operating principles,Cause analysis,Disposal points}。其中:①Operating principles:所有设备的操作原则集合,包含设备操作手册、设备维修操作流程、操作注意事项等;②Cause analysis:原因分析,包含设备故障原因分析、故障发生时间、地点、设备故障状态等;③Disposal points:处置要点,包含处理步骤、处理流程、故障修复情况以及修复后设备运行状态等内容。
4)故障案例事件。故障案例事件是对每个设备的故障信息进行记录与存储,并建立结构化的案例库,在新的事件信息出现后,可将案件信息从概念层面上进行特征提取和统计相似程度,以便给出对相似案件的处理历史信息和使用建议。故障案例事件本体表示为:Failure case events ={Failure name,Failure handling process,Handling points,Failure repair results}。其中:①Failure name:故障案例库中故障事件名称;②Failure handling process:整个设备故障整体处置流程,包括处理人、处理时间、结束时间、检查故障原因等;③Handling points:故障处置要点,包含维修关键配件重难点分析、更换配件拆装流程;④Failure repair results:故障修复结果,包含故障之前状态描述、维修后设备运转状态等。
5)模型方法事件。模型方法事件,从设备维修操作规程与历史经验中人工或半自动化地构建逻辑运算库、规则库、算法库,针对设备的不同单元体,构建相应的算法模型图谱,实现对露天矿山设备故障诊断和处置进行推理决策。模型方法本体是有关模型方法概念层次关系、属性关系以及关联关系的统一描述。将一个模型方法本体表示为:Model method event= {Method Concept,Method Property,Method Relation,Method Restriction,Method Instance}。其中:①Method Concept:模型方法概念的集合;②Method Property:模型方法本身属性的定义;③Method Relation :模型方法之间语义关联关系的定义;④Method Restriction:公理,描述方法与方法之间的约束关系;⑤Method Instance:模型方法的具体实例。
根据现有的露天矿设备故障评估模型、方法体系和专家先验知识,将模型方法分为统计分析、模型仿真和故障诊断3 大类。每个类可以再细分为子类。模型方法的基本属性包括:方法名称、类别、方法功能、方法描述、应用效果、适用设备类型、适用矿区。语义关系主要分为方法之间的相关性、方法名称的相似性和方法函数的相似性。该方法的关联度计算类似于设备数据本体中的数据关联度计算,采用关联分析算法对文本相似度进行计算。
2.2 设备图谱构建技术
1)知识抽取。实体抽取的典型方法包括基于特征的方法和神经网络方法。在工程设备故障处理中,大部分工程设备实体通过已有数据库进行实体构建,还需从文本中抽取的实体包括设备异常原因、设备异常状态、操作内容、调整措施、维修流程及维修手段等内容。知识抽取包括对结构化数据和非结构化数据抽取两种方式。结构化数据主要通过安装在车辆仪表的车载终端设备对将车辆所有静态和动态数据进行采集;非结构化数据抽取:故障处理的属性抽取任务主要指从预案、操作说明书、处置手册中提取相关状态量阈值、开关分合状态等内容。知识抽取流程如图2。
图2 知识抽取流程图
2)知识融合。露天矿设备的故障知识库图谱中,有较大比例数据源都是中文文本数据,因为中文多样性的描述,或者多个文字表示方法的同一内容可能会造成在知识提取过程中出现数据冗余,所以针对提取过程中获取的孤立的实体构造、属性和相关信息,就需要将数据融合,并对其加以统一管理,以保证数据质量,主要内容就是实体链接方法和知识库的信息融合。露天矿山设备实体在系统的数据库中一般都有具体定义和名称,要利用计算机技术手段,将现有数据库内涵转换成资源与描述框架的三角组合形态,将从其他形式中提取的知识要素与其内涵实现知识融通。
3)知识加工。进行了知识融合之后,下一步还必须进行质量评价,部分质量评价要求在人工参与甄别之后,合格的部分内容才会进入到知识库中,这样为了保证知识库的品质,在增加数据后,才能实现知识推理、扩展已有的知识、获取新知识,主要内容可以分为本体构造、知识推理和质量评价。本体构造的大致过程可以分为实体相似度计算、实体关系抽取以及本体的生成,例如对露天矿山运输车辆本体构架。通过机器学习挖掘新的实体或建立实体之间的新关联的过程,从而实现拓展和丰富矿山设备之间的图谱知识网络。
4)知识更新。随着露天矿山设备更新、备品备件的更新、装备模块设计的更新,各类相关对应的装备使用准则、装备的应对预案等内容,都会进行不断更新。而实体层的更新,主要是为了更新装备实体图谱中的重要实体知识节点,包括露天矿山设备的新增或相关传感装置限值的设计变化、装备部件变化等。
5)知识存储。经过知识抽取,融合,加工和更新之后,把不同结构的来源信息,转换为更结构化的三元组信息。针对露天矿山设备中的实体、关系属性等明确的设备数据而言,图数据库的存储方法有时较为明显,能够做到从概念、特性、实例等几个层面,对露天矿山设备的故障知识图谱进行综合呈现。将实体-关系-实体、实体-属性-属性值三元组当中的首尾部分保存为对应的节点,将属性关联、语义相关保存为边,以此完成了结构化知识三元组在图形中节点与边之间的映射。
6)可视化平台。多维数据可视化分析平台支持多种类型的数据源,关系型数据库、Hive、Elasticsearch、Kylin 和REST API 等大数据平台数据源,可提供交叉表、柱状图、饼状图、时序图等多种丰富多样的图表种类,可快速定制在浏览器上生成业务化、可视化的业务报表,实现工业设备相关传感器数据在设备仿真图上实时展示。可视化平台如图3。
图3 可视化平台
3 结语
1)提出了一种面向露天矿山工程设备故障处理辅助决策的知识图谱架构,自下而上分为5 个层级,即设备数据层、图谱实现层、数据分析层、推理决策层和综合展示层。针对露天矿山设备故障处理的应用场景和技术需求,开发露天矿设备故障辅助决策雏形系统。并在国内某露天矿进行运用,验证了知识图谱的科学性和高效合理的关联性,提高了维修人员的技术水平和设备的安全运行能力,为下一步深入分析提供了重要的参考。
2)知识图谱在露天矿山设备故障领域的分析还才刚起步,在知识图谱设备数据层结构中,受到多维数据、完整度的制约很大,而且由于在具体案例中,对完整的关系描述基本缺乏,所以对实体、关系信息抽取的有效性也会受影响。本书还将进一步拓展数据来源的范畴,通过总结与运用对露天矿山设备检修时已有的经验,对新知识、新设备的有关故障诊断理论和方法流程加以发现和总结,并以此增加知识图谱的完善程度。
3)随着智能矿山建设的逐步推进,矿山设备故障知识图谱设计可融合图像、音频、文本等多维数据信息,进一步分析故障知识演化、推理及人机交互,更好的服务矿山安全生产,提高设备效率,降低矿山开采成本。