钻床设备知识图谱的构建及应用
2021-06-16刘政张华廖育武肖国宏
刘政 张华 廖育武 肖国宏
(1.湖北文理学院汽车与交通工程学院 湖北省襄阳市 441053 2.湖北欧安电气股份有限公司信息装备部 湖北省襄阳市 441030)
1 引言
伴随信息技术的发展和制造行业数字化改造的实施,国内制造行业积累与沉淀了大量的制造设备工作过程数据,逐渐形成了工业大数据。这些设备中各种机床设备占有较大的比例[1]。为了有效利用机床设备的大数据信息,研究人员提出将数据存储于关系数据库等当中的数据进行调用并应用于相关设备的健康状态监测与故障诊断及预测等[2]。随着2012年谷歌公司正式提出知识图谱的概念并应用于提高搜索的能力以来,知识图谱技术被广泛关注并开始在各行业进行应用[3]。Hai[4]等提出了半自动构建知识图谱并应用于电网设备的运行及维修。Feng Yun[5]等提出了基于知识图谱的电气信息采集系统故障诊断知识问答系统,实现采集和维护故障诊断的高效化、智能化。知识图谱的应用大大提高了数据处理的效率,并能清晰直观的表示知识间的深层关系,有利于采用神经网络等机器学习算法对设备的健康状态和故障隐患进行预测。本文针对制造设备中应用较多的钻床设备建立知识图谱并将其在设备故障诊断与预测方面的应用进行了探索,建立了相关知识图谱框架及数据库案例,并对其应用进行了分析。
2 知识图谱定义及架构
2.1 知识图谱的定义
百度百科中解释知识图谱为图书情报界中的知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系[6]。而知识图谱作为知识的结构化表示,是一种以图的形式来描述知识和客观世界万物之间关联关系的技术方法[7]。本质上,知识图谱是一种描述实体、实体属性与实体关系的大型语义网络,其由节点与边组成。节点可以代表一个概念、一个实体或一个属性,边可以代表实体、概念等相关属性。
同时知识图谱对于不同的领域可分为通用知识图谱与领域知识图谱。通用知识图谱主要采用三元组的形式进行表示,实体构建的规模较大,精确度要求较低一般应用于搜索与问答。而领域知识图谱侧重于知识的质量,需要行业数据进行构建,一般应用于军事、机械、医疗等特定领域进行辅助决策。
2.2 知识图谱的架构
知识图谱架构主要从逻辑结构与构建技术两方面进行区分。
2.2.1 知识图谱逻辑结构
知识图谱的逻辑结构包括数据层与模式层,知识的表示形式是事实,故而数据层由大量的事实构成。而模式层由实体构成,是知识图谱的核心,是保证知识质量的部分。其建立在数据层之上,利用本体与实体的相关公理、规则与约束条件对数据层的事实进行规范[8]。对于本体来说是概念的集合,是公认的概念事实,变化的概率较小,对于借助本体库构建的知识图谱不仅结构性强,知识质量高冗余较小。
2.2.2 知识图谱构建技术
知识图谱的技术架构如图1 所示。
知识图谱构建的基本方法分为自顶向下的构建方法、自底向上的构建方法两种方法,自顶向下的构建方法指的是根据已有的结构化数据库定义本体与模式层,再从其他数据源中抽取实体加入到知识库。该方法需要根据结构化数据库、专家知识及固定的知识体系进行实体与模式层的构建,保障知识的质量与准确性。自低向上的构建方法从开放的、半结构化、非结构化或结构化的数据库、文本信息中抽取事实,选择置信度较高的知识加入数据库中构建数据层。然后再根据数据层构建相关实体与模式层[9]。目前通用知识图谱大多数采用自底向上的构建方法,如微软的Satori 知识库。
图1:知识图谱技术架构
图2:钻床设备故障知识图谱构建步骤
但对于一些领域知识图谱数据的特殊性及不完善性,通常采用自顶向下和自低向上相结合的方式进行构建。一般首先建立模式层,设置实体、属性及关系的相关规则;然后利用数据映射或知识抽取进行实体、属性、关系的填充;最后再利用数据层知识的关系进行知识推理、知识更新扩展知识图谱。
3 钻床设备知识图谱主要构建技术
本文提出构建钻床设备的知识图谱并根据钻床设备数据的复杂性提出了相关构建方法,提出利用自顶向下与自底向上结合的方式构建知识图谱,首先通过人工建立实体模式层,然后随着数据的积累从事实进行实体更新与填充。根据钻床设备故障数据的复杂性进行实体、实体关系的定义,钻床设备知识图谱的构建过程主要包括知识表示即实体建模与存储、知识映射、知识更新与可视化处理。其具体实现步骤如图2 所示。
3.1 知识表示
知识表示是对知识的一种描述,将知识表示称为一种计算机可理解的数据结构,现如今知识表示可分为逻辑表示[10]、产生式表示、框架表示、面向对象的表示、本体表示、基于模型的知识表示等。对于钻床设备的知识表示可分为数据的收集与本体的构建,钻床设备数据来源于设备使用手册、生产制造积累的关系数据库、专家经验、案例文本等结构化、非结构化数据,为本体模式层的构建提供了数据的支持。
本文以本体表示的方式进行知识表示,并将本体模型定义为P=<C、R、S、A>四元组形式,P 表示本体模型、C 表示本体概念即某实体类别的集合、R 表示概念之间的关系、S 表示子概念即实体元素、A 元素属性,同时本文将概念的属性与概念表示在一起,并未采用单独表示的形式。根据定义的本体模型建立钻床设备的网状知识结构,为了便于查询与分析,也可以将其转化为RDF 语言三元组的形式。
3.2 知识映射
知识映射是指建立两个数据模型,利用相关语言或技术将模型之间的元素进行关系的链接形成网状结构。钻床设备故障事实一般存储于关系数据库中,属于结构化数据,所以本文提出基于关系数据库进行知识映射。将钻床设备故障案例中的实体、关系、属性等存储于Mysql 关系数据库中,形成相应的数据表格,利用R2RML[11]、D2RQ 映射语言进行直接映射或采用间接映射将本体与数据同时存在Neo4j 中进行数据映射等。根据解析工具将本体解析为如<主轴(实体)、故障原因(关系)、电机(实体)>的形式,然后与建立的关系数据库进行相关映射,将数据库中的如<主轴反转、出现、电机电源接反>与本体中的主轴实体、故障关系、电机实体映射到解析的本体三元组中,建立本体与数据的相关关系。
本文中采用人工建立关系数据库与本体的形式,将数据库存储与Mysql 关系型数据库中,形成XML 或Excel 关系表格并就将其存入Neo4j 图数据库中,然后利用protégé[12]软件建立本体与实体形成SQL 语言文件并进行解析形成三元组。通过知识映射能更好地表示实体间关系,同时为知识推理与知识更新做了相应的基础,丰富了本体、实体间的关系。
3.3 知识推理与更新
知识推理是指对已建立的知识图谱进行进一步的知识挖掘与预测,挖掘出实体间隐含的关系,并对未来的关系、属性等进行预测,进而丰富扩充知识图谱。Ni Lao·William W. Cohen[13]等提出了一种新的邻近度度量方法用于路径约束随机行走,进行检测实体间的关系。Lei[14]提出了改进的基于规则的推理方法来推理出微生物之间的相关性。
钻床设备故障的知识推理可体现在如电机部件间的关系、使用时间与发生故障可能性的关系、主轴之间的位置关系等。其应用的对象可以是设备的实体、属性、实体的关系等。从推理的方式上知识推理可分为基于演绎的知识图谱推理和基于归纳的知识图谱推理。知识更新一般分为模式层更新与数据层更新,模式层更新就是对本体的增加、删减、变更等[15],但本体更改概率较小且会影响实体与其他概念,所以钻床设备知识的更新一般采用数据层的更新。根据工业生产过程中产生的事实数据,筛选高质量的知识进行实体的增加、删减、变更等,实现数据层的扩充。
3.4 知识图谱可视化
钻床设备知识图谱数据可以采用三元组形式存储,工作人员根据存储的语言进行相关查询,但并不能直观清晰的查看实体间的关系,对于不具有工作经验的人员不能直接进行设备故障的检测与判断。故而本文提出采用Neo4j[16]对三元组知识进行处理,利用neo4j-admin import 将部分钻床设备的关系型数据导入Neo4j 中展示可视化图谱。图谱中包含了47 个实体事实、4 种关系。47 个实体分为三类属性进行表示为18 个故障实体如丝杠、主轴、电机、数控装置等并分别标签钻床部件、气动系统、数控系统等属性,16个发生现象如丝杠支撑松动、传动精度减弱、主轴运动困难等标签为故障现象、13 个故障原因如灰尘进入数控装置、主轴与皮带过松或过紧等标签为故障原因。每个实体对应一个节点,每个边表示4 种关系,第一层关系为子类及包含、第二层关系为发生、第三层关系为发生的原因。实体及边共同构成了钻床设备部分事实数据的知识图谱,具有高性能、轻量级、嵌入式等优点同时还提供了相关的图算法更加便捷、清晰,可视化如图3 所示。
图3:钻床设备知识图谱的可视化
4 钻床设备知识图谱的应用
知识图谱已经在语义搜索、智能问答、辅助决策以及一些垂直行业有所发展及应用,并有了一些成熟的系统及平台,比较著名的有苹果的智能语音助手Siri,百度公司的小度APP 等。同时基于知识图谱的辅助决策也被应用于军事、机械等行业,李代祎[17]等构建了一种基于知识图谱的军事武器问答系统,乔骥[18]等提出了一种知识图谱框架应用于电网调度故障处理的辅助决策。
钻床设备是被广泛应用的通用性机械设备,可对零件进行钻孔、扩孔、绞孔等工艺,同时钻床可分为立式、台式、摇臂式、深孔等类型。而对于通用性广泛、种类较多的钻床,其设备故障作为复杂事件,将会受到机械部件、数控系统、使用周期等各方面的综合影响。例如钻床电机发生不转动故障,可能是器件接触不良、电源故障等方面问题;某钻床出现发热、电流变大现象,可归咎于数控设备进入灰尘,引起元器件绝缘电阻下降损坏器件;某型号钻床打孔深度、大小不精确、出现误差,主轴升降、正反转出现故障可能由平台偏移、主轴过松、电机故障引起。
针对不同种类的钻床设备出现的故障事实可能属于同类故障现象,也可属于不同故障现象,共同构成了复杂的事实知识网络架构。对于扁平化的关系数据库则不能清晰明了的表示钻床知识与展示知识间的深层关系,而知识图谱对知识进行直接的表示,并进一步分析故障事实间的关系。所以钻床设备知识图谱将可应用于故障案例的问答搜索,通过可视化界面进行相关部件的查询并给出具有关联性较大的实体及关系,同时建立的知识图谱中包含解决方法帮助钻床操作人员做出决策,起到辅助决策的作用。钻床设备知识图谱描述了钻床实体、使用时间、实体关系等事件的复杂关系,在钻床设备领域方面发挥了较大的技术作用,提升了设备故障诊断的智能化处理水平。应用于故障诊断与预测方面不仅提高了数据的利用率及故障处理的效率,对于无经验的工作人员还具有重要的指导效果,能清晰直观的展示故障对象、故障原因及解决方法,减少了处理不当的发生概率。
5 总结与展望
为了提高工业大数据的应用效率,本文提出一种钻床设备知识图谱的构建及其在设备故障诊断与预测中的应用方法。介绍了关于知识图谱的定义及架构,并从知识表示、知识映射、知识推理与更新及可视化处理四个方面对钻床设备故障案例知识图谱的构建进行了相关介绍。同时提出将该知识图谱应用与问答及辅助决策方面,分析了应用特点及优点。对于未来的工作将实现知识图谱的具体建立并进行实际应用,建立的知识图谱将包含不同类型钻床的故障案例实体,扩大本体与关系的建立。同时选择最优路径选择算法,实现最优路径并提供概率最大发生的故障实体与原因。