注塑工艺缺陷知识图谱的构建及应用
2023-07-17葛睿夫林越高祖标
葛睿夫 林越 高祖标
摘要:注塑过程故障原因通常需要技术专家进行现场人工定位,费时费力。为实现对工艺手册及故障解决方案文本中诊断知识的有效管理和利用以及辅助提高专家诊断效率,提出了一种针对注塑工艺缺陷诊断领域的知识图谱构建方法。采用增量式本体构建框架建立注塑工艺缺陷本体模型;基于R2RML实现数据由关系型数据库表向资源描述框架(RDF)的转化;基于RDF中的三元组实现知识智能搜索、故障诊断及工艺卡解析等应用,展示了知识图谱技术在注塑领域的良好应用前景。
关键词:知识图谱;注塑产品缺陷;本体构建;RDF;智能应用
中图法分类号:TP391 文献标识码:A
1 引言
注塑产品的成型受原料、模具及机器本身等诸多因素的影响,在不具备行业专家经验与知识的情况下仅依靠产品缺陷表征很难定位其问题所在,这极大地增加了解决问题的时间成本,严重降低了自动化产线设备的利用率和生产效率。同时,生产人员对工艺手册和故障案例文本的现有检索方式效率低下,亟待优化。
本文提出构建注塑领域知识图谱,探究每个产品缺陷案例内在因素之间的关联,并将这些因素与关系结构化、显性化和可视化,从而实现产品缺陷知识的有效积累和组织,帮助车间工人更好地定位并解决引起产品缺陷的共性问题。随着知识的更新和补全,将当前可获取的知识作为先验知识,能够使设备的维护和管理水平得到更好的提升。
知识图谱技术对海量知识的高效管理、组织和理解提供了可能[1] 。基于其良好的知识表达能力,已有多个领域对知识图谱进行了深入研究及探索[2] ,且应用形式广泛,主要包括推理[3] 、搜索[4] 、推荐[5] 、问答[6] 。在推理方面,吴运兵等[7] 提出了一种基于路径张量分解的知识图谱推理算法,利用路径排列算法(PRA)获得知识图谱中实体对间的关系路径,对其进行张量分解,并在迭代过程中采用交替最小二乘法。
于娟等[8] 提出了基于图数据库的人物关系知识图谱推理方法,根据知识图谱中已有人物与关系,发现新的关系并检测人物关系数据中的不一致性,提升基于人物关系作出的管理决策的有效性。在搜索方面,王萌等[9] 基于搜索系统难以精准捕获用户查询意图的难点,提出了人机混合的知识图谱主动搜索。在推荐方面,余敦辉[10] 利用知识图谱及基于知识图谱结构的重启随机游走,实现了一种跨平台的用户推荐方法。李浩等[11] 结合电影自身知识和外部评分等属性,提出了一种基于循环知识图谱和协同过滤的电影推荐模型。在问答方面,张鹏举等[12] 基于多特征消歧的方法,提出了一种新型的中文知识图谱问答系统。曹明宇等[13] 针对原发性肝癌设计了基于知识图谱的原发性肝癌问答系统。除了以上的热门应用外,知识图谱也被用于展示文献间的高频关键词,有助于学者和企业管理者对行业热点进行分析。
目前,国内外对这一问题的研究也取得了一定的进展。Feng 等[14] 基于电信息采集系统故障运维知识库难以满足大量運维信息条件下高效智能决策制定需求的背景,提出了一种用电信息采集系统的知识问答系统,实现了边与节点的高效遍历搜索,支持高效和智能化的采集与维护故障诊断,使得推理效率获得提高。Ou 等[15] 指出随着电力无线专网的覆盖率逐渐上升,如何有效利用智慧终端的信息来实现无人网络监控和自动运维成了亟待解决的问题。针对以上问题,使用故障信息和终端信息构建了知识图谱,实现了电力无线专网的决策制定和故障诊断。Liu等[16] 提出了铁路操作故障及其危害组成的因果网络,并基于该网络构建铁路操作故障知识图谱,在异构网络中对故障和危害进行了描述,探索故障的潜在规则并提出预防措施。李乐乐等[17] 基于飞机维护和维修的相关知识研究知识图谱的构建和应用方法,利用SQLite 数据库和知识图谱构建了飞机维护维修知识库,并利用数据库对飞机故障进行了时间和空间维度的分析。刘瑞宏等[18] 将电信网络领域零散的产品、案例、专家知识和故障数据进行了有效关联,提出了电信领域知识图谱的构建方法。
2 注塑工艺缺陷知识图谱构建
2.1 知识表示
数据采集、领域本体建模构成了知识表示的2 个阶段。构建知识图谱的数据通常来源于RDB(Relational DataBase,关系型数据库,是基于关系模型的数据与数据库对象的集合)结构化数据、原始文本资料、行业专家经验,只有拥有充足的数据来源,才能更好地对领域本体进行建模。
本体能够将领域概念、概念间的逻辑关系和层次、概念的属性和约束等进行清晰的描述,能够保证知识含义在传递和共享过程中的唯一性。通过对知识来源及知识属性的分析,将数据源信息中所涉及的知识模块进行细节划分,从而构建出知识本体框架。
在此基础上,若要实现对模块细节概念和关系的进一步扩展,则需采用数据驱动的增量式本体建模方法,本体构建流程如图1 所示。
本体模型的数学形式可表述为:O =〈C,R,A,I,F〉(1)式中,各元素的含义如下。O: 本体模型; C: 概念(类),某一类实体对象的集合;R:概念(实例)逻辑关系,指概念之间的交互作用关系(组成关系、继承关系及其他业务关系);A:概念(实例)属性关系,即概念具有的属性和属性值;I:实例(独立的实体),表示属于某种概念类的基本元素。F:函数(公理),即关系或函数之间存在的关联或约束。
实例的集合构成概念,每一个实例作为概念的子类都会继承概念的所有属性,且实例之间也存在交叉和关联关系。
构建完成的本体依靠JENA 解析器(一个基于Java 的语义网应用框架,常用于解析本体模型),实现本体元数据向资源描述框架RDF ( ResourceDescription Framework,使用XML 语法,用于描述Web资源的特性及资源之间的关系)的转化,并将本体按照〈主体〉?〈属性〉?〈客体〉的三元组形式进行解析和存储,且支持SPARQL 查询语言对存储的三元组进行查询。
2.2 数据映射
数据映射过程包括2 种语言标准: “ DirectMapping”(A direct mapping of relational data to RDF)和“R2RML”(RDB to RDF mapping language)。前者直接按照关系型数据库的结构将数据向RDF 图中映射,其映射方式简单便捷,但无法将数据库中的表名与本体中的类进行关联;后者可以通过自定义的词表实现关系型数据库向RDF 数据集的转化,在前者的基础上增加了自由定制的特性,其灵活性适用于各种场景。
R2RML 映射设计一个在关系数据库中检索数据的逻辑表,将关系数据库的一个基表的SQL 查询定义为逻辑表。每个逻辑表被一个三元组映射(triplesmap)转换成RDF,即逻辑表中每一行实例数据被映射为若干RDF 三元组。
映射文档( mapDoc) 由一个关系数据的全部R2RML 映射构成,表现为一系列RDF 三元组映射的集合,通常以Turtle 语法格式书写。在梳理了概念之间的逻辑关系后,编写了注塑产品缺陷数据库的R2RML 映射文档,部分实体R2RML 映射原理图如图2 所示。
通过R2RML 映射文档,基于D2R Server 关系数据映射引擎实现数据从扁平化到网状结构化形式的转换,在很大程度上丰富了本体中的实例与属性关系。
2.3 智能应用
(1)基于属性名称的知识搜索。
针对传统检索效率低下的问题,采用知识图谱的图结构优化检索效率。作为知识融合的载体,知识图谱所有的知识点被具有语义信息的边所关联,通过检索其包含的任意知识即可将与其所关联的全部知识显示出来。
知识搜索界面如图3 所示,该功能可以通过输入实体名称,实现精准匹配,从而挖掘实体间潜在关系。
在学习故障诊断相关知识时可以直接输入书籍目录中的故障名称,界面会快速显示以故障名称为中心且包含故障描述、故障成因、解决措施等实体之间关联关系的知识图谱。
(2)基于数据驱动的智能诊断。
智能诊断界面如图4 所示,该功能基于过往积累的设备和产品失效知识(如故障树分析(FTA)、故障分析(FA)等)构建关系图谱。该功能集成的自然语言处理领域常用的TF?IDF(词频?逆文档频率)用于解决技术人员输入的故障名称不能精确匹配知识图谱中已存储的语义信息的问题,即输入的故障名称会根据TF?IDF 计算的相似度分值匹配到知识图谱数据库中分值最高的文本。
(3)工艺卡信息提取。
工艺卡记录了一台注塑机加工产品的正常工序及参数设定,是一线工作人员操作注塑机的重要参考。同类型的产品对应的工艺卡片内容大体一致,但格式多有变化,较为复杂的工艺卡格式容易增加一线工作人员的理解难度。因此,将不同格式的工艺卡解析为同一种图谱形式(如图5 所示),可以更直观地展示工艺卡内容,降低理解难度。
由于注塑机工艺卡电子版本大多是以Excel 文件格式存在,因此其很容易被解析成知识图谱的形式。
将每张工艺卡的设备型号作为知识图谱的中心实体节点,各类型参数作为叶子实体节点与中心节点建立连接。在知识图谱中,通过检索设备型号即可获得各项设定参数,有利于提升工作人员的工作效率。
3 结束语
本文针对如何对现有工艺手册和故障诊断文本中的诊断知识进行高效管理和利用的问题,提出了注塑工艺缺陷知识图谱的构建方法。构建了领域本体模型,采用基于规则的数据映射机制生成了RDF 文件,并基于RDF 中包含的注塑工艺缺陷知识开发了3个功能模块,以辅助工业现场故障诊断效率的提升。
注塑工艺缺陷知识图谱提升了对现有故障诊断知识的利用率,并对未来诊断推理方法的研究贡献了较高的应用价值。
参考文献:
[1] 黄海松,陈启鹏,李宜汀.数字孪生技术在智能制造中的发展与应用研究综述[J].贵州大学学报(自然科学版),2020,37(5):1?8.
[2] 刘烨宸,李华昱.领域知识图谱研究综述[J].计算机系统应用,2020,29(6):1?12.
[3] 王树徽,闫旭,黄庆明.跨媒体分析与推理技术研究综述[J]. 计算机科学,2021,48(3): 79?86.
[4] 王渊,彭晨辉,王志强,等.知识图谱在电网全业务统一数据中心的应用[J].计算机工程与应用, 2019, 55(15):104?109.
[5] 常亮, 张伟涛,古天龙,等. 知识图谱的推荐系统综述[J].智能系统学报,2019,14(2):207?216.
[6] 王智悦,于清,王楠,等.基于知识图谱的智能问答研究综述[J].计算机工程与应用,2020,56(23):1?11.
[7] 吴运兵,朱丹红,廖祥文,等.路径张量分解的知识图谱推理算法[J].模式识别与人工智能,2017,30(5):473?480.
[8] 于娟,黄恒琪,席运江,等.基于图数据库的人物关系知识图谱推理方法研究[J].情报科学,2019,37(10):8?12.
[9] 王萌,王靖婷,江胤霖,等.人机混合的知识图谱主动搜索[J].计算机研究与发展,2020,57(12):2501?2513.
[10] 余敦辉,张蕗怡,张笑笑,等.基于知识图谱和重啟随机游走的跨平台用户推荐方法[J].计算机应用,2021,47(1):1871?1877.
[11] 李浩,张亚钏,康雁,等.融合循环知识图谱和协同过滤电影推荐算法[J] 计算机工程与应用,2020,56(2):106?114.
[12] 张鹏举,贾永辉,陈文亮.基于多特征实体消歧的中文知识图谱问答研究[J].计算机工程,2022,48(2):47?54.
[13] 曹明宇,李青青,杨志豪,等.基于知识图谱的原发性肝癌知识问答系统[J].中文信息学报,2019,33(6):88?93.
[14] FENG Y,ZHAI F,LI B F,et al.Research on intelligent faultdiagnosis of power acquisition based on knowledge graph[C]∥ 2019 3rd International Conference on ElectronicInformation Technology and Computer Engineering(EITCE). Piscataway,NJ:IEEE Press,2019:1737?1740.
[15] OU Q H,ZHENG W J,QI W W,et al. Research on theconstruction method of knowledge graph for electric powerwireless private network[C]∥2020 IEEE 10th InternationalConference on Electronics Information and EmergencyCommunication ( ICEIEC). Piscataway, NJ: IEEE Press,2020: 10?13.
[16] LIU J T,SCHMID F,LI K P,et al. A knowledge graph basedapproach for exploring railway operational accidents [ J].Reliability Engineering & System Safety,2021,207:107352.
[17] 李乐乐,王奕为,丁超,等.面向飞机维修与维护的知识图谱应用[J].内燃机与配件,2019(23):147?148.
[18] 刘瑞宏,谢国强,苑宗港,等.基于知识图谱的智能故障诊断研究[J].邮电设计技术,2020(10):30?35.
作者简介:葛睿夫(1996—),硕士,研究方向:工业知识图谱。