基于企业质量问题知识图谱的构建及应用
2020-06-03郭叶鹏
马 刚,李 楠,郭叶鹏
(中核控制系统工程有限公司,北京 102401)
产品质量是企业的生命线,全员质量是全面质量管理理念的核心,如何采用先进技术和新思维保证产品质量是企业员工都需关注的问题。企业在产品实现过程中会产生大量记录信息,运用先进技术和新思维对这些数据进行组织,既可规避企业在产品实现过程中的质量风险,也可为企业积累提供宝贵的经验反馈信息。
1 企业知识图谱构建
1.1 知识图谱概念
知识图谱最初是由谷歌提出,它运用知识图谱的结构来挖掘、分析、建立、描述和展示不同来源的知识资源之间的关联,用简单直观的方法来展示复杂的关系,以便使计算机和人更好的理解。
知识图谱是语义网络技术更新所产生的成果,它用结构化的架构描述了客观世界中的概念、实体及关系,用节点和连线表示。在知识图谱中,这些节点代表现实世界中存在某个具体事物或者其属性值,用这些线来连接所有有关系的实体,形成关系网,其中每个节点和关系都具有唯一性[1]。知识图谱将关系作为知识表示的一种方式,它可通过关系将相差甚远的不同种类事物进行关联,为使用者提供了一种从“关系”角度对事物进行分析的新视野。知识图谱可以根据使用者的需求回答出精准的答案以及一些有关联的信息,并利用可视化技术直观的展示其关系,以方便使用者更好的理解知识,同时能够为行业内的应用决策提供精准化的依据。
根据知识图谱的覆盖面的不同来看,可以把知识图谱划分为通用知识图谱和行业知识图谱两大类。
通用知识图谱是面向通用领域,以日常生活中产生的知识为主,注重对知识广度的描述,而行业知识图谱则是面向某一领域,充分利用了本企业内产生的数据进行构建,更加注重知识的深度和准确性[2]。本文构建的基于企业质量问题知识图谱是行业知识图谱,清晰的展示了概念及关系模式。
1.2 数据来源及数据处理
在通用领域知识图谱构建过程中,大量实体和属性都会带来许多冗余和错误信息,需进一步进行知识融合来消除歧义、剔除冗余和错误信息[3]。本文数据来源于本企业记录的质量问题,是经人工筛选后去除冗余的数据。但仔细对这些记录内容进行分析,发现这些数据对质量问题的语言描述,缺乏规范性和标准性。先将这些记录进行统一化、标准化处理,规范质量问题描述内容。规范的描述是知识图谱的构建前提条件。
1.3 质量问题知识图谱的构建
1.3.1 质量问题本体的概念及关系的确定
质量问题知识图谱是由其实体和实体之间的关系构成,用以描述整个质量问题的知识语义网络[4]。
在对质量问题知识图谱构建前,应结合用户需求进行组织和规范,构建有效的、可扩展的知识模式。本体指“共享概念模型的形式化规范说明”[5]。故引入本体可实现对知识图谱实体与实体间关系和属性的统一规范和管理,有助于提高知识图谱质量。
本文根据质量问题知识图谱的概念抽取主问题、问题实体描述、从问题层次抽取概念后,又采用访谈法和观察法,从安全质量管理部门对其控制的角度切入的。构建的质量问题知识图谱面向的用户为安全质量部门,根据其调研结果,结合其需求及检索习惯确定了本体概念,同时结合其业务流程定义了概念间关系及实体间关系,如图1 所示。
图1 本企业质量问题本体概念及关系Fig.1 Quality problem ontology concept and relationship of the enterprise
图2 本体与知识图谱映射机制Fig.2 Mapping mechanism of ontology and knowledge map
在概念和关系确定后,采用“自顶向下”方式,从概念层开始,逐级细化,进行实体扩充。每个实体包含一个或多个实例,根据本体特性,实例将继承其所属概念的所有属性和关系。
1.3.2 本体映射及知识存储
知识图谱是将概念层级作为树,概念节点作为树的节点,实体节点作为知识图谱的实体关系图节点,用线连接节点之间的关系[6]。
图3 企业质量问题知识图谱部分Fig.3 Knowledge map of enterprise quality problems
构建的质量问题知识图谱首先要确定本体和知识图谱间的映射机制,如图2 所示。本体可看作是将概念层级结构,即为“树的主干”,其中概念和实例等为“树的枝节”,用关联关系连接。
经过映射后的知识以三元组形式存在,将知识存储在图数据库中,运用数据库存储知识可快速、直观、灵活地处理大量复杂和相互连接的数据。
1.4 质量问题知识图谱的可视化
知识图谱最大的优点就是可利用空间形态直观地表示出知识间的相互关系。构建的质量问题知识图谱,安全质量管理人员可根据其使用需求和检索习惯,多维度的利用知识,同时利用实体间关系,可为实现质量问题精准定位、根本原因深度挖掘、为制定有效措施奠定基础。
通过对构建完成的质量问题知识图谱进行分析发现,企业内同类质量问题时有发生,根据此现象,引入语义相似度[7],将这些相似“问题描述”进行聚类,并借助标签组织簇实体,如图3 所示。如,人工将“生锈”作为两个质量问题的共同标签,通过语义相似度计算,便将描述中有关“机柜门板生锈”“机柜顶部及内部生锈”等质量问题,聚为一类。标签的制定为后续的质量问题分析奠定基础。
2 质量问题知识图谱在企业的应用
构建完成的质量问题知识图谱将主要应用于以下几方面:
2.1 智能化检索和分析
本文构建的知识图谱以图结构的形式对产品实现过程中所发生的质量问题的概念、实体、属性及关系进行组织和存储,使知识间的关联更加立体[8]。随着知识的不断积累,借助知识图谱可挖掘质量问题产生的根本原因与问题发生的潜在关系,便于企业在产品实现过程中出现质量问题时,可实现智能化检索和问题的逻辑推理,并能进一步快速精准定位问题原因。
2.2 问题全程追溯
从质量问题的实体描述,到解决方案等多步深入分析,便于用户对该质量问题进行全程回顾和追溯,为合理制定改进措施提供物质基础。
3 小结
本文涉及如何运用新技术和新思维构建企业质量问题知识图谱,实现企业质量问题高效检索、问题原因精准定位、相关知识的有效积累和共享等,后续还将继续开展对其研究和实践,将最大限度地发挥知识图谱的应用价值。