基于第三方云平台的服务价值链多链知识图谱构建
2022-03-11刘鹏程孙林夫
刘鹏程,孙林夫+
(1.西南交通大学 计算机与人工智能学院,四川 成都 610031; 2.西南交通大学 制造业产业链协同与信息化支撑技术四川省重点实验室,四川 成都 610031)
1 问题的提出
随着信息技术的发展,基于云平台的网络化协同模式逐渐成为服务价值链运营和管控的重要手段[1]。云平台突破了制造企业与服务企业业务协同的空间和时间限制[2],制造企业可以通过云平台与地理分散的服务企业进行业务协同和信息交互,提升了制造企业对服务价值链的运营和管控水平[3-4]。相对于私有云平台,依托第三方云平台的网络化协同模式可以同时为多条服务价值链提供业务协同服务,具有更多的业务参与者和更强的资源汇聚能力。
(1)平台决策支持能力不足 第三方云平台侧重于业务协同流程管理,即控制业务信息流转,缺乏数据向知识的转化能力,导致平台对业务运行的决策支持能力不足。
(2)平台数据资源闲置 在服务价值链业务协同过程中,第三方平台积累了大量多链业务数据资源,然而多数数据分散闲置,并未得到有效利用,亟待挖掘潜在价值。
(3)多链连接亟待打通 第三方云平台虽然连接多条服务价值链,汇聚多方资源,但是并未打通服务价值链内外各个价值节点间的横向连接,信息与知识并未在多链范围内流动,网络效应未完全激发。
针对上述问题,如何挖掘数据资源潜力,提升知识转化和共享能力,已经成为支持业务决策、进一步激发网络效应的重要途经之一。知识图谱[5]为基于概念和实体关系的语义知识库[6-7],是实现数据和知识组织的一种技术[8],有助于理解和管理信息[9]。本文通过研究服务价值链多链知识图谱的构建,用集成分散的多链数据资源抽取多链知识,以充分发掘数据价值,实现知识共享,持续地支持多链服务业务决策,具体目标如下:
(1)实现服务价值链多链知识共享化 通过将第三方云平台上各服务价值链的业务信息归纳到统一的知识体系下,打通多价值链各节点间的数据,构建统一的数据模式,表达一致的语义信息,实现多链知识的融合与共享,从而产生更大的价值。
(2)实现业务决策智能化 基于服务价值链多链知识图谱,利用知识、数据和业务融合驱动业务运营,基于知识图谱的查询、分析和推理能力进行知识发现和挖掘,实现对各重要流程节点业务决策的支持。
(3)实现知识应用持续化 通过第三方云平台汇聚业务数据资源,将数据资源转化为可共享的知识,支持多条服务价值链的业务决策;业务决策产生的数据则汇聚到平台上转化为新的共享知识,形成知识应用闭环,从而持续产生知识。如图2所示。
针对上述目标,基于第三方云平台多服务价值链的业务特点和需求,围绕知识图谱构建的各个环节提出相应的解决方案,主要研究内容如下:
(1)服务价值链多链知识图谱的概念 服务价值链系统中存在多种概念,从服务业务、服务资源和产品等维度出发,构建基于第三方云平台的服务价值链多链知识体系,形成规范统一的多链知识;建立了面向服务价值链多链环境下的知识图谱整体构建框架,以实现对服务价值链内外分散知识的组织、序化和统一,为服务价值链的业务提供决策支持。
(2)服务价值链多链知识图谱的知识 服务价值链多链知识图谱为领域知识图谱,具有较强的专业性和针对性,对知识准确性有较高要求。在知识图谱构建过程中,为保证知识的准确性,对知识进行一致性检测和补全,基于此本文设计了基于二阶段的知识模型构建方法,通过一阶段求解初始模型、二阶段求解精确模型,完成知识图谱模型的构建。
(3) 服务价值链多链知识图谱的存储 针对知识图谱模型存储问题,设计了基于两级Map结构的知识图谱转存方法。
(4) 服务价值链多链知识图谱的构建与应用示例 基于第三方云平台数据资源构建服务价值链业务知识图谱,以验证服务价值链多链知识图谱构建方法的可行性,展示了基于该方法研发的服务价值链故障维修知识图谱构建与应用系统示例。
2 服务价值多链知识图谱总体框架
2.1 服务价值链多链知识图谱模型
服务价值链多知识图谱模型形式化表示为KG=〈T,A〉,其中T表示模型的模式层,A表示模型的实例层。模式层定义领域概念及其关系,通过模式层管理和组织实例层,完善实例层知识,并对实例层进行规范和约束。通常利用本体对模式层进行建模,通过本体描述概念及其关系(概念与概念属性)形成公理知识;实例层由实体及其关系(实体与实体属性)构成,用于描述事实性知识。
当前知识图谱在制造业服务环节[10-12]的研究主要涉及对产品故障和维修知识的组织,集中在对单个产品的诊断和维护中,其数据源和功能相对单一,忽略了服务环节中其他业务概念及其关系的知识,本文将关联服务价值链中的多种业务概念和实例,更加完整地组织服务价值链业务知识体系,如图3中所示。
本文将模式层分为全局核心概念层和局部扩展概念层,如图3所示。在全局核心概念层中,对全局核心概念及其关系进行定义,形成服务价值链多链间统一和规范的顶层共享概念,避免共享概念在价值链间重复定义;在局部扩展概念层中,针对各服务价值链的特有概念,对全局核心概念进行扩展和继承。在实例层中,实例个体概念和关系均依赖模式层中概念和关系的定义,通过抽取服务价值链多链数据形成实例层知识。
本文通过映射关系将实例层和模式层进行关联,形成统一的多链知识模型框架,并利用该知识模型框架实现服务价值链多链知识组织。
2.2 服务价值链多链知识图谱构建框架
知识图谱的构建一般包括自顶向下和自底向上两种方式[13],这两种方式的选择主要取决于数据源。当数据质量较高且拥有规范模式时,可以采用自顶向下的方法[14],利用确定的模式构建知识图谱;当数据没有规范模式时,可以采用自底向上的方法,通过实体识别、关系抽取等技术提取数据模式来构建知识图谱。另外,可将两种方式融合来构建知识图谱,文献[15]通过本体建模构建知识图谱的概念模式层,然后从多个数据源中抽取数据构建实例层,最后通过在概念模式与数据之间建立映射关系形成知识图谱。本文采用自顶向下的方式构建服务价值链多链知识图谱。
知识图谱模型架构设计侧重于对模式层概念的表示和组织,并基于模式层中的全局和局部概念控制知识图谱模型的构建过程。针对该构建过程,本文提出服务价值链多链知识图谱构建框架及相关方法组织多链知识,该构建框架如图4所示,主要包括数据集成、知识建模和知识存储3部分。
(1)数据集成 基于模式层概念及其关系构建统一数据模式形成全局视图,集成多源异构的服务价值链数据(如图4中的操作数据层)进行知识抽取,形成实体数据库。
(2)知识建模 通过两个阶段求解知识模型:①建立模式层和实体数据库的映射,形成初始知识模型;②求解出规范和完整的精确知识模型。基于知识模型的模式层和实例层组织知识,改变原有数据的组织形式,实现对多链知识的描述和序列化。
(3)知识存储 本文将精确知识模型存入图数据库,实现知识图谱落地,提出一种知识图谱转存算法,同时实现序列化知识模型到图数据库的存储,以便对知识进行管理和计算。
3 服务价值链多链知识表示与建模
3.1 服务价值链多链知识模型的模式层知识表示
服务价值链多链知识表示侧重于构建统一规范的概念描述,基于对服务业务的分析和梳理,以服务价值链中的共性概念及其关系为基础构建模式层。
3.1.1 全局核心概念
描述逻辑建立在事实概念和关系之上,具有较强的表达能力,适用于通过概念分类表示领域知识,其中概念可以解释为对象集合,关系指对象之间的二元关系。本文利用描述逻辑对模型的模式层概念及其关系进行形式化描述,实现对服务价值链多链知识的统一表示。
全局核心概念层主要包括6个顶层服务价值链实体概念ValueChainEntity,分别为服务业务概念ServiceBusiness、服务业务流程概念ServiceBusinessProcess、服务业务资源概念ServiceBusinessResource、产品概念Product、客户概念Customer和地点概念Location,各概念间不相交。服务业务顶层概念间存在较多关联关系,大致归纳为业务与业务流程、业务流程与业务资源、客户与产品等概念之间的关联关系。
(1)服务业务实体概念
服务业务概念ServiceBusiness是整个服务价值链的主体部分,面向服务业务需求,核心企业和服务企业协同推动业务执行,所定义的服务业务概念主要包括保养业务MaintenanceBusiness、索赔业务(主要指三包期内的维修业务)ClaimBusiness和旧件业务OldPartBusiness 3种,各个服务业务概念间不相交。保养业务和索赔业务直接面向客户,为客户提供产品的售后服务;旧件业务为保养和维修的后序业务,实现对旧件资源的管理。
(2)业务资源实体概念
服务业务资源ServiceBusinessResource指维持业务流程运转所需的资源,包括业务活动中人力、物力和信息等要素以及各要素的组合,基于资源在业务活动中的流动方向,业务资源可以分为输入业务资源和输出业务资源,输入业务资源指业务流程运行过程中需要消耗的人力、物力和信息等要素,输出业务资源指业务流程运行过程中需要产生的物力和信息等要素。服务价值链中的业务资源包括组织类业务资源OrganizationResource、物料类业务资源MaterialResource和信息类业务资源InformationResource,分别对应人力、物力和信息要素。
1)组织类业务资源概念
组织类业务资源指参与到价值链流程运行中的企业Enterprise和该企业中的人力资源HumanResource,由于服务价值链中的业务流程是一类跨企业边界的业务流程,流程的参与者为来自多个企业的多部门人员。从服务价值链业务协同的宏观角度看,开展服务业务协同的企业分为核心企业与协同企业两类;从企业角度看,服务价值链中的核心企业与业务协同企业(服务企业)由不同概念类组成,例如在汽车行业中,核心企业包括发动机制造厂、汽车制造厂等中上游制造企业,业务协同企业包括与其进行业务协同的4S店、服务商等服务企业;从业务人员角度看,组织资源包括各单位内部参与业务活动的人员,如服务站内部与核心企业对接业务的索赔专员、制造企业内部审核索赔单的业务人员。
2)物料类业务资源概念
物料类业务资源MaterialResource指服务价值链流程中涉及的物料类资源,基于物料资源的流动方向将物料类业务资源分为输入类物料业务资源InputMaterialResource和输出类物料业务资源OutputMaterialResource。输入类物料业务资源主要指业务流程运行过程中消耗的物料,例如维修活动中的配件业务资源为一类重要的输入物料业务资源,配件概念体系在产品领域中具有一定的通用性,构建统一的配件概念组织体系对知识图谱跨链知识共享具有重要意义;输出类物料业务资源主要指业务流程运行过程中产生的物料,例如在维修过程中会用新配件替换故障件,此时产生的旧件OldPart即为当前流程产生的物料资源。输入与输出物料间也存在一定关联关系,如旧件与配件类概念之间的关系OldPart⊆normalPart.Part。
3)信息类业务资源概念
信息类业务资源InformationResource指服务价值链流程运行中涉及的信息资源,同样基于资源流动方向分为输入类信息业务资源InputInformationResource和输出类信息业务资源OutputInformationResource。例如在索赔业务流程中,维修人员使用的维修手册即为信息类业务资源,这些知识为当前业务流程的输入信息资源。在完成产品维修后,服务企业会向制造厂(核心企业)提交索赔单,其中记录了维修活动的相关信息,此时索赔单即为当前业务流程的输出信息资源。
(3)业务流程实体概念
业务流程是服务价值链的核心概念,基于两端三方的基本组织关系,业务流程概念组织和关联价值链中涉及的诸多重要实体,通过分析服务业务流程选取服务价值链中的核心流程作为全局概念。以索赔业务流程ClaimBusinessProcess为例,给出相关概念及其关系描述,基于索赔业务流程将产品、客户和业务资源等概念进行关联,式(1)~式(12)为索赔业务流程与关联概念的部分公理描述,包括索赔业务流程中消耗和产生的业务资源。
ClaimBusinessProcess⊆ServiceBusinessProcess;
(1)
ClaimBusinessProcess⊆∀processe.ClaimBusiness;
(2)
RepairArchive⊆InputInformationResource∪
OutputInformationResource;
(3)
Part⊆InputMaterialResource∩
∃partOfComponent.Component;
(4)
OldPart⊆OutputMaterialResource∩
normalPart.Part;
(5)
ClaimBusinessDocument⊆
OutputInformationResource;
(6)
ClaimBusinessProcess⊆
∃comsume.RepairArchive;
(7)
ClaimBusinessProcess⊆∃generate.
ClaimBusinessDocument;
(8)
ClaimBusinessProcess⊆∃generate.RepairArchive;
(9)
ClaimBusinessProcess⊆∃comsume.Part;
(10)
ClaimBusinessProcess⊆∃generate.OldPart;
(11)
ClaimBusinessProcess⊆∃comsume.
HumanResource。
(12)
(4)其他实体概念
1)地点实体概念
地点概念描述空间信息,用于关联业务活动、企业等概念。设Location为地点实体顶层概念,其对省、地级市等相关地点概念的定义为Province⊆Location,City⊆Location,City⊆≥1inProvinceOf.Province∩≤1inProvinceOf.Province,其中Province为省级地点概念,City为地级市地点概念,知识图谱模型利用地点实体概念组织相关地点概念。
2)产品及客户实体概念
产品概念Product为业务流程服务的对象,知识图谱模型基于Product概念组织相关概念,例如将整车产品Automobile定义为Automobile⊆Product;同时,产品概念与其他类实体概念也存在关联,例如客户Customer为产品Product的所有者,客户购买产品Customer⊆∃purchase.Product将产品与客户关联,另外产品Product与服务业务流程等概念也存在关联。
3.1.2 局部扩展概念
全局核心概念层实现了对服务价值链全局共享概念及其关系的表示和组织,但部分服务价值链存在特有实体概念,这些特有实体概念及其关系可基于全局核心概念层进行扩展。从概念划分粒度分析,全局核心概念层是在归纳服务价值链中的实体概念及其关联概念的基础上形成的抽象概念,局部扩展概念是在全局核心概念基础上实现的更细粒度的概念分类组织。
在图3中,全局概念协作企业CollaborativeEnterprise可以直接作为数据层实例关联的概念,CollaborativeEnterprise(cei)表示cei为协作企业的实例,当对协作企业概念进行扩展后,如添加配件供应商概念PartSupplier⊆CollaborativeEnterprise,可以利用PartSupplier(cei)将实例cei表示为更加具体的概念。在图3的索赔流程中,不同服务价值链中围绕索赔核心流程会设计一些辅助流程,例如某些制造厂针对三包期内的业务活动会特定地设计一些业务流程,可以将该类流程包含于全局核心概念的特殊申请流程中,定义在扩展概念层,以减少对全局核心概念层的影响。
3.2 服务价值链多链知识建模
本文基于服务价值链多链知识图谱的两层框架结构,通过集成分散的异构数据构建实体数据集,利用两个阶段求解出规范和完整的精确知识模型。
3.2.1 构建实体数据集
服务价值链中核心企业与服务企业的业务协同数据是构建服务价值链多链知识图谱的主要数据源,基于模式层中涉及的实体、关系和属性概念对数据进行筛选,确定各局部数据源与全局统一数据模式对应的映射关系,从服务价值链多链数据中抽取和集成实体数据,构建实体数据集。
基于上述定义对数据集成过程进行描述,并基于各数据源的局部模式和全局模式,利用Cut操作和Join操作进行数据抽取,实现业务操作数据与实例数据的映射,构建实体数据集,图5所示为该过程的一个简单案例展示,多个数据源经过Cut操作、Cut和Join混合操作实现集成,具体流程如下:
步骤1设源于多个业务系统数据形成的操作数据层为s,价值链i的数据源为si,例如图4中操作数据层共有k个数据源{s1,s2,…,sk}。
步骤2根据目标实体数据,设抽取实体的全局统一数据模式为{ψt1,ψt2,…,ψtg},tg为实体类型数目,基于全局数据模式确定各局部数据源与其对应的映射关系及相应的抽取操作。
3.2.2 二阶段求解知识图谱模型
服务价值链多链知识图谱作为一种领域知识图谱深入到某个领域,其知识具有较强的专业性和针对性,对知识准确性有较高要求[16-17]。为保证知识准确性,在求解知识图谱模型的过程中,对知识进行一致性检测和补全,以保证形成精确的知识模型。在服务价值链多链数据集成过程中,以目标实体数据模式作为全局统一模式,抽取实体数据,这些实体数据为实例层知识模型的数据源,知识模型的求解过程如图6所示,具体步骤如下:
(1)一阶段求解——构建初始模型
步骤1基于服务价值链多链知识表示获取模式层概念及其关系的语义信息,基于Web本体描述语言(Web Ontology Language,OWL)构建模式层本体模型。
步骤2首先,以实体数据库为数据源,建立实体数据与知识模型实例层的映射关系;其次,基于实体数据类型形成实体层概念集合;再次,构造实体数值属性,设定实体数值属性名称及值类型,构造实体关系属性,设定实体间关系名称及类型;最后,基于实体数值属性和实体关系属性,构造实体及其关系集合,形成实例层模型,实现对知识元的抽取。
步骤3建立概念与实例的映射关系,关联模式层模型与实例层模型,将模式层与实例层知识融合,形成初始模型。
(2)二阶段求解——构建精确模型
步骤4对初始知识模型的知识进行一致性检测,包括可满足性检测、实例检测和概念包含检测。其中,可满足性检测是对知识库的一致性进行检测,以判断知识库是否存在错误;实例检测用于判断实例层中的实体是否为概念的实例;概念包含检测用于判断概念间的包含关系,即判断概念间的包含关系是否为知识模型的逻辑结论。
步骤5在知识模型一致性检测过程中,对模型中的知识进行推理,发现概念间的包含关系,从而推理出实例层实体对应的所有概念。
步骤6将推理所得的新知识与知识模型的现有知识进行融合,形成新模型,同时利用OWL数据模式序列化知识模型求解出精确知识模型。
3.3 面向图结构数据库的知识图谱存储
基于二阶段求解出知识图谱模型,为取得更优的查询和存储性能,将知识图谱模型转存入neo4j图数据库形成知识图谱。文献[17]提出通过在OWL本体模型与neo4j图数据库之间创建映射关系实现知识图谱存储的方法;文献[18]提出一种知识图谱转存算法,通过解析RDF文件,基于解析结果在neo4j图数据库中创建知识图谱节点和关系,然而该算法在运行过程中需要多次判断节点的存在性,影响了存储性能。本文提出一种基于两级Map结构的知识图谱转存算法(Two Level MapTransform Store, TLMTS)进行知识图谱模型到neo4j图数据库的存储,算法通过解析知识模型构建两级Map数据结构形成模型的实体集和关系集,从而减少运行过程中对节点存在性的判断,提升转存性能。算法过程如图7所示。
步骤1解析知识图谱模型数据模式,抽取实体数值属性和实体间的关系形成实体数据集和实体关系集。实体集合中包含二级Map结构,其中第一级以实体uri为键值,以实体属性关系为值,形成全局唯一实体集合,以同样的数据结构形成关系二级Map结构集合。
步骤2读取二级Map结构中的实体集合,在neo4j数据库中创建实体节点,然后遍历实体集合,将实体节点插入数据库,可以用Map结构确保实体的唯一性,不用再判断节点的存在性。
步骤3结束实体集合读取后,通过遍历实体关系集合,插入节点关系,在neo4j数据库中创建实体间的节点关系。遍历实体关系集合后,整个存储流程结束,完成知识图谱模型到neo4j图数据库的存储。
4 案例分析
本文案例分为两部分,以本文所提知识图谱的构建方法和框架为基础,第1部分验证知识图谱构建方法的可实现性,第2部分以第1部分的方法和工具为基础,展示基于该方法研发的服务价值链多链知识图谱和应用案例,以验证该构建方法的有效性和实用性。
4.1 服务价值链知识图谱的构建方法
基于服务价值链多链知识图谱的知识组织体系,以及知识图谱的构建框架和相关步骤,以服务价值链中索赔业务活动所涉及的概念和知识为主题构建多链知识图谱,验证构建方法的可行性。
4.1.1 服务业务实体数据集成
以第三方云平台[1]累积的服务价值链多链数据为数据源构建知识图谱模型实例层,通过数据集成工具Kettle对多链实体数据进行集成,形成数据源。
如图8所示为实体数据集成框架,包括数据源、数据集成和目标数据3部分。图8中以A和B两条服务价值链的故障维修数据为数据源,其中服务价值链A的数据来自多个excel文件的维修档案,服务价值链B的数据来自数据库中的故障码表、索赔单表和索赔旧件表,以目标数据中的旧件和维修档案实体数据模式为全局视图进行数据集成。在数据集成形成实体数据的过程中,利用多步Cut和Join基本操作形成各数据源的局部视图,通过构建全局与局部视图的映射实现A,B两条服务价值链中旧件和维修档案实体数据的集成。
4.1.2 一阶段——初始模型求解
(1) 模式层建模
基于对面向索赔业务的服务价值链多链知识图谱模型框架的分析,结合对多链知识组织体系,本文利用protégé工具构建知识图谱模型的模式层,知识图谱模式层中的部分概念及其关系的定义如图9所示。图10中“A实体类概念”部分为模式层中的概念类,其基于6个顶层概念进行扩展,对索赔业务的相关概念,包括索赔业务相关的业务资源、产品、客户和地点概念进行定义;“B实体关系”部分指实体概念间的关系,概念关系的定义主要涉及定义域和值域,图10所示为索赔业务多链知识图谱模式层概念间的关系;“C实体值关系”部分定义实体概念的值属性。
(2)实例层建模
基于全局统一的多链实体数据库抽取实体及其关系,本案例采用D2R[19-20]平台从实体数据库抽取知识。首先,生成实体数据与实例层映射关系,包括构造实体概念、确定实体数据库中实体数据的概念,例如利用d2rq:class vocab:RepairArchive设置实体概念为RepairArchive;其次,构造实体数值属性,确定实体数据的值属性信息,例如利用d2rq:property vocab:repairArchiveCode构造属性repairArchiveCode,其类型为xsd:string;最后,构造实体关系属性,例如利用d2rq:join “dbo.Component.SystemCode =>dbo.System.SystemCode”设置实体概念Component与实体概念System之间存在的关联关系。
基于实体数据与实例层的映射关系,从实体数据库中抽取实体知识形成实例层知识模型,实例层的数据模型为一个三元组,表1所示为实体及数值属性构成的三元组模型。
表1 实体及数值属性三元组模型
模型中的实体关系分为两种类型(如表2),这两种类型均采用〈S,P,O〉三元组数据模型存储实体关系信息,其中S表示定义域,P表示存在的映射关系,O表示值域。两种类型的具体内容如下:
(1)用于建立实体与模式层中概念的关系,如表2中的类型1,为维修档案实体S与模式层维修档案概念O建立类型映射关系P。
(2)用于建立实例层中各个实体间的关系,如表2中的类型2,为旧件实体S与维修档案实体O建立实例间映射关系P。
表2 实例层关系类型
4.1.3 二阶段——精确模型求解
通过融合实例层与模式层构建初始知识模型。在二阶段中利用推理机检测模型中知识内容的一致性,形成正确性较高的领域知识模型,同时对概念间的包含关系和实例类型进行推理,完善模型中的知识。
图11所示为ClaimBusinessDocument,ClaimBusinessProcess,ServiceStation实例的所属概念及概念间包含关系的推理结果。对关系间的包含关系进行推理,如图11中的isLocation与cityLocation和areaLocation关系的推理,基于ServiceStation实例与City/5001实例在初始模型中存在的cityLocation关系,推理出ServiceStation实例与City/5001实例存在isLocation关系;在对逆关系的推理中,初始模型中的ClaimBusinessDocument实例和ClaimBusinessProcess实例存在isGeneratedBy关系,由于isGeneratedBy和generate互为逆关系,推断ClaimBusinessProcess实例与ClaimBusinessDocument实例存在generate关系。
通过对知识图谱模型中的知识进行上述推理,可以完成对初始模型的一致性检测,并将推理发现的新知识融合到知识图谱模型中,形成序列化的精确知识图谱模型,从而实现对精确模型的求解。采用基于两级Map结构的知识图谱转存方法可以将索赔知识模型存储到neo4j中,图12所示为索赔知识图谱中的部分实体节点及其关系,包括服务站、索赔单等实体及其关系。
4.2 服务价值链知识图谱应用示例
以索赔业务中的整车故障维修环节为基础,基于服务价值链多链知识图谱的构建方法、过程和相关工具研发服务价值链多链知识图谱的构建与应用系统,下面两个应用示例分别为基于服务价值链多链维修知识图谱的故障诊断和基于服务价值链知识图谱的维修服务搜索,总计约24.5万个节点。
4.2.1 服务价值链多链维修知识图谱
本节通过两个有关故障维修的示例更加详细地对服务价值链多链知识图谱进行说明,包括具体示例的查询和推理过程、相关界面的操作步骤,以展示知识图谱在多链知识查询和推理过程中发挥的作用。
(1)建立实体数据库与知识图谱的映射关系
以Kettle引擎为数据集成工具,形成构建知识图谱所需的实体数据源,即维修档案实体数据库。在本案例中,通过抽取索赔业务中的多链维修知识获取多价值链的故障知识,通过组织整车故障诊断知识,在知识图谱中形成统一的“系统←部件←配件←故障件←故障档案”知识体系。基于4.1.1节的实例层数据生成方法,在构建系统中进行映射配置并生成映射文件。图13所示为服务价值链知识图谱构建系统的配置页面,该页面实现了各实体数据表与知识图谱实体的映射、数据表字段和知识图谱中实体属性的映射,以及各个数据表之间关系与知识图谱中各个实体间关系的映射,通过勾选表名筛选确定需要抽取的表数据。在图13中,通过配置映射类名实现实体数据表与知识图谱的实体映射,通过添加过滤器可以删选实体数据,例如在图13的系统映射配置界面中,将数据表OldPart配置中过滤器过滤条件VCName的属性设置为vc_a,然后系统仅抽取价值链vc_a的数据。
(2)基于服务价值链多链知识图谱的故障诊断
按照统一标准对多链中同语义概念进行集成,构建统一的服务价值链多链概念体系,融合多链知识。融合过程如图14所示,图中以统一配件概念体系为全局的集成标准,对vc_a和vc_b两条价值链中的故障知识进行集成和融合,该配件概念体系属于概念InputMaterialResource,包括系统、部件和配件3层结构,其中系统层、部件层均对应具体的标准概念,例如图14的统一配件概念标准中的离合器概念位于系统层,离合器操纵机构概念位于部件层,各价值链中具体的故障配件和相关故障知识实例则与该配件体系互联,基于统一概念消除语义障碍,使多链间的知识查询和共享成为可能。
基于知识图谱中统一的“系统←部件←配件←故障件←故障档案”知识组织体系,逐一融合各个层次的知识,形成多链知识,将知识共享范围从单链扩展到多链,为故障诊断提供查询和推理功能,针对该知识图谱的查询和推理过程具体如下:
1)获取查询内容,如自然语言描述的故障现象“离合踏板不回位”。
2)通过语义分析模型对该输入进行预处理,利用文本分类模型识别出文本中的部件/配件实体,规范实体名称,确定搜索范围,利用文本匹配模型在已确定的部件范围内对相关联的故障档案知识进行更精确的语义匹配.
3)对“系统←部件←配件←故障件←故障档案”关联节点进行查询和推理操作。
4)返回关联节点,包括哪些部件出现了问题,通过故障档案节点了解相关解决方法,实现对故障问题的诊断和维修。
故障查询系统界面如图15所示,具体操作过程如下:
1) 输入用自然语言描述的故障现象。
2) 选择“所属价值链”,以确定查询的知识范围。
3)系统对输入请求进行查询(内部的运行过程如图16),然后返回查询结果。
查询结果如图15所示,图中a和b分别展示了在单链和多链范围内对故障现象“离合踏板不回位”查询的返回值,可见相比图15a,图15b的多链知识查询返回的知识更加丰富。针对“离合踏板不回位”的故障现象,在vc_a链内捕获了“离合器”和“车前、后钣金”两类故障案例知识,在多链范围内捕获了更多“离合器”故障案例知识,通过点击故障档案节点可以浏览相关解决方法,对故障问题进行诊断,并提供相应的维修方法。
4.2.2 服务价值链维修服务商搜索
当服务人员应用多链知识图谱进行故障诊断后仍不能独立解决维修问题时,可以通过多链知识图谱搜索故障维修服务以寻求外援,查询和推理过程如图17所示。具体为,对输入的故障现象进行查询预处理后,展开对多链知识图谱的搜索和推理,筛选出合适的服务商,然后基于知识图谱中“省←市←区/县←服务站←故障档案”关联节点关系搜索多条价值链的服务商,返回更多可选的近距离维修服务商。
该搜索的具体操作界面如图18所示,搜索系统内部按照图17所示的查询和推理过程向用户返回搜索结果。通过输入故障现象搜索维修服务商,利用多链知识图谱返回具有维修该故障经历的服务站的地理信息,根据服务距离筛选出合适的服务站,用户则通过与知识图谱交互确定维修服务搜索结果,为链内/跨链的服务站间派员维修服务提供决策支持,具体操作如下:①用户输入故障现象,知识图谱返回相似维修案例在全国的分布图,颜色越深的案例数量越多;②点击不同的省份,展示该省各城市的维修案例分布图;③选择点击不同城市,进一步查询各区/县有过相似维修经验的服务商信息,从而确定服务协同对象。
5 结束语
本文通过详细分析基于第三方云平台的多服务价值链系统,针对存在的问题及需求提出服务价值链多链知识图谱构建的框架和方法,统一了多条服务价值链的相关业务类概念及其关系的语义描述和定义,同时融合多链知识实现了对多链知识的组织,为支持业务决策提供了更丰富的知识。在服务价值链多链知识图谱构建过程中集成多链数据,经过两个阶段求解精确的知识图谱模型,并将知识图谱模型存储到图数据库,完成了服务价值链多链知识图谱的构建,同时对相关案例进行展示。
本文研究主要侧重于构建服务价值链多链知识图谱,未来的研究重点将以服务价值链多链知识图谱为基础,对语义搜索和推理等服务进行深入研究。