铁路调度应急预案知识图谱构建
2021-07-06冯小芳金福才
李 欣,冯小芳,金福才
(1.北京经纬信息技术有限公司,北京 100081;2.中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081)
铁路调度应急预案是铁路调度应急指挥的指导性方案,是铁路调度人员应对突发事件的行动指南。铁路调度应急预案管理水平关系调度应急指挥的效率及应急处置的成效。铁路应急处置大多是由多工种业务人员共同参与、配合完成,但全面掌握相关业务知识的专业人员极少,导致应急预案编制缺乏系统性;另一方面,现有的铁路调度应急预案对多源应急信息资源缺乏系统梳理和有效组织,造成相关信息资源整合困难,制约了铁路调度应急预案管理能力。
目前,国内针对铁路应急预案数字化方案已开展了一些研究。文献[1]提出融合本体与深度学习的应急预案数字化方法,运用深度学习算法,从应急事件消息文本中提取关键信息,并用本体方法对事件处理流程进行分析和梳理,自动生成数字化铁路应急预案;文献[2] 研究提取应急预案指定要素核心内容的数字化预案转化方法,利用工作流引擎实现应急预案编写、评审、发布、使用、修订、废止的全生命周期管理,提高应急预案的适用性与可操作性。
知识图谱(Knowledge Graph)本质上是一种揭示实体之间关系的语义网络,为海量、异构、动态数据的表达、组织、管理及利用提供一种非常有效方式,可快速、准确地实现信息关联搜索。目前,知识图谱广泛地应用于医疗、政务、电商、金融等领域,为智能问答、商品推荐、金融风险识别等提供实用工具。文献[3]通过语义匹配、图神经网络、路径多跳、逻辑多跳等知识图谱多跳问答推理方法,研究智能问答的解决方式;文献[4]提出“预训练+知识向量服务”模式,设计知识图谱预训练模型,极大地提高了商品分类、同类商品挖掘、商品推荐等应用的性能;文献[5]通过图分析、图挖掘等技术,发现深层风险关联,增强风险账户识别能力。
本文研究运用知识图谱概念和方法,结合铁路应急救援场景,对铁路调度应急预案所涉及的多源信息资源进行分析和整合,实现相关信息的关联存储与有序组织,为铁路调度应急预案的综合展示与规范化管理提供有利条件。
1 知识图谱概念及构建方法
1.1 知识图谱概念简介
知识图谱采用可视化方式,系统、形象地展示领域知识的整体框架、核心概念实体及其关联关系,是一种综合应用数学、图形学、信息可视化技术、信息学等学科的理论方法。
知识图谱是由节点和边组成的图,节点表示各个知识点,边是知识点之间的关联关系,形成网状知识结构,能够显式、直观地表达知识的关联关系,可有效避免信息遗漏,也便于快速检索相关知识。
通常,知识图谱采用图数据库实现领域知识的关联存储,相较于关系型数据库,图数据库更适于构建复杂关系网络,使机器具备认知、理解领域知识的能力,实现智能解决业务问题的目的。
1.2 知识图谱的一般构建方法
知识图谱的构建过程主要包括知识抽取、知识融合、知识存储3 个步骤,从多源信息中抽取概念、属性、关系,并封装成知识单元,融合语义表达不同但表示同一对象的概念、属性,将整理的知识及其关联存储为图。一般将知识图谱划分为实体层和数据层2 个层面,采用自顶向下和自底向上相结合的方法进行构建,基本流程如图1 所示。
图1 知识图谱构建流程
2 铁路调度应急预案知识图谱构建过程
依照知识图谱的一般构建方法,铁路调度应急预案知识图谱构建过程为:先识别出铁路调度应急预案涉及的相关实体概念,定义其属性及其关系,然后完成铁路调度应急预案数据的抽取、融合与存储。
2.1 铁路调度应急预案知识图谱实体层的构建
实体指的是事物基础、本源的规范化概念,是实际存在的起作用的组织或机构、行为的发起者或执行者。实体是概念、属性、关系的集合,根据经验知识进行概念层次划分、要素属性识别、关联关系定义,完成实体层的构建。
2.1.1 主要实体概念
在铁路调度应急预案中,实体概念主要为应急处置任务的4 个核心要素,包括应急事件、与应急处置相关的机构岗位职责、应急处置流程、应急处置评价。
(1)应急事件是因自然灾害、设备故障等因素对列车运行造成影响,需要调度人员采取故障处置、现场救援等措施实施干预的事件。
(2)机构岗位职责主要以调度所和应急指挥中心为核心,以二者的管辖机构、平行单位为辐射半径,会合与铁路应急处置相关的路外其他行业机构,机构内设置有应急处置的岗位职责。
(3)应急处置流程是指对于发生的应急事件,有关部门按其岗位职责需完成的指定任务。按照应急处置流程的不同阶段,将应急处置任务划分为事前、事发、事中、事后4 个层次,可为每个阶段设定不同的目标和任务[6],如表1 所示。
表1 应急处置流程概念实体的层次划分
(4)应急处置评价是对应急事件综合处理情况的各项评定,包括应急处置流程核心阶段的完成情况评价、相关部门履职情况评价等。
2.1.2 实体属性定义
每个实体具有多个基本属性,其每个基本属性可设置一到多个属性值。
(1)应急事件实体的属性包括事件类型、等级、发生时间、线路地点、发生原因、影响情况、应急措施等。
(2)机构岗位职责实体的属性包括部门名称、部门职责、岗位名称、岗位职责、人员信息等。
(3)应急处置流程实体的属性包括流程名称、流程内容、流程进度等。
(4)应急处置评价实体的属性包括评价项目、评价标准、评价结果、评价分析等。
2.1.3 实体关系定义
铁路调度应急预案中,除因果、跟随、并发、互斥、顺序等一般实体关系外,还包括表达隶属、协同、信息指令传达等领域业务逻辑的实体关系[7],各类关系的含义,如表2 所示。按照上述实体关系的定义,梳理出如图2 所示的铁路调度应急预案知识图谱实体层结构。
表2 铁路调度应急预案实体关系含义说明
图2 铁路调度应急预案知识图谱实体层结构
2.2 铁路调度应急预案知识图谱数据层的构建
按照不同知识来源,将铁路调度应急预案涉及的多源异构信息资源进行数据抽取、数据融合与知识存储,构建铁路调度应急预案知识图谱数据层。
2.2.1 数据抽取
铁路调度应急预案涉及的数据来源较多,数据类型多样。除信息系统的结构化数据外,还有诸如从气象局网站获取的天气信息这类半结构化数据,以及处置现场图像、视频、事后总结分析等的非结构化数据。
(1)结构化数据一般存储于关系型数据库,因字段定义明确,一般通过设置字段映射规则,实现从数据库中自动抽取实体、属性及关系。
(2)半结构化数据本身存在一定结构但需要进一步提取整理,可利用包装器(Wrapper)进行抽取,由包装器从HTML 网页中爬取数据,并重新组装为结构化数据。
(3)非结构化数据一般通过已知实体对非结构化内容进行标注,转化为有监督学习的问题[8-9]。图像、视频类非结构型数据可通过实体标注后进行分类抽取;文本型非结构化数据的抽取较为困难,以最小粒度的实体概念属性进行语义相似度校验,将关键信息抽取出来,例如应急规章制度文件中抽取具体场景的规章制度条款。
2.2.2 数据融合
对于非结构化文本数据,因中文描述的多样性,相同的内容可能存在多种表述,导致抽取的数据存在冗余。可通过计算语义相似度,对孤立的实体概念、属性和关系进行数据融合处理[10]。以地点和天气为例,非结构化文本数据融合结果前后对比,如表3所示。
表3 非结构化文本数据融合示例
2.2.3 知识存储
将结构各异的多源数据转化为由开始节点、关系、结束节点3 个元素组成的结构化数据,建立关系三元组<实体1,实体关系,实体2>。以跟随关系为例,应急处置流程总是跟随应急事件发生,对应的三元组关系可表示为<应急处置流程,跟随,应急事件>,以此建立实体关系集合。
对于属性和关系较为丰富的结构化数据,采用图数据库方式存储更有优势[11]。将关系三元组<实体1,实体关系,实体2>中的实体1 和实体2 存储为节点,属性关系、语义关系存储为边,将结构化知识三元组映射为图中的节点和边,以便于使用图查询语言和图挖掘算法实现基于知识图谱的具体应用[12-13]。
3 应用实例
以自然灾害启动应急预案为例,采用上述方法完成应急事件、机构岗位职责、处置流程、应急评价等应急预案核心实体概念及关联关系的形式化表达,将相对孤立、零散的多源数据转化为相互关联的知识结构体,构建铁路调度应急预案的知识图谱。
3.1 面向具体场景的应急预案实体结构图
鉴于铁路调度应急预案的核心要素与环节较多,内部关系复杂,采用实体结构图对铁路调度应急预案知识体系进行梳理。以自然灾害雾天行车场景为例,对处置过程中各部门岗位职责、关联信息以及外部资源等进行剖析,形成应急预案知识体系,如图3 所示。
图3 雾天行车场景的应急预案相关实体结构图
3.2 面向具体场景的铁路调度应急预案知识图谱
根据应急预案的相关概念实体结构图,对应急预案场景涉及的多源异构数据进行抽取、融合及存储,形成铁路调度应急预案知识图谱。以雾天行车场景为例,铁路调度应急预案知识图谱如图4 所示。
图4 雾天行车场景的应急预案知识图谱
3.3 应急预案知识图谱的应用场景模拟
针对雾天行车场景的应急预案知识图谱构建好之后,可以便利地综合展示预案相关信息,减少人工查找和汇集信息的工作量,应用如图5 所示。
图5 雾天行车场景的应急预案展示
在大雾天气启动应急预案的应用场景中,通过将应急事件与对应场景处置的应急专家、相应故障的应急规章、历史案例及处置流程等多项信息建立起关联,实现了特定类型的应急预案的综合管理。在启动应急响应后,可以迅速参照响应规章制度进行工作部署,按照处置流程的提示逐步执行;处置过程中遇到难题时,能马上联系到具有相应应急救援场景处置经验的专家,召开分析会诊,快速查阅到可供参考历史案例等。
总之,知识图谱可以根据信息的内在关联性实现应急预案相关信息资源的整合和结构化展示,实现铁路调度应急预案的综合管理,使应急预案相关信息资源的使用更加便利化,更好地支持应急指挥快速决策,支持应急处置工作从容有序开展。
4 结束语
知识图谱概念和方法为领域知识的提取、融合和组织管理提供了有效的方法。依照知识图谱的构建方法,本文研究提出铁路调度应急预案的概念层次划分、要素属性识别、关联关系定义,将铁路调度应急预案相关信息资源组织成概念明确、结构清晰、联系紧密的知识体系;在此基础上,研究铁路调度应急预案的数据抽取、数据融合与知识存储方法,实现异构多源数据的规范、有序组织与存储,为应急预案相关信息资源的有效利用与综合展示提供良好条件。
铁路调度应急预案涉及的信息多种多样,目前还没有度量各类信息与应急预案关联的紧密程度,由此造成信息大量存储,不利于数据的高效利用。因此,今后需要对如何量化应急预案数据关联性开展深入研究,以提高铁路调度应急预案的综合管理、自主学习、关联性分析水平,为铁路应急调度指挥提供更加完备、有效的决策参考。