铁路运输设备故障知识图谱构建与应用研究
2023-02-18李新琴刘承亮代明睿李国华史维峰
李新琴,刘承亮,代明睿,李国华,史维峰
(中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081)
铁路运输设备状态是铁路安全运输的根本,良好的设备状态既是运输生产的物质基础,又是运输安全的重要保证[1]。随着铁路运营里程的积累和铁路设备的更新迭代,积累了大量的铁路运输设备故障数据。这些故障数据记录了故障发生的详细信息,包括故障的基础信息和对故障的人工分析数据,蕴含了铁路运输设备的重要价值信息。科学分析设备故障数据是将故障从消极转变为积极的有效途径,但由于这些故障数据存在存储分散、数据格式不同、存储形式各异的情况,给数据分析带来了困难[2]。知识图谱能够有效地将多源异构数据转化为基于深层语义的知识服务,基于知识图谱技术实现设备故障的深度挖掘和智能应用,是分析铁路运输设备故障数据的有效途径[3-6]。
知识图谱技术在各行业事故故障智能化服务中已得到了广泛的研究和应用。在电力行业,李新鹏等人[7]通过构建调度自动化系统的知识图谱,实现系统故障的智能诊断和分析;郭榕等人[8]针对电网故障处置预案数据,构建电网故障处置知识图谱,提升了电网故障处置能力和智能化水平;在中石油领域,陈传刚等人[9]构建基于知识图谱的站场故障预警模型,实现现场事故预警;在铁路领域,杨连报等人[10]通过构建铁路设备事故故障部位知识图谱,实现了设备故障关联分析和原因推荐。基于各行业对知识图谱构建方法及应用模式的研究,本文在研究铁路运输设备安全保障体系的基础上,提出了铁路运输设备故障知识图谱构建与应用架构,以及设备故障知识图谱应用场景。
1 铁路运输设备安全保障体系
为保障铁路运输安全,面向铁路运输系统构建了健全的铁路运输设备安全保障体系。在该体系下,可对运输设备的基础信息、运行维护(简称:运维)信息及故障数据进行有效管理。铁路运输设备安全保障体系包含针对铁路基础设施设备构建的铁路运输设备监测检测系统、铁路运输设备信息管理系统及铁路运营集成化平台,可实现铁路运输设备的全生命周期管理、设备故障信息管理,以及设备故障数据一体化分析。铁路运输安全保障体系架构如图1 所示。
图1 铁路运输设备安全保障体系
1.1 基础设备设施
铁路运输基础设备设施主要指铁路桥梁、道岔、信号机、接触网、动车组等固定设备和移动设备。铁路运输设备故障数据管理和设备全生命周期管理主要是围绕铁路运输基础设备设施开展安全监控和信息化建设。
1.2 设备故障数据管理
铁路运输设备故障数据管理可实现设备基础信息、维修维护、故障信息的全面管理。铁路运输设备信息管理系统中存储了大量的设备故障数据,这些数据记载了设备故障发生的详细情况,包括故障发生的时间、线别、铁路局集团公司、车间、故障部位、原因分析等数据。根据数据来源和价值,可将其分为客观记实、主观选项及主观描述等数据。
(1)客观记实数据
客观记实数据主要包括故障发生的时间、线别、铁路局集团公司、车间等数据,这些数据可根据故障的具体情况直接通过铁路运输设备信息管理系统的选项进行选择。客观记实数据是不可更改的事实,具有真实性,通常以结构化形式存储。
(2)主观选项数据
主观选项数据主要包括故障发生的部位、故障原因分类等数据。这些数据是相关人员通过对故障的分析,根据信息系统的选项进行选择,通常以结构化形式存储。由于人员对故障数据认知经验不同,通常,故障原因分类数据存在随意性。
(3)主观描述数据
主观描述数据主要是指故障原因分析数据。此类数据以大段的文本形式记录了故障发生的现象、原因分析、处理结果、原因定性等内容,是人员根据自身经验对故障的详细分析描述,蕴含重要价值。主观描述数据以非结构化文本的形式进行存储。
1.3 设备的全生命周期管理
铁路运输设备的全生命周期管理包括对设备的状态巡检、维护维修、计划保养、档案管理和决策分析。通过构建工务、电务、供电等专业的检测监测系统,实现设备状态的实时采集和监控,有效辅助设备信息管理,进行设备故障检测、故障数据管理和故障数据分析。
1.4 设备故障一体化分析
设备故障一体化分析主要基于铁路运营集成化平台实现铁路各专业的设备信息汇集,打破设备信息传递阻隔,实现设备的跨专业分析。通过对铁路运输设备故障数据的类别分析可知,设备故障数据包括结构化数据和非结构化数据,且蕴含价值丰富,知识图谱能够有效的组织和表达结构化和非结构化数据,并将其进行充分的关联,实现数据的分析与挖掘。因此,基于知识图谱技术实现故障知识的构建和故障数据的科学分析,是分析铁路设备故障数据的有效方法。
2 铁路运输设备故障知识图谱构建过程
铁路运输设备故障知识图谱的构建过程主要包括设备故障本体结构定义、知识抽取及知识对齐。
2.1 设备故障本体结构定义
本体结构定义是构建铁路运输设备故障知识图谱的首要环节,通过对铁路运输设备故障结构化与非结构化数据的全面分析,定义设备故障的知识单元、知识单元关系和知识层次结构,将设备故障数据有序地组织为知识图谱结构,如图2 所示。
图2 铁路运输设备故障本体结构
2.2 设备故障知识抽取
针对存储于设备故障主观描述数据中的设备故障非结构化文本数据,定义设备现象、设备现象采取的措施、设备故障的处理结果等为命名实体,将实体之间的引起、发生、结果等关系作为实体关系,采用命名实体识别和实体关系抽取的方法获取文本中的知识。
2.3 设备故障知识对齐
由于设备故障主观描述数据的随意性,对同一设备、故障现象、处理措施等内容的描述不同,可导致抽取的知识存在大量知识重复现象,例如“道岔失去表示”和“道岔无表示”实际为同一设备故障现象,采用知识对齐技术解决设备故障知识冗余问题,知识对齐过程能够有效地将设备故障知识图谱精细化。
3 知识图谱构建与应用架构
铁路运输设备故障知识图谱构建与应用涉及的技术众多,需要设计完整的架构支持。铁路运输设备故障知识图谱构建与应用架构如图3 所示。
图3 铁路运输设备故障知识图谱构建与应用架构
3.1 知识图谱构建
通过对铁路运输设备故障的本体结构构建,汇集铁路各专业设备故障数据,包括设备故障的结构化和非结构化数据。在进行数据分析前需要对数据进行预处理,包括非结构化数据的正文抽取和结构化数据的ETL(Extract、Transform、Load)处理。
知识图谱构建技术主要包括知识获取、知识对齐及知识存储。知识获取技术包括命名实体识别、关系抽取、文本分类等,通过对设备故障主观描述文本数据的上下文语义学习,有效地从非结构化文本数据中抽取出与故障密切的关键数据;知识对齐技术是整合故障结构化数据的有效方法,通过实体对齐、实体去重、实体链接计算等技术将相同的、有关联关系的、有歧义的知识单元进行整合;知识存储是将设备故障知识以“图”的形式存储在数据库中,通常存储在Neo4j、OrientDB 等图数据库中。
3.2 知识图谱应用
知识图谱应用基于铁路运输设备故障知识图谱,通过对知识单元的计算和推理,实现设备故障知识的智能应用。通过路径计算、规则推理等方法实现设备故障的知识搜索,采用本体推理、相似图计算等方法实现设备故障单元间的关联关系推理,并将这种关联关系连接,对设备故障知识图谱进行扩展和丰富,实现设备故障知识补全。同时,通过知识图谱不一致检测技术发现设备故障知识图谱中错误或冗余的数据,实现设备故障准确的知识体系和推理。知识图谱应用可支持铁路运输设备故障应用场景的构建。
3.3 大数据分布式计算
铁路运输设备故障知识图谱具有海量的知识单元,在模型训练过程中,需采用分布式计算实现模型的高效训练。在知识图谱应用过程中,为保障知识图谱的快速检索与较高的推理性能,需要借助Spark、Hadoop 等大数据技术支持知识快速的运算与推理,所以在整个设备故障知识图谱的构建与应用过程中,都需要大数据技术的支撑。
4 铁路运输设备故障知识图谱应用场景
基于铁路运输设备故障知识图谱,推理实现设备故障的智能诊断与处理、智能问答、风险管理等应用场景,高效利用设备故障相关知识,帮助铁路运输设备运维人员快速查找故障致因链、定位故障原因、确定故障维修措施,达到减少故障处理时间、提高故障处理效率的目的。
4.1 设备故障智能诊断与处理
铁路运输设备故障知识图谱蕴含了设备、故障部位、故障现象、故障原因、维修措施等本体间的隐含关系,通过对关系的多级匹配和知识推理技术,可使铁路运维人员了解故障背后的隐含知识,实现故障原因推理、故障链条分析、故障结果推理和故障处理建议等功能,可应用于铁路各专业智能运维系统中,有效提升运维系统智能化程度。
4.2 设备故障风险管理
铁路运输设备故障知识图谱通过对设备故障数据的知识化,可从复杂的设备故障中分析出每个设备发生故障的数量、原因,以及与之关联的设备状况,通过知识图谱对设备故障的分析,可有效辅助人员对相关设备进行重点关注,协助铁路日常设备风险管理工作,可应用于铁路安全大数据系统,实现设备的风险研判和风险管理。
4.3 设备故障智能问答
铁路运输设备故障种类复杂,查询设备故障数据往往需要多次查询或展开多级查询目录。设备故障智能问答通过语音或手动输入对故障的简单描述,即可得到多级、深层次的关系,快速准确地找到所需要的设备故障知识,提高工作效率和知识共享能力,辅助铁路工作人员对设备知识进行快速学习和实时查询。设备故障智能问答可应用于铁路各专业智能运维系统中,实现设备故障知识的有效应用。
5 结束语
本文针对铁路运输设备安全保障体系内产生的设备故障数据,阐述针对铁路运输设备故障数据的知识图谱构建过程,提出设备故障知识图谱构建和应用架构及设备故障知识图谱的应用场景,为铁路领域学者基于知识图谱技术进行设备故障数据分析提供参考。铁路运输安全问题风险库、隐患库等也存储了非结构化文本形式的蕴含重要价值的数据,本文的研究方法也可为该类数据的分析提供参考。