APP下载

高速铁路信号系统异构数据融合和智能维护决策

2015-12-26徐田华杨连报胡红利王小鑫

西安交通大学学报 2015年1期
关键词:信号系统异构本体

徐田华,杨连报,胡红利,王小鑫

(1.北京交通大学轨道交通控制与安全国家重点实验室,100044,北京;2.西安交通大学电力设备电气绝缘国家重点实验室,710049,西安)



高速铁路信号系统异构数据融合和智能维护决策

徐田华1,杨连报1,胡红利2,王小鑫2

(1.北京交通大学轨道交通控制与安全国家重点实验室,100044,北京;2.西安交通大学电力设备电气绝缘国家重点实验室,710049,西安)

针对高速铁路智能维护决策中的信息多源异构问题,提出了高铁信号系统异构数据融合和智能维护决策架构。通过本地数据库资源描述框架(resource description framework (schema),RDF(S))到全局RDF(S)的转换和基于RDF(S)图的本体合并,实现了多源异构信息的融合。利用适合缺失数据的结构期望最大化(SEM)算法,结合专家知识,构建了高铁信号系统的智能维护贝叶斯网络(BN)决策模型。最后,利用高铁武广线2011~2012年的监控数据,分别对基于RDF(S)图的全局RDF(S)合并算法性能和故障诊断结果的准确性进行了分析对比,实验结果表明所提出的本体融合算法具有多项式级的计算复杂度,同时融合专家知识和SEM算法的智能维护BN决策模型的一级故障诊断准确率为92.4%。因此,所提出的异构数据融合和智能维护架构可以有效提高高铁信号系统维护决策的准确性和有效性。

高速铁路;信号系统;异构数据;本体融合

近年来,我国高速铁路正处于快速发展时期,逐步进入网络化运营阶段,在社会经济发展中起到了重要作用。高铁信号系统是高速铁路的大脑和神经中枢,对保障高速铁路安全、高效的运营起关键作用。

与传统的信号系统相比,高速铁路信号系统不断采用新技术和新设备。设备的先进性一方面保证了系统运行的高效性,同时也增加了故障的隐蔽性和突发性,为设备的故障定位和智能维护设置了障碍。另一方面,支撑高铁信号系统可靠、高效运营的运营维护记录和监控数据仍然存在多源异构和信息非完整性等突出问题。造成这些问题的主要原因是维护记录信息来源复杂,从司机、调度员、铁路专家和维护人员的记录日志到微机监测系统、司法记录仪(JRU)和列车动态监控系统(DMS)的设备记录信息等组成了多源的维护记录信息。更为重要的是,多源的维修记录信息存在概念术语不统一、缺乏统一的格式和标准、维护数据语义不一致甚至冲突、维护记录信息不完整等问题,因而无法形成一种有效的信息共享机制,最终形成了大量的信息孤岛,不能有效地实现知识的共享和互操作,这将影响高铁的智能运营维护决策和行车效率。

因此,如何构建高铁信号系统规范统一的知识体系,在多源异构数据融合的基础上实现高铁信号系统的智能维护决策,以适应高铁信号设备技术现代化发展需要,成为亟待解决的问题。

目前,国内外学者在异构信息的融合和智能维护决策等领域开展了卓有成效的探索。文献[1-3]应用本体论解决了欧洲铁路领域内由于运营商和开发商不同而造成维护信息不统一的问题,实现了不同国家、不同格式铁路基础设施、旅客信息和设备管理信息的互操作和共享;文献[4]主要应用本体论对我国高铁领域中各专业领域本体的融合方法进行了研究;文献[5-6]应用本体论解决了铁路选线时数据不统一、共享率低的问题;欧洲EuRoMain FP5-IST Project提出了通过建立维护数据的标准化文档,实现不同来源的维护数据的共享,进而搭建支持欧洲铁路维护系统的解决方案[7]。但是,该项目还是建立在XML、XSLT等数据格式的基础上。由于XML缺乏语义描述,因此很难实现在语义层次上的机器理解和处理。欧洲的InterGRail项目提出铁路领域的信息共享,使得维护决策优化得以实现[8]。在该项目参与者中,英国伯明翰大学的Cliver提出了使用本体论解决大规模轨道交通维护数据融合方法。在故障诊断和决策支持方面,Ferreiro和Vong等分别给出了基于案例的推理和基于贝叶斯网络(BN)的运输系统故障诊断和决策维护[9-10],但其研究并未涉及异构数据的融合和语义冲突的消除。

上述研究对推动轨道交通领域的异构数据融合和智能决策支持的发展起着重要作用,但针对高速铁路信号数据记录存在的多源异构、非确定和不完整数据等突出问题,没有提出统一的异构数据融合和智能维护决策架构。同时,对于异构数据的属性抽取、转换和融合缺乏严格的形式化定义,这将对后续的严格规范推理和智能维护决策造成不利影响。

针对上述问题,本文提出了高铁信号系统异构数据融合和智能维护决策的统一架构,给出了局部关系数据库到局部本体数据库资源描述框架(resource description framework (schema),RDF(S))转换的形式化定义,提出了匹配数据记录时间和地点模式的本体合并方法,并给出了适合非确定和不完整数据的BN维护决策方法,最后利用武广高铁维护记录数据验证了所提架构和算法的可行性和正确性。

1 高铁信号系统异构数据融合和智能维护架构

高铁信号系统异构数据融合和智能维护架构参见图1,整个架构分为3个层次。

最底层是实际的物理数据库,分布在不同的电务段、车站、分局等数据库中,内容包括司机、调度员、铁路专家和维护人员的记录和信号监控设备的监控信息,如微机监测、JRU记录信息、AElog日志记录、Abis协议记录和DMS等。其突出的特点是:记录缺乏统一的概念、术语及关系的准确定义,存在概念歧义和语义冲突等问题,阻碍了高铁信号系统维护信息的逻辑关系的建立,如故障模式、故障原因、故障征兆、测试手段、维护手段等。同时,维护数据呈现明显的不完整性和非确定性。高铁信号系统维护数据来源多源化,分布在运营维护人员和不同的监控设备中,加之专家经验和历史数据,其完整性、一致性和确定性都难以得到保证。

中间层为本体合并层。首先构建对应分布式数据库的局部RDF(S)本体,抽取分布式数据库的概念、属性及其关联关系。接着借助于RDF(S)图的合成思路,定义关系数据库到RDF(S)的形式化转换方法,为下一步本体转化的完备性和覆盖性等性能验证提供依据。在模型转换的支持下,实现局部本体到全局本体的合成,同时建立全局本体到局部本体概念、属性的映射关系,为后续的分布式数据库数据检索和查询提供依据。

框架的最上层对应智能决策层。利用全局本体和局部本体的映射关系,实现故障原因、故障征兆、故障现象和故障类别、设备结构及其维护措施的数据训练样本的抽取,采用结构和参数学习,结合专家知识,形成信号系统维护决策BN模型,构造故障诊断和维护的智能维护支持系统。

图1 高铁信号系统异构数据融合和智能维护架构

2 高铁信号系统异构维护信息融合

通过异构信息的融合,实现高铁信号系统物理数据到全局本体的转换,并在全局本体的指导下,实现概念数据的统一、语义冲突的消除和多源信息的统一集成。其主要步骤包括本地关系数据库到局部RDF(S)的转换,通过基于图论的方法实现局部RDF(S)本体到全局本体RDF(S)的融合。

2.1 本地关系数据库到局部RDF(S)的转换

构建局部本体到全局本体的形式化定义是本体转换的严格推理和逻辑验证的保证,同时也是实现本体合并的语义一致性、完备性证明中的重要步骤。

下面首先给出关系数据库、本体图和关系数据库的形式化定义。

定义1 一个关系数据库模式DBS=(L,PKey,FKey,Attr)是一个四元组,其中:

(1)L=R∪D为名称集合,这里R=ET∪RT为表名集合,ET和RT分别为实体表和关系表,D为数据类型名称的集合,表示关系数据库中预定义的类型名称;

(2)Attr为属性集合,∀T∈R,T有一个非空的列集合Attr(T),且∀A∈Attr(T)有一个预先定义的数据类型Type(A)∈D;

(3)∀T∈R,T有且仅有一个主键PKey(T)(非空列集合),PKey(T)∈Attr(T)(单键,并且T∈ET),或者PKey(T)∈Attr(复合键,并且T∈RT);

(4)∀T∈R,T可能有一个或多个引用其他实体表G(G∈ET)主键的外键FKey(T,G)的列的集合FKey(T,G)∈Attr(T)。

2.2 局部RDF(S)本体到全局本体RDF(S)的融合

分布式数据库的数据字段由于在设计初期没有考虑数据融合问题,导致局部RDF(S)存在类名和属性命名冲突。例如,在信号系统车载维护数据记录中,频繁出现“ATP故障”、“ATP故障停车”、“ATPCU故障”、“ATPCU相关”等数据来刻画ATPCU这一概念。同时,不同的监控设备(如JRU、AElog和DMS等)记录ATPCU的数据字段存在不一致的现象,这直接导致RDF(S)中的术语不统一甚至冲突。

本文针对上述问题,借鉴文献[11-12]提出的RDF(S)合并思路,利用霍尔(Horn)逻辑来刻画概念和属性间的等价、包含或者冲突关系。例如,将表达同一概念的“ATP故障”、“ATP故障停车”、“ATPCU故障”之间的关系用下述Horn等价逻辑刻画:

ATP故障⟺ATP故障停车⟺ATPCU故障

同时考虑到高铁信号系统数据记录的时空特征,提出了改进的RDF(S)合成算法。算法中考虑了信号系统维护记录中的时间地点匹配原则,即RDF(S)图的合并三元组必须满足时空匹配,也就是在相同的时间、地点(如线路站点、电务段)的前提下进行融合。具体的算法如表1所示。

所提算法利用Horn逻辑刻画异构数据源的概念和属性的关系(参见算法第3行),其中的timeAddrMode表示时间地点匹配模式,保证所有融合的节点需要满足相同的时空约束。算法第10~13行根据Horn逻辑描述的不同本体中概念的等价关系,计算强连通图SCC,完成等价节点的合并,实现包括同物异名节点等语义冲突的消除,第14~15行消除RDF(S)合并过程中的冗余边。本体融合算法伪代码见表1。

表1 本体融合算法伪代码

3 基于全局RDF(S)检索数据的BN诊断模型

3.1 故障数据训练矢量的获取

根据生成的全局RDF(S)本体和局部RDF(S)本体的映射关系,构建包含故障现象和原因的矢量样本,其对应同一时刻、同一地点和设备故障的所有数据库的监控设备记录、人员记录以及维修日志。在信号系统的故障诊断中,矢量空间中的变量定义如下:DMIMasterFail表示DMI与主机通信中断;DMIEquipFail表示DMI报地面设备故障;StartRBC表示启动RBC;MT表示车载电台;SafeTrans表示安全传输模块;Stop表示停车。

需要注意的是:由于记录设备或人员的限制,导致数据库中的故障存在记录缺失的现状(见表2),这对后续的完全数据的结构和参数学习设置了极大的障碍。

表2 高铁信号设备故障记录表单

注:“缺失“表示没有对应的数据记录。

3.2 缺失数据的智能维护BN模型

鉴于故障数据记录缺失的现状和目前存在大量的高铁信号系统故障传播机理先验知识,本文中采用以专家经验BN模型为主,利用结构和参数学习挖掘隐含BN关系为辅的方式构建智能维护BN模型。下面给出适应缺失数据下的结构期望最大化(SEM)算法[13-14]的描述。

(1)

式中:Xi为网络中节点变量,∏Xi为其父变量,#(Xi,∏Xi)为贝叶斯网络所需要的参数个数。这里BN定义为B=〈G,Θ〉,G为网络结构,Θ为网络参数。其基本思想:从某一初始贝叶斯网络B0=〈G0,Θ0〉出发开始迭代,在进行了t次迭代得到当前最佳网络Bt=〈Gt,Θt〉后,第t+1次迭代由以下两步骤组成。

(1)基于当前最佳网络Bt=〈Gt,Θt〉对数据集D利用EM算法进行补全,使之完整并得到完整数据集Dt。

(2)基于数据集D对模型及参数进一步优化,得到Bt=〈Gt,Θt〉,其中初始网络的选择一般是:隐变量和所有的已观测变量都是相连的,并且是它们的父节点。如果一个网络结构中有很多隐变量,那么就从中随机地选择边,以确保不会超过父节点集的大小,然后按照上述思想进行迭代。

参照全局RDF(S)和局部RDF(S)的映射关系,提取武广高铁信号系统车载设备、地面监控设备、DMS设备等多源异构信息数据库中数据用于BN的结构和参数学习,由SEM算法得到的BN结果如图2所示。

图2 基于SEM算法的BN故障模型

由于数据结构量较小,所以结构学习的结果并不十分理想,但是在有限的学习过程中,我们也可以从中提取到有用的信息。例如:18、19、20三个节点的关联(参见图2中的粗箭头线)在基于专家知识的BN故障模型中是缺失的,但是在SEM结构学习中挖掘出了专家知识忽视的隐含关联关系。

图2中1~34节点的具体含义如表3所示。

按照故障传播机理,完整的故障因果关系包括故障现象、故障征兆、故障传播环节,这里可以根据高铁信号系统的子系统、设备和具体部件分为多级故障,即系统级故障、子系统级故障、器件级故障和最终的故障源。

表3 BN中各节点所代表的含义

大量的故障分析工具如故障树、FEMA等方法为建立信号系统的故障因果关系的BN提供了支持。鉴于篇幅的限制,本文不再赘述。

3.3 融合先验知识的故障诊断BN结构

在实际应用中,考虑到先验知识构建的BN的稳定性和可靠性,确定以其为主、结构学习为辅的策略。利用结构学习中发掘的隐含联系对先验知识构建的BN进行补充,当出现二者之间的冲突联系,应该以先验知识的BN为主。同时,充分考虑结构学习的“过拟合”问题,即结构过于复杂,对训练样本达到非常高的精度,但样本产生的噪声会导致网络的泛化能力降低。

图3为执行上述融合原则所得到的最优BN结构,其中细线表示基于专家知识的节点关联关系,粗线表示SEM算法挖掘的隐含关系,因此融合后的模型综合考虑了先验的故障传播机理和经过数据挖掘后先验知识无法揭示的隐含故障传播关系。

图3 融合先验知识和SEM算法的BN故障诊断模型

4 实验结果

本文所使用的故障数据来自武广线2011年8月至2012年12月的信号系统监控数据。分别对基于RDF(S)图的全局RDF(S)的合并算法性能和故障诊断结果的准确性进行了分析对比。

4.1 RDF(S)合并算法性能比较

为了说明本文提出的改进的RDF(S)合并算法的有效性,将提出的算法与经典的闭包本体融合算法进行比较。图4给出了计算时间的比较结果。图4中计算了本体节点在20~980范围内的计算时间,可以看出,在较小的节点数量下,两算法具有基本相似的计算时间,但随着节点数量的增加,基于闭包算法的计算时间远高于提出的改进算法。这主要是由于前者的计算复杂度为指数级,而提出的改进本体融合算法的时间复杂度为多项式。

图4 RDF(S)本体融合运行时间

4.2 基于BN的智能维护决策模型的性能

根据全局RDF(S)和局部RDF(S)的映射关系,提取武广高铁信号系统车载设备、地面监控设备、DMS设备等多源异构信息数据库中608条数据用于BN的结构和参数学习,剩余100条用来验证BN的正确性。图5为故障诊断系统测试结果。

图5 故障诊断系统测试结果

由图5可以看出,一级故障和二级故障诊断的平均正确率均为92.4%,三级故障为67.2%。

在故障诊断过程中,三级故障中误诊的概率比较大,主要原因是监控数据缺少大量的细节证据来支持第三级的故障诊断。如果结合维修检测证据和日常巡检和第三级故障相关的证据,则诊断的准确性会得到较大的提升。

5 结 论

针对高速铁路信号系统的多源异构监控信息,本文建立了融合异构设备监控数据的智能维护决策架构。在架构中的RDF(S)本体合并部分,根据监控数据的时空配准原则,提出了改进的RDF(S)融合算法,算法具有多项式的计算复杂度。针对高铁信号监控数据的缺失现状,在智能维护BN模型部分,结合结构化期望最大BN学习算法和专家知识,提出优化的BN维护决策模型。利用实际的高铁监控数据对决策模型的测试,证明了其对于第一级和第二级故障诊断的准确性。对于更为细粒度的判定准确性,需要进一步加强相关证据的抽取和测试,这将是下一步需要解决的关键问题。

[1] ABANDA H, NG’OMBE A, TAH J, et al. An ontology-driven decision support system for land delivery in Zambia [J]. Expert Systems with Applications, 2011, 38(9): 10896-10905.

[2] VERSTICHEL S, ONGENAE F, LOEVE L, et al. Efficient data integration in the railway domain through an ontology-based methodology [J]. Transportation Research: Part C, 2011, 19: 617-643.

[3] SAA R, GARCIA A, GOMEZ C, et al. An ontology-driven decision support system for high-performance and cost-optimized design of complex railway portal frames [J]. Expert Systems with Applications, 2012, 39: 8784-8792.

[4] LIU Z, HUANG L, XU D. Research on semantic retrieval system for high-speed railway knowledge based on ontology [C]∥International Colloquium on Computing, Communication, Control, and Management. Piscataway, USA: IEEE, 2008: 303-307.

[5] 韩春华, 易思蓉, 吕希奎. 基于GIS的铁路选线智能环境及领域本体建模方法 [J]. 中国铁道科学, 2006, 27(6): 84-88. HAN Chunhua, YI Sirong, LV Xikui. GIS based railway location intelligent environment and domain ontology modeling method [J]. China Railway Science, 2006, 27(6): 84-90.

[6] CHOUGULE R, RAJPATHAK D, BANDYOPADHYAY P. An integrated framework for effective service and repair in the automotive domain: an application of association mining and case-based-reasoning [J]. Computers in Industry, 2011, 62: 742-754.

[7] European Commission. European railway open maintenance system. [EB/OL]. [2014-06-30]. http:∥www.transport-research.info/web/projects/project_details.cfm?id=15048.

[8] European Commission. Intelligent integration of railway systems. [DB/OL]. [2014-06-30]. http:∥www.integrail.info/.

[9] FERREIRO S, ARNAIZ A, SIERRA B, et al. Application of Bayesian networks in prognostics for a new Integrated Vehicle Health Management concept [J]. Expert Systems with Applications, 2012, 39(7): 6402-6418.

[10]VONG C, WONG P, IP W. Case-based expert system using wavelet packet transform and kernel-based feature manipulation for engine ignition system [J]. Engineering Applications of Artificial Intelligence, 2011, 24(7): 1281-1294.

[11]UDREA O, DENG Y, RUCKHAUS E, et al. A graph theoretical foundation for integrating RDF ontologies [C]∥Proceedings of the Twentieth National Conference on Artificial Intelligence. Pittsburgh, Pennsylvania, USA: AAAI, 2005: 1442-1447.

[12]HOU X, OON S K, NEE A Y C, et al. A graph-based approach for automatic construction of domain ontology [J]. Expert Systems with Applications, 2011, 38: 11958-11975.

[13]FRIEDMAN N. Learning belief networks in the presence of missing values and hidden variables [C]∥Proceedings of the Fourteenth International Conference on Machine Learning. San Francisco, USA: ADM, 1997: 125-133.

[14]NIELSEN J D, RUMR, SALMERN A. Structural-EM for learning PDG models from incomplete data [J]. International Journal of Approximate Reasoning, 2010, 51: 515-530.

[本刊相关文献链接]

杜晓林,苏涛,朱文涛,等.一种多输入多输出雷达相位编码信号的设计方法.2014,48(12):93-99.[doi:10.7652/xjtuxb 201412015]

尚佳栋,王祖林,周丽娜,等.采用随机共振增强的混合扩频信号跳频参数估计.2014,48(10):42-48.[doi:10.7652/xjtuxb201410007]

李实锋,王玉林,华宇,等.罗兰拟C信号的抗干扰快速检测方法.2013,47(10):91-96.[doi:10.7652/xjtuxb201310016]

陈晓光,徐光华,梁霖,等.一种电流弱信号特征提取方法.2013,47(9):83-87.[doi:10.7652/xjtuxb201309014]

刁瑞朋,孟庆丰.一种衰减信号加窗频域插值算法.2013,47(7):85-90.[doi:10.7652/xjtuxb201307016]

齐巍,陆明泉,李强,等.高动态测量系统中的自适应信号成形滤波器设计.2013,47(6):124-129.[doi:10.7652/xjtuxb 201306021]

谢桢,付立军,肖飞,等.三电平直流变换器全模式小信号建模和控制器设计.2013,47(6):109-116.[doi:10.7652/xjtuxb201306019]

郑纪彬,任爱锋,苏涛,等.多分量Chirp信号相位参数的精确估计算法.2013,47(2):69-74.[doi:10.7652/xjtuxb2013 02012]

谢航,廖与禾,林京.一种含噪声多模态调频调幅信号的提取方法.2012,46(7):93-97.[doi:10.7652/xjtuxb201207017]

朱军涛,廖红建,谢勇勇,等.采用短时傅里叶变换的铁路车载探地雷达数据解译方法.2012,46(7):108-114.[doi:10.7652/xjtuxb201207020]

(编辑 荆树蓉)

Heterogeneous Data Fusion and Intelligent Maintenance Decision for High Speed Railway Signaling Systems

XU Tianhua1,YANG Lianbao1,HU Hongli2,WANG Xiaoxin2

(1. State Key Laboratory of Rail Traffic Control and Safety, Beijing Jiaotong University, Beijing 100044, China; 2. State Key Laboratory of Electrical Insulation and Power Equipment, Xi’an Jiaotong University, Xi’an 710049, China)

A framework of integrated heterogeneous data and intelligent maintenance decision was proposed aiming at the multi-source heterogeneous data in intelligent maintenance decision for railway signaling systems. By means of transformation and fusion from local resource description framework (schema)(RDF(S)) to global RDF(S), the fusion of heterogeneous data was realized. In addition, a Bayesian net (BN) based intelligent maintenance decision model was constructed by combing the structural expectation maximum (SEM) algorithm for missing data with the expert knowledge. The correctness and efficiency of the proposed framework and the RDF(S) fusion algorithm were verified by the maintenance data from Wuhan-Guangzhou high-speed railway signaling systems in 2011-2012. The experimental results show that the computational complexity of the proposed ontology fusion algorithm is polynomial, and the average accuracy of the fault diagnosis for the first level reaches 92.4%. Therefore, the proposed framework may improve the accuracy and efficiency of the intelligent maintenance decision of high-speed railway systems.

high-speed railway; signaling system; heterogeneous data; ontology fusion

2014-07-21。

徐田华(1971—),男,副教授。

国家自然科学基金资助项目(51305021);铁路总公司重点资助项目(2013X015-B);轨道交通控制与安全国家重点实验室自主研究课题(RCS2012ZT005)。

时间:2014-10-15

10.7652/xjtuxb201501012

TM934

A

0253-987X(2015)01-0072-07

网络出版地址:http:∥www.cnki.net/kcms/detail/61.1069.T.20141015.1752.006.html

猜你喜欢

信号系统异构本体
试论同课异构之“同”与“异”
眼睛是“本体”
LTE-M在地铁信号系统中的应用
SmarTram型有轨电车信号系统
吴健:多元异构的数字敦煌
跨座式单轨与中低速磁浮信号系统的关键技术
异构醇醚在超浓缩洗衣液中的应用探索
基于本体的机械产品工艺知识表示
信号系统一体化的探讨
LTE异构网技术与组网研究