基于图论推理的高速铁路信号系统网络诊断方法研究
2021-02-25徐德龙鲁剑锋
徐德龙,鲁剑锋,窦 伟,杨 璘
(1.中国铁道科学研究院集团有限公司通信信号研究所,北京 100081; 2.国家铁路智能运输系统工程技术研究中心,北京 100081)
作为保证列车安全运行、控制列车运行速度的高速铁路信号系统,系统结构都很复杂[1-3]。如果用户要详细了解系统内部状态,需要额外借助于一个人机接口,即维护终端设备。通过维护终端详细记录系统内部状态数据,对于故障判断,传统的方法为通过收集记录信息,依靠工作人员的经验,对信息进行人工分析及识别,得出判断结果,判断结果往往受人的因素影响大。目前,各行业对智能诊断方法研究较多,如人工智能应用中的神经网络、贝叶斯网络技术等[4-6]。信号系统多涉及行车安全,日志信息以记录信息、开关量信息为主,用户期望判断出精准的故障点,人工智能的技术方法适用性不强。为此,以计算机联锁系统(CBI)为例,提出一种基于图论模型和模糊推理的显示和故障推理方法,并结合CBI系统网络方面的监测及诊断技术进行实例研究,力图计算出高质量的诊断结果。
1 CBI系统维护终端架构
CBI是典型的地面信号系统,由负责逻辑运算和控制输出的联锁机、负责操作显示的操作机组成[7-8]。系统的可靠性、安全性要求高,系统内各组成部分均为冗余设备,各组成部分间为网络通信或串行通信方式,是一个有着较复杂网络架构的控制系统[9]。维护终端与联锁机、操作机间为通信接口,其本身无控制功能,仅作为维护管理的手段,其总体架构如图1所示。
图1 计算机联锁系统维护终端总体架构
图1中,维护终端从联锁机接收系统控制对象和采集对象的状态信息(驱采对象信息),系统内部的设备状态、内部通道信息,以及系统外部的接口信息和通道信息(网络状态信息),从操作机接收界面显示信息以及操作命令,并对这些数据信息记录和管理。维护终端设置人机界面,用户可以通过界面操作查询以上信息。当前的维护终端仅实现了这些基本信息的记录和查询功能,远不能满足用户对智能化的需求。
在智能化方面,网络监测是一个关键点,主要包括各主机状态及通信通道状态。其中,通道状态主要包括两个方面:一个是联锁系统内部设备之间的通信状态,主要包括联锁机、操作机、维护终端之间的通信状态;另一个是联锁系统与外部设备之间的通信状态,主要包含联锁系统与列控中心(TCC)、无线闭塞中心(RBC)、相邻的CBI、调度集中(CTC)等冗余接口的通信状态[10]。CBI系统网络结构相对复杂,接口数量大,冗余通道多,且中间存在交换机等转发的环节。因此,研究CBI系统的网络监测和诊断比较有代表性。
2 图论及推理技术研究
对于维护终端,如果能采用图形、图像技术交互式地显示,并基于图形作进一步的推理,将大大提升智能化水平。近年来,相关学者对于图论和推理技术进行了深入研究,为本文研究提供了理论支撑。
2.1 图论模型研究
图(Graph)是由节点及节点间的关系集合组成的一种网状模型,用公式表达为G=(V,E)。其中,V是节点的集合;E是节点之间关系的集合,也称为边。图分为有向图(Directed Graph)和无向图(Undirected Graph)。在有向图中,两个节点u、v是有顺序的,用表示从节点u到节点v的一条有向边。在无向图中,节点u和节点v相关联的一条边没有特定的方向,用(u,v)表示[11]。CBI系统为各主机以及双向交互数据的特定应用系统,可将具体主机抽象为节点,将通信通道抽象为连接两个节点的边,依据此方法将CBI系统网络转化为无向图模型[12]。
根据图论模型搭建的网络节点和通道模型示意如图2(a)所示。其中,A为第1层节点,B1、B2、B3为第2层节点,C11、C12、C21等为第3层节点。本模型中上层节点和下层节点为独立连接,节点间没有交叉互通的情况。在CBI系统中,各主机之间的冗余通道存在交叉关联的情况。为此,将图2(a)的模型进一步改进,增加交叉的无向边。如图2(b)中虚线部分,B1节点和C21节点关联,B2节点和C11节点关联。这种情况下的关联关系将更复杂,但无论如何交叉互通,采用的方法是相同的。以B1节点为例,其关联的通道有4条,分别为A-B1、B1-C11、B1-C12、B1-C21,如果模型中还存在C13、C14等节点,也就是还存在第5、6条通道。
图2 改进前后的网络节点和通道示意
2.2 推理技术研究
推理机是整个推理过程的核心,其关键是推理方向和推理方法,推理过程如图3所示。推理方向包括正向推理、反向推理及正反向混合推理3种[13]。其中,正向推理为从事实出发,推理出目标的方法。反向推理从目标出发,沿着推理路径回溯到事实,从一般性开始,逐步涉及细节,通过收集越来越详细的证据以求证实一种情况或假设。在实际应用中,正向、反向推理应用均比较广泛。正向推理多应用于节点、边状态都已知的情况下。反向推理可应用于有未知节点或边状态的情况下,通过反向多条无向边分析和推理,推理出未知节点状态。本文的推理方向主要为依据搭建的图论模型展开。图2(b)中的节点B1,如因条件限制,无法获取其节点状态,这时可对B1节点反向推理。满足B1相关的所有节点的故障判断后,即多异常节点的互相验证后,确定B1节点状态。
图3 基本推理流程
模糊逻辑是一门数学学科,它以允许真实度和谬误度的模糊集理论为基础[14]。模糊推理是效仿人思维的推理过程,是常用的分析方法之一[15-16]。模糊逻辑方法是基于有着表示判定特征的模糊集,采用IF-THEN语言规则,针对某一前提推理出结果的过程。其公式表述为式(1)的形式
(1)
其中,M→P,当M′与M满足一定相似要求时,得出结论P′。模糊推理及控制已经应用到控制高阶非线性系统,不能用数学描述或由于太复杂而不能分析的系统,如飞机飞行控制、电力系统和核反应堆控制等。对于CBI系统,当网络发生故障时,因通道中有交换机等中间设备,难于精确地判断出故障点。采用不确定性推理方法对故障信息进行模糊推理,将有助于解决系统网络故障时节点或边判断的难题。
3 CBI系统网络监测实例研究
3.1 基于图论原理的显示界面设计
根据图论的原理,网络监测按照系统物理连接的方式进行显示,反映出系统中所有的物理设备及物理连接通道。所有设备及设备间的连接线缆都能显示且与实际设备一一对应,做到图形界面与实物相符,有利于用户准确地处理故障设备[17]。
(1)节点设备设计
本文以TYJL-ADX型计算机联锁系统为例,对其二乘二取二冗余结构的设备组成进行分析,梳理出系统内各节点设备,如表1所示[18]。主要包括操作A机状态、操作B机状态、联锁I系状态、联锁II系状态,以及外部设备CTC-A机状态、CTC-B机状态,以及相邻的CBI、TCC、RBC主机状态。
表1 节点设备
(2)节点和通道状态库
根据表1的节点设备,建立主机状态库。主机状态库基本信息主要包括节点编号、设备名称和节点状态,节点状态主要为主控、备用、故障、未知等。
建立通道状态库。计算机联锁系统的网络监测数据来源分散,通道数量大,维护终端只能收集到逻辑通道的状态信息,没有直接反映物理通道状态的信息。在软件实现方面,将所有逻辑通道状态按照自定义的存储格式保存在一片缓存里,自定义的存储格式举例如表2所示,通道状态为0表示未知,1表示正常,2表示故障。
表2 逻辑通道状态库格式
按照图论模型和以上分析,并参照航空领域的人因工程相关标准,设计的TYJL-ADX型计算机联锁网络监测实物界面效果如图4所示。
图4 TYJL-ADX型计算机联锁节点和通道边显示效果
在图4中,节点用方框表示,通道边用线条表示。节点的状态通过边框颜色进行区分,其中绿色表示主控,黄色表示备用,红色表示故障,灰色表示未知。通道边的颜色通过连接线颜色反映,其中绿色表示正常,橙色表示部分故障,红色表示故障,灰色表示未知。在界面中,白色虚框以内的节点和通道边为CBI系统内部设备,虚框以外的节点和通道边为外部接口设备[19]。
逻辑通道的状态显示采用二级窗口的方式呈现。当点击节点设备框时,弹出相关联的逻辑通道状态表。图5为联锁Ⅰ系节点的逻辑通道状态表效果,共包括与操作机、TCC、CBI、RBC的16个逻辑通道状态。采用这种两级界面的显示方式,实现了基于图论模型实物关系图,同时也显示出了底层状态数据,便于对比分析。
图5 逻辑通道状态显示效果
(3)通道状态计算方法
在通道边状态显示前,首先要将状态库中的逻辑通道数据信息转换为物理通道状态。CBI系统的通道为一段通信线,两端节点为主机,或主机与交换机。在网络模式下,逻辑通道与物理通道存在着本质上的区别。一是起点、终点节点的区别,逻辑通道为主机与主机的状态,物理通道的两个端点可能是主机与交换机,仅仅是逻辑通道的一段;二是每个物理通道包含了多个逻辑通道状态的一段。物理通道和逻辑通道部分重叠但又不完全相同,逐段逐条一一对应是一个难题。本文提出的计算方法基本原则是,根据网络结构,一条物理通道状态的显示综合考虑该物理通道上所有逻辑通道的状态。经由该通道的所有逻辑通道都正常,物理通道显示为正常;所有逻辑通道都故障,物理通道显示为故障;否则物理通道显示为部分故障状态。以操作A机到交换机A的物理通道为例说明。操作A机通过该物理通道与联锁Ⅰ系、联锁Ⅱ系、维修机分别建立逻辑通信。根据表2,3个逻辑通道的状态在状态库缓存中分别位于第1,9,14位。在初始化该物理通道时,新建一个列表用于保存该物理通道对应所有逻辑通道状态的索引值,即将索引值1,9,14保存到该列表中,如表3所示。在计算该物理通道状态时,在缓存中遍历该列表中索引值对应的状态值,从而实时获取操作A机到交换机A的物理通道状态。其他物理通道计算方法类似。
表3 物理通道与逻辑通道索引关系
为了实现网络状态的回放,将实时接收到的逻辑通道状态按时间顺序存储成文件。在回放网络状态时,读取状态库文件,重新按以上规则进行以上计算即可再现历史时刻的网络状态。
3.2 基于推理的故障诊断
在实际使用过程中,系统中某条线缆或者某个节点设备故障后,往往出现的现象是,网络状态图上显示的故障区域比实际的范围要大。如交换机A故障,与交换机A相连的5个通道边全部显示为故障,致使从建立的图论模型上难于直观看出故障点。
使用者希望能提供一种自动的故障定位功能,引导用户优先排查最可能出现故障的节点设备或连接通道。采用基于图论模型和模糊推理方法的混合推理控制策略,从主机节点追溯网络状态,查询的方式发送诊断指令,调取状态库的记录信息进行识别判断,追溯到相关的所有节点。以根据全部的逻辑通道状态及主机节点工作状态,通过逻辑判断和模糊推理方法,最终定位到最可能出现故障的设备或者通道[20]。按照以上需求设计的推理机判定流程如图6所示。
图6 网络故障推理判定流程
在图6所示的推理工作流程中,对于交换机的故障定位,在具体判别时,还需采用模糊推理的方法。在已知“经过交换机所有逻辑通过通信中断,为交换机故障”大前提后,如对于交换机A故障,根据具体状态库中逻辑通道状态作为小前提,经过模糊推理判别出故障点,具体推理如下:
结合本文研究的通道特定计算方法,以及图6的推理工作流程,经过进一步延伸分析,得出图7所示的联锁Ⅰ系推理流程。
图7 联锁Ⅰ系至交换机B故障推理处理流程
以联锁Ⅰ系与交换机B的网线故障为例,这是一个较常见的故障情况。在网络图中,如图8所示,交换机B有一各通道显示为3倍宽度的红色线条,3个通道显示为2倍宽度的橙色线条。该故障导致联锁Ⅰ系至交换机B的逻辑通道全部中断,包括联锁Ⅰ系与操作A机逻辑通道中断、联锁Ⅰ系与操作B机逻辑通道中断、联锁Ⅰ系与维修机逻辑通道中断。此情况下,操作A机、操作B机、维修机经过交换机B与联锁Ⅱ系通信正常。按照图7所示推理过程,从联锁Ⅰ系查询,推理出联锁Ⅰ系与交换机B的通道边故障。
图8 网络监测界面故障显示
除此之外,对于安全数据网故障、与CTC通道故障也能参照以上方法进行推理分析。基于本流程对CBI系统进行了完整的网络故障推理,覆盖了所有设备节点和通道故障判别,现已完成软件开发。
4 结论
基于图论模型进行设计,并在图论模型和模糊推理方法的混合推理策略的基础上,结合计算机联锁系统的网络监测诊断功能进行实例研究,从显示、故障定位方面对网络主机节点、通道边的故障点分析进行了深入研究。经实践验证结论如下。
(1)采用图论模型的信号系统网络状态显示方式,可视化程度高,可用性强。
(2)基于图论模型和模糊推理方法的混合推理方法,能够有效对主机节点、交换机、通道边进行精准或区域故障定位,可行性强。
(3)以上显示和故障定位方法,可为相关系统的网络监测和诊断提供借鉴。