关于动车通信网络高可用性无缝冗余研究仿真
2021-11-17董敬超崔红月
董敬超,崔红月
(1. 北京交通大学,北京 100044;2. 中车唐山机车车辆有限公司,河北 唐山 063000)
1 引言
在动车运行过程中,车辆检测器件,交互组件,以及控制单元将产生大量异构的数据,而这些数据的集中处理需要依靠动车通信网络,进行及时可靠的传输。由于这些数据直接影响动车运行的状态,因此动车通信网络的可靠性与可用性至关重要[1-2]。对于动车的大量数据与复杂控制,通信网络在满足大数据吞吐量的同时,也要尽可能提高传输速率与网络安全[3-4],传统的以太网通信协议已经难以应对应用需求,对此,研究人员也提出了一些优化的网络方法。
文献[5]采用对交换机进行优先等级划分的方式,优化了网络传输的速度,但是该方法没有实现网络的冗余设计,通信数据的可靠性无法保证。文献[6]针对交换机设计了混合调度策略,通过演算理论判断各类数据对应的时间窗口,从而提高网络数据的传输实时性,但是该方法也没有考虑动车通信网络的高可用与高可靠。文献[7]采用了PRP与HSR的网络结构,提升了网络异常恢复的速度,而且网络实现了冗余设计,提高了通信数据的可靠性,但是网络的高可用没有采取优化。针对动车运行的实际需要与现有研究的缺陷,提出了高可用无缝冗余传输策略。网络整体采用主从热备机制,保证通信网络大吞吐量的同时,也引入了网络冗余设计,提高网络数据传输的可靠性,而且设计的优先级调度策略,以及协议中加入的冗余参数,都能够有效改善网络的传输延时。
2 动车并行冗余通信模型建立
动车在启动运行过程中,会产生大量的通信数据,这些数据类型复杂且异构,分为过程、消息、监控、流,以及其它数据,它们包含了车辆启动运行时的所有检测、指令与故障信息,通过列车通信系统的并行拓扑传递到各个机构处理。考虑到数据量与传输速度,并行冗余通信的底层选择数据带宽大的Ethernet及其相应协议,并根据实际需求对运行其上的传输协议与应用协议做出相应的修改与优化,通过高性能网络路由完成通信链路的测试与切换任务。为了具有良好的可靠性,在动车上层通信协议中,设计了双层通信拓扑ETB和ECN,并在其上应用冗余协议。具体实现如图1中描述。
图1 动车通信网络的冗余设计
图中描述了两个并行通信网络,共同实现通信协议的高可用。每个并行通信网络又分别具有ETB和ECN两层,其中ETB层采取的是线性结构的工作机制,ECN层采取的是环结构工作机制。并行通信网络之间的ETB根据设计的竞争机制,获得主机通信权力,另外的ETB自动成为备机。由主ETB对通信协议做初始化,以及参与通信数据的包装,同时由主ETB中的ETBN和ECN建立通信,ETBN会把并行通信网络的ECN区分为主从,从而形成主从热备状态,提高可用性。在发现其中一个ETB或者ECN宕机时,自动唤行另外的备机,继续通信,保证可靠性。
3 动车通信网络的高可用无缝冗余优化设计
在动车通信数据中,监控与故障数据是最为重要的,这类数据应该尽可能保证其时效性与安全性,而相对次要的数据则可以适当调整其传输周期及包结构。如果在动车运行中发生通信故障,应该做到50ms内实现恢复,才能满足传输性能要求,由于PRP协议的并发特点,可以在通信故障情况下进行无缝切换,该过程的耗时远远小于要求的50ms,因此将其用于上层通信协议中,有利于网络的高可用。而相对于实时性要求并不强的数据,可以将其重要程度进行降档处理,采取交替传输处理,由此可以节约带宽,保障重要数据的传递性能能。
在并行传输的过程中,PRP协议利用LRE准备网络传输报文,报文格式如图2所示。如果执行的是发送处理,通过LRE把传输报文采取副本机制,同时追加4 Byte冗余参数RCT,再将双副本报文传输到各并行网络,从而提高报文发送的冗余性。如果执行的是接收处理,LRE采取逆向操作,根据报文冗余参数判断副本,保证数据的安全与可靠。
图2 传输报文格式
报文尾部追加的冗余参数由16bit的序列码SequenceNr,4bit的标识符LAN,以及12bit的数据字节数量LSNU-size构成。当开始一次新的发送任务时,LRE会在准备报文的同时对前一次的SequenceNr进行递增,作为本次的序列码填充到报文中。LSNU-size为报文中数据字节数量,根据该值可以判断是否要采取冗余操作,若判断出数据未包含冗余参数时,则将报文不做任何处理进行转发。LAN用于控制将报文发往哪个并行网络中,所以多个副本发送时,只有该值是不同的。多副本通过并行网络传输,接收报文的时间有先后,LRE根据冗余参数判断报文是否存在,如果不存在,保留报文,反之抛出。这种处理方法可以有效避免某个并发网络异常,使得传输链路不通,导致报文丢失,通信中断。该处理利用并发网络采取副本冗余机制,将一个报文从多条链路传输,接收节点只需要根据冗余参数确定报文的去留即可,而且不会增加网络传输带宽和传输开销。
在抛弃报文时,需要根据SequenceNr确定抛弃窗口,此时涉及到上下边界问题,假定窗口范围表示为[StarSequence,ExpectedSequence],且当前收到的SequenceNr是CurrentSequence,则可以得到
ExpectedSequence=CurrentSequence+1
(1)
报文抛弃窗口设计如图3所示,假定某次通信收到LANB的传输报文,通过SequenceNr进行判断,如果该报文同样也来自于LANA,则将该报文与抛弃窗口进行比较,并判定来自两个并发网络报文的有效性,判定依据如下
图3 报文抛弃窗口设计
(2)
当序列码满足该条件时,判定为抛弃接收到的LANB报文
(3)
当序列码满足该条件时,判定为保留接收到的LANB报文。
4 动车通信网络高可用无缝冗余的可靠性
在所设计的动车通信网络中,实现高可用与无缝冗余功能的是两个并行网络,分别标记为A和B,它们构成双机热备系统,假定A发生异常的概率是p1,异常恢复的概率是u1,B发生异常的概率是p2,异常恢复的概率是u2,则通信网络整体失效的概率可以表示为
(4)
网络拓扑设备的恢复概率一般可看作固定不变,即有u1=u2=1/tmttr,假设每个并行网络中设置4台交换机,则每个并行网络的可用程度计算为
(5)
根据动态故障状态的特点,采取si描述网络状态i对应的稳态概率如下
(6)
其中的Q代表状态矩阵,由故障概率与恢复概率,得到关于网络状态矩阵Q如下
(7)
利用式(6)和式(7),整理得到关于稳态分布的公式如下
(8)
网络拓扑单个设备的故障率通常是固定不变的,利用前述公式便可以计算出网络的静态可靠性。对于动态组件,比如DANH端口,假定其异常概率是p,异常恢复的概率是u,基于并行网络的平等特点,可以将动态组件的故障状态描述如图4所示。
图4 故障状态描述
此时,可以将状态矩阵表示为
(9)
对应的稳态概率可以描述如下
(10)
根据式(9)和式(10),整理得出稳态分布公式为
(11)
据此,可以求出通信网路的动态可靠度。
5 仿真与结果分析
为了验证设计的动车高可用无缝冗余通信网络的性能,基于TimeNet平台建立仿真分析,分别从通信可靠性、传输延时,以及数据吞吐量三个方面对其进行验证。
5.1 通信可靠性分析
在本文设计的高可用冗余通信网络中,其中任何一个并行网络发生故障,造成通信链路中断时,另外的副本网络都会无缝接替其工作,恢复通信,因此,将可靠性定义如下
Rs=RETB×RECN
(12)
等式右侧的两项依次代表ETB和ECN两层的可靠度,通过仿真,得到高可用无缝冗余网络的可靠性结果如图5所示。根据结果曲线分析可知,单一网络,没有冗余设计时,一旦存在故障且不能及时恢复,就会导致通信失败,可靠性差。而引入高可用冗余设计后,提高了网络抗故障的能力,双机热备能够实现监督机制,发现主机网络存在故障,从机网络快速转为工作模式。
图5 动车通信网络可靠性结果曲线
引入传统PRP协议与本文方法进行性能对比,实验得到两种通信网络中对应的可靠性相关数据如表1所示。根据实验数据对比,本文方法显著降低了网络故障的概率,发生故障的平均间隔比传统PRP延长了将近一倍的时间,且真正实现了通信网络的高可用性。从可靠性的角度分析,本文方法能够显著提高动车通信网络的传输性能。
表1 可靠性数据结果对比
5.2 通信延时分析
在动车通信网络中,报文传输的时间计算公式可以表示为
T=Ln/Bwidth
(13)
其中,Ln表示传输数据的字节数量,Bwidth表示网络带宽。考虑到过程数据的形成具有的周期性,在其周期改变的过程中观测与通信时间的关系。实验过程中,采用传统PRP协议与本文方法进行对比,通信延时结果曲线如图6所示。根据结果曲线可知,随着数据形成周期的增加,在15ms之前,传统PRP协议传输延时呈现下降趋势,当周期变化到15ms时,下降平缓,并趋于稳定,保持在0.6ms左右。而本文的高可用冗余协议无论周期如何变化,始终稳定在0.2ms左右,通信延时明显优于传统PRP协议。导致该结果的原因是由于本文方法将传输数据进行重要程度区分等级,在协议中对重要程度最高的数据采取并行发送,处理周期更快,报文更小;而重要程度较弱的数据则采取大报文,串行发送,使优先级低的数据让优先级高的数据先行,这种优先级调度策略有效保证了实时性要求高的数据传递性能。
图6 通信延时结果曲线
5.3 数据吞吐量分析
数据吞吐量也是衡量通信网络性能的重要指标,它的计算公式表示如下
(14)
其中,E{Pm}是待传输数据的平均标识数,Ln是传输报文的字节数。由于数据字节的多少会影响数据吞吐量,因此在实验过程中,改变数据报文的生成速度,得到吞吐量的变化情况,如图7所示。
图7 吞吐量和报文生成速度曲线
根据结果曲线分析,随着报文生成速度的增长,通信网络的数据吞吐量会随之增加,但是本文方法的吞吐量增长速度更快,且一直高于传统PRP方法,这也是由于协议中采用了优先级调度策略导致的。
6 结束语
动车通信网络需要完成大量异构数据的传输,传统传输协议存在可靠性与实时性等诸多性能缺陷,为此,本文提出并设计了关于动车通信网络的高可用无缝冗余传输协议。方法首先针对动车通信网络中数据的类型与传输要求,设计了双层通信拓扑ETB和ECN,并在并行网络中形成主从热备。然后根据数据的重要程度与实时性要求,设计优先级调度策略,将传输数据划分为不同等级,并采取不同的传输策略。再在传输报文尾部追加冗余参数,并设计报文抛弃窗口,对冗余参数进行判定,处理接收报文。最后对动车通信网络可靠性进行了相应分析。实验结果表明,高可用无缝冗余协议具有比传统通信协议更高的传输可靠性,且报文传输延时更小,数据吞吐量更大,能够有效处理动车大量异构的数据传输。