时间触发以太网TTE的时间特性辩析
2018-12-28张振刚
张振刚
(中国西南电子技术研究所,四川 成都 610036)
0 引言
随着航天技术和计算机信息技术的发展[1],现代航天系统内的电子设备越来越多,系统内的电气设备的配置越来越复杂。在装备数字化、信息化程度的要求不断提高的情况下,对系统内各电气设备之间的信息交换的要求也越来越高。因此,以模拟电缆点对点的传输方式已经无法满足系统研制、调试和测试的需求,更无法实现冗余设计与故障自动检测、隔离的要求,迫切需要具有高传输速率、高管理效率和高可靠性的数据互联方式,即:高速数据总线。
由于以太网在各行各业中的普遍应用,研究人员很容易想到的解决方案是提高以太网的实时性、确定性和可靠性,以满足航天器综合电子系统的技术要求。基于以太网的改造方案和标准非常多,文献[2]综合分析了航天器综合电子系统的通信要求,并 对 PROFINET-IRT、EtherCAT、PowerLink、EPA、ARINC664[3]、TTEthernet等多种以太网改造方案进行分析和对比。
近年来,在众多的以太网改造方案中,以SAE AS6802[4]标准为基础的时间触发以太网解决方案因突出宣传其时间触发概念和时间确定性而越来越多地获得了大家的青睐。也有人把时间触发概念与光纤通道[5]结合起来,提出了TT-FC解决方案。可是对TTE的面向应用使用时总线时间特性分析研究较少。
1 时间触发以太网的特点
高效的访问控制管理:全局时间可以为有时间故障的设备提供强大的故障隔离机制,因为全局时间作为时间防火墙进行操作。
统一网络:分配给时间触发通信的通信带宽可以精确地位于时间域。这个时态规范允许将时间关键消息与非时间触发的消息隔离。
精确诊断:AS6802提供的全局时间戳服务简化了重构分布式事件链的过程。与此同时,传感器值的同步捕获使构建整个系统状态的快照成为可能。
时间可组合性:使用全局时间允许对设备接口的规范不仅在值域中,而且在时间域上。这意味着在设备的设计过程中,通信网络有一个预定义的访问模式。因此,设备可以并行开发。
可伸缩网络:本文描述的时间触发以太网QoS增强适用于具有可伸缩的容错需求和n-冗余以太网设计的广泛应用程序。
电路切换仿真:时间触发以太网交换设备根据依赖全局时间的调度发送数据包。
2 关于时间触发
所谓时间触发传输,是指通过在时间轴上预先编排顺序执行的传输任务,避免传输冲突以及由此带来的传输时延抖动和丢包。
TTE的时间触发概念,是在对ARINC664[6]协议进行改进时提出来的。在ARINC664协议约束下,各个虚拟链路VL通过自调度,保证VL承载的各个应用都可以获得预先分配的传输带宽,在端系统(Endsystem,ES)不会产生严重的拥塞。但ARINC664却无法保证不同端系统的报文会不在交换机处产生较大的拥塞,导致依然会出现传输延时的不确定性,严重时会造成丢包。TTE在ARINC664协议的基础上,增加了一种TT报文,保证TT报文对带宽的独占性,从而保证TT报文传输的时候一定不会出现冲突,消除了因为交换机拥塞而造成延时和可能丢包的风险。
但TTE对可靠性的贡献,是专指对ARINC664网络的可靠性提升。TTE和其他很多时间触发协议(例如AS5643[7])都是通过时间编排避免传输冲突来提升可靠性,然而二者都没有实现传输确认、超时重传等策略,当随机误码、电源噪音、环境干扰等因素出现时,依然不能保证传输的正确性,其可靠性指标远远低于1553B[8]网络。
3 时间确定性、实时性与时延抖动
TTE网络具有确定性,包括路由的确定性和传输时间的确定性,其中路由的确定性是从ARINC664继承下来的,而时间确定性有2个伴生指标:实时性和时延抖动,这三者经常一起提及。由于TTE的时间确定性良好,研究人员自然认为其实时性好、时延抖动小。SAE AS6802在标准中也强调其实时性以及常数时延和微秒级亚微秒级的时延抖动。
但是,传输的内容来自上层应用,上层应用的数据产生时间与传输时间窗口之间是异步的。所以,从上层应用来看,并不能体现低时延和低抖动特性。而且,由于周期调度的原因,上层应用看到的时延和抖动往往会被放大,达到毫秒数量级。当然,这几乎是所有周期调度系统都存在同样的问题,因此TTE也将受到同样的制约。
应用程序的数据产生周期与TTE的传输时间窗口周期的异步特性如图1。
图1 时间触发以太网的传输时延Fig.1 Transmission delay of time triggered Ethernet
从图1可以看出:
(1)由于数据产生的时间与传输窗口不同步,数据产生以后并不是每次都能立即传输,从而造成总延时并不总是足够小,一般分布在[最短延时,最短延时+调度周期]范围里。传输时延抖动jitter将可能达到一个调度周期的时间。
由于数据产生的时间与传输窗口不同步,数据产生以后并不是每次都能立即传输,从而造成总延时并不总是足够小,一般分布在(最短延时,最短延时+调度周期)范围里。由于上述原因,传输时延抖动jitter将可能达到一个调度周期的时间;
(2)一个源端把同时产生的2路数据分别发送给不同端系统的时候,由于受到时间触发的约束,2路数据的传输时延是不一样的,而且必然有1路数据会产生较大的延时;一个源端把同时产生的2路数据分别发送给不同端系统的时候,由于受到时间触发的约束,2路数据的传输时延是不一样的,而且必然有1路数据会产生较大的延时;
(3)不同源端把同时产生的2路数据发送给同一个目的端时(上图为表示),同样由于时间触发的约束,也会产生不一样的延时,而且必然也会有1路数据会产生较大的延时。不同源端把同时产生的2路数据发送给同一个目的端时(上图为表示),同样由于时间触发的约束,也会产生不一样的延时,而且必然也会有1路数据会产生较大的延时。
4 时间确定性的代价
为了实现各种不同应用数据的复合传输,时间触发以太网除了传输时间触发报文TT以外,还会传输带宽受限报文RC和尽力传输报文BE。为了保证TT的时间确定性,RC和BE就要受到限制。
端系统和交换机的时间触发TT传输窗口到达的时候,如果恰好当时正在传输RC或BE报文,这时可以有2种选择:
(1)立即中断正在传输的报文,等TT报文传输结束以后再重传前面被中止的报文,这样必然会造成一种结果:网络上充斥着大量不完整的垃圾报文,消耗网络带宽,冲击网络设备的容错能力;立即中断正在传输的报文,等TT报文传输结束以后再重传前面被中止的报文,这样必然会造成一种结果:网络上充斥着大量不完整的垃圾报文,消耗网络带宽,冲击网络设备的容错能力;
(2)等待当前报文传输以后再开始传输TT报文,这样做的结果是:在100Mbps网络下,TT报文最大的可能传输时延要等待长大120us,在1000Mbps网络下,TT报文最大的可能传输时延要等待长大12us,时间触发以太网的时间确定性特征就大打折扣了。等待当前报文传输以后再开始传输TT报文,这样做的结果是:在100Mbps网络下,TT报文最大的可能传输时延要等待长大120us,在1000Mbps网络下,TT报文最大的可能传输时延要等待长大12us,时间触发以太网的时间,如图2。
图2 传输冲突处理Fig.2 Transmission conflict handling
两种处理方式当然都不理想。为了避免上述传输冲突的出现,还有一个办法是增加预判:在需要发送一个BE/RC报文的时候,首先要判断在这个BE/RC报文的传输期间,是否要传输TT报文。如果将有TT,则暂时不能发送这个报文,要等即将到来的TT报文发送完成以后再做判断,直到确认在传输期间不会有TT报文出现才启动传输;采取该方式虽能保证TT报文的时间确定性,却导致端系统和交换机需预先判断全局下一个TT报文出现的时刻和持续时长,浪费带宽资源和运算资源。
5 非周期时间的处理
时间触发以太网的高确定性低延时都是针对周期通信形式,不能提供高确定性高实时的非周期通信支持。
实际系统中处理周期命令/数据以外,还有一些高优先级的非周期命令,例如航天器逃逸系统。逃逸系统一旦收到自动逃逸信号或手动逃逸信号,立即实施应急逃逸,将航天员带离危险区, 并为航天员的返回着陆提供必要的条件[9]。一旦满足逃逸条件,控制系统应该“尽可能快”地实施应急逃逸,而对于这种突发事件,时间触发以太网并不能够提供一种“尽可能快”的通信方式。
参考1553B总线,高优先级非周期消息的总传输延时约50us[10],假定时间触发以太网用周期100us的TT报文来承载逃逸系统通信,报文最小长度64字节(加上8字节前导码和12字节IFG,相当于总长度84字节),用10个VL来承载各个方向的通信,这时消耗的带宽为67.2Mbps,基本上就把一个100Mbps网络的带宽占满了。
6 结论
以上分析了基于AS6802的时间触发以太网TTE的时间特性,包括时间触发概念、时间确定性/实时性、非周期事件的处理以及分布式时间同步等。分析结果表明,TTE确实在ARINC664协议基础上带来了更好的时间确定性,但并不意味着TTE就具有绝对的实时性,尤其是TTE并不支持底层的传输确认与重传,不支持高优先级的非周期事件处理,在航空航天等安全关键系统应用上依然存在一些隐患和缺陷。