铁路数据网故障恢复与OTN网络保护间协调策略探讨
2015-01-03岳铭凯
岳铭凯
(北京全路通信信号研究设计院有限公司,北京 100073)
铁路数据网故障恢复与OTN网络保护间协调策略探讨
岳铭凯
(北京全路通信信号研究设计院有限公司,北京 100073)
在研究数据网故障恢复技术及OTN网络保护方式基础上,结合铁路数据网及传输OTN网络建设情况,重点分析探讨铁路数据网故障恢复与OTN网络保护间协调策略。
故障恢复;保护;协调策略
1 概述
OTN技术是在SDH和WDM技术基础上发展起来的传输技术, OTN网络保护主要包括电层保护、光层保护方式,数据网为实现快速路由收敛采用FRR、BFD等协议。为保证数据网业务的可靠性,数据网要求其OTN承载网络启用保护功能,在OTN链路或节点失效时,应做好铁路数据网故障恢复与OTN网络保护间协调策略。
2 OTN网络保护方式
2.1 电层保护
OTN电层线性保护指在ODUk层采用子网连接保护(SNCP),它可用于网状网、环网或混合结构的物理拓扑以及分层网络中通道层,根据服务层故障、客户层信息或通道的性能信息进行倒换。根据保护路径是否可共享,OTN电层线性保护倒换机制可分为ODUk层线性1+1、线性1∶1、线性1∶n和线性m∶n保护倒换结构。
OTN电层环形网保护指基于ODUk的共享环网保护, 受保护的子网络连接是两个终结连接点之间的完整端到端网络连接。环网结构中的工作通路和保护通路可在同一根光纤中,也可在不同的光纤中, 具体方式可由用户配置指定。ODUk环网保护仅支持双向倒换,保护粒度为ODUk。OTN电层环网保护分为双纤ODUk共享环网保护和四纤共享环网保护。
2.2 光层保护
OTN光层线性保护包括光通路线性保护和光复用段线性保护。光通路线性保护是指在光波长层面采用的子网连接保护, 是一种专用端到端的保护机制,可用于网状网、环网或混合结构的物理拓扑,通过光通路保护单元的双发选收或选发选收功能,利用不同的光纤或同一光纤中不同波长等对业务提供保护。光复用段线性保护是指通过光复用段保护单元的双发选收或选发选收功能,利用相同或不同光缆中的一对光纤,对合波后的光复用段信号提供保护,其中,光复用段保护单元在合分波器与光放大器之间为类型I,光复用段保护单元在光放大器与光纤之间为类型II。OTN光层线性保护从倒换结构上可以划分为线性1+1、线性1∶1、线性1∶n保护倒换。
OTN光层环网保护包括通路环网保护和光复用段环网保护。OTN光通路环网保护指基于波长的共享环保护,工作波长和保护波长可在同一根光纤中,也可在不同光纤中, 具体方式可由用户配置指定。光通路环网保护支持双向倒换,保护粒度为波长,在业务上下节点发生保护倒换动作。OTN光复用段环网保护指基于复用段的共享环保护,工作路径和保护路径的一对光纤可在同一根光缆中,也可在不同光缆中,具体方式可由用户配置指定。光复用段环网保护支持双向倒换。
3 数据网故障恢复
3.1 故障恢复过程
当网络发生链路故障时,与故障链路相连的网络设备及时探测到故障并更新到备用链路重新进行流量转发过程即为网络故障恢复过程。
网络检测到故障后,并不是立即扩散路由信息并进行路由计算,数据网络一般会启用FRR(在MPLS的环境下,一般会启用MPLS FRR/MPLS TE FRR)机制,首先倒换到备用路由进行流量转发,然后全网路由重新收敛,在此期间使用备份路由转发。启用FRR后,倒换到备用路由时间一般可在50 ms之内,这样数据网故障恢复的关键就在于快速故障检测。
如果通过链路层来进行故障检测,那么链路层协议不同,故障检测时间也不同。例如链路层协议为POS时,可以在50 ms内检测到链路故障;而当两台路由器通过以太网相连时,如果一台路由器接口状态为Down,而另一台路由器接口状态仍为Up时,只能通过协议自身握手机制来检测链路故障。IS-IS通过Hello报文进行链路故障检测,故障检测时间在1 s以上,无法满足快速收敛(ms级)要求,而在以太网链路上启用BFD机制,就能完成快速故障检测。
3.2 BFD协议
BFD提供一种通用的、标准化的、协议无关的快速故障检测机制,为各上层协议如路由协议、MPLS等统一地快速检测两台路由器间双向转发路径的故障。
BFD在两台路由器上建立会话,用来监测两台路由器间的双向转发路径,为上层协议服务。BFD本身并没有发现机制,而是靠被服务的上层协议通知其该与谁建立会话,会话建立后如果在检测时间内没有收到对端的BFD控制报文则认为发生故障,并通知被服务的上层协议,上层协议进行相应的处理。
由于BFD报文的标准与协议无关,可以通过硬件芯片处理BFD探测报文的收发,提高报文的收发速度以及探测速度,实现50 ms以内的快速故障探测。
BFD控制报文包括强制部分和可选认证部分。强制部分格式如图1所示。
图1 BFD控制报文强制部分
可选认证部分格式如图2所示。
图2 BFD控制报文可选认证部分
控制报文各字段的含义如下:
*Vers:BFD协议版本号,目前为1;
*Diag:诊断字,标明本地BFD系统最后一次会话Down的原因;
*Sta:BFD本地状态;
*P:如果标记该标志,表示参数发生改变或发送系统进行连接时,请求对方立即进行确认和响应。否则,不请求对方进行确认和响应;
*F:响应P标志置位的回应报文中必须将F标志置位;
*C:转发/控制分离标志,一旦置位,控制平面的变化不影响BFD检测,如:控制平面为ISIS,当IS-IS重启/GR时,BFD可以继续监测链路状态;
*A:认证标识,置位代表会话需要进行验证;
*D:查询请求,置位代表发送方期望采用查询模式对链路进行监测;
*R:预留位;
*Detect Mult:检测超时倍数,用于检测方计算检测超时时间;
*Length:报文长度;
*My Discreaminator:BFD会话连接本地标识符;
*Your Discreaminator:BFD会话连接远端标识符;
*Desired Min Tx Interval:本地支持的最小BFD报文发送间隔;
*Required Min RX Interval:本地支持的最小BFD接收间隔;
*Required Min Echo RX Interval:本地支持的最小Echo报文接收间隔(如果本地不支持Echo功能,则设置0);
*Auth Type:认证类型,目前协议提供有Simple Password,Keyed MD5,Meticulous Keyed MD5,Keyed SHA1和Meticulous Keyed SHA1;
*Auth Length:认证数据长度;
*Authentication Data:认证数据区。
4 铁路OTN网络建设
4.1 OTN网络架构
目前铁路光传送网网络结构分为骨干层、汇聚层(局内干线)和接入层。骨干层传输网主要完成各路局至铁路总公司、路局之间业务的传送及调度,并为铁路局组网提供迂回保护通道。汇聚层(局内干线)传输网主要完成局内骨干节点之间业务传送,实现业务从接入层到路局内骨干节点汇聚。接入层传输网则提供丰富的业务接口,实现多种业务的接入,为路局内各种接入业务提供通道。
4.2 OTN网络保护方式
铁路骨干层OTN网络在电层面,承载IP数据业务的子波启用ODUk SNCP的保护方式,承载SDH业务的子波启用SDH自有的环网保护。在光层面,敷设2条光缆的铁路线,启用OLP 1+1保护方式(光复用段线性保护类型II)。对于2条光缆敷设时间间隔较长、光缆指标相差较大区段,则采用OMSP保护(光复用段线性保护类型I)。汇聚层(局内干线)OTN网络在电层面,承载SDH业务的子波启用SDH自有的环网保护。承载IP数据业务的子波,则根据各路局的实际情况,启用或不启用ODUk SNCP保护方式。在光层面,由于路局光缆条件不一,除客运专线外,大多数铁路两侧的光缆敷设时间不一致,因此各路局根据光缆情况决定是否启用OLP保护方式。
5 铁路数据网建设
5.1 数据网网络构架
铁路数据网分为骨干网络和各铁路局区域网络2级结构。铁路总公司作为骨干网汇接节点,北京、西安、武汉、上海、成都作为骨干网转发节点、各路局设置骨干网接入节点。北京、西安、武汉骨干网转发节点间组成半网状连接,相邻转发节点互联,各转发节点与铁路总公司节点直接互联,骨干网接入节点同时与两个大区转发节点互联。骨干网节点间采用10 GE接口互联。骨干数据网由铁路骨干层OTN网络承载。
铁路局区域网络由核心节点(铁路局所在地)、汇聚节点和接入节点组成。对于汇聚节点到核心节点间、接入节点到汇聚节点间的连接,在城域范围内或有需求的节点,采用环形或星形方式接入上层节点,在铁路沿线范围,采用链型双归方式接入上层节点。目前,随着铁路局局内OTN网络的建设,数据网汇聚节点到核心节点间、接入节点到汇聚节点间的连接链路,主要由局干OTN网络或MSTP传输系统(GE接口)提供,同城链路及接入节点间的链路直接承载在光纤上。
5.2 数据网故障恢复
随着铁路OTN网络的建设,铁路数据网主要由OTN网络和光纤承载。铁路骨干数据网,对于OTN承载数据网的10 G链路,数据网路由器10 GE接口的成本为10 G POS接口成本的40%~50%,而目前的OTN设备的10 G和10 GE接口成本差别不大,因此一般采用10 GE接口类型。铁路局区域网络,主要以GE链路为主。
为保证数据网对业务承载的可靠性,针对网络故障恢复,在其关键过程启用了BFD完成快速链路故障探测;并先期在骨干网络转发节点间进行了MPLS-TE FRR部署,在积累运维经验后进一步结合多种技术,优化数据网对业务的承载。
6 铁路数据网故障恢复与OTN网络保护间协调策略
OTN承载数据网络,主要链路类型为10 GE、GE,这样,数据网启用了BFD协议实现快速感知链路故障。当链路故障时,采用首先启用OTN保护机制,再启用数据网故障恢复机制的原则。
不启用BFD时,当OTN链路出现故障,OTN设备在50 ms内完成倒换,对IP业务没有影响;当OTN链路出现故障,而OTN保护无法处理时,数据网会自己完成故障恢复,但恢复时间较长,一般大于1 s。
启用BFD时,当OTN链路出现故障,OTN进行保护倒换,但因数据网的故障恢复时间变短,有时会出现OTN和数据网同时进行链路倒换情况。这样就需要OTN网络保护机制、数据网故障恢复机制协调配合来共同保证数据网业务的可靠性。
6.1 铁路数据网故障恢复与OTN单层网络保护间协调策略
在OTN网络对于数据业务采用ODUk SNCP 或OLP或OMSP单层网络保护机制时,OTN系统完成对故障的保护倒换总体时间包括检测时间(目前铁路OTN网络均采用1+1单向倒换的保护,检测时间在10 ms以内)+保护倒换时间(50 ms)+链路传输时间(5 us/km)+设备传输延迟时间(us级,可忽略)。根据铁路数据网构架,最长链路(西安—乌鲁木齐)按3 000 km考虑,链路传输时间为15 ms, 则OTN系统完成对故障的保护倒换总体时间小于75 ms。
BFD报文的各种参数在会话建立后都可动态改变,不影响会话当前状态,其中可以动态改变的参数有:DMTI、RMRI、使能去使能ECHO功能、使能去使能查询功能、使能去使能认证等。在异步模式下,由于检测位置是在对端,所以对端计算检测时间时需要用到本端的检测倍数,公式如下:检测时间=接收的远端DM×max(bfd.RMRI,接收到的DMTI)。
为了先启用OTN保护机制,通过设置路由器的BFD时间,适当增加故障检测时间,可以保证OTN首先进行倒换并且不触发IP层的倒换机制,因此,对于BFD,可设置max(bfd.RMRI,接收到的DMTI)为40 ms,DM为3,则检测时间为120 ms,完成OTN保护与数据网故障恢复的协同工作。
6.2 数据网故障恢复与OTN多层网络保护间协调策略
在OTN网络对于数据业务将电层ODUk SNCP与光层OLP或OMSP网络保护机制同时启用时,OTN系统一般先启用光层OLP或OMSP保护,对于ODUk SNCP做拖延时间设置,一般设置30 ms~40 ms,这样,根据铁路数据网构架,最长链路(西安—乌鲁木齐)按3 000 km考虑, 则OTN系统对故障的保护倒换总体时间小于115 ms。
BFD报文的各种参数在会话建立以后都可动态改变,不影响会话当前状态,其中可以动态改变的参数有:DMTI、RMRI、使能去使能ECHO功能、使能去使能查询功能、使能去使能认证等。在异步模式下,由于检测的位置是在对端,所以对端计算检测时间时需要用到本端的检测倍数,公式如下:检测时间=接收的远端DM×max(bfd.RMRI,接收到的DMTI)。为了先启用OTN的保护机制,通过设置路由器的BFD时间,适当增加故障检测时间,可以保证OTN首先进行倒换并且不触发IP层的倒换机制,因此,对于BFD,可设置max(bfd. RMRI,接收到的DMTI)为60 ms,DM为3,则检测时间为180 ms,完成OTN保护与数据网故障恢复的协同工作。
7 结束语
当数据网由OTN网络承载时,由于OTN网络保护倒换时间较短,当链路出现故障,一般采用首先启用OTN保护机制原则。在具体工程应用中,要综合考虑OTN各种保护方式及多层保护同时启用的情况,采用有效策略做好与数据网故障恢复机制的协调,以保证数据网业务的可靠性。
[1]李允博.光传送网(OTN)技术的原理与测试[M].北京:人民邮电出版社,2013.
[2]中华人民共和国工业和信息化部.YD/T 1990-2009 光传送网(OTN)网络总体技术要求[S].北京:人民邮电出版社,2009.
[3] RFC 5881 Bidirectional Forwarding Detection (BFD) for IPv4 and IPv6 (Single Hop)[S].
Based on the research on the fault recovery technology of railway data network and OTN network protection methods, the paper analyzes and discusses the coordination strategy between fault recovery of railway data network and OTN network protection methods considering the current construction situation of railway data network and OTN network.
fault recovery; protection; coordination strategy
10.3969/j.issn.1673-4440.2015.03.008
2015-04-01)
中国铁路总公司科技研究开发重大课题项目(BK-2013X003-A1-1)