刍议BGP/VPN快速收敛技术
2011-05-08汪小滟
汪小滟
(哈尔滨元申广电网络有限公司,黑龙江 哈尔滨150090)
1 技术简介
在一个MPLS/VPN网络中,通常在两个PE之间建立IBGP邻居,用来交换VPN私网路由,此私网路由的下一跳为PE设备;另外,还需要在物理直连的PE-P、P-P之间建立IGP/LDP邻居,从而建立外层隧道。而最终VPN路由转发表项,则需要将VPNBGP路由的远端下一跳和IGP/LDP外层隧道进行迭代,生成最终的VPN FIB表项,以此来指导PE设备上VPN业务的转发。
当MPLS/VPN网络中发生各种故障后,首先进行公网IGP/LDP路由的收敛,这个收敛在使用IGP/LDP快速收敛技术后,通常可以达到200ms-800ms左右的收敛速度。IGP/LDP收敛之后,新的外层隧道生成,同时原先旧的外层隧道删除,此时所有的BGP/VPN路由需要重新迭代一次,迭代到新的外层隧道后,下发到转发平面,此时VPN业务才能最终收敛。这个收敛迭代时间和VPN的路由数目成正比关系。在VPN路由数目比较多的情况下,通常需要几秒甚至几十秒钟才能完成。
2 关键技术
2.1 P设备IGP/LSP更新
在MPLS/VPN网络中,当P-P链路发生故障时。由于先向PE发送了一个LSP撤销消息,然后再发送新的更新的LSP。这样的过程导致了PE设备公网LSP隧道变化,所以必然要进行一次VPN路由迭代。
新的P设备IGP/LSP更新技术解决了这个问题。在P1设备上,由于使用了IGP/LSP更新技术,IGP/LDP收敛均使用收敛后的新路由直接替换原先的老路由,所以不再向上游的PE设备发送LSP删除以及更新消息,上游的PE设备没有收到影响,所以无需进行VPN路由迭代,这样当P1设备上完成IGP/LDP收敛之后,VPN业务即完成收敛。这样在P-P链路故障,或者P设备故障(不引发PE-P链路故障)的情况,VPN业务端到端收敛时间完全取决于公网IGP/LDP收敛速度,而这个时间通常是200ms-800ms。
2.2 VPN按需迭代
当PE-P链路发生故障后(包括PE设备故障,以及P设备故障引发的PE-P链路故障),由于去往远端PE的LSP发生了故障,所以本地VPN路由需要重新迭代,但并不是所有本地VPN路由都需要迭代,假设PE2-P2链路发生故障,此时PE2至PE1、PE5、PE6的外层隧道没有任何变化,而PE至PE3、PE4的外层隧道则需要重新计算,生成新的LSP。
针对这种情况出现了VPN按需迭代技术。将所有的BGP/VPN路由按照不同的远端下一跳(即不同的PE)分别建立不同的队列,当公网隧道发生变化的时候,只需要对发生变化的外层隧道的BGP/VPN路由进行迭代即可,其他不受影响的VPN路由则无需迭代,这样往往可以节省大量的时间,从而加快网络收敛速度。
2.3 VPN按照优选级的按需迭代
在多业务MPLS/VPN承载网络中,通常会有很多VPN,这些VPN业务有实时类业务,也有非实时类业务,所以它们的收敛速度和要求是有所区别的。针对这种情况,VPN按照优先级的按需迭代功能则能很好的适应和满足这种需求。
2.4 VPN下一跳分离
VPN下一跳分离技术的实现原理在转发平面,将VPN路由转发表按照VPN路由的远端下一跳做分离,将原先的一个VPN路由表分离成两张表,首先查找VPN路由表,查找出远端下一跳,然后再通过远端下一跳查出直连下一跳。当公网发生故障后,公网IGP/LDP收敛,针对每个远端下一跳,直接将原先老的LSP1删除,替换为新的LSP2,这样所有的VPN都会按照新的LSP2进行转发。这样VPN路由不再需要迭代,当IGP/LSP收敛后VPN路由可以立即收敛,即使得VPN路由的收敛速度提升到IGP/LSP收敛的级别上来。
2.5 VPNFRR
VPNFRR技术实现原理如下:对于同一个VPN路由前缀在转发平面同时安装了主用路由和备用路由,同时使用快速检测机制检测主用路由外层隧道状态。一旦检测到某个外层隧道失效,则直接使用备用路由进行报文转发。由于备用路由已经安装在转发表中,所以VPN路由的收敛时间主要取决与外层隧道状态的检测时间。其中对于外层隧道状态检测技术的不同,VPNFRR又可以分为BFD触发的VPNFRR和IGP触发的VPNFRR。其中BFD触发的VPNFRR技术,使用BFD进行外层隧道状态检测,这种方法的优点是检测速度比较快,通常可以做到200ms-500ms,不足点在于,需要整网配置多跳BFD;IGP触发的VPNFRR技术中,当网络发生故障后,IGP/LDP重新收敛,收敛之后即可得知原先的外层隧道失效,此时即可将转发平面中的外层隧道状态置为无效,触发VPN路由切换到备用路由上去。
VPNFRR技术除了可以用来进行PE节点故障保护之外,同时也可以进行PE-P链路、P-P链路、以及P设备故障保护。假设在PE1上部署VPNFRR,其中主用外层隧道为LSP1(去往主用PE3),备用隧道为LSP2(去往备用PE4)。当P1和P2之间链路故障后,检测到LSP1故障,触发VPNFRR切换,流量切换到LSP2上。此后VPN重新迭代,重新迭代生成主用LSP3、备用LSP2的新的VPN路由,流量重新切回到LSP3上来。其中从LSP1切换到LSP2是一个VPNFRR切换过程,而LSP2切回到LSP3是一个路由更新不会造成丢包。因此VPN FRR技术完全可以做到端到端的VPN业务的保护。
2.6 BGP/VPN快速收敛技术总结
下面用一个表格,将这些技术使用的场景、需要的收敛时间,以及需要的网络拓扑做一个综合比较。
BGP/VPN快速收敛比较表
结束语
MPLSVPN作为多业务承载网络的基础,其中BGP/VPN路由的收敛速度当前已经成为端到端业务收敛的瓶颈,而一系列BGP/VPN快速收敛技术的提供必然会大大提高业务保护能力,提高网络的可靠性。使MPLSVPN网络成为语音、视频、数据业务的可靠、高效、易扩展的多业务承载网络。
[1]钟晓莉,马跃,王炜.MPLS/BGPVPN 体系结构关键特性的研究.中国通信学会信息通信网络技术委员会2003年年会论文集,2003-09-01.