基于分段路由的跨域数据中心网络关键技术
2020-12-31
(西南石油大学计算机科学学院 四川 610500)
1 绪论
1.1 研究背景与意义
近年来,随着互联网和云计算等业务的飞速发展,数据中心作为云计算基础架构的也随之大规模建设和部署,而数据中心组网尤其是跨域组网也面临新的要求及挑战。
软件定义网络SDN 及软件定义广域网SD-WAN的体系结构的出现,为数据中心网络自动化、智能化的部署提供了可能。SDN 将数据中心网络的控制层面和转发层面解耦,构建了可编程的集中控制器和分布式流表转发的体系结构,该技术屏蔽了异构硬件及设备的复杂度,为上层应用提供了简单高效的配置与管理。但是基于OpenFlow的SDN技术实现为数据中心网络部署带来新的问题:对于数据流的控制粒度太小,基于流的转发方式为每一条数据流都生成一条表项,需要维持的表项结构过于庞大;集中控制器根据网络状态生成流表,同步给网络设备,网络设备再将其下发到硬件指导数据转发,从某些层面增加了处理及转发延迟;集中控制器收集网络拓扑信息然后再根据拓扑变化计算转发逻辑,会造成收敛缓慢等问题。
1.2 研究现状
随着云计算技术的发展,数据中心的网络规模也随着服务器的容量规模增多而扩大,从成本和运维角度上来看,大规模数据中心网络架构的设计必须考虑较高的服务器密度,而随着虚拟机迁移等东西向流量的日益增加,合理的数据中心网络架构的提出必须迎合上述需求、应对上述挑战。
2 相关技术介绍
2.1 分段路由技术
SR(Segment Routing)体系结构不是基于特定的网络拓扑,而是可以使用SR来优化大型数据中心网络体系结构的部署,网络体系结构可以使用SR 从“网络适配器业务”向“业务驱动的网络”演进,SR 可用于根据需要计算业务显示路径,实时动态调整前向神经网络路径。SR 具有以下基本概念:
段路由域:SR 节点的集合。
SID:即Segment ID,用于标识唯一的Segment,作为SRGB的索引,转发层可以映射到MPLS标签等。
SRGB(分段路由全局块):用户指定的为分段路由保留的全局标签集。
作为高度可扩展的路由协议,ISIS 通过使用类型/长度/值(TLV)三元组对通知信息进行编码。此外,通知使用sub-tlv(Sub TLV)将更多信息封装在TLV中。通过定义新的TLV 或扩展现有的TLV,可以轻松添加新协议的功能。ISIS SR 扩展引入了必要的TLV,可以是Prefix-SID和Adjacency-SID 附加到各种前缀和Adjacency 通知TLV。BGP 也可以用作SR,SID 平面,控制某些网络中的分发网络,特别是大型跨域数据中心网络将BGP仅用作路由协议,而BGP相对简单,其属性使BGP 路由功能可以支持流量工程的每一个飞跃,所有供应商都可以支持交易,但是实际上通过MP-BGP协议BGP 分配和单播前缀标签在当前网络中非常普遍。
2.2 IS-IS for SR
随着网络的不断发展,VoIP和在线视频等业务对实时性的要求越来越高,而IS-IS 故障恢复需要经历“故障感知、LSP 更新、LSP泛洪、路由计算和下发FIB 由这几个过程才能将流量切换到新的链路上,因此流量中断的时间远远超过了50ms,不能满足此类网络业务对实时性的要求。TI-LFA FRR 能为Segment Routing 隧道提供链路及节点的保护。当某处链路或节点故障时,流量会快速切换到备份路径,继续转发,从而最大程度上避免流量的丢失。LFA和Remote LFA对于某些大型组网,特别是P 空间和Q 空间即没有交集,也没有直连的邻居,当某处链路或者节点故障时,无法计算出备份路径,导致流量丢失,不能满足可靠性要求。这种情况下实现了TI-LFA。
3 中心网络关键技术研究
3.1 快速重路由
快速重路由(FRR)是为网络中出现链路或节点故障后的这些重要节点或链路提供备份保护,以实现快速重路由,减少链路或节点故障对流量的影响,使流量快速恢复。段路由(SR)是一种新兴的网络技术,可以应用于快速重路由方案。单链路故障时可以实现快速重路由。对于具有大量流量的网络,当多个链接同时出现故障时,将出现一些问题。最可能的问题是链路拥塞,这会导致整体网络性能下降。如果多个链路发生故障,并且仍基于下一跳选择恢复路径,则业务流量会频繁地在故障链路的两端恢复,不仅影响业务的恢复过程,而且在业务出现故障时容易造成拥塞,流量很大,而且,先前的算法可能存在一些网络拓扑的恢复路径重叠的问题。
3.2 分段路由
分段路由(Segment Routing,可以转换为指令的路由),简称为SR,是一种基于SPRING 框架,网络节点(通常为路由器或主机设备等)选择路径的源路由协议,并且引导数据包沿网络路径通过,具体的实现方法是在入口节点中按顺序插入Segment数据包头列表,以指导如何处理相应的节点并转发数据包。这种部署方法可以将整个数据中心网络简化为几个部分。由几个段构成的显示路径只需要根据上述指示转发数据包,而不需要维护大量的状态信息或转发项。通过将SR的部署模式与SDN相结合,SDN 集中式控制器只需在网络源节点或入口节点上发布相应的网段列表,就大大简化了控制级别的复杂性,并提高了相应SDN 控制器的可扩展性。但是,上述部署模式不需要控制器与所有网络节点之间频繁的交互,因此可以提高网络的收敛速度。
针对网络中多链路故障的情况下的快速重路由。该算法基于不同的服务目的地来计算其恢复路径,当受影响的服务数量较大时,可以最大限度地减少网络多链路故障引起的链路拥塞。通过应用分段路由(SR)编码恢复路径来获得分段列表,然后在分段列表中标签(分段)的指导下将受影响的业务流转发到目标。
目前,主流的数据中心网络架构是Clos网络架构,可以根据需求分为三层或两层。
4 结论
随着Internet的不断快速发展,部署在Internet上的应用程序发生了很大变化。Internet上部署的应用程序正在从非实时应用程序发展为实时应用程序(股票交易,视频流,实时通信等)。但是现在,实时应用程序可用于网络并对网络提出了更高的要求。在此之前,分组传输网络已经在运营商网络中大规模部署,以满足客户对于网络越来越高的要求。