数据中心间光互联网络中的跨层动态保护策略
2018-06-14李志强杨娅娅
熊 余, 李志强, 杨娅娅
(重庆邮电大学 光通信与网络重点实验室,重庆 400065)
在云计算推动下,传统的网络架构逐渐向以数据中心为核心的数据中心网络演进.由于数据中心之间数据备份及数据同步等需求愈发迫切,亟需通过高效的传输网来满足数据中心间的互联需求.光网络凭借大容量、高带宽、低时延等优势成为互联数据中心的最佳选择.显然,互联数据中心的光网络上承载有海量的数据业务,这对网络的可靠性提出巨大挑战.保护技术以网络冗余为代价实现了故障业务的快速恢复,是提高网络可靠性的重要手段.但是数据中心间光互联网络属于典型的跨层系统,其底层是连接数据中心的光网络,上层是由基于数据中心业务服务构成的IP网络[1].因此,如何结合数据中心间光互联网络的结构特点和业务特点,实现层间信息交互并设计高效跨层保护策略,是需要重点研究的问题.
针对跨层保护问题,最早基于通用多协议标志交换协议(Generalized MultiProtocol Label Switching,GMPLS)光控技术文献[2]在IP over波分复用(Wavelength Division Multiplexing,WDM)中提出跨层保护算法,通过GMPLS协议作为IP层和光层沟通的桥梁,提高了网络利用率和传输可靠性.近年来,弹性光网络(Elastic Optical Network, EON)的出现打破了WDM光网络粗糙的光层资源分配方式,将光层的带宽分配粒度降低到子载波信道的亚波长量级,大大提高了网络的带宽利用率和灵活性[3].文献[4]提出了IP over弹性光网络中基于业务疏导的共享保护策略,仿真表明,所提策略可以有效提高网络的资源利用率.与此同时,软件定义网络(Software Defined Network, SDN)作为新一代管控技术,凭借其集中控制的优势被引入到光网络中[5].其弹性管道、即时带宽和可编程控制等特性,能够满足未来光网络发展的需要.文献[6]基于软件定义光网络(Software Defined Optical Network, SDON)场景,提出一种IP over Optical的多层弹性架构和资源整合图策略,通过IP层控制器与光层控制器之间的交互,实现了层间的信息共享和资源的统一调度,有效提升了网络的可靠性.本项目组前期也针对SDON中的可靠性进行过研究,提出控制器部署算法和跨层生存性算法,增强了网络控制平面的可靠性[7].以上研究虽然提高了网络可靠性,也对跨层保护有初步研究,但未考虑业务的多样性问题.数据中心间由于业务的多样性,不同业务的可靠性需求将各不相同.用户可根据自己的需要,向服务提供商购买符合自身需求的网络服务.一般地,用户和网络提供商之间会签订服务等级协议(Service Level Agreement, SLA),若出现违背协议的情况,网络提供商将向用户支付大量的赔偿[8].可见,针对数据中心间光互联网络这一重要场景,面向业务本身提供可靠性的保护尤为重要.文献[9]提出一种生存性自适应保护策略,该策略将业务分为3个等级并提供不同的保护方案.仿真表明,所提策略有效提升了资源利用率,但是其并不能保证业务的可靠性要求.文献[10]根据业务的重要程度,为业务设置n条保护光路来达到业务所需可靠性,其中n的值由业务的重要程度决定.以上研究虽然保证了用户对可靠性的要求,但在业务持续时间内,保护光路始终存在且所占资源无法被其他业务利用.而由于数据中心间的业务具有大带宽的特性,这将导致大量网络资源在整个业务持续时间都被占用,过多的保护开销严重降低了网络资源利用率.
为此,为了在保证业务可靠性需求的同时降低保护开销,文中提出了带有可靠性感知的跨层动态保护策略(Reliability-aware Cross-layer Protection Strategy, RCPS).首先,建立软件定义的IP over弹性光网络架构,通过控制器间的信息交互实现跨层的可靠性感知,使光层控制器充分了解业务的实时可靠性.然后光层控制器根据业务实时可靠性的变化情况,利用最小资源占用块释放方法调整光层的保护资源,从而在充分保证业务可靠性的前提下达到降低保护开销的目的.
1 软件定义IP over弹性光网络架构
软件定义IP over弹性光网络打破底层光网络简单作为IP承载层的局限,将IP层与光层设备中的控制平面抽离出来,形成各自独立的控制器,然后通过控制器间的协同工作实现两层间的流量调度、路径计算、保护协作等功能,从而在全网对两层进行资源优化.在此基础上对网络架构进行重新设计,如图1所示.该架构包括IP层和光层,每一层的资源都由该层控制器集中管控.IP层控制器的功能包括:通过相应的接口与IP层OpenFlow使能的路由器(OF-Router)相连,负责收集IP网络拓扑;通过业务请求接口来接收数据中心间业务请求,实时监测业务的状态并向光层控制器发送资源调度信息.光层控制器的功能包括:与光层OpenFlow使能的带宽可变光交叉连接器(OF-BVOS)相连,负责收集光网络拓扑、光层资源使用情况等;向上层的IP控制器提供资源调度接口,接到IP控制器的资源调度信息后调用底层的弹性光网络资源来满足上层业务需求.
2 跨层可靠性感知的实现
定义1 网络元件的可靠性r,即在整个服务时间内底层物理链路正常工作时间所占的比例,如式(1)所示.
r=tMTBF(tMTBF+tMTTR) ,(1)
其中,tMTBF表示平均无故障时间,tMTTR表示平均故障修复时间.由此得到一条物理路径的可靠性如式(2)表示.
(2)
其中,rj表示第j条链路的可靠性,G表示该条路径的链路集合.同理,多条路径的联合可靠性可以由式(3)来计算.
(3)
其中,Ri表示第i条路径的可靠性,Q表示n条路径的集合.
定义2 业务的可靠性要求Rd,即在业务请求时间内被正常服务时间所占的比例.业务的可靠性要求是SLA中最重要的服务质量衡量指标,如式(4)所示:
Rd=TwTd=Tw(Tw+Tf) ,(4)
其中,Tw表示业务请求持续时间中正常工作时间,Td表示业务请求持续时间,包括Tw和业务所能容忍的故障时间Tf.
图2 跨层可靠性感知的信息交互流程
在软件定义IP over弹性光网络架构中,IP层控制器和光层控制器通过扩展的OpenFlow协议分别掌握各层的全局信息.通过控制器之间的信息交互,实现光层即时感知IP层业务的可靠性需求,并根据业务的实时可靠性变化动态调整光层网络资源,达到提高网络资源利用率的目的.其跨层可靠性感知流程如图2所示.首先,当业务到来时,IP层控制器对PACKET_IN消息进行分析处理,获知业务基本信息.然后将这些信息发送给光层控制器.光层控制器收到IP层发送的消息后,在光层为业务寻找满足其可靠性要求的光路(包括工作光路和保护光路),并向相关的光交换机发送FLOW_MOD信息,完成建路过程.为充分满足业务的可靠性需求,这里的保护光路可能有多条.建路完成后,光层控制器将为业务分配的工作光路和保护光路的信息发送给IP层控制器.在业务正常传输期间,IP层控制器监测业务实时状态,并判断是否对保护光路进行释放,如果达到释放底层光路的条件,则IP层控制器将释放保护光路的信息发送给光层控制器.光层控制器接到信息后,向相应的光交换机发送拆除冗余保护光路的信息,释放的光路资源可以被其他的业务利用.
3 保证可靠性的跨层动态保护
为满足IP层业务对可靠性的要求,传统可靠性保护一般在整个业务请求的持续时间内,保护光路始终存在且所占的资源无法被其他业务利用.在数据中心业务大带宽的特点下,这种做法导致大量冗余网络资源在业务持续时间内被占用,严重降低网络资源利用率.而实际上这样是没有必要的.为此,这里给定一个数据中心间业务请求r(s,d,φ,R,Td),其中s和d为业务的源目节点,φ代表业务的带宽请求,R表示业务的可靠性需求,Td表示业务的持续时间.如果业务已经被服务了一段时间ξ,而这段时间内没有中断发生,那对于网络提供商来说,只需保证在业务请求剩余的时间Td-ξ内可以有Tw-ξ的正常工作时间即可[11].下面给出实时可靠性的定义.
定义3 实时可靠性R*,即在业务被正常服务期间,从某一时刻起到业务结束这段时间内,网络提供商为保证SLA要求而至少需要为业务提供的可靠性称为业务在该时刻的实时可靠性,如式(5)所示.
R*=(Tw-ξ)((Tw+Tf)-ξ) .(5)
图3 不同释放顺序下的资源占用块
由式(5)易知,随着时间ξ的增加,业务的实时可靠性是下降的.也就是说,随着业务被正常服务时间的增加,网络提供商可以降低为该业务提供的可靠性,而这并不影响服务的SLA质量.这就为利用实时可靠性来降低网络保护开销提供了契机.根据上节所述跨层可靠性的信息交互可知,光层控制器可以时刻感知业务的实时可靠性变化.在此基础上,随着业务实时可靠性下降,如果在一定时刻,释放某一条保护光路后,业务的实时可靠性仍可以被满足,则释放该条保护光路.但是在释放保护光路时,由于保护光路的可靠性以及带宽不相同导致不同的释放顺序下保护光路的持续时间也不一样,因此,对网络资源的消耗是不一样的.如图3所示,同一个业务请求在不同的保护光路释放顺序下(假设保护光路1的可靠性大于保护光路2,带宽大小相同),右边的释放顺序在业务持续时间内对网络资源的占用较少.由此看来,选择合适的释放顺序可以进一步提高网络的资源利用率,为此拟设计最小资源占用块释放方法来对冗余的保护光路进行释放.
定义4 资源占用块(Resource Occupation Block, ROB),即光路在持续时间内对资源的占用情况,用频谱和时间的乘积来衡量.
LROB=BT,(6)
其中,B表示光路的带宽,T表示光路的持续时间.因此,一个业务的资源占用块可以用式(7)表示.
(7)
一个业务的ROB越小,表示该业务在其持续时间内占用网络资源越少,网络的资源利用率越高.从图3可以看出,由于保护光路的释放顺序不同,导致在左边的释放顺序下业务的ROB要大于右边业务的ROB.由此看来,不同的光路释放顺序影响到业务的ROB大小.尤其是在数据中心间业务的大带宽特性下,其影响将更大.为了选择合理的保护光路释放顺序,达到更好的资源利用率,最小资源占用块(MinROB)释放方法的步骤如下:
步骤2 根据式(5)及每条保护光路的可靠性,可以得到不同释放方案中每条保护光路何时可以释放(即保护光路的持续时间),然后利用式(7)计算每一种释放方案中业务的RROB大小.
利用MinROB释放方法可以最小化业务在其持续时间内对资源的占用,有效提高网络的资源利用率.在此基础上结合定义3中业务的实时可靠性,提出带有可靠性感知的跨层动态保护策略,其具体步骤如下:
步骤1 当一个业务请求到来时,IP层的控制器首先对业务进行分析处理,掌握业务的源目节点、带宽大小、业务持续时间以及可靠性需求等信息.
步骤2 IP层的控制器将业务基本信息发送给底层的光层控制器,光层控制器在接到IP层控制器发来的信息之后,首先根据其源目节点和带宽大小,在底层的弹性光网络中利用k最短路径算法找到k条链路分离的光路,并按可靠性下降的顺序排列.如果不存在可行的光路,则阻塞这个请求;否则,转步骤3.
步骤3 判断k条光路中可靠性最大的光路是否可以满足业务的可靠性需求,如果可以满足可靠性要求,则选择可靠性最大的光路作为工作光路,且不为其设置保护光路,转步骤6;否则,转步骤4.
步骤5 随着业务被正常服务时间的增加,按照MinROB释放方法中的光路释放顺序,根据业务实时可靠性的下降,IP层控制器告知光层控制器,动态地对保护光路进行逐一释放,直至只剩下工作光路.
步骤6 工作光路一直持续到业务结束,如果在此期间工作光路发生中断,则选择对业务重路由,转步骤1.
4 仿真分析
采用floodlight+mininet作为仿真平台,在NSF网络(14节点,21条链路)及COST239网络(11节点,26条链路)进行仿真.在NSF网络中,数据中心部署在节点0、5和8上[13]; 在COST239网络中,数据中心部署在节点2、5和8上[13].假设每条光纤链路上有400个频隙,每个频隙的带宽为 12.5 GHz.业务带宽请求在 [12.5 Gb/s,100 Gb/s] 上服从均匀分布,为业务进行频谱分配时使用首次命中算法[10].业务请求到达的速率服从参数为β的泊松分布,业务持续时间服从均值为 1/μ的指数分布,网络中总负载为 (β/μ) Erlang,仿真时,μ取值为1.底层弹性光网络中链路的可靠性均为0.99,业务的可靠性需求在[0.980,0.999]上服从均匀分布.
为衡量所提RCPS策略的性能,选择传统的专有通道保护(Dedicated Path Protection, DPP)策略、文献[9]所提的生存性自适应(Adaptive Survivability Approach, ASA)保护策略及文献[10]所提的多路径保护(MultiPath Protection, MPP)策略作为对比.其中,DPP策略在工作光路的可靠性无法满足业务要求时,最多为其分配一条保护光路,并不保证业务的可靠性.ASA策略将业务分为3个等级,对高等级的业务采用专有保护,中等级的业务采用压缩带宽专有保护,低等级的业务不设置保护.而MPP策略充分满足业务的可靠性要求,对于可靠性要求较高的业务,为其分配多条保护光路,但在业务的持续时间内保护光路上的资源始终被占用.图4是在两种网络拓扑下,所提RCPS策略同两种对比策略的可靠性满足率(Reliability Satisfaction Ratio, RSR)对比情况,可以看到,RCPS策略和MPP策略的RSR都是100%,而DPP策略和ASA策略的RSR较低且随着网络负载的增加略有下降.
图4 可靠性满足率对比情况
图5为两种网络拓扑下,所提RCPS策略同两种对比策略在保护开销(Protection Overbuild, PO)上的对比情况,其中PO为保护光路占用资源和工作光路占用资源的比值.MPP策略选择为业务设置多条保护路径来满足可靠性要求,对于优先级较高的业务可能存在多条保护路径,故MPP的PO最高.而DPP策略最多为业务设置一条保护路径,当工作光路的可靠性满足业务的需求时,不为业务设置保护路径,故DPP的PO在1附近且略低于1.ASA策略只对优先级高的业务设置一条保护路径,对于中等优先级的业务采用压缩专有保护,不重要的业务不设置保护,故其PO要小于DPP策略.RCPS策略的PO最低,甚至比MPP节省了约49%的保护开销,这是因为RCPS策略采用了动态保护策略,虽然也采取设置多条保护光路来充分满足业务的可靠性需求,但是随着业务的实时可靠性下降,可以动态释放冗余的保护光路,因此,有效地减少了PO.
图5 保护开销对比情况
图6为所提RCPS策略同3种对比策略在带宽阻塞率(Bandwidth Blocking Ratio, BBR)上的对比情况.同时为了说明MinROB释放方法的合理性,这里对RCPS without和RCPS也进行了对比,其中RCPS without表示保护光路按随机顺序进行释放.随着网络负载的增加,4种策略的BBR都随负载的增加而增加.因为MPP需要确保业务所需的可靠性得到满足,对于可靠性要求较高的业务,要消耗更多的保护资源,因此,BBR最高.而DPP策略最多为业务设置一条保护路径,所以BBR低于MPP策略.ASA策略的保护开销小于DPP策略的,所以其阻塞率也要小于DPP策略的.RCPS策略和MPP策略一样,需要确保业务的可靠性得到满足.但是随着业务的正常传输,业务的实时可靠性需求在下降,此时可以动态释放冗余的保护路径,因此,网络中将会有更多可用资源用来成功建立业务请求,从而减少被阻塞的业务请求数量.与MPP策略相比,RCPS策略阻塞率降低了约58%.RCPS without和RCPS两种策略中RCPS的BBR较低,这是因为MinROB释放方法可以进一步减少业务在持续时间内占用的网络资源,与随机顺序释放保护光路相比,有更多的可用资源来承载新到来的业务,从而取得更小的网络阻塞率.
图6 阻塞率对比情况
5 结 束 语
为了使业务所需的可靠性得到充分满足,同时最小化保护开销,文中提出了带有可靠性感知的跨层动态保护策略.该策略首先建立IP over弹性光网络架构,通过IP层和光层设置各自的控制器来实现对网络状态的全局掌握; 其次,在IP over弹性光网络架构中,通过控制器间的信息交互,实现跨层可靠性感知,使光层了解业务的实时可靠性;最后,提出RCPS策略,光层控制器根据业务的实时可靠性的变化,在不违背SLA的前提下,利用MinROB方法动态地释放冗余的保护光路.仿真试验表明,在保证业务的可靠性得到满足的前提下,相对于MPP策略所提RCPS策略的保护开销降低了49%,同时网络阻塞率降低了58%.
[1] YANG H, ZHAO Y, ZHANG J, et al. Multi-stratum Resilience with Resources Integration for Software Defined Data Center Interconnection Based on IP over Elastic Optical Networks[C]//Proceedings of the 2014 European Conference on Optical Communications. Piscataway: IEEE, 2014: 6964052.
[2] YE Y, ASSI C, DIXIT S, et al. A Simple Dynamic Integrated Provisioning/Protection Scheme in IP over WDM Networks[J]. IEEE Communications Magazine, 2001, 39(11): 174-182.
[3] XIONG Y, FAN X, LIU S. Fairness Enhanced Dynamic Routing and Spectrum Allocation in Elastic Optical Networks[J]. IET Communications, 2016, 10(9): 1012-1020.
[4] TANG F, LI L, CHEN B, et al. Mixed Channel Traffic Grooming in Shared Backup Path Protected IP over Elastic Optical Network[C]//Proceedings of the 2017 Optical Fiber Communications Conference and Exhibition. Piscataway: IEEE, 2017: 1-3.
[5] 左青云, 陈鸣, 王秀磊, 等. 一种基于SDN的在线流量异常检测方法[J]. 西安电子科技大学学报, 2015, 42(1): 155-160.
ZUO Qingyun, CHEN Ming, WANG Xiulei, et al. Online Traffic Anomaly Detection Method for SDN[J]. Journal of Xidian University, 2015, 42(1): 155-160.
[6] YANG H, ZHANG J, ZHAO Y, et al. Global Resources Integrated Resilience for Software Defined Data Center Interconnection Based on IP over Elastic Optical Network[J]. IEEE Communications Letters, 2014, 18(10): 1735-1738.
[7] 熊余, 董先存, 李圆圆, 等. 软件定义光网络中基于最小点覆盖的控制平面跨层生存性设计[J]. 电子与信息学报, 2016, 38(5): 1211-1218.
XIONG Yu, DONG Xiancun, LI Yuanyuan, et. al. The Cross-layer Survivable Design of Control Plane Based on Minimum Point Covering in Software Defined Optical Network[J]. Journal of Electronics & Information Technology, 2016, 38(5): 1211-1218.
[8] GAO Y, GUAN H, QI Z, et al. Service Level Agreement Based Energy-efficient Resource Management in Cloud Data Centers[J]. Computers and Electrical Engineering, 2014, 40(5): 1621-1633.
[9] AIBIN M, WALKOWIAK K, SEN A. Software-defined Adaptive Survivability for Elastic Optical Networks[J]. Optical Switching and Networking, 2017, 23: 85-96.
[10] YANG H, CHENG L, YUAN J, et al. Multipath Protection for Data Center Services in Openflow-based Software Defined Elastic Optical Networks[J]. Optical Fiber Technology, 2015, 23: 108-115.
[11] LUCERNA D, TORNATORE M, MUKHERJEE B, et al. Trading Availability among Shared-protected Dynamic Connections in WDM Networks[J]. Computer Networks, 2012, 56(13): 3150-3162.
[12] XIONG Y, LI Y, DONG X, et al. Exploiting SDN Principles for Extremely Fast Restoration in Elastic Optical Datacenter Networks[C]//Proceedings of the 2016 IEEE Global Communications Conference. Piscataway: IEEE, 2016: 7841831.
[13] MA C, ZHANG J, ZHAO Y L, et al. Bandwidth-adaptability Protection with Content Connectivity against Disaster in Elastic Optical Datacenter Networks[J]. Photonic Network Communications, 2015, 30(2): 309-320.