4G/5G融合网络下基于SDN控制器的流量动态调度策略
2021-05-28
(中国移动通信集团广东有限公司,广东 广州 510623)
0 引言
5G网络必须支持多样化的多媒体应用,具有更高的数据峰值、更低时延、更强的室内覆盖和更高的能源利用效率,上述的变化将会对核心网的资源调度带来更大挑战。软件定义网络的技术为5G核心网的资源动态调度带来机遇,其将数据平面和控制平面进行分离,并利用集中控制器采用软件的方式来管理服务器集群的负载均衡和链路负载均衡,在庞大的服务器集群间提供高效的互联互通方法,实现网络资源的共享和灵活分配。Jin等人[1]采用一种可扩展的服务策略来实现核心网交换机流量的聚合;Basta等人[2]将NFV和SDN的技术应用到移动核心网的网关中,SDN将移动网络控制面和数据面进行分离,NFV将网络功能以实例的方式在数据中心上运行,提升了网络的可扩展性和灵活性;Nguyen等人[3]将不同网络制式进行分组并划分成不同的控制平台,以此提高核心网的网络资源利用率,降低部署和运营成本。针对前面学者所提出5G核心网新架构的相关研究,后面的学者开始研究基于5G核心网架构下的切片管理、链路状态和基于网络拓扑的路由规划资源管理方式,分别有:Guan等人[4]提出一个快速部署的端到端网络切片模型,借助虚拟网络功能将切片结果映射到基础设施上;董旭[5]提出基于端到端网络切片动态资源优化算法实现对资源的灵活管理;Devlic等人[6]提出基于一种网络切片管理和编排的框架,旨在实现网络切片的自动化管理和编排,该架构在多个制式核心网资源中自动实现切片的自动设计、部署、配置等生命周期管理,能够管理多制式的核心网功能和基础设施资源,以细粒度的方式实现网络切片的资源配置,提高资源利用率;吴艳[7]提出一种基于流量分类的智能SDN路由优化技术,通过对流量分类模型确定业务的QoS等级后,采用强化学习的方法实现动态路由路径规划,能够提升网络吞吐量和用户服务质量;农黄武等人[8]提出一种基于链路流量负载均衡的多路径路由规划算法,通过比较所有可以转发流量的路径及各路径的瓶颈链路负载,选择一条最小负载的路径进行流量转发;徐军[9]采用机器学习的方法判断数据流的特征,基于流的优先级别和网络资源的状态实现最优路径的选择;Azzouni等人[10]提出一种基于神经网络的动态路由方法,综合链路流量矩阵估计、链路流量矩阵预测和流量路由等数据来实现路由路径的选择,该方法为:基于链路流量分布预测下一周期链路流量,结合核心网每一条链路的负载状态、瓶颈链路负载和业务的QoS指标要求,选择路由最优路径。
上述文章往往采用最小代价法来实现路由路径的优化,很少考虑到业务流量对带宽的要求,也就是很少参考整个网络流量状态、链路可用率、服务器性能可用率以及当前流量对带宽要求来实现路由路径的优化。鉴于此,本文在衡量网络流量分布的基础上,考虑网络流量分布不均衡的特点,结合现有链路可用率和服务节点可用率来选取网络可用路径;在此基础上,结合用户业务QoS的指标要求,以路径时延最小化为目标优化核心网路由选择策略,旨在提高融合网络的平均链路利用率和吞吐率降低网络拥塞。
1 基于SDN控制器的流量动态调度策略
基于SDN控制器的流量动态调度策略是综合考虑网络流量、链路可用率和服务器节点可用率等因素后,结合业务QoS指标要求和路径时延最小化原则实现路由策略的优化,最终实现全局范围内的网络负载均衡,提升网络吞吐量和网络拓扑的流量分布水平,达到最优的流量负载均衡,避免网络因某个计算节点瘫痪而导致网络拥塞。
1.1 核心网网络环境的描述
核心网可以看作一个有向图G=(H∪S,E),其中H表示服务器集群的节点集合,S表示交换机集合,E表示交换机与节点之间、节点之间的链路集合。那么,交换机的带宽可用b(s)来表示,链路的带宽可用b(e)来表示,节点的带宽可用b(h)来表示,其中s∈S,h∈H,e∈E。流经交换机之间、节点与交换机之间、节点之间的网络流量组成的集合用F表示,F={f1,f2,...,fn}。某一个数据流所占用的带宽用b(fi)表示。4G/5G融合网络下的核心网是以功能服务链部署的方式在物理网络中实例化对应网络功能模块。每个切片对应一条服务功能链,经过服务功能链传输的流量与虚拟网络功能是完全一致的。图1表示服务功能链部署的模型,每一条服务功能链都实例化到底层的网络中,底层网络在满足资源需求和业务QoS需求的前提下实现功能服务链部署。
由图1的网络功能链部署可知,在流量调度的时候,不仅需要考虑链路上的网络流量和链路状态,还需要考虑节点的处理性能。服务功能链1和服务功能链2的网元功能一样,但考虑到服务器的性能,需要通过不同的路径组合实现流量转发。
图1 核心网的网络服务功能链部署及流量路径展示图
1.2 基于SDN控制器的流量控制思路
基于SDN控制器的流量控制思路,是在对流量分布状态、链路可用率以及服务节点可用率进行评估的基础上,为业务选取网络可用路径。其中,流量分布状态评估是基于核心网中所有数据流经链路的情况;链路可用率是核心网流经链路剩余流量带宽与链路负载最大可用带宽的比值,是衡量网络资源利用率的指标之一;服务节点可用率通过节点正常工作概率和节点当前资源可用率来衡量。具体的思路如图2所示。
图2 基于SDN控制器的流量控制思路图
(1)流量分布状态分析
流量状态评估需采集核心网所有数据流的流向,在数据流传输过程中实时记录某个数据流是否流经某一个交换机节服务器节点和链路的情况。为表征这一概念,基于上文F={f1,f2,...,fn}和s∈S,h∈H,e∈E,构造交换机节点数据流矩阵X=F×S,服务器节点数据流矩阵Y=F×H,链路数据流矩阵Z=F×E。矩阵元素值x(fi,hj)∈(0,1)表示数据流fi是否流经交换机节点hj;矩阵元素值y(fi,sj)∈(0,1)表示数据流fi是否流经服务器节点sj;矩阵元素值z(fi,ej)∈(0,1)表示数据流fi是否流经节点-交换机之间的路径ej。通过对上述三个矩阵进行协方差分析,识别当前流量分布是否均匀。如果网络流量分布不均匀,则会存在设备或链路过于繁忙引致网络瘫痪的风险;相反,在流量分散的区域,存在设备或者链路过于空闲会导致利用率不高的问题。
(2)链路可用率评估
本文将链路ej的链路关键度定义为链路平均负载与链路建设时的带宽之比:
其中AVE(ej)是平均负载,表示所有流经链路的流量带宽之和与数据流数量之比,如式(2):
在核心网中,引入一个系数β(取值为0~1)来衡量链路最大负载,定义为:
那么链路ej剩余带宽可以表示为:
链路可用率F(ej)则表示为:
在传输时可根据链路可用率将数据流合理分配到可用率大的路径中,从而解决路径拥塞的问题。
(3)服务节点可用率评估
服务节点可用率包括两点:节点正常工作的概率和节点当前资源可用率。服务器节点正常工作的概率是衡量节点正常工作的时间与节点存在总时间之比:
服务器节点当前资源可用率采用计算资源占用情况来衡量。资源占用情况需要考虑服务节点的计算资源、存储资源以及带宽资源的占用情况,节点占用情况可以表达为:
其中w1+w2+w3=1,Chj、Mhj、Bhj表示服务器节点hj最大的计算资源、存储资源以及带宽资源。cfi、mfi、bfi表示服务器节点hj已经被占用的计算资源、存储资源以及带宽资源。
基于式(6-7),服务器节点资源可用率可表示为:
在获取链路可用率服务器节点资源可用率的基础上,核心网网络拓扑路径权重表示为:
∀(hi,hj)∈E 表示服务器节点hi和hi之间的路径。也就是路径的权重不仅表示链路之间的可用率,还要考虑链路两端服务器的节点资源可用率。
1.3 结合用户业务QoS指标的转发路径规划联合优化
流量路由单元可通过SDN控制器获得整个网络的网络拓扑权重信息和流量大小,结合业务的QoS等级,输出一条满足业务QoS等级的转发路径,如果存在多条转发路径,选择时延最小路径作为最优路径,从而实现转发策略的转变或更新。具体的路径规划优化如图3所示。
图3 结合用户业务QoS指标的转发路径规划联合优化图
具体步骤描述如下:
1)SDN控制器对网络中每条新的业务数据包进行在线管控,结合业务数据所需要的速率、时延、带宽需求设定数据包所需要的QoS等级。
2)SDN控制器对当前数据流大小和网络拓扑进行流量分布分析,判定网络流量分布的均匀性,基于当前各链路的可用性确定候选链路集;
3)评估与候选链路集关联服务器节点资源的可用率,判定各服务器计算资源、存储资源以及带宽资源的可用性,确定转发路径集;
4)计算各转发路径的时延,选取时延最小的路径作为最终流量转发路径。
从上面4个步骤可知,本文结合当前全局网络的流量分布、各链路可用情况以及与其关联的各服务器节点可用性来计算转发路径集合;在此基础上,选取转发时延最小的路径进行转发。由此看来,本文的流量调度算法具有动态性,能根据业务数据包的需求进行实时响应,该方法能够灵活应对突发数据量的需求;其次,该方法不仅考虑链路可用性因素,还考虑与链路关联服务器可用性因素,因此,它能够在很大程度上提升了数据转发速率,降低数据包重传概率,提升网络吞吐量。
2 实验分析
2.1 实验环境
搭建一个实验环境进行仿真,以此验证本文提出的算法在流量资源动态调度方面的效果。VNF部署算法使用JUNG框架,实验运行在8个PowerEdge R740/R740XD机架式服务器,主机R740 6核6线程处理器,16G内存,2T存储的服务器节点上,使用Windows Server 2012 R2操作系统,通过Python改写控制器组件实现拓扑发现、链路检测、节点资源检测以及路由规划等功能。利用Open vSwitch 模拟 OpenFlow 交换机,设置链路容量为10Mbps,链路传输时延为1 μs,控制器组件的检测周期为10 s,休眠周期10 s,路径跳数的上限为6。为了更有效对比本文算法与传统固定指派算法的区别,实验采用热点通信的模式来模拟网络流量传输的过程,也就是超过80%的流量从某个源服务器节点发出,而数据流量大小、发生时间和目的服务器节点是随机产生的。
2.2 实验结果
在对实验结果分析之前,先介绍传统的流量调度方法。传统方法基于周期性检测网络大流量和链路负载情况,确定需要重新调度的大流量并估算大流量的带宽需求,最后计算最短的传输路径。
从网络平均带宽利用率和平均吞吐量两方面对实验进行对比。网络平均带宽利用率是传输数据的带宽占总带宽的平均占比;平均网络吞吐量是在没有帧丢失的情况下,网络设备能够接受的平均速率。
从图4可知,本文算法比传统算法的平均带宽利用率高,这是因为传统的路径规划方式只能按照最短路径传输数据流,当最短路径上的流量已经接近饱和时仍允许新的数据流引入,却不会进行分流操作,而且基于周期性检测的流量分配方法,其控制粒度过粗,所选择的路径并非是最优路径,很容易导致部分链路过载。本文算法考虑业务本身流量大小、链路资源可用率以及节点资源可用率,并基于时延最小的原则选取路径进行流量转发,这种做法降低了链路过载的可能性,因此能够大幅度提升带宽利用率。
图4 不同算法在平均带宽利用率的对比情况
从图5可知,本文算法比传统算法的数据流平均吞吐量高,这是因为传统算法采用大量共享链路来实现流量转发,这种做法使得网络可选链路范围被缩小,因此,传统算法的网络数据流平均吞吐量比本文算法低。
图5 不同算法在多个检测周期数据流平均吞吐量对比情况
3 结束语
本文提出一种4G/5G异构网络融合下的5G核心网流量动态调度策略。通过链路和服务器节点剩余资源可用率来获取网络拓扑路径权重,结合业务QoS指标来选取可用路径集合,并以时延最小的原则实现路径选取。实验表明,基于本文策略的转发路径能够提升网络平均带宽利用率和平均吞吐量,降低网络拥塞,实现流量灵活调度。