5G TSN-IP确定性时延保障方案设计及创新应用验证
2022-12-06邢剑卿王笃炎刘惜吾陈华旺中国联通广东分公司广东广州510627
邢剑卿,王笃炎,刘惜吾,陈华旺(中国联通广东分公司,广东广州 510627)
0 引言
传统的IP 网络QoS 方式,面向终端用户有限的业务类型时(如语音、视频、上网等),通过为不同的业务分配不同的优先级来尽力提升服务质量,但不做任何量化SLA 承诺。现网中大部分业务基于最短路径转发,设备转发面并不量化预留资源,在部分业务突发较大,或者上下游加速转发(Expedited Forwarding,EF)带宽不匹配,或者多个流汇聚等情况下,可能产生网络的拥塞/瞬时拥塞,影响业务的带宽、时延、丢包率等指标。当前网络的应对方式是让承载网络尽量轻载,降低拥塞/瞬时拥塞的可能性,但会产生大量的带宽浪费,却依然不能提供100%网络能力保障。
在工业互联网场景下,5G TSN-IP 可以面向各类工业应用涉及的业务流特性进行建模和定义[1],并在此基础上,自适应定义不同的优先级与调度机制,从而实现5G网络服务质量差异化保障。
1 传统QoS面临的挑战
传统IP网络是面向无连接的统计复用网络[2]。如图1所示,来自不同入接口的报文,汇聚后从同一个出接口发出,出接口报文输出顺序是根据报文到达出接口队列的时机决定,先到的先发出,后到的后发出。
图1 传统IP网络转发机制
传统IP 网络是尽力而为网络。其优势在于:充分利用网络带宽,节省运营商的网络投资[3]。但随着5G网络技术日新月异的演进和工业互联网复杂多样的严苛业务需求,传统IP网络面临以下挑战:
a)优先处理,但不承诺:从RFC3246 对于EF 的定义可以看出[4],EF 优先级是单节点优先处理的行为,但不能对业务SLA做出承诺。
b)缺少全局规划和资源预留:DiffServ 定义的逐跳行为(Per-Hop Behavior,PHB)是一个单机行为,缺少全局视角且不能预留充足的资源,难以做到业务端到端SLA保障。
c)无差异化能力:所有关键业务都是EF 转发,1 ms业务和20 ms业务等同处理[5]。
d)网络轻载难以定义:突发业务引起的峰值速率比例大,可能引起瞬时拥塞[6];此外,在保障SLA 基础上,可以部署业务的数量难以量化[7]。
因此,亟需引入5G TSN-IP 技术突破当前瓶颈,满足工业互联网网络需求。
2 TSN-IP方案设计
2.1 TSN-IP理论基础
面向5G 网络确定性时延关键挑战,TSN-IP 方案基于对网络演算理论的工程化探索,以创新的控制面时延编排算法和转发面时延队列调度设计,达成高价值业务端到端时延保障、低价值业务带宽充分复用、关键业务队列级隔离以及现网设备平滑演进的目标[8]。
如图2 所示,TSN-IP 的实现原理是在原有的网络控制器基础上,配置了一个专用的大脑,通过设备转发面的触手,在业务入口自动学习业务的流量模型,评估收集各种业务的平均速率、峰值速率、突发大小等参数,基于网络演算理论在全局量化计算,在网络节点接口处规划高优先级车道,量化预留资源,并给出各种业务的最优转发路径,最终给出节点级和网络级的时延上界承诺。
图2 TSN-IP实现原理示意图
在设备级,TSN-IP 将网络演算理论应用于设备端口队列,基于现有QoS队列调度能力,叠加业务流量模型和设备调度服务模型,规划时延队列做到节点级时延保障。在网络级,依靠全局规划算法规划队列级业务路径,并量化计算资源预留,保障业务端到端时延可靠。TSN-IP演算理论框架如图3所示。
图3 TSN-IP演算理论框架图
根据网络演算理论基础,建立业务流量模型、设备服务模型和时延上限之间的算法关系。通过基于业务时延上限需求和业务流量模型,求解设备服务模型。网络演算理论基本原理如图4所示。
图4 网络演算理论基本原理
2.2 设备级方案设计
2.2.1 业务到达模型建模方法
基于设备转发面采集上报的实时测量信息,如报文到达时间、报文长度等信息,上报控制面分析模块。
分析模块拟合流量模型(到达曲线),保证任意时间段均为实际累计流量的上包络。
转发面和分析模块间使用压缩算法,减小上报数据量,提升信息上报效率。流量特征提取基本原理如图5所示。
图5 流量特征提取基本原理
2.2.2 服务模型保障方案
选取用户队列为时延队列的规划对象,不同时延队列之间,使用差分加权轮循(Deficit Weighted Round Robin,DWRR)按照权重调度,基于算法规划结果,为不同的时延队列配置资源预留值/调度权重。
在顶层端口队列使用严格优先级(Strict Priority,SP)调度,优先调度时延队列(时延敏感业务),然后调度其他队列(非时延敏感业务)。
2.3 网络级方案设计
基于设备队列级时延保障能力,配合管控面的路径、队列、资源规划算法,规划设备队列数量、队列时延等级、队列预留资源、业务队列级路径等,从而保证业务网络级时延上限。
3 TSN-IP典型应用场景测试验证
3.1 测试方案及环境搭建
基于流量特征分析器、TSN-IP 规划工具和流量特征提取设备构建TSN-IP 管控系统,与ATN1(Advantaged Transport Network)相连,接入测试网络。TSN-IP管控系统完成流量特征提取,将流量特征提取结果通知TSN-IP 规划工具。TSN-IP 规划工具基于流量特征数据、网络拓扑信息、业务需求信息等,算法计算设备相关端口时延队列预留资源,以及队列级的规划路径。最后,规划结果通过Telnet/SSH(Secure Shell)下发给ATN/MER(X8A/X16A)设备。5G TSN-IP 测试方案拓扑图如图6所示。
图6 5G TSN-IP测试方案拓扑图
其中ATN1-MER1、MER1-MER2、MER2-ATN2、ATN1-ATN2 间链路为50GE 链路,MER1-MER3、MER3-MER4 间为GE 链路,MER4-MER2 间为10GE链路,从而模拟了网络中多种带宽链路网络场景下的规划部署能力。
ATN1 和ATN2 分别提供4 个GE 接口与12×GE 测试仪相连,用于接入测试仪业务模拟流量,4 个GE 接口与8×10GE 测试仪相连,用于接入测试仪模拟的背景流量。
另外,在实验网机房部署2台测试仪,分别用于构建业务模拟流量和背景业务流量。ATN1 模拟业务云端或者服务端,ATN2 模拟客户侧终端,构建上下行双向业务,验证部署TSN-IP 确定性方案后,三大场景业务时延保障能力。
3.2 应用场景测试用例
本次测试选取智能电网、智慧港口和工厂自动化三大业务场景,分别对电力差动保护、龙门吊控制业务、龙门吊视频业务、AGV 集卡控制业务、工厂自动控制业务等共15种业务进行测试,相关业务流量模型和网络需求参考3GPP TS 122.104[9]。
3.3 典型测试用例验证结果
本次测试共涉及3 类典型场景、15 种业务、30 个测试用例,本文选取3 种典型业务场景测试用例中的电力差动保护、龙门吊控制业务、工厂自动控制业务进行重点分析。其中,对电力差动保护、龙门吊控制业务进行流量特征采集测试,对工厂自动控制业务进行业务确定性保障测试。
3.3.1 电力差动保护业务
电力差动保护是典型的低时延、高可靠需求业务之一[10],具体性能要求如表1所示。
表1 电力差动保护典型业务需求
根据表1 中的需求,采用测试仪模拟业务流配置如表2所示。
表2 电力差动保护业务测试仪配置
图7 为分析器从设备转发面获取业务特征数据,并可视化呈现ms级报文到达Bytes数。
图7 业务达到模型监控
建模拟合结果如图8 所示,呈现结果与测试仪构造特征匹配,并输出TSN-IP 规划工具所需的报文大小、峰值速率、平均速率、突发大小等建模结果,建模结果能够包络目标业务流量到达曲线。
图8 建模拟合结果
3.3.2 龙门吊控制信号业务
龙门吊控制也是典型的低时延、高可靠需求业务之一[11],具体性能要求如表3所示。
根据表3 中的需求,采用测试仪模拟业务流配置如表4所示。
表3 龙门吊控制信号典型业务需求
表4 龙门吊控制信号业务测试仪配置
图9 为分析器从设备转发面获取业务特征数据,并可视化呈现ms级报文到达Bytes数。
图9 业务达到模型监控
建模拟合结果如图10 所示。呈现结果与测试仪构造特征匹配,并输出TSN-IP规划工具所需的报文大小、峰值速率、平均速率、突发大小等建模结果,建模结果能够包络目标业务流量到达曲线。
图10 建模拟合结果
3.3.3 工厂自动化运动控制业务
工厂自动化运动控制是典型的超低时延、超高可靠需求业务[12],具体性能要求如表5所示。
表5 工厂自动化运动控制典型业务需求
经过控制面规划和配置下发,业务最大时延始终低于需求时延和规划时延。资源预留数据量化呈现,业务队列级路径清晰呈现。
业务间呈现差异化保障效果,并且在背景流量冲击下,时延保障效果仍然保持良好。
4 总结
实验结果表明,5G TSN-IP 确定性网络技术方案可实现对业务流量特征自动学习,在不依赖网络低载的条件下,TSN-IP 技术能针对可识别的数据流进行有效的时延和带宽上界保障;可解决为了保障服务质量网络被迫空载/低载的问题,可满足不同业务对网络性能的差异化需求,提供精细化的网络服务保障。该技术与算网大脑等技术结合,可在更大范围内实现网络规划与优化策略的协调,以达到提高运营商全网资源利用率的效果。
TSN-IP 等确定性网络技术与5G 的结合,不仅可以赋能工业企业提供性能稳定的定制化网络服务,也能为游戏、XR 等实时交互类业务提供保障,是运营商未来面向垂直行业多样化需求的关键网络技术。