5G SA 共享网络时延优化策略*
2022-10-16欧阳恩山方云根田经化
欧阳恩山,方云根,田经化
(中国联通湖南省分公司,湖南 长沙 410014)
0 引言
中国电信与中国联通共同建设了一张全球规模最大的5G 独立组网(Stand Alone,SA)共享网络,实现了“一张物理网、两张逻辑网”的共享模式,为双方5G 业务发展提供了强有力的网络保障。5G SA 网络具有高速率、低时延、大连接的特点[1],可广泛应用于VR/AR、远程医疗、无人驾驶、工业控制等场景,赋能产业转型升级。特别是5G R16 版本,更是增强了对低时延高可靠通信(Ultra-Reliable Low-Latency Communications,uRLLC)业务场景的支持能力,用户面可达到10 ms 的端到端时延、1 ms 的空口时延,可靠性高达99.999%。
但在网络的实际运营过程中,固定网络段的传输路由问题、无线信号的覆盖质量引起的丢包重传、共享网络的参数配置等,都会大幅增加用户端到端的时延,进而影响到网络性能和对时延敏感业务的感知。
本文针对5G SA 网络共享方用户的使用感知问题,深入分析影响用户端到端时延的主要原因,提出一种端到端时延问题定位的方法;通过研究降低5G 无线空口调度时延、传输时延等关键技术[2],针对固定网络段提出网络结构优化策略和路由优化算法;针对无线网络部分,研究提出一种无线网络参数优化策略,减少丢包降低时延。经实际运行验证,本文所提策略取得了明显改善效果,大幅提升了共享方用户在5G SA 网络下的业务感知。
1 5G 网络端到端时延影响因素分析
5G 应用对业务面数据包的传输时延有较高要求,只有达到一定基准值才不会影响业务感知,如网站页面访问、视频直播、点播、游戏等业务均对时延敏感,因此在衡量网络端到端体验指标时,需要对这些业务都进行时延测评[3]。
端到端时延包含无线空口(用户设备UE 与基站间)、固定传输段(基站至用户面功能(User Plane Function,UPF))间的信号传输时延,需关联无线小区、核心网、承载网监控常用关键指标(Key Performance Indicators,KPI),建立时延影响因子库。可以通过建立如图1 所示的基于用户感知的端到端时延监控模型,快速定位问题。
图1 基于感知的端到端时延监控模型
本文面向用户感知,以打造低时延高可靠SA网络为出发点,剖析优化5G 无线空口调度时延、传输时延、固定网络端口传输时延及设备处理时延等关键技术,深入开展分段研究与问题定位。
1.1 光纤传输距离时延
光信号在光纤中传输所耗费的时间为传播时延。传播距离影响传播时延,传输介质也影响传播时延。通常单位长度光缆的时延约为5 μs/km,传输距离越长,时延越大。
1.2 设备转发时延
设备转发时延包括业务发送时延、处理时延及排队时延,在网络未发生拥塞时,设备转发时延主要和经过的设备跳数有关。这里重点探讨波分复用(Wavelength Division Multiplexing,WDM)和光传送网(Optical Transport Network,OTN)设备的时延[4]。WDM 和OTN 设备主要由电路板OTU、合分波单元、光放大单元组成,设备部分的时延一般在100~400 μs,收、发两端加起来,时延一般小于1 ms。一般来说,短距离(如<100 km)情况下设备的时延影响占比较大,长距离时(如>500 km),光纤时延影响较大,传输设备的时延可以忽略。
1.3 无线空口传输时延
无线空口侧时延主要受传输间隔、资源调度、混合重传、终端和基站处理时延等因素影响。在第三代移动通信伙伴项目(the 3rd Generation Partner Project,3GPP)定义的5G NR 协议中,引入了基于时隙的调度方法、上行优先级处理方法、更加灵活的传输定时方案等[5]。影响无线空口的时延因子有ping 包调度方式模式、上行预调度、预调度次数、上行误块率(Block Error Rate,BLER)、下行BLER 等。
2 端到端时延定位方法
由于5G 共享网络组网复杂,因此面临端到端时延定位的问题。针对电信SA 共享基站至联通UPF 网络访问路径上所有节点路由,研究基于路由追踪(tracer)的时延跟踪方法,总结排查影响时延的各个因素并提出解决方案,实现无线网、承载网、核心网时延变化的根因定位。同步实施网络结构优化、路由策略优化、无线网络参数优化[6],降低各段时延,提升5G 用户感知。
本文采取ping 测试分段隔离“透视”跟踪每一跳网元路段时延,为时延问题定位提供了关键性方法,建立了端到端时延问题“三维四步法”诊断手段与优化策略,如图2 所示。
图2 端到端时延优化“三维四步法”
将SA 网络时延路由分为两段,即无线空口段(UE 与基站间)、固定网络段(基站至UPF),通过T1、T2 时间戳解析空口时延、固定段时延,见图3。
图3 端口跟踪(T1—T2)基站空口以上时延回环
基于tracer 测试跟踪,进一步解析出基站至UPF 的各段路由时延,实现分段定位,如图4。
图4 基于tracer 跟踪时延分段隔离
将联通地市承载网N3 接口地址添加至电信地市边缘路由器(Edge Router,ER),打通电信SA共享基站至联通UPF 网络访问路径上所有节点路由,实现利用ping 测试每一跳网元路段时延。测试的时延包括:
(1)共享基站空口时延;
(2)基站端至电信城域网ER 时延;
(3)电信城域网ER 至地市联通智能城域网核心路由器(Metro Core Router,MCR)时延;
(4)地市联通城域网MCR 至省会汇聚路由器(Multipul Custom Edge,MCE)时延;
(5)省会MCE 至省会MCR 时延;
(6)省会MCR 至省会核心网底层交换机(End of Row,EOR)时延;
(7)省会EOR 交换机至省会UPF 时延;
(8)省会UPF 至文件访问服务器(File Transport Protol Server,FTP)时延。
3 网络结构优化
3.1 优化网络拓扑,MCR 直连简化路由降低时延
承载网总时延=光纤时延+设备转发时延,其中,设备转发时延每跳为40~50 μs[7],光纤时延为5 μs/km。经对比测算,光纤距离是增加时延的主要原因。通过优化网络拓扑结构,将地市智能城域网MCR 通过波分直连省会长沙MCR,可缩短两跳路由节点转发时延和两段光纤链路时延,减少1~2 ms 时延。地市至省会MCR 路由直连改造如图5、图6 所示,经测试统计对比,可有效降低时延。
图5 地市MCR 直连改造前
以衡阳为例,时延对比结果如表1 所示,采取MCR 直连后,基站ping 至省会UPF 的大小包时延平均缩短了1 ms 左右。目前,湖南联通已完成了13 个共享区地市直连改造。
表1 地市MCR 直连前后ping 时延对比结果
3.2 优化环网结构,减少传输路径和时延
地市到省中心的链路,由省干OTN 系统承载,省干OTN 的环网结构决定了信号在光纤传输所耗费的时延。
如图7 所示,湘潭至省中心的两条链路分别为湘潭—阅读中心局点(短径,由湘潭直达长沙)、湘潭—河西局点(长径,经过衡阳、郴州、株洲最后到达长沙)。其短径、长径的时延分别为0.5 ms和4.0 ms。经过环网结构优化,在湘潭至株洲新增了一个直达路由,其长度仅为100 km,时延为0.5 ms。优化后湘潭至河西局点的长径,以及株洲至阅读中心局点的短径经新路由开通业务,可减少587 km 的光缆长度,减少了3 ms 时延。
图7 湘潭、株洲环路优化
通过对长沙和株洲进行环路改造,传输距离分别从779 km 下降到92 km 左右,传输时延下降约3 ms。环网改造前后时延对比详见表2。
表2 环网改造前后时延对比
4 基于负荷的短径优先路由算法
分段测试过程中,发现本地网基站至同一UPF的时延波动差异大,最终确定是受路由中波分环路长、短径影响。以衡阳为例,长、短径时延差异约4 ms,如图8 所示。
图8 波分长短径影响
因为网络协议(Internet Protocol,IP)默认转发策略为动态负载均衡随机算法,地市SA 流量长短径负载流量各占50%,导致不同基站随机选择长径或短径,时延差异大。基于软件定义网络(Software Defined Network,SDN)[8],本文创新提出基于流量负荷的最短路由优化算法:
按照上述算法,通过分析传输网络性能参数,可实现基于负荷的路由最短路径性能优化,具体实现过程如下:
(1)SDN 控制器获取网络拓扑信息及网络状态信息。网络接收用户接入请求信息,将其发送至控制器,控制器判断业务类型,并获取网络拓扑信息。
(2)控制器计算确定业务起止网络节点之间所有可选路由。根据获取的网络拓扑信息和网络状态信息,计算出业务起止网络节点之间所有可选路由。
(3)基于业务特性确定最佳路由。充分评估当前承载网核心出口为轻载,在不更改线路资源情况下,自动监控网络负荷,并采用本文提出的算法策略,当链路负荷低于50%时,路由选择最短路径;当链路负荷高于50%时,根据业务特性,将非时延敏感业务分流至长径波分,实现业务分流。
(4)业务快速重路由。在线路故障时通过承载网网络协议(Internet Protocol,IP)的快速重路由(Fast Reroute,FRR)保护技术,业务毫秒级切换到长径备份链路,对用户实现无感知切换。
基于上述算法,针对衡阳智能城域网MCR 和长沙智能城域网MCR,配置外部边界路由协议(External Border Gateway Protocol,EBGP)本地优先级(local-preference)属性,并修改转发策略为主备模式,经测试验证,衡阳ping 时延减少了4 ms。
5 无线网络参数优化策略
5.1 上行智能预调度算法
如图9 所示,传统的上行调度,需要等待终端发送调度请求(Scheduling Request,SR)[10],并获得授权后才能进行调度。普通上行预调度,虽减少了SR 环节,但在终端没有上行数据发送时,会造成上行资源的浪费,并引发上行干扰。
图9 3 种调度方式对比
本文引入智能预调度方法,该功能由下行业务触发,一旦基站给终端发送下行数据之后,考虑到终端有相应回复,会有上行数传,此时基站将在一定时间内持续主动给终端上行授权,实现数据即到即传,从而有效降低业务等待时延。
本文针对不同厂家智能预调度机制,总结出时延优化参数集,包括上行聪慧预调度次数、上行聪慧预调度间隔、上行聪慧预调度延迟触发时间、上行聪慧预调度的缓冲区状态报告(Buffer Status Reporting,BSR)计算门限等,详见表3。
表3 预调度时延参数集
修改预调度参数前后时延对比如图10 所示。开启智能预调度后,ping 循环时间(PingLoop Time)从18 ms 下降到12 ms,平均改善了6 ms,时延优化效果明显。
图10 修改预调度参数前后时延对比
5.2 无线网络覆盖差异化下的时延影响因子
由于无线环境比较复杂,UE 终端接收基站信号强度偏弱、信噪比(Signal to Interference plus Noise Ratio,SINR)较差、干扰等因素均可导致UE的传输速率达不到低时延业务的传输速率要求,从而出现大量通信误码,引发检错、重传等,会导致无线空口时延大幅增加。
5G 网络基于时分双工(Time Division Duplexing,TDD)下行时延处理的关键是混合自动重传(Hybrid Automatic Repeat Request,HARQ)响应和重传机制[11]。此外,无线网络覆盖及信号质量,都将不同程度影响到业务数据的传送质量。在控制面表现为,在NR 基于竞争的随机接入(即PRACH 接入)过程中,手机终端发送Msg1 到RRCSetupComplete 之间的时延大幅增加。
在UE 的PRACH 接入过程(从发送Msg1 到RRCSetupComplete 期间),若发生Msg2 或Msg4 失败,则会触发Msg1 重传。Msg1 的最大重传次数由参数preambleTransMax 定义,重传时间由raResponseWindow定义。每次重传功率以powerRampingSte 功率攀升步长增长,直到UE 达到最大发射功率或最大重传次数,在此期间会导致空口时延的增加。
在用户面时延主要是通过Ping 包来测试,通常情况下Ping 小包为32 Byte,中包为1 500 Byte,大包为2 000 Byte。Ping 包周期通常为1 s,Ping 不通时会间隔3 s 再次进行Ping 包。统计空闲态UE 对FTP 服务器发起Ping 业务,终端发出第一条RACH preamble 至终端发出RRC Connection Reconfiguration Complete 的时间差形成延时。Ping 包过程如图11所示。
图11 Ping 包过程
本文分别选取了无线基站覆盖好点、差点、极差点,开展大量时延测试。统计结果显示,当无线网络参考信号接收功率(Reference Signal Receiving Power,RSRP)小于-105 dBm 时,随着信号质量的变差,丢包率上升,因此需大量重传数据包,经测算每重传一次增加6 ms 时延。在RSRP 持续下降至-130 dBm 期间,ping 时延采样点严重劣化,部分采样点时延甚至达到100 ms 左右。如图12 所示,对不同强度无线信号下开展大量ping 测试结果进行统计,结果表明,RSRP 信号强度越低,时延越大。
图12 网络覆盖差异化下的空口时延采样对比
测试结论:当RSRP 小于-105 dBm 时,ping平均时延将大幅增加。因此,在预调度参数一致的情况下,良好的无线网络覆盖及信号质量,可有效降低空口时延。
6 效果验证
6.1 共享区时延优化成效显著
将本文研究成果应用于现有网络,经大量测试,结果如表4 所示,共享区联通5G SA 时延由优化前的20.48~24.41 ms,降低至13.68~14.02 ms,平均时延缩短了9~10 ms,与承建区电信用户的时延基本一致,实现了双方用户时延敏感类业务体验一致。
表4 共享区SA 时延优化前后对比
6.2 5G 网络核心业务感知明显改善
将本文策略应用于湖南联通网络,发现5G 用户视频、游戏类核心业务体验良好,视频卡顿率从1.58%降低至0.93%;游戏卡顿率从0.54%降低至0.29%;移动网络工信部满意度测评,由2021 年的82.28分稳步提升至2022 年的91.09 分。
7 结语
针对共享区域5G 业务端到端时延过大、电联时延感知不一致等问题,本文深入分析了影响时延的关键因素,研究了降低电联5G SA 共享网络端到端时延的关键技术,以及基于无线网、承载网、核心网的端到端时延优化策略,提出了网络结构优化方案、短径优先路由调度算法、无线空口参数优化方案。现网部署后取得了良好的改善效果,对提升共建共享5G 网络品质,有较高的参考价值。