VoLTE接续时延分析与优化实践
2021-03-13严锋雲武红然中国联通广东分公司广东广州5067中国联通河北分公司河北石家庄050000
严锋雲,武红然(.中国联通广东分公司,广东 广州 5067;.中国联通河北分公司,河北 石家庄 050000)
0 引言
截至2020 年6 月底,广东省VoLTE 用户数占比达到50%。VoLTE以其接通快、语音清晰,语音过程不影响数据业务、支持视频彩铃等特点越来越受到客户的青睐。呼叫接续时延是用于评估VoLTE 网络业务可接入性、衡量VoLTE 用户体验的一个重要指标。随着网络技术的不断成熟,业务优化功能不断改进,用户对呼叫时延感知的要求也越来越高,为提升市场竞争力,接续时延优化势在必行。
1 VoLTE接续时延分析
根据被叫号码类型或被叫域选情况,VoLTE 呼叫场景分为V2V 和V2C 2 种。V2C 场景的被叫号码为CS、PSTN、网间号码和VoLTE 域选在CS 等。V2V 场景的主被叫均为VoLTE且双方均在LTE。本文重点讨论V2V 场景。为了定位影响V2V 接续时延的关键因素,主要从2 个方面入手,一方面通过第三方信令工具对现网VoLTE 用户呼叫时延进行专题分析,从地(市)、厂家等维度定位接续时延短板;另一方面组织不同网元、厂商、运营商等进行呼叫测试,通过消息跟踪记录各子流程耗时,统计分析测试结果定位耗时较多的网元或场景。
其次,基于VoLTE 呼叫流程,进行多种场景测试,通过信令跟踪记录时间消耗情况,测试场景遍历省内IMS 和EPC 域内不同厂商的所有网元,同时结合友商相同场景的测试情况进行对比分析。将多次呼叫流程测试中的时间消耗进行详细记录,通过数据对比分析获取影响接续时延的关键因素。
为了分析呼叫流程各段时间消耗,将VoLTE 呼叫建立过程细分为6 个过程的13 个子流程。其中主叫侧为主叫控制过程、主叫承载建立过程,被叫侧为被叫寻址过程、被叫呼叫控制过程、被叫承载建立过程和彩铃过程(可选)。VoLTE 呼叫建立时长如图1 所示。
图1 VoLTE呼叫建立示意图
通过2 省核心网维护人员近3 个月的统计分析和测试验证,共定位图1中红色编号④⑧⑩⑫(主被叫专有承载建立过程、域选过程和寻呼过程)4 个子流程存在时延优化潜力。针对这4 个子流程中涉及的关键网元和流程进行系统评估,制定时延优化方案,经测试验证,优化措施对降低呼叫接续时延效果明显,且赶超友商呼叫接续效果。
2 时延优化方案制定和效果验证
2.1 专有承载建立时延优化(SBC开启Rx会话提升)
广东联通VoLTE 与A 省友商VoLTE 拉网对比测试,通过与友商的跟踪消息对比,发现二者SBC网元在Rx 流程上存在差异,正是这种差异,导致一次呼叫下来,广东联通比友商多耗时170 ms 左右。按消息端来区分主要在INVITE→183 和prack→200,详细的时延消耗对比如表1所示。
据了解中国联通不同省分SBC 的Rx 会话提升目前开启情况不一,部分省分已开启,时延降低约170 ms。选取开启Rx 会话提升流程的河北联通和未开启该流程的广东联通,将这2 个省的测试结果和A 省友商的测试情况进行对比分析。
2.1.1 SBC MT侧183发送流程
青辰心中难过,或许是因为自己的努力没有获得回报,抑或是因为眼见美丽的事物在自己面前毁灭,而自己却无能为力。他默然站起身,却忽听背后恶风不善,却是一头土狼不知何时来到了他的背后,发动了偷袭。
开启了Rx 会话效率提升流程后,MT 侧SBC 收到带SDP的183消息后给PCRF发送AAR,SBC收到AAA后,不等待RAR 消息上报订阅事件,直接转发SIP消息到核心侧。而未开启该流程的MT 侧SBC 收到带SDP的183消息后,发送AAR给PCRF,SBC收到AAA,且要等收到RAR 后回送RAA,然后才向核心侧转发183 消息,此段流程下来广东联通与A 省友商相比多耗时100 ms左右(多次测试取均值)。
广东联通MT 侧发送183 流程(未开启Rx 提升)耗时173 ms。A 省友商MT 侧183 发送流程(开启Rx 提升)耗时92 ms。河北联通MT 侧183 发送流程(开启Rx提升)耗时7 ms。
表1 广东联通与A省友商MO和MT时延
2.1.2 PSBC MO侧183发送
配置了Rx 会话效率提升流程的SBC,在最初收到带SDP 的INVITE 消息,给PCRF 发送AAR 消息时,Flow-Status AVP 中填写ENABLED,后续再收到ISBG的183消息,在给PCRF发送AAR消息前,对该AAR消息进行检查,发现该AAR 消息与上一个AAR 消息完全相同,不需要再向PCRF 发送AAR-U,直接向核心侧转发送183;未配置该流程的SBC 在收到183 后,还需要向PCRF 发送AAR-U 更新承载,此段多耗时70 ms左右(多次测试取均值)。
广东联通MO 侧发送183流程(未开启Rx提升)耗时106 ms。A 省友商MO 侧发送183 流程(开启Rx 提升)耗时30 ms。河北联通MO 侧发送183 流程(开启Rx提升)耗时8 ms。
上述2 个流程,在3 个测试场景的测试结果对比如图2所示。
图2 结论证实,中国联通SBC 开启Rx 提升后,时延降低效果明显,耗时少于友商,经过多次测试统计,平均每次呼叫缩短时延约为260 ms。目前中国联通各省开启Rx提升情况不统一,建议未开启省分评估现网情况,尽可能开启该功能(因涉及参数较多,建议各省评估现网情况,制定具体操作方案)。
图2 SBC侧183发送流程耗时示意图
2.2 寻呼过程优化(中兴MME优化寻呼参数)
通过第三方信令工具对河北联通各地(市)V2V平均时延进行统计分析,发现4 个地(市)的V2V 时延明显高于其他地(市),如图3所示。
图3 河北各地(市)V2V平均时延示意图
对时延差距最大的地(市)A 与地(市)L 的V2V 端到端INVITE 消息和180 消息时延进行对比,鱼骨分析见图4。
通过图4对地(市)L和地(市)A 的时延分段对比,可以看出被叫终端的180消息到达SBC 的时间开始有明显差异,导致2个地(市)V2V 时延差异,初步怀疑为EPC 域寻呼时长差异。进一步分析地(市)A 和地(市)L 的KPI,地(市)A VoLTE 被叫寻呼响应时延为1 140 ms,地(市)L VoLTE 被叫寻呼响应时延为582 ms。该时延差异进一步证实,地(市)A 和地(市)L 相比,时延差异主要体现为VoLTE 寻呼响应时长。对全省11 个地(市)的指标进行对比分析,地(市)A、B、C、D 的时延明显较大,这4 个地(市)为中兴MME 覆盖范围,其他地(市)为华为MME 覆盖范围,因此进一步分析中兴MME寻呼参数配置情况。
VoLTE是按照TAL进行寻呼,目前中兴MME配置的策略为每100 ms 下发64 个eNodeB,而目前各地(市)配置的最大的TA可能要到400个eNodeB,最差的要700 ms 才可能寻呼到。TA 过大是造成寻呼时长的一个主要原因,此问题在各地(市)TA与电信拉齐后会有所缓解,TAC 数量增加,每个TAC 下带eNodeB 数量减少,寻呼时间也将随之下降。
为了规避上述问题,通过修改MME寻呼策略来降低时延,由目前的每100 ms 下发64 个eNodeB,调整为每50 ms 下发512 个eNodeB,这种调整将带来MME 负荷增加,经系统评估该操作的影响在核心网的承受范围内。
完成中兴MME 参数修改后,业务测试正常,调整后观察一周,上述4 个地(市)V2V 时延降低约300 ms。指标情况如图5所示。
图5 地(市)时延优化效果示意图
2.3 域选过程优化(HSS优化IDR/IDA流程)
在VoLTE 测试中发现,华为HSS 中VoLTE 用户在每次被叫域选过程中,无论被叫注册VoLTE 或CS,HSS都会向MME发送IDR消息查询用户T-ADS信息,而中兴HSS 不会。分别使用华为、中兴HSS 的VoLTE卡(注册状态一致,均在华为MME)进行测试,多次跟踪信令统计时延,2 个厂家HSS 用户在LTE 做被叫的时延统计比对如图6所示。
由于华为HSS 比中兴HSS 增加了IDR/IDA 流程,该流程耗时均值为42.2 ms,导致被叫时延增加。根据T-ADS 域选流程,融合HLR/HSS 收到UDR 消息后,根据被叫用户在Gn/Gp SGSN上的注册情况,按照判断原则判断是否查询MME 以获取被叫用户的T-ADS 信息。查阅华为HSS 的T-ADS 域选流程中HSS 判断是否查询MME 的配置说明,当用户只在MME 注册,HSS上记录该网元的“IMS Voice Over PS Sessions”为“SUP⁃PORT”,当“T-ADS 查询方式”参数值为“NOQUERY”时,HSS 不向MME 发送T-ADS 查询请求,直接向SC⁃CAS 返回UDA 消息;当“T-ADS 查询方式”没有设置为“NOQUERY”时,HSS 向MME 发送T-ADS 查询请求。而现网配置为“NOQUERYGnGpSGSN”,因此触发HSS向MME发送T-DAS查询请求流程,增加了域选时延。
图6 HSS域选时延示意图
中国联通规范要求所有厂家MME开启单域注册,位置更新时携带单域注册标识,用户附着4G 时发送ULR 来确保所有的4G attach 都通知HSS,HSS 向SGSN发送CLR 并清空SGSN 地址。因此域选可以直接在HSS 终结,不需要再通过IDR 消息向MME 查询用户信息。
综合评估后,在现网华为HSS 修改T-ADS 为NO⁃QUERY 方式。修改后同样条件下测试,HSS 的UDR/UDA时延减少约36 ms。
2.4 域选过程优化(MME上报能力)
华为HSS 修改T-ADS 查询方式为“NOQUERY”(不查询)后,发现华为HSS 用户注册在中兴MME 下,HSS 仍向MME 发IDR 消息。当HSS 上记录MME 的“IMS Voice Over PS Sessions”为“SUPPORT”,HSS 不向MME 发送T-ADS 查询请求,直接向SCCAS 返回UDA消息。但查询用户动态信息发现IMS-VO-PS-Ses⁃sions-Supported=UNKNOWN,所以HSS 向MME 发起IDR/IDA查询。
跟踪信令发现华为MME 会上报IMS-VO-PS-Ses⁃sions-Supported能力,中兴MME未上报,同样触发HSS向MME发送T-DAS查询请求,增加域选时延。
检查现网中兴MME 配置,确实不上报IMS-VOPS-Sessions-Supported 能力。MME 的IMS-VO-PSSessions-Supported 能力是在EPC 注册时的ULR 消息中,向HSS 上报网络是否支持IMS 语音,经综合评估,MME 需要修改软参支持VOPS 能力变化时通知HSS,使得MME 向HSS 获取签约数据的ULR 消息中携带“Homogenous Support of IMS Voice over PS Sessions”。
广东联通全省中兴MME 修改参数后,经复测AS时延平均降低约53 ms,HSS时延平均降低约21 ms,时延降低效果明显。通过专业网管U2000 进一步统计HSS 的IDR/IDA 消息忙时次数,修改后平均减少232 869 次/时,从而降低HSS/DRA/MME 等网元负荷(见图7)。
3 结束语
图7 HSS接入用户数据请求(IDR)次数示意图
通过广东联通和河北联通2省核心网维护人员历时近3 个月的统计分析和测试验证,共定位主被叫专有承载建立过程、域选过程和寻呼过程这4 个子流程存在时延优化潜力。针对这4个子流程中涉及的关键网元和流程进行系统评估,制定开创性时延优化方案,经测试验证,证实优化措施对降低呼叫接续时延效果明显,且赶超友商呼叫接续效果。优化效果如表2所示。
表2 VoLTE时延优化效果
基于增强网管和专业网管的时延统计分析,结合不同地(市)、网元、运营商的实测记录统计分析,分段研究影响VoLTE 呼叫接续时延的因素,在研究过程中发现4 类典型的影响时延的问题,针对每类问题制定优化方案,进行系统评估后在现网实施。经测试验证,时延优化效果明显,且系统负荷有所减轻,总体效果符合预期。
重点说明SBC 开启Rx 提升措施,通过中国联通2个省份和友商3 家的消息对比,证实中国联通SBC 开启Rx提升后时延降低效果显著,明显优于友商。据了解该措施尚未全网实施,建议未开启省分评估现网情况,开启该功能。本文所有优化措施均有现网实施案例,时延降低效果显著。建议涉及相同厂商有共性问题的省分系统评估本省网络现状,制定相应时延优化方案,全面提升VoLTE端到端时延感知。