数据不一致引起VoLTE故障的分析处理
2019-12-04邹波
邹波
摘要:随着LTE网络大规模商用,VoLTE业务也越来越普遍,该业务在某些场景下需要进行EDS查询,一旦查询失败将会导致呼叫失败。本文对由于数据一致性问题导致EDS查询失败,引起的VoLTE故障进行深入分析,提出逐段对比排查方法进行处理,为处理类似故障提供了一定的参考价值。
关键词:EDS;查询;VoLTE
中图分类号:TN929.5 文献标识码:A 文章编号:1007-9416(2019)08-0027-02
0 引言
当前,随着LTE网络覆盖和业务成熟,基于LTE网络的语音业务也得到越来越多的使用,除为用户提供更高质量语音服务外,而且容量更大。但是,由于网络覆盖或手机终端原因,当开通VoLTE服务的用户做被叫时,还是需要回到到3G网络,需进行EDS查询,由于局数据不一致的情况会导致查询失败,从而导致呼叫失败,重视并积累如何更快捷处理VoLTE呼叫失败故障,对于提升用户满意度具有十分重大意义。
1 故障背景
EDS进行容灾倒换演练结束后,照母山停止双机进程后,业务切换到水土局后,测试正常。在进行水土停止双机进程后,业务切换到照母山局,测试正常。但当水土局重新进行cluster-start启动双机时,发现双机启动异常。主机进程起不来,经过和研发多次沟通,未能解决。于是将业务进程启到了备机,并通过手工分别在照母山和水土进行了dig命令模拟号码查询,命令查询结果正常。
第二天,接到多起用户投诉语音呼叫故障,被叫打不通,经过查询投诉用户都是最近开通VoLTE业务,投诉地点4G网络覆盖不好等普遍现象,维护人员通过用户了解到这类现象后,汇总到技术人员进行了协同分析,决定采用模拟测试各场景呼叫,并逐段排查的思路进行故障处理。
2 故障分析
2.1 号码跟踪
根据故障号码跟踪,发现华为VIMS侧的SCSCF在向水土EDS上进行SRV查询aspool01这条数据时,没有返回查询结果:
然后分别进行其他SRV数据查询和A查询也都没有返回结果。
在照母山局点进行测试发现主局均正常,查询结果也正常,进行下一步处理和排查。
2.2 数据一致性检查
然后怀疑是水土局主备机数据同步不一致,通过分别查看zxin12用户下dns_local的文件發现,水土备机的dns_local下的3gppnetwork全量文件(3gppnetwork.org0000000001.axf)的序列号为1,照母山局的dns_local下的3gppnetwork全量文件(3gppnetwork.org0000000011.axf)序列号是11,导致备局文件未加载全。
全量文件的序列号配置如下,照母山和水土主备局的配置文件一致,且主备局配置文件中序列号是11,但是主局的全量文件序列号已经是11(主局的全量文件可能合并过,所以全量序列号是11),备局的全量文件序列号是1,导致备局文件未加载全。
3 SRV查询和A查询失败原因分析和故障处理
由于固网IMS用户和驻留在VIMS网络的VoLTE用户,呼叫过程中只会发起号码查询,不会发起SRV查询,所以在割接当晚业务验证非发现异常。该参数也不影响固网IMS,所以在历次EDS倒换过程中也未发现该问题。该次故障影响数据上开了VoLTE功能,但因手机或者网络原因,要回落到3G并且作为被叫的用户。当回落到3G时,需要到EDS进行SRV查询,EDS未正常返回结果,导致呼叫异常。
通过以上分析,最后确认故障原因为,由于备局点3gppnet work全量文件未加载完,导致3gppnetwork的数据查询有问题。通过拷贝主局全量文件到备局,并把dns_local下以前3gppnetwork开头的文件删除,然后在zxin12用户下重启进程后,场景模拟测试naptr查询,SRV查询和A查询,能够正常返回查询结果,通过验证,该问题得到了很好解决。
4 结语
为避免出现类似故障,平时需要加强现场定期巡检,检查通过对比主备局boss_data和eds_local下的文件和config目录下zxeds_ data.scr配置文件,对比查看dns_local下的文件。如果发现主备数据不一致,及时与后方专家确认整改方案。
除此之外,验证业务时,需加强业务的各种场景拨打测试,避免遗漏场景下的业务测试,将问题扼杀在初期,对于提升用户感知有着很大意义。
参考文献
[1] 江林华.LTE语音业务及VoLTE技术详解[M].北京:电子工业出版社,2016.
[2] 丁胜高.LTE无线网络优化[M].北京:机械工业出版社,2016.
[3] 沈嘉,索士强,等.3GPP长期演进(LTE)技术原理与系统设计[M].北京:人民邮电出版社,2008.
Analysis and Processing of VoLTE Fault Caused by Data Inconsistency
ZOU Bo
(China Unicom Ltd.ChongQing Branch,Chongqing 401221)
Abstract:With the large-scale commercial use of LTE network, VOLTE service is becoming more and more popular. In some scenarios, EDS query is needed for this service. Once the query fails, the call will fail. In this paper, the failure of EDS query caused by data consistency is analyzed in depth, and the method of comparing and checking step by step is put forward to deal with it, which provides a certain reference value for dealing with similar faults.
Key words:ENUM &DNS;Data inconsistency;Voice of LTE