某运营商移动综合网管有价值的几个案例分析
2019-11-22张军霞韩红蕊
张军霞 韩红蕊
摘 要:本文通过某运营商移动综合网管日常维护的几个小案例分析,对移动综合网管数据缺失的几个业务场景进行了阐述。在未来新的多样化业务需求下移动综合网管也需要基于发展愿景和当前网络特点,选择合适的组网方式。在各种网络架构下数据保障依然是重中之重,本文通过这几个小案例分享希望给相关人员提供一些有效的维护经验。
关键词:运营商;移动综合网管;案例分析
随着移动网络的不断壮大,移动综合网管起着越来越重要的作用。如何更好地保障移动综合网管采集的各类数据,尽可能地挖掘数据的有效价值成为从业人员越来越重视的问题,本文从维护的角度汇总了几个小案例,希望给相关人员提供一些行之有效的维护经验。
1 案例一、6月6日承德IUCS语音业务话务量异常增高的分析与说明
2019年6月7日,在每日的例行流量监控中,发现承德6月6日IuCS接口语音业务话务量异常增高7倍。
随即开始查找原因。
首先查找综合网管数据,综合网管平台是由采集和入库两部分组成,经过检查,采集与入库程序均正常,数据是从专业网管如实采集上来的。
其次检查综合网管与专业网管的接口正常连通,数据可以正常上报。
再次检查在接口正常的前提下,数据是否从端局正常产生并从专业网管正常上报到综合网管。从专业网管提取承德6月6日全天IUCS数据,发现承德端局网元无话务统计数据。由于话务统计是从端局生成后上传专业网管进而上传综合网管的,端局如果话统生成有问题会引起上层综合网管数据呈现,由此断定问题出现在端局自身上。经过查找,发现当晚组POOL的端局未订制IUCS文件的全局话统对象文件。
针对这种情况我们采取了以下措施:
(1)在承德端局订制含有IUCS文件的全局话统对象文件,将组POOL后的端局话统数据写入NAT为0的大本地网网元文件。
(2)综合网管修改承德提取文件,由原来提取NAT为CDGS1.MGW1和CDGS1.MGW2的文件改为提取NAT为0的大本地网文件。
(3)通知厂家和相关人员以后网元组POOL后一定及时登记话务统计到大本地网并及时通知上层综合网管。
7日上午9:49分,大本地网数据加入IUCS对象定制,问题解决。
本案例中有3个疑点,产生及原因如下:
疑点一:承德组POOL后话统数据未及时订制导致大本地网数据缺失,現象应该是数据缺失,而不应该是爆涨。
原因:割接当时虽然数据未写入大本地网,但上层综合网管提取的原CDGS1.MGW1和CDGS1.MGW2数据在割接当时(6日凌晨1点)瞬间爆涨了近7倍,数据由正常的7万多爆涨到47万多,由于端局未对数据进行订制,综合网这照常去取原CDGS1.MGW1和CDGS1.MGW2数据导致数据呈现上出现了爆涨情况。
疑点二:为什么只影响IUCS话务量而没有影响同在一个大本地网文件中的A接口话务量?
原因:IUCS接口的对象需要手动加入NAT为0的大本地网文件中而A接口的对象是可以自动同步到网管从而实现自动统计的,所以IUCS话务量受到了影响而A接口未受影响。
疑点三:为什么割接当时原话务统计数据会爆涨?
原因:组POOL过程中网元重启,重启网元引起数据异常。说明某厂家端局网元重启会引起话务统计数据异常。
2 案例二、唐山某2RNC没有性能数据处理与分析
2019年5月25日,在例行流量监控中发现唐山某两RNC从5月20日开始一直没有性能数据,随即开始查找原因。
性能数据的呈现分3部分完成:(1)首先要通过CORBA接口从厂家FTP到性能文件。(2)采集服务器开始解析分析厂家的性能文件,通过解析插入到数据库的底层数据性能表里面。(3)等采集完成后进程最后会触发汇总,把底层的数据先汇总到中层,再从中层汇总到上层,最后呈现在报表上。
问题发现之后采取倒序检查法,首先排除采集跟汇总这两个过程,因为采集跟汇总都是按照OMC粒度进行的,不会对单个网元进程采集汇总。排除这两种可能后直接查看第二步和第一步,查看采集服务器发现缺失性能文件,并没有采集到厂家性能文件。
继续检查发现厂家服务器上发现没有生成性能文件,后经过排查是由于设备掉电导致性能文件没有生成。重新加电后性能文件生成正常,故障恢复。
3 案例三、石家庄邢台某网管SERVER性能缺失数据处理与分析
5月23日12点发现石家庄邢台某网管SERVER性能数据缺失,随即开始查找原因。
经查,原因为厂家服务器未发送文件生成完成可以获取性能文件的CORBA接口消息导致性能文件未采集成功。
此类问题无法直接定位原因,只能按照采集的过程一步步排查,最后找到问题症结:(1)首先查看汇总发现底层跟上层都没有数据,需要查看采集。(2)查看采集发现任务一开始就没有获取到要解析的性能文件,那现在就能知道是性能文件的问题了。(3)登陆CORBA服务器找到厂家性能文件存放的位置,结果没有性能文件。
查看某厂家服务器有性能文件,这就说明是CORBA接口采集过程中出了问题。需要手工登陆到厂家服务器ftp过来性能文件,再采集、汇总问题解决。经过询问该厂家服务器头天晚上进行了设备升级但未重启针对网管接口的FTP服务。
4 结论
某厂家网管服务器升级之后需要对综合网管接口的FTP服务进行重新定制,否则厂家服务器将会出现不发送文件生成完成可以获取性能文件的CORBA接口消息导致性能文件采集不成功。
作者简介:张军霞,女,高级工程师,就职于中国联通河北省分公司网管中心,从事移动通信运行维护工作二十多年,主要负责移动核心网数据保障、异常指标核查、移动网运行分析等工作;韩红蕊,女,高级工程师,就职于中国联通河北省分公司网管中心,从事移动通信运行维护工作二十年,主要负责核心网的网络资源及调度管理等工作。