ALCATELSPATIAL交换机计费原始话单在运行维护中的应用探讨
2009-09-26刘国兴
刘国兴
[摘要]话单分析不仅能帮助维护人员快速定位网络问题,而且通过编写软件,可以定期对话单进行分析统计,能够提前发现问题,化被动维护为主动维护。以ALCATELSPATIAL交换机计费原始话单为例,详细说明在核查单通问题以及通话中异常释放原因的分析处理过程。目的是提供一种分析和解决问题的思路与方法。
[关键词]原始话单 运行维护 单通 异常终止
中图分类号:TN8文献标识码:A文章编号:1671-7597(2009)0920044-02
一、概述
在日常维护中,我们一般是通过设备网管的告警功能,来发现一些诸如硬件设备故障以及定义的阈值超出等网络问题;对于很多不能触发告警的问题,主要通过分析性能统计,对比各个性能指标的变化,来查找问题。产生详细话单的交换机(如移动交换机)能够真实、详细地记录用户每一次的呼叫过程。同时交换机上都会产生一条CDR(Call Detail Record)记录.即通常所说的原始话单。交换机的原始话单记录相对性能统计而言,内容更加详细,通过编写话单的解码分拣软件,根据不同的目的对详单进行细化统计分析,结合话务统计功能,对于解决一些日常投诉较难处理的问题,可大大提高工作效率。
在实际情况中,CDR的格式会因交换机的不同而不相同,具体到每一项,各个厂家的叫法也不同。Alcatel Spatial采用3GPP TS32.205标准ASN.1格式话单。可查阅相关资料或调用ASN.1专用函数库解码。本文主要讨论如何应用详单辅助运行维护工作,具体解码可根据自己的目的进行分别处理。
二、应用实例
应用1:依据详单分析快速定位单通故障。
单通现象是移动通信中最常见的故障之一,严重地影响了整个网络的运行质量,用户反映强烈。出现投诉后,如果能尽量准确、高效地处理,可提高用户的满意度。反之,则可能会造成用户感知度的降低,甚至可能造成用户的流失。
引起单通现象的原因很多,汇总日常维护中遇到的部分单通情况:(1)交换机端口传输环路或鸳鸯线;(2)近远端端口本身隐性故障导致;(3)时隙有问题,两端状态不一致;(4)A接口电路问题,MSC到BSC到A接口电路中有些时隙不作为话音信道使用,并且A接口还牵扯到TC压缩,很容易发生两端电路不对应端情况,应在MSC端创建电路时隔掉不作为话音信道使用的时隙向,否则极易产生单向通话;(5)BTS的上下行功率不匹配。
分析以上原因1到4条故障都会集中反映在问题局向的某一电路或某一时隙上。目前的交换机的性能统计点只能到中继群层面,无法细化到电路、时隙级别。查找该故障传统的方法是用2Mbit/s测试仪表在DDF架上进行监听。没有仪表的话只能在夜间闲时对逐个电路进行拨测来查找问题电路。Alcatel Spatial交换机打开相关记录CIC的开关后,CDR中会记录呼叫的出入中继群号及CIC编码。根据记录中的出入中继群号以及CIC编码,通过软件对相关电路、时隙进行一个忙时平均呼叫时长计算,根据用户行为的特点,若遇到不能正常通话的情况后,会立即挂机再次拨叫的特点,会表现为中继占用时长较短。根据大量的统计发现,如果该电路平均呼叫时长小于20s,可以把该电路当成可疑电路。
对于原因5,同样可以对记录中的小区号进行一个忙时平均呼叫时长计算,来判别问题是否集中在某一小区。
实例分析:
通过编写了一个数据库分析软件,对本地3个SERVER分拣了一个忙时(19:00-20:00)的原始话单进行了分析,提取了moc和mtc两种类型的话单(共计268144条记录),对每个中继群每个电路平均呼叫时长运算。统计到通话占用涉及中继群62个电路数共计1349条。
首先筛选可疑中继群,针对中继群的每个电路平均占用时长统计,提取最小值。视图如下:
从上图分析看出:平均时长小于20s的只有中继群GS1-121001,对此中继群所有电路统计如下:
通过统计发现,可疑电路PCMID为0。这条电路整个忙时只有一次占用,本次占用详细记录如下(去除无关字段):
CALLING_NO CALLED_NO IN_TGRP DUR_TIME INC_CIC_PCMIDINC_CIC_TS
1383102****1553205**** 121001 6015
对此电路拨测,确实有单通现象,登陆两端交换机查询状态发现,此电路传输不稳定,双方状态不一致,暂时闭锁,传输故障排除后,解锁拨测正常。此实例充分表明,此办法可行,且能够节省运维人员大量精力,有效缩短投诉处理时间。
应用2:统计分析异常通信终止原因。
Alcatel Spatial交换机通信终止原因(字段:causeForTerm)话单中主要有以下值(全部取值可查阅厂家文档):
normalRelease (0),
partialRecord (1),
stableCallAbnormalTermination (4),
其中4表示异常终止,因此我们只需过滤次字段值为4的话单进行统计分析。根据字段diagnostics gsm0408Cause可以得出异常终止的详细原因。交换机的性能统计中有各个原因值的统计,但是其中只有次数以及比例等,结合话单中的统计就能得到部分原因值的详细记录,包括主被叫号码,位置区小区,小区切换记录等。通过对比可有效提高问题处理效率。
对现网忙时(19:00-20:00)moc、mtc话单记录(共计:268144条),通过软件针对异常终止话单进行过滤,共计得到3285条记录,主要原因汇总如下(选取大于10次的):
从上表可已看出cause 204是异常终止的是最主要原因参考相关GSM规范可知相关原因:Cause No.204"radio access lost。因此针对cause 204进行过滤,统计大于8次的小区的分布情况如下:
从上表可以看出,问题主要集中在个别基站或个别小区上,经过核实,其中ci为*0047的基站是由于微波闪断,abis接口传输质量不稳定造成的掉话,传输更改为光缆后,问题解决。Ci为*1976的基站是由于基站环境温度过高,造成BTS设备性能不稳定,引起掉话。总之通过话单的过滤是可以提前发现一些问题的,可以把分拣结果提交给无线网优人员,对相关小区重点关注。其他cause导致的异常终止,可以参考交换机的性能统计,观察所占比例是否异常,根据需要进行详细分析、处理。
应用3:日常局数据验证,作业计划等辅助工作。
日常进行局数据制作时,一般情况制作完成后,验证正确与否主要是通过拨测,要想验证号码传送是否符合规范,以及传送路由是否正确,只能通过信令跟踪方式,其实详单中记录的各种号码很详细:
calledNumber:用户拨叫的号码
translatedNumber:交换机翻译后的出局号码
roamingNumber:漫游号码
通过分拣以上字段以及出入中继群字段,很直观判断出号码翻译、传送路由是否正确。在进行投诉处理以及批量核查是能有效缩短响应时间。
核心网优化作业计划中,有单通串话整治项目,传统办法是逐个电路进行测试,这种办法耗时太长,浪费精力,通过软件进行分析,首先排查可疑电路,然后再进行小范围测试、验证。这种方式更加可行有效。
总之,随着计算机技术和信息技术的发展,运行维护工作逐渐由被动式维护和人工维护向主动式维护、智能化维护方向发展。利用软件对原始话单分析,在新局入网、电路扩容等易出现此类问题时,做几次详细分析,提前发现问题,解决问题,可以有效降低用户投诉,提高用户感知度。
参考文献:
[1]朱晓燕,计费话单应用于小灵通网优的探讨,电信科学,2007年第6期.
[2]张秀成,GSM网络单通的处理办法和交换机的优化,http://61.136.184.182/js/jiao/2/gsm.Htm.
[3]3GPP TS 24.008 V6.3.0.
[4]上海贝尔阿尔卡特股份有限公司,Spatial计费白皮书.