移动通信网单通串话故障的成因分析及排查预防
2009-10-29邱健
邱 健
【摘要】文章比较系统地研究了移动通信网中的单通串音问题及其成因,对排查方法进行了探讨,提出了建立长效预防机制的若干建议。文章的主要价值在于提出了处理客户投诉时的3W3H原则和四单原则,以及排查和预防的系统表,对移动通信运营商整治单通串话有借鉴意义。
【关键词】单通串话 3W3H 四单原则 排查预防
随着移动通信网络规模的不断提升,网络复杂程度不断提高,网络话音质量投诉明显增多,客户满意度严重受影响。但因其成因复杂,分析手段有限,故障的快速排查和有效预防一直困扰着移动运营商。因此,有必要对单通、串话故障的成因进行分析,并结合具体设备,寻求快速排查和有效预防的方法。
1 单通故障表象及成因分析
1.1 单通故障表象
单通故障的典型表象为:通话双方中仅一方能听到对方讲话,而另一方听不到任何声音。在更广泛的意义上,通话过程中的杂音、回音、双不通都可归入单通的范畴。根据持续时长,单通可分为持续单通和间歇单通。例如:传输电路的鸳鸯线、环回线等将导致持续单通;无线环境差、FER高,则多表现为间歇单通。
1.2 单通故障成因
单通故障的成因,除了常见的工程性问题(鸳鸯线、接头故障)、无线环境问题(FER高、通话质量差)外,还与相关设备的性能和数据配置有关。下面按照话音呼叫的常规路径,逐段分析可能导致单通的原因。
(1)移动台部分
因手机终端故障,引起各种通话质量差的现象,从而影响用户的通话感受。
(2)无线系统
无线系统主要由基站、无线链路(电磁波)组成。按照语音信号的处理过程,基站部分可以划分为基带信号处理、射频信号处理、射频信号发送/接收三部分。以下将分别从各环节阐述无线系统中单通现象的机理:
a)天馈线故障;
b)无线信号强度突变或受到严重干扰;
c)BTS部分:
◆无线小区的上、下行链路不平衡;
◆基站信道处理板故障;
◆基站收发信机故障;
◆站内射频电缆连接故障。
d)Abis接口部分:
Abis接口是BTS和BSC之间的接口。BTS和BSC两者的CIC数据不匹配,两者之间的传输中继设备存在故障,DDF连线错误(鸳鸯线、环回线),各连线端口接触不良,传输电路高误码等,都可能导致通话质量差,具体表现为单通、双不通、杂音、回音等。这主要与工程施工质量、传输网络的可靠性和稳定性有关。
e)BSC部分:
BSC部分直接引发单通的可能性较小。负责呼叫处理的单板/中继板发生故障或连线错误时,可能连带引起各种通话质量不良的现象。
f)A接口部分:
A接口是BSC和MSC之间的接口,主要实现码速变换及帧选择/复制的功能,即TRAU(码速变换器)/Vocoder(声码器)。TRAU板件故障引发单通的概率较大。此外,鸳鸯线、环回线、传输设备故障等传输电路原因同样会引发单通。
(3)MSC部分
◆交换矩阵
当话务负荷过高时,交换机不能正常疏通话务,用户反复拨打会造成话务拥塞,使交换矩阵处理紊乱,可能导致单通。
◆互联互通环节
本端交换局到关口局(GW)这一段网络连接正常,但经关口局(GW)出局后,由于传输部分或两端CIC数据配错以及其他运营商的网络故障等原因,也会导致单通。
◆录音通知机
录音通知可以向主叫方简短提示呼叫未接通的原因,引导用户正确发起呼叫。当录音通知资源出现拥塞或故障时,会引发单通。应对各种呼损设置合适的录音通知,以避免用户反复拨打而造成话务拥塞。
(4)传输部分
所谓“鸳鸯线”是指一个E1系统和另一个E1系统的收发端接反,如图1所示。由于“鸳鸯线”可能发生在A口,也可能发生在E口,且单通和串话成对出现,因而在此专门讨论。
“鸳鸯线”连接时,设备的各端口仍能收到载波信号,不会触发告警,却无法通过线路环回进行检查。如果用户A和B占用了“鸳鸯线”连接的一对PCM系统,由图1可知,A能听到B的声音,但B却听不到A的声音,造成单通。如果用户C和D占用了“鸳鸯线”的另一对PCM系统,则造成串线。“鸳鸯线”影响成对的E1,即可能影响两对通话用户而造成串线。这主要与工程施工质量、电路开通时没有逐根(关闭-查看告警-打开)核对有关。
另外,传输中电路环回状态也会导致单通、回声或无声现象,因此,在对电路做环测试后必须尽快恢复。
2 串话故障表象及成因分析
狭义来讲,串话是指在通话过程中,随机有第三方用户串入正在通话的双方,导致原通话双方无法正常通话。而从广义来看,串话与单通只是同一问题不同用户的不同感受而已。
通常可能产生串话的原因是:
(1)与MSC CIC的管理分配、电路板的工作状态以及MSC和BSC之间CIC的连接有关。CIC为电路识别码,指MSC到BSC间的话音电路,其取值范围是0~4095,电路群中每一个时隙对应一个CIC号。
(2)MSC到BSC间的2Mbit/s链路连接不正确,如2Mbit/s链路交叉,或2个2Mbit/s链路间的收发交叉等。
(3)MSC在通话结束后没有释放CIC,随后又分配给其他用户使用,可能引起串话。
(4)手机问题。手机在切换失败后,应该以切换前的形式(包括频点、时隙、全速率/半速率、加密模式等等)回到原来的信道,网络对此无法干预。而文献[2]中萨基姆手机在切换失败返回时“擅自”改变信道参数,被认为是手机存在问题。
(5)切换问题。切换是造成串话的必要条件,但非充分条件。
(6)载频问题。载频自动重启也会造成串话。
3 单通串话故障的快速排查
因单通串话故障的隐蔽性(在网络设备上不会产生直接的告警)和传统排查的低效性(逐条电路的CIC测试耗时耗力),为提高对用户单通投诉的响应速度,我们结合前述单通故障的特点,探讨快速排查的方法。
所谓“快速排查”,是指运用科学的方法在较短时间内准确定位故障点;首先是定位故障范围,是全局的(整个MSC/BSC范围)还是局部的(单个BTS的范围)。若是终端侧的原因,建议采用更换投诉用户SIM卡、终端的方式进行排查;对于个别单通投诉,可排除终端侧的原因,直接进行网络侧的排查。在排查过程中,应综合考虑无线侧和交换侧的影响因素,以利于问题的准确定位。
3.1 用户端信息排查方法
(1)用户投诉询问要素
10086接到用户单通、无声或串话的投诉后,应尽量询问到下列详细信息:
◆时间:投诉往往在事后,但发生问题的准确时间对后来的故障分析(如话单、信令的查询)等有至关重要的作用。
◆地理位置:需要把主被叫发生问题时所处的位置描述得尽量详细准确。
◆功能:手机SIM卡功能的调查,是否有彩铃、VPMN等智能网的功能。
◆移动性:需询问通话中主被叫手机是否在移动过程中。
◆故障现象:除了基本的故障现象外,还需询问故障发生是在通话建立时还是通话过程中,以及问题出现的频率。
简单归纳为以下几句话(3W3H):
◆什么时间发生的?(when)
◆在哪里发生的?周围有什么建筑?室内还是室外?(where)
主被叫号码?(who)
◆故障发生时手机是否在移动?(How move)
◆故障是发生在通话建立时还是通话过程中?(How happen)
◆类似问题在此地发生是否频繁?(How offen)
注:第3点要素(who)关系到用户使用哪些功能,客服中心可通过BOSS系统查得。
(2)利用用户呼叫信息排查
研究用户行为发现,用户在遭遇单通、双不通、串线等情况时,会在极短时间内挂断电话重拨,这样就会在通话路径相关的设备上留下“超短通话记录”(通话时间在30s以下),并且该设备上基本不出现“长呼叫”的通话记录。因此,过滤出超短通话记录,对与此呼叫相关的设备信息进行统计(如:出现短通话最多的某个中继号、某个基站、某个信道板等),就能基本圈定可疑设备。对这些可疑设备进行针对性的软/硬件检查,就能很快排查故障。此方法操作简便,应用广泛。
3.2 交换侧相关的排查方法
交换侧排查方法总结如表1:
3.3 排查处理流程
流程描述如下:
(1)10086接到用户单通、无声或串话的投诉后,询问到用户异常通话的详细信息。
(2)在获得上述信息后,立即通知维护人员,以便及时进行现场路测。
(3)汇总10086的投诉,并结合现场测试结果确定故障发生的范围:
◆集中在某个特定的基站下?
◆集中在某个BSC下?
◆集中在某个MSC下?
◆集中在某特定局向(如CMCC-UNICOM、TELECOM-CMCC)?
以上简称“四单”原则,即是否单个基站、单个BSC、单个MSC或单个局向?
(4)如果发生在某一基站下,首先查看EVENT历史记录有无RCI告警,尝试更换相关硬件。
(5)如果基站上无告警,则通过拨打测试来断定问题所在:
◆集中在一块或多块特定载频,则先收集数据,然后执行INS操作或更换载频。
◆集中在某一小区的全部载频上,则检查天馈线(分布式、直放站)系统、覆盖及干扰情况。
◆集中在某一条传输的RTF上,则检查传输是否连接正确及有无接触不良问题。
(6)如果单通发生在某一个BSC下的多个基站,则问题出现在BSC侧。首先查看历史记录确定是否存在CIC相关的告警,再通过命令确定CIC的物理通路,更换相应板件。
(7)检查数据库CIC配置是否有错,以排除可能的软件故障。
(8)如果没有CIC告警,则使用仪表逐一监听A接口、Abis接口的所有CIC,以确定出问题的CIC,然后更换板件,并检查BSC-MSC之间的电路鸳鸯线、接头阻抗大等问题。
(9)如果问题发生在特定局向,则确定无声问题发生在上下行哪个方向。如从MSC侧来的下行链路无声,则问题不在BSS侧。如果上行无声,则不会固定在特定的局向,需参考上面的步骤予以排查。
(10)如果是一个MSC下的多个BSC产生单通现象,可对所有BSC逐一采用步骤(6)~(9)进行排查。同时在MSC侧开展调查。
(11)如果不同MSC下的BSC出现单通,除了对相关BSC和MSC进行调查外,还应检查MSC之间电路的配置和连接是否正常。
4 单通串话故障的预防措施
要对移动通信网的单通串话故障进行预防,可从两个角度来分析:
4.1 系统外部变化
(1)工程
◆新增批量电路
在铺设中继线时,一定要贴好标签,包括线序和收发端,尽量降低鸳鸯线、自环线的出现概率。在话务量小的情况下,可闭塞部分原有中继,增加新增中继的占用概率。调测电路一定要仔细,观察时隙占用情况和对应的电路号,确保每条新增中继都被测试到。
◆局数据调整
(2)网络变化
◆启机
◆新增部分电路
对于新开局、新增电路,要严格统一电路标识,并进行电路商用前的测试(电路维护测试、电路承载测试等)。
◆数据变化
◆互联互通调整
对于互联互通GW MSC,要定期进行传输电路的维护和测试。
4.2 系统内部变化
(1)指向性普查
◆局数据
◆硬件模块
对重要区域的MSC,要定期进行交换矩阵的诊断和倒换测试。
◆接口检查
(2)综合性普查
◆话务统计分析
◆信令流程分析
◆话单分析
在密集城区、重要客户聚集区的服务MSC、服务BSC,要定期检查超短通话记录,对可疑设备作进一步诊断。
单通串话故障因其成因复杂,排查和预防的手段需要在日常运维实践中不断丰富和改善。而无论是快速排查还是有效预防,目标都是提高投诉响应速度,改善用户通话感受。
参考文献
[1]刘嵘. 移动通信网单通故障的成因分析及排查预防[J]. 广东通信技术,2006,26(7).
[2]彭四斌. GSM直放站覆盖区串话问题分析[J]. 信息通信,2007(4). ★
【作者简介】
邱健:硕士就读于上海交通大学计算机技术专业,现任职于中国移动上海公司。