MSC POOL工作原理及应急方案探讨
2011-11-13黄斌
黄斌
摘要文章介绍了MSC POOL的原理与优势,归纳了MSC POOL的几种故障类型及相应的处理方案,并通过维护实例予以说明。
关键词MSC POOLServerMGWBSC核心网
1MSC POOL的原理
在3GPP R99和R4版本中,核心网延续了传统的树形网络结构,一个RNC只能被一个核心网节点控制(如MSC Server),如果核心网节点发生故障,其所管理的RNC就无法正常工作。基于3GPP R5(3GPPTS23.236)的MSC POOL技术引入了“池区”(POOL Area)的概念,多个核心网节点组成一个区域池。和以往RNC/BSC与MSC一对一的控制关系不同,在MSC POOL内的每个RNC/BSC都可以受控于池内所有的MSC节点,每个MSC节点都同等地服务池区内所有RNC/BSC覆盖的区域,连接到RNC/BSC的终端用户可以注册到池中的任意一个MSC节点。
换言之就是多个MSC共同服务一个大的服务区,所有MSC以POOL组方式共同工作,其中不同类型和厂家的BSC与传统交换必须升级支持MSC POOL。POOL内每个BSC/RNC都能受控于POOL内每个MSC,控制逻辑关系全连接,BSC/RNC被POOL中的多个网元同时管理,终端用户可以按照负载均衡的原则注册到POOL中的任意一个节点以共享资源。
MSC POOL技术的引入,提供了一种突破点到多点的连接限制、实现网络资源共享的手段。图1表示了MSC POOL的组网结构。
2MSC POOL的优势
MSC POOL优良的组网技术为运营商对移动网络的运维带来了诸多优势,其主要有:
(1)减少核心网络信令开销负荷
POOL提供了公共MSC/SGSN服务区,原有MSC/SGSN间的位置更新全部优化为MSC内的位置更新。这样,话务负荷就被平均分配给资源池中的MSC,对每个MSC来说没有负荷高峰,而且池内无MSC局间切换;即MSC POOL可大大降低局间的位置更新/切换次数,减少MSC和HLR的系统信令开销,降低核心网节点负荷,提升网元容量,减少网元占用。在3G网络正在部署发展的阶段,MSC POOL可以有效减少2G/TD网络间的重选次数,提升系统间切换成功率,为TD发展提供可靠保障。
(2)核心网设备负载均衡
传统网络中不同节点由于覆盖范围不同,话务峰值出现在不同时间不同地点,网络规划都按各自最大可能出现的话务来配置单个节点。MSC POOL的引入,使话务在所有节点中平均分配,避免网络资源不均衡利用。
(3)网络规划扩容灵活,简化工程实施
MSC POOL中的节点数量可以随着话务量的增长而逐步增加,只需在MSC POOL中增加一个MSC,即可方便地实现扩容,不需要割接,不影响正常的网络运行,也不需要重新划分服务区。同时,无线网络与核心网络实现分离规划,不需要无线网络跟随核心网络的扩容来费时费力地重新划分服务区,从而减少了对无线接入网的影响。
(4)实现网络级冗余备份安全保障
当MSC POOL中的某个节点发生故障时,BSC会把接入网络的终端的服务请求(位置更新、试呼)重新分配给POOL中仍然正常工作的MSC,从而实现零宕机时间,提高MSC服务性能;而POOL中的其它MSC/MSCServer会接手故障节点的话务,丝毫不影响用户的使用。当需要进行维护或升级时,只需以受控的、适当的方式暂停某个MSC/MSC Server的服务,激活话务的重新分配,即可实现完全自动的冗余分配。
3应急方案
由于MSC POOL的引入增强了核心网的安全性及稳定性,所以对于MSC POOL的维护显得尤为重要,做好POOL维护的应急预案对日常工作有着相当重要的意义。以下为常见的几种MSC POOL故障的处理方法:
3,1Server
(1)POOL内Server高负荷
在MSC-S高话务情况下,立即进行用户重分配反而会对MSC-S造成冲击,可以先采用GRI(GMSCRoaming Interlocation)分流等方法降低MSC负荷,然后再迁移该MSC-S(假设MSC1)部分用户到POOL内其它MSC-S。
1)第一步:GRI分流
把高负荷的MSC的呼叫通过其他低负荷的MSC来转接,减少高负荷MSC与HLR之间的信令交互,从而降低MSC的负荷。在MSC高负荷可以预先判断的情况下,应该提前根据话务预测来做好高话务MSC的话务分流比例以及分流局向的计划,尽量做到把高话务均衡地转接到多个低话务的MSC。遇到突发情况,可以直接把话务分流到话务比例较低的互联关口局上进行转接。
2)第二步:迁移MSC1部分用户到POOL内的其它MSC
检查POOL内其它MSC-S的负荷和用户数,确定POOL内其它MSC-S可承担该MSC-S的部分话务,根据情况选择迁移比例;观察MSC1的用户迁移情况,并关注POOL内其它MSC-S的负荷情况,确保用户迁移不会引起其它MSC负荷过高引起限呼,如果其它MSC负荷过高,参考用户迁移的方法进行动态调整。
(2)POOL内某MSC Server工作不稳定,呼叫困难或无法正常处理话务
POOL内某一MSC Server(假设MSC1)工作不稳定,能保证与BSC的信令联系,但无法正常处理话务,在短时间内无法定位故障原因及修复故障。为了快速恢复话务处理,利用MSC POOL特性,把MSC1用户迁移到POOL中其它MSC-S,并将MSC1隔离,用POOL内其他MSC来承载MSC1的业务。
(3)POOL内某MSC Server宕机
由于MSC POOL具有实时自动容灾备份功能,当POOL内某MSC宕机后,主被叫业务都可以自动重分配到POOL内其它MSC。由于MSC宕机后,其POOL内MSC要增加对宕机MSC用户的被叫恢复信令处理,会引起POOL内MSC负荷升高,需要重点关注POOL内其他MSC的负荷情况,如果负荷过高,则启动负荷分流方案。
3.2MGW
(1)BSC双连MGW,POOL内某MGW宕机引起BSC连接的另一MGW License受限
当BSC所连的一个MGW发生该故障时,由于BSC双连MGW,故障MGW下带的BSC业务会全部转移到BSC连接的另外一个正常的MGW上,造成正常MGW话务受冲击而引起交换机设备受限,扩大故障覆盖面。为避免正常MGW受限制,可以采用两种方法:1)限制小区接入;2)闭塞部分AN设备。
(2)POOL内某MGW宕机,BSC单连MGW
发生该故障时,采用本地网MSC N+1容灾备份方案,实现BSC的准实时容灾。前提条件:利用退网的多
个MSC作为容灾MSC,提前布放好POOL内现网BSC到容灾MSCI的A口电路,并且在容灾MSC、BSC中提前定义好相关数据。
3.3BSC
POOL内出现某个BSC到某个MSC Server(假设MSC1)的A接口电路占用率过高。对此,可以采取以下措施进行处理:
(1)检查POOL内其它MSC-S的CP负荷、用户数以及A接口占用率,确定POOL内其它MSC-S可承担MSC1的话务;
(2)将MSC1的部分用户迁移到POOL内其它MSC上;
(3)观察MSC1用户迁移情况,并关注POOL内其它MSC-S的负荷情况,确保用户迁移不会引起其它MSC负荷过高从而引起限呼。如果其它MSC负荷过高,参考用户迁移的方法进行动态调整;
(4)确认MSC1的指定比例用户迁移后,观察高负荷A接口占用率是否已经正常,并在POOL内所有BSC上恢复数据。
4维护案例
(1)故障现象
POOL内某一个Server出现某LAC下小区用户无法做被叫,暂时无法接听到通知音,但是做主叫正常。通过指令查看,该LAC下的小区异常。
(2)处理过程
1)利用POOL的特性,在相应的BSC/RNC中启用用户重选功能,将该BSC/RNC中的用户驱赶到POOL内其他的MSC-S上,以此来减少用户投诉,提高用户感知;
2)根据用户投诉情况和故障现象,在必要时更改BSC中的T3212时长,以此使得用户能更快速通过重选机制迁移到其他MSC-S上;
3)待用户全部迁移完成后,恢复原有的T32121时长,并对登记在故障LAC下面的用户进行拨测,确认用户完全通话正常。
(3)过程回顾
从该故障处理的过程可以看出,当POOL内的某一个MSC下带的用户出现异常,但该MSC尚未退服,仍可以处理登记在其上的用户业务的时候,可以通过启用用户重选机制的方式来把用户迁移到POOL内其他MSC上,以此减少用户投诉,改善用户感知。
5结束语
MSC POOL技术为移动核心网的组网结构带来了革命性的变化,各个MSC/MSS不再是相对独立的网元,而是结合成了一个有机的整体,核心网资源在整个POOL内做到了共享,不仅提高了核心网的可靠性,也有效地提高了核心网络资源的利用率。同时我们也应该看到,维护手段需要随着MSC POOL工作进展而不断更新和完善,这对于缩短MSC POOL的故障处理时长、改善客户的感知度有着重要意义。