河南联通SGSN POOL维护优化的实施
2015-12-20郭威龚建勇
郭威,龚建勇
(中国联合网络通信有限公司河南省分公司,河南 郑州 450002)
河南联通SGSN POOL维护优化的实施
郭威,龚建勇
(中国联合网络通信有限公司河南省分公司,河南 郑州 450002)
结合现网SGSN组池的情况,对SGSN POOL维护中容量评估、负载均衡、负荷卸载等关键工作进行了探讨和总结,为SGSN池组化组网和优化维护提供了参考经验。
SGSN POOL 容量 容灾 负载均衡 负荷卸载
1 引言
SGSN POOL作为移动分组域网络架构演进的关键技术,其具有业务容灾、提高资源利用率、降低局间信令负荷等组网优势,已经被电信运营商广泛应用。随着SGSN POOL部署条件的具备(Iu/Gb接口IP化),为做好SGSN POOL的网络规划建设工作,中国联通集团在组织SGSN池组方案测试验证的基础上,于2013年8月下发了《SGSN POOL建设指导意见》,开始在全国范围进行规模化部署。
河南联通目前已完成全网SGSN POOL的建设部署。结合无线侧3G实现Iu-Flex接入而2G未实施Gb-Flex的情况,如何做好池组内容量配置评估,池组日常负荷优化以及业务应急恢复评估,成为今后SGSN POOL运行维护工作中重点关注的问题。本文以现网SGSN POOL的维护优化为案例,就以上重点问题的实施进行了经验总结。
2 SGSN POOL容量评估优化
2.1 SGSN POOL资源共享和容灾原理
作为目前移动分组域网络容灾效果最好的技术手段,当SGSN POOL中某SGSN发生故障时,RNC/BSC识别该SGSN故障后,会将本来分配给该SGSN的新发起的用户业务转移到SGSN POOL中其他SGSN上。从而实现SGSN POOL内业务容灾,有效提高了网络的安全性。
SGSN POOL内SGSN业务通过负荷分担、动态调整来实现资源共享,消除了覆盖区域内用户移动带来的业务区域性波动,从而提升了整个核心网资源的设备利用率。
SGSN POOL容灾/资源共享原理图如图1所示:
图1 SGSN POOL容灾/资源共享原理图
2.2 SGSN POOL容量评估原则
SGSN POOL部署后,基于POOL全局容量评估优化至关重要。容量配置过高,影响容灾效果;容量配置过低不能发挥SGSN POOL资源共享,提高设备利用率,降低投资成本的优势。所以需在满足容灾的要求下,兼顾设备利用率,适时评估,及时调整。
评估原则一:池内SGSN的容量应考虑正常情况和单个SGSN故障情况下的设备利用率,并以容量配置需求较大者为准。建议正常情况下,POOL内SGSN的利用率按照65%左右考虑。当POOL内容量最大的1套SGSN故障退服时,其余SGSN能够全部接管该故障SGSN所承载的业务,接管后各SGSN设备利用率不高于95%。
评估原则二:对于3G网络组POOL,2G网络BSC单独下挂POOL内SGSN下的网络,为避免SGSN负载不均衡以及“吸附效应”问题,要求该SGSN应在2G容量上适当预留。
2.3 容量评估举例
以现网SGSN POOL4为例,平忙时池组内SGSN设备利用率为50%左右,为未入池的2G网络留有余量。在池内最大容量的LYSGSN10设备宕机时,附着利用率不超过95%。根据负荷容量评估原则,从表1可以看到目前容量配置比较合理,满足业务容灾的需求。
表1 SGSN POOL4容量评估表
3 SGSN POOL负荷分担评估优化
3.1 评估原则
从容灾要求可以看出,SGSN POOL内SGSN用户容量相近,更有利于提高资源利用率。而且,规划简单,尽量减少2G未池组化引起对3G的“吸附效应”造成的业务负荷不均衡。
3.2 现网SGSN POOL负荷分担评估分析
从表1可以看出现网SGSN POOL4负载不够均衡,不仅单独挂接在POOL内各个SGSN上的2G用户不均衡,入POOL的3G用户也不均衡。
(1)2G用户不均衡评估优化
导致2G业务不均衡原因为BSC未实现Gb-Flex池组挂接。为保证SGSN POOL内各SGSN业务均衡通过调整BSC挂接关系,尽量做到均分用户到各SGSN。需要注意的是对未入POOL的BSC做调整时,尽量还是以本地网为单位挂接。如果只考虑通过调整BSC挂接关系实现负载相对均衡为目标而将本地网BSC分割开,会增加该本地网内2G用户SGSN局间信令切换进而影响业务感知。毕竟本地网内用户位置更新较本地网间更频繁,建议在调整时要对利弊进行充分权衡后再实施。
(2)3G用户不均衡评估优化
SGSN POOL4开始部署时,对于初始接入用户,RNC根据IMSI按照负荷分担原则选择SGSN接入。对于非初始接入用户,RNC根据P-TMSI中的NRI来选择原SGSN接入。现网中SGSN包含不支持Flex的BSC,用户从不支持Flex的BSC漫游进入支持Flex的RNC,携带P-TMSI进行附着。支持Flex的RNC从中获取的NRI值是原SGSN的NRI,从而附着到原SGSN上。随着时间的推移,大部分3G用户附着到挂接本地BSC的SGSN上。由于区域本地用户量的差异,最终导致SGSN POOL4内SGSN间3G用户不均衡。RNC04入POOL当天3G用户迁移趋势如图2所示。
部分SGSN设备厂家提供有参数可以缓解这种情况。中兴SGSN设备为解决SGSN下3G用户负荷不均衡问题提供了名称为“支持NNSF功能”的软参,ID:65582。开启软参,用户从不支持Flex的BSC漫游进入支持Flex的RNC附着或RAU时,SGSN将核实是否是局内2G/3G互切换。如果是,则分配NULL NRI和Non Broadcast RAI给用户,让其按照负荷分担原则重新选择POOL内SGSN。中兴SGSN支持NNSF功能软参示意图如图3所示。
采用此措施虽可均衡负荷,但会大幅增加2G/3G SGSN局间RAU。同时由于SGSN局间RAU成功率低于SGSN局内RAU成功率,导致PS域RAB指派建立失败次数增多。在CS并发PS业务的情况下,PS域RAB指派建立失败,会将CS和PS一并释放掉,最终导致CS域无线掉话率升高,严重影响用户感知。从图4的统计可以看出开启参数前后掉话率明显上升,所以不建议为追求解决负荷不均衡而开启设备上的特定软参。需要针对当地的业务场景来考虑,特别是3G覆盖欠佳的区域,更要谨慎使用。
图2 RNC04入POOL当天3G用户迁移趋势
图3 中兴SGSN支持NNSF功能软参示意图
综上所述,要解决负荷不均衡的问题,应避免同一SGSN既有POOL用户又有非POOL用户。在条件允许的情况下增加无线Gb-Flex功能实现2G池组化接入,这是实现负荷均衡的最有效的办法。考虑到目前运营商2G投资基本已停止,在2G/3G混合组网且只有3G组池的情况下,在以本地网为单元和减少信令切换的基础上,尽量均分2G非POOL用户到各SGSN。同时结合设备自身特性,在不影响业务的前提下,通过参数设置来修正负荷不均衡。另外需要加强日常利用率监控,特殊情况下,采取人工卸载干预来保证业务运行的安全性,防止出现池内单台SGSN利用率过高的情况。
图4 开启软参2G SGSN局间RAU、信令负荷变化情况
4 SGSN POOL负载重分配应急维护
SGSN POOL实现业务容灾是通过SGSN POOL内业务迁移重分配来实现的。当业务故障时,如何将池内其余SGSN安全快速地恢复业务承载是SGSN POOL容灾应急方案的重点。不仅要考虑到将故障SGSN承载的用户业务迁移到本POOL内其它SGSN时,容量能否能满足卸载用户的接入,而且要关注池组内SGSN有关业务负荷控制的参数、控制MS接入的速率,避免大量用户重新附着、激活业务对接纳卸载用户的SGSN、HLR造成冲击,引起瘫局。负载重分配过程中,密切观察SGSN信令处理板卡负荷和HLR之间链路负荷。在负荷承受允许的情况下动态逐步调整业务负荷控制的参数,提高MS接入的速率,估算出最短业务恢复时限。
下面仍以SGSN POOL4为例。LYSGSN08整局同期实际附着用户数总共有58万,其宕机时需LYSGNS09和LYSGSN10分担接管其业务,要求附着用户尽快平稳接入。中兴SGSN信令处理SMP模块每秒通过附着业务个数可达到65 535,无线侧接入信令处理基本无瓶颈。再来看Gr口,Gr接口需要考虑整局的信令能力。按照Gr带宽70%利用率不会对HLR造成信令冲击,推算出业务恢复最短时限。根据估算,1次附着过程Gr口大约产生1KB流量,整局可用流量估算为576KB(总流量4*2MB/8*70%-已用流量148KB),则每秒可完成576个附着业务流程。单USMP模块每秒可完成576(附着个数)/79(模块)个附着业务流。配置时“每秒通过附着业务数目”取7即可,现网日常配置为5,这样故障LYSGSN08业务最快可在10分钟内恢复。
通过对负荷卸载过程的有效评估,防止操作过程对网络产生信令冲击,保证业务恢复的时限,从而在实施业务应急恢复过程中做到心中有数。
5 结束语
伴随运营商LTE网络的大规模部署,GPRS核心网将向EPC核心网方向演进,融合的SGSN/MME及GGSN/SAEGW将成为最终趋势。随之SGSN POOL将成为SGSN/ MME POOL,网络功能将更加汇聚和扁平。2G/3G时代SGSN POOL部署后对分组核心网网络安全起到了重要作用。做好组池化的维护优化,不仅对SGSN POOL后期网络运行十分重要,也可以为融合后EPC网络池组维护提供参考。
[1] 中国联通集团网络建设部. SGSN POOL建设指导意见[Z]. 2013.
[2] 3GPP TS 23.236. Intra-domain Connection of Radio Access Network (RAN) Nodes to Multiple Core Network (CN) Nodes; Stage1 (Release 10) [S]. 2011.
[3] 刘扬,王娜,郑航. SGSN池组规划关键问题与后续演进浅析[J]. 邮电设计技术, 2012(12): 76-80.
[4] 中兴公司. ZXUN uMAC V4.12.11 SGSN支持Flex功能特性指导书[Z]. 2014.
[5] 唐荣,程立彦. SGSN Pool组网设计及演进趋势分析[J]. 移动通信, 2013(22): 29-34.★
Implementations of SGSN POOL Maintenance and Optimization of Henan Unicom
GUO Wei, GONG Jian-yong
(China Unicom Co., Ltd., Henan Branch, Zhengzhou 450002, China)
According to the status of SGSN POOL in existing networks, capacity evaluation, load balancing and load unloading in SGSN POOL maintenance are discussed and summarized. It provides useful references to planning, optimization and maintenance of SGSN POOL.
SGSN POOL capacity disaster tolerance load balancing load unloading
10.3969/j.issn.1006-1010.2015.07.010
TN929.5
A
1006-1010(2015)07-0047-04
郭威,龚建勇. 河南联通SGSN POOL维护优化的实施[J]. 移动通信, 2015,39(7): 47-50.
2014-09-25
责任编辑:刘妙 liumiao@mbcom.cn