IUB口配置数据冗余导致PS业务异常问题分析
2016-09-08殷守江
殷守江
【摘要】 本文详细描述了在日常投诉处理过程中遇到的疑难问题分析和解决过程,排除问题的假象,精准定位影响用户感知的真实原因,从终端、无线侧、到传输,逐级排查,最终使问题得以解决。
【关键字】 用户感知 双IP测试 IPPATH冗余
一、背景介绍
近年来随着移动互联网的蓬勃发展,数据业务流量呈现高速增长的趋势。从2G发展到3G,再到4G时代,网络的演进和发展是为了满足数据业务高速发展的需求。能够提供高速、稳定、低时延的数据业务服务成为运营商的核心竞争力。影响数据业务感知的因素很多,后台监控和KPI指标不能完全反映真实用户感知情况。在网络的日常维护和优化过程中,用户投诉数据是我们发现网络问题,提升用户感知的重要途径。
二、问题描述
日前接到某基站周边多个用户投诉,反映有信号无法上网或上网慢现象。根据用户投诉现象和数量来看,该问题影响的范围较大,用户感知恶化比较明显。现场测试发现投诉区域3G信号覆盖正常,但经常上网断线,分析测试数据未定位具体问题。统计指标发现该站RRC连接建立完成超时导致RRC建立失败的次数较多,怀疑基站存在单板隐性故障,重启复位后问题依然无法排除。
三、问题分析定位过程
3.1数据采集
安排测试人员采用probe测试软件+华为测试终端U120E+华为数据卡+普通的智能手机在现场分别模拟打开网页、数据下载/上传、并发业务等多种用户行为做相关测试,后台同时跟踪CDT数据,发现以下四个问题:
1)先做数据业务后并发语音业务,PS业务降速严重;2)后台信令分析发现指配速率8M/2M,但RAB响应速率只有384k;3)PDP激活成功信令分配速率为384kbps,但实测基本无速率;4)FTP下载测试期间06:40:00—06:50:00PDP激活后无业务速率。
3.2问题分析
仔细分析,其中3个问题是由于测试终端或后台策略配置的影响,与本次用户投诉现象无关。
1)先做数据业务后并发语音业务,PS业务降速严重;
经确认,AMR并发数据业务时,系统配置的侧率是PS限速16kbps,并非异常。
2)后台信令分析发现RAB指配多次出现失败,以及RAB指配和响应的速率不一致;
经过确认,测试手机华为U120e的PS业务仅支持 384kbps,属于终端问题。
3)PDP激活成功信令分配速率为384kbps,但实测基本无速率;
根据前台测试数据分析,此时测试人员做了上传业务,速率正常。参见下图:
FTP下载测试期间06:40:00—06:50:00PDP激活后无业务速率。
根据后台信令分析,期间传输信道同步失败,IE信息为unspecifiedcause,可能为影响用户感知的真实原因,接下来重点核查传输问题。
3.3问题定位
经进一步分析,RAB发起释放的对应的原因值为“RR_ ERR_RNCAP_FP_FAILURE”,确认IUB口传输存在问题。因此,根据以下步骤排查:
1)检查基站和RNC之间的传输是否存在误码、闪断告警、ping包异常等,传输链路质量正常。2)检查配置脚本,R99的PS业务也在走IPPATH,现场将R99业务转到ATM上承载,在ATM上传输时数传正常,因此传输同步失败与IPPATH相关。3)检查RNC的IPPATH传输配置文件,发现IUB口IPPATH配置两个IP节点,且IP为172.22.149.2地址无法PING通,为无效IP。4)经核查,前期做传输双IP测试时为该站点添加了IPPATH链路的冗余配置,但测试结束后未及时删除。
四、解决方案及效果验证
IPpath采用双IP配置有两个作用:一是业务负荷分担;二是风险控制,业务可自动切换。正常情况下,ping检测开关需打开,否则无效IP相应的PATH上业务照常指配,导致业务无法进行,出现本案例当中用户无法上网的情况。
根据定位的原因,后台删除冗余配置信息。经现场复测和投诉用户回访均反馈已恢复正常,问题得到彻底解决。在全网范围排查IPPATH冗余配置隐患,未发现其他站点出现类似问题。
五、总结
IPPATH冗余配置问题隐蔽性较强,后台无明显特征,且网优后台系统操作人员不熟悉传输技术,在排查该类问题存在一定的局限性。因此在日常工作中需严格规范基站操作,杜绝此类问题发生。
参 考 文 献
[1](美)谢瓦利尔(Chevallier,C.)等,编著.WCDMA设计与优化手册[M].人民邮电出版社,2008
[2]徐志宇,韩玮,蒲迎春,编著.HSDPA技术原理与网络规划实践[M].人民邮电出版社,2006
[3]张长钢等编著.WCDMA无线网络规划原理与实践[M].人民邮电出版社,2005