华为relay宿主基站业务IP掩码配置优化提升业务感知
2019-12-11
(中国移动通信集团福建有限公司泉州分公司,泉州 362000)
1 问题描述
用户反映在某地附近经常出现电话无法接通,无法正常上网问题。现场验证无法上网,VoLTE语音概率性接通,通过无线、传输联合排查,定位问题原因。
2 问题分析
2.1 告警排查
宿主站MMF-HLH-1,从告警来看,一直存在“中继远程节点不可用告警”。Relay站SSD-HLH-1,从告警来看,长期存在SCTP链路故障告警、S1接口故障告警。如图1所示。
图1 Relay站SSD-HLH-1告警信息
2.2 指标排查
查看接入指标,RelaySSD-HLH-1小区的E-RAB建立成功率非常低,建立失败COUNTER主要为“传输层问题导致E-RAB建立失败”其他指标正常。如表1所示。
表1 RelaySSD无线侧指标
从话统数据查看E-RAB建立失败原因,主要是TNL失败。如图2所示。
图2 E-RAB建立失败原因
查看信令失败原因值均为传输资源不可用,与后台指标统计接入失败原因一致,初步推断是传输存在问题导致E-RAB建立失败。如图3所示。
图3 信令面立失败原因
2.3 现场排查
从现场勘测来看,RRN上的信号灯只显示3格,且为黄色灯,测试宿主站MMF-HLH-1信号覆盖,RSRP在-98左右,SINR在2左右,按照RRN的部署条件要求,需要优化覆盖。Relay站SSD-HLH-1信号覆盖,RSRP在-77左右,SINR在33左右,覆盖正常。
现场通过RF优化,宿主站MMF-HLH-1小区信号RSRP在-89左右,SINR优化到16左右,RRN信号灯已恢复为正常的绿色常亮。如图4所示。
图4 RRN信号灯
现场测试,语音已基本恢复正常,但数据业务仍有问题,后台监控指标,E-RAB建立成功率未恢复正常,查询告警仍然存在。如表2所示。
表2 RelaySSD无线侧指标
2.4 RRN传输规划核查
L3 Relay组网站点IP地址配置的具体要求如下:
(1)RRN的LAN IP、下游站点IP共网段。
(2)RRN的OMIP与LANIP不共网段。
(3)对于宿主站点来说,宿主站点的IP地址与RRN的LAN IP、下游站点IP不共网段。
(4)对于传输来说(网关掩码一般为255.255. 255.192,IP地址为广播IP地址),宿主站点IP、RRN的OMIP、RRN的LAN IP、下游站点IP共网段。
如图5所示,从当前宿主站点以及RRN、下游站点IP规划来看:
图5 现网IP配置
宿主站点业务IP(100.98.44.197/255. 255.255.192)和下游级联站点使用的有业务IP(100.98.44.210/255.255.255.252)在一个网段,在这种情况下,如果宿主站点连接的PTN上开启了ARP代理,宿主站点有可能通过ARP学习到一条与下游站点相同IP地址的直连路由。该直连路由由网关代理生成,其由宿主站点指向PTN代理;同时用户还手动配置了一条指向真实回传基站的空口路由。在网络上有数据传输时,对相同目的IP的路由,按照源IP、目的IP等散列选择其中一条路由进行选路。若回送给下游站的报文,选择到错误的直连路由时,则无法到达真实的下游站,此时会出现下游站点业务链路异常(表现S1接口以及用户面链路频繁闪断)。
在宿主站点进行DSP ARP,发现宿主站点ARP解析到一条与下游站点相同IP地址的直连路由。如图5所示。
图6 网管截图
3 解决方法
通过修改宿主基站业务IP子网掩码的方式,大大降低E-RAB建立失败和QCI=1 E-RAB建立失败的次数,有效降低路由问题可能引起的业务失败,有效提升用户业务感知。具体解决方法是将宿主站MMF的业务IP的子网掩码由192修改为240。
4 处理效果
10月23日09:50现场更改路由后,“S1接口故障告警”、“中继远程节点不可用告警”告警恢复,后台监控指标,E-RAB建立成功率也恢复正常,现场多次测试验证,所有业务均恢复正常。如表3所示。
表3 RelaySSD无线侧指标
5 结束语
由于宿主站点的IP地址与RRN的LAN IP和下游站点IP在同一网段,宿主站点通过ARP学习到一条与下游站点相同IP地址的直连路由;同时用户还手动配置了一条指向真实回传基站的空口路由。宿主站点回送给下游站的报文,由于存在2条路由,可能概率性选择到错误的直连路由,进而下行业务报文无法到达真实的下游站,引起业务异常。
现网PTN的ARP默认都是开启的,所以针对有开通Relay的宿主站点,需要通过子网掩码划分使宿主站点的IP地址与RRN的LAN IP、下游站点IP 不共网段。