GSM-R车载设备库检业务典型故障分析及库检基站设置建议
2014-01-18赵武元
■ 赵武元
GSM-R车载设备库检业务典型故障分析及库检基站设置建议
■ 赵武元
1 概述
GSM-R车载设备包括C3列控区段列车自动防护(ATP)系统的MT模块、列控设备动态监测系统(DMS)终端、机车综合无线通信设备(CIR)、GSM-R手持终端等。这些设备在C3列控、调度通信等行车控制和指挥、保障运输安全方面都发挥了重要作用。各铁路局规定GSM-R系统车载设备未进行出入库检测或检测不合格时,机车不得出库担当牵引任务。因此,一旦GSM-R系统车载设备出入库检测不能正常完成,将直接影响铁路运输秩序,因此保证车载设备出入库作业正常至关重要。以下针对GSM-R车载设备库检业务典型故障案例进行分析,并就库检基站组网和配置等进行探讨。
2 典型故障分析
库检点GSM-R网络由库检基站、库检设备及库内机车终端组成。库检设备的GSM-R终端有2个:语音模块和数据模块。每台机车的GSM-R终端有5个:CIR语音模块和数据模块、ATP的MT1和MT2、DMS的通用分组无线业务(GPRS)模块。库检点GSM-R网络见图1。
2.1 库检基站及CIR出入库检测设备故障
2.1.1 传输光缆中断造成库检基站脱网
传输光缆中断造成库检基站脱网,影响GSM-R系统车载设备出入库检测。
图1 库检点GSM-R网络
(1)故障现象:某铁路局GSM-R网管机房OMCR网管显示动车所库检基站传输链路告警,基站脱管,库检点通信作业人员反映GSM-R终端有场强信号电平显示,但无GSM-R标识,不能发起业务,影响GSM-R系统车载设备(包括C3列控车载设备、CIR、DMS)出入库检测作业,造成机车不能按时出库。
(2)处理过程:GSM-R网管机房通知传输专业进行故障处理,判断故障原因是由于至库检点传输光缆中断造成,立即组织光缆抢修后故障恢复,GSM-R系统车载设备出入库检测作业正常。故障延时1 h 10 min。
(3)原因分析:该故障中库检点无线覆盖由库检基站单独覆盖,其中基站(BTS)接入基站控制器(BSC)传输链路为单链,没有传输电路保护,因此光缆中断导致BTS至BSC传输链路中断后库检点基站脱网,造成业务中断,影响GSM-R系统车载设备出入库检测作业。
2.1.2 雷击造成库检点基站冗余电源模块故障
雷击造成库检点基站冗余电源模块故障后基站宕机,雷击同时造成库检设备故障,影响GSM-R系统车载设备出入库检测。
(1)故障现象:某铁路局库检点基站受雷击后,基站双冗余电源模块均故障,终端无场强信号显示,GSM-R系统车载设备出入库检测作业失败。
(2)处理过程:输入交流电源正常,基站各指示灯均熄灭,判断电源模块故障,通信段立即组织调用电源模块备件进行更换,更换后基站故障恢复,同时命令本局另一库检点临时承担本库检点CIR库检业务,CIR库检业务临时恢复,延时45 min。后续修复CIR库检设备后,库检业务正式恢复。
(3)小结:本故障同样是由于外界原因造成库检基站、检测设备故障后影响出入库检测工作。在库检设备未恢复情况下,基站故障恢复,GSM-R网络覆盖正常后,由其他库检点临时承担本库检点库检业务,是减少库检业务故障延时的可行方法。
2.2 库检基站GPRS信道拥塞
库检基站GPRS信道拥塞,影响车载CIR设备GPRS业务检测不成功。
2.2.1 故障现象
某铁路局某动车所自6月7日起,在晚间21:00—次日上午8:30左右,入库机车CIR数据模块分组报文协议(PDP)激活成功率低,且GPRS业务库检成功率低,影响机车出入库检测。查阅故障记录得知,前期其他铁路局动车所库检也发生类似故障,均是在夜间至次日凌晨时段,在日间(一般是在大部分入库机车出库后)自然恢复。每日晚间21:00—次日上午8:30左右,入库机车CIR数据卡附着GSM-R网络和PDP成功激活(即获取IP地址)困难,且CIR库检高峰期数据检测成功率在10%左右。在白天其他时段,CIR数据卡附着GSM-R网络和PDP成功激活相对晚间较为容易,CIR数据检测成功率在80%以上。
2.2.2 库检点GSM-R网络设置及终端信息
该动车所使用的枢纽基站作为库检基站,小区载频数为2载频;信道配置:1个广播信道,1个信令信道,14个业务信道,业务信道中GPRS的信道(PDCH)采用1个固定、3个动态的配置方式。每个PDCH信道最多允许16个用户同时接收下行数据包、7个用户同时发送上行数据包。库检基站覆盖范围内库检过程中需占用业务信道主要用户包括:列控终端(电路域数据模块)、列车CIR(含语音及数据模块)、库检设备(含语音及数据模块)、手持终端(语音业务)等。
2.2.3 故障分析
故障发生后,首先对GSM-R共用设备(归属位置寄存器(HLR)、远程用户拨号认证系统(RADIUS)、信令转接点(STP)),核心网设备服务GPRS支持节点(SGSN)和网关GPRS支持节点(GGSN),无线网设备BSC进行了检查,设备均工作正常;查询RADSIU认证日志,日志显示该铁路局用户发起的认证均成功,排除网络设备问题。
(1)库检基站信道占用情况。检查该基站信道使用情况,发现承载GPRS数据业务4个信道一直处于忙状态。暂时闭锁该基站后,发现与其相邻的维修基地、车站小区的GPRS信道占用数量立即增加,说明正常情况下动车所内机车用户只选择库检小区下的业务信道,即使出现拥塞也不选择相邻小区的业务信道。而GPRS业务信道的使用机制是当有数据包传送时,显示为繁忙状态,说明库检基站小区下一直有数据包在传送。
(2)GPRS数据传输延时测试。出入库检测异常期间,从GPRS接口服务器(GRIS)上ping测试动车所内已经PDP激活的CIR和库检台,平均延时达到2 000~3 000 ms,而正常情况应为700~1 000 ms,说明多用户占用信道情况下,传输速率下降较多,该基站覆盖范围用户传送数据包需更长时间占用PDCH信道,加剧信道拥塞情况。
(3)话务统计数据分析。对库检基站小区6月7—9日话务统计进行分析,该小区在每天21:00—次日8:00的临时数据块(TBF)分配成功率较低:上行平均54%,下行平均56%;而该小区9:00—20:00的TBF分配成功率较高:上行平均92%,下行平均90%。说明该小区在库检业务忙时的GPRS PDCH信道出现拥塞。
(4)Gb接口数据包分析。6月9日0:50—9:30在汉口BSC的Gb接口对库检基站小区进行数据包监测。
①数据包数量按业务类型分析。6月9日0:50—9:30,本库检点基站上行数据包共176 497个,其中DMS终端发往M-GRIS(10.13.1.9)的数据包有170 712个,占数据包总数的97%;下行数据包共113 934个,发往DMS终端的共103 528个,占数据包总数的91%。用户上、下行数据包在每小时内的数量基本一致;CIR用户每小时发送上行数据包600个左右,接收下行数据包1 000个左右;DMS用户每小时发送上行数据包20 000个左右,接收下行数据包11 000个左右。
②解析数据包后用户数量分析。6月9日0:50—9:30,本库检点基站小区下共有57个用户占用PDCH发送业务数据包,CIR数据用户35个、DMS用户21个、库检台1个。
(5)故障原因分析。根据库检点基站小区的PDCH参数设置,本小区最多有4个PDCH可用,每个GPRS业务信道PDCH允许接入用户数量参数设置为上行7、下行16,即最多允许28个用户同时发送上行数据。库检作业期间,由数据包发送数量可知DMS终端数据量大,且多用户同时向网络发送数据,需长时间占用PDCH。6月9日,该小区下有21个DMS用户长时间占用PDCH,剩余资源只能分配给7个CIR数据、库检用户发送上行数据。根据上述用户情况统计, 36个用户(CIR数据+库检)中如有7个用户同时发送上行数据,其他用户则无法进行PDP激活(PDP激活需占用PDCH信道)或已经PDP激活的用户(库检台)无法发送上行数据进行GPRS业务检测。
结论:库检点动车库机车CIR数据模块PDP激活成功率低、GPRS库检业务成功率低的原因是该小区PDCH拥塞造成的,而PDCH拥塞原因是由于DMS用户上行发送数据量大,需长时间占用PDCH。
3 库检点基站设置建议
GSM-R车载设备都直接关系到铁路运输安全和运输秩序的重要设备,出入库检修工作是保证上述车载设备良好运用的重要环节,由于出入库检测试设备和GSM-R检测环境问题造成无法完成出入库检测工作,机车将不能担当牵引工作,对铁路运输造成巨大影响,因此库检点基站设置问题需引起高度重视,结合上述故障分析,基站设置应符合以下原则:
(1)承担库检业务的GSM-R基站传输通道应按冗余环形组网,主备电路通道应安排在不同传输系统,承载传输系统光纤应安排在不同径路的不同光缆,以保证库检点基站传输电路的安全。
(2)库检点GSM-R场强覆盖应考虑不同基站双重覆盖,以保证其中之一基站宕机后,库检点GSM-R场强覆盖正常,车载设备库检业务能够正常完成。
(3)在库检点GSM-R场强覆盖正常而库检检测设备故障时,为压缩库检业务故障延时,可临时采用其他库检点检测设备完成本库检点相关工作。
(4)由于库检工作各专业基本在同一时间进行,库检点基站小区信道配置应按照最大入库机车并行检测及本小区内其他用户数计算所需信道数量。
(5)由于工程验收测试时,只有测试终端占用信道,发送GPRS测试数据包可承载于多个PDCH信道,传输延时一般较小。而实际应用过程中,信道由多用户占用,传输延时较大,因此库检点基站小区GPRS信道数量配置,应同时考虑上下行每信道可接入用户数及不同业务检测数据包传输时延的要求。
赵武元:北京铁路通信技术中心,高级工程师,北京,100038
责任编辑 卢敏