针对FRMR帧无线通信超时的电台优化方案
2021-02-11谢佳宜高尚勇
杨 胜,方 怡,谢佳宜,高尚勇
CTCS-3级列车控制系统是高速铁路核心技术装备和安全关键系统,负责指挥列车运行、保证行车安全、提高铁路运输效率。目前CTCS-3级列车控制系统因FRMR帧[1-2]引起的无线通信超时故障时有发生,且在同类故障中所占比例较高。该类故障基本都是由物理层或数据链路层数据异常所致,长期以来并无有效手段解决。为此,深入研究CTCS-3级列控系统中的电台(MT),在不对车载ATP(列车超速防护系统)和地面RBC(无线闭塞中心)设备[3-4]做任何改动的情况下,仅对电台小区切换流程进行优化,可大幅度降低该类型无线通信超时故障[5]。
1 基本概念
1.1 数据链路层
CTCS-3级列控系统数据链路层采用的是HDLC(高级数据链路控制)协议[6]。该协议采用扩充异步平衡模式,提供帧同步、差错控制、流量控制和链路管理功能;规定在收到FRMR帧(帧拒绝)的情况下不允许重建连接,故主叫系统ATP或者被叫系统RBC中任何一方在数据链路层发送FRMR帧,对方用DSIC帧响应,导致链路断开,必然会引起无线通信超时[7]。
HDLC协议定义了4种类型的FRMR帧:①收到未定义的或不能实现的命令或响应控制字段;②收到信息字段超过设定的最大长度的Ⅰ帧;③收到无效的N(R);④收到不允许具有信息字段但却包含信息字段的帧,或收到具有不正确长度的监控帧。
CTCS-3级列控系统中,GSM-R小区切换是硬切换,数据传输采用电路域的方式,以列车300 km/h的速度计算,平均每36 s就需要完成一次小区切换,MT、无线信道及GSM-R网络作为数据链路层的透传通道[8],对ATP或者RBC在数据链路层是否发送FRMR帧有决定性影响。
1.2 FRMR帧
ATP或者RBC会将发送FRMR帧的原因值包含在FRMR帧中的信息比特字段,FRMR帧结构见图1。
图1 FRMR帧结构
其中,W、X、Y、Z对应FRMR帧的4种原因值(即4种状态)。归纳当前由FRMR帧引起的CTCS-3级列控系统无线通信超时,绝大多数是Y=1和Z=1。Y=1,即收到的任何信息字段超过了报告拒绝状态的ATP或RBC的最大设定容量;而Z=1,即所收到的并在1~8比特内送回的控制字段包括了无效的N(R)。解决这2种情况将会大幅降低CTCS-3级列控系统的无线通信超时故障。
2 原因分析
2.1 对于Z=1的FRMR帧情况
对于Z=1的FRMR帧情况,基本都是收到乱序的RR帧后,接收方判断为无效N(R),引发该类型FRMR帧,有较明显的特征,即在小区切换前很短的时间内ATP或者RBC向对端连续发送2个RR帧。RBC发送FRMR帧时的PRI[9]接口数据见表1。
提取FRMR帧中的信息位,其为018701 B0 BA 6708233D,解析后可知,RBC在收到车载发送的N(R)=89 RR帧后,又收到了N(R)=88的RR帧,RBC通过发送Z=1的FRMR帧来表明其收到N(R)=88的无效N(R)帧。MT电台LOG日志记录[10]见图2。
由图2可以看出,ATP通过电台向RBC发送R∶88和R∶89的RR帧后,电台开始执行小区切换,此后ATP并未重复发送R∶88和R∶89的RR帧,但表1却显示RBC重复收到过2次,造成接收方认为收到的RR帧序号乱序。同理,车载侧ATP在同样条件下也会多次重复收到2个连续RR帧,引发RR帧序号乱序,导致ATP发起Z=1的FRMR拒绝帧。
图2 MT电台LOG日志记录
表1 RBC发送FRMR帧时的PRI接口数据
2.2 对于Y=1的FRMR帧情况
对于Y=1的FRMR帧情况,场景也是发送方在小区切换时发送Ⅰ帧,接收方接收到该Ⅰ帧(信息帧)的信息比特位中含有大量乱码,导致Ⅰ帧信息比特位超长,超过接收方设定的容量,这种情况下,即使接收方可通过CRC(循环冗余校验)校验失败来确定该Ⅰ帧为无效帧,但HDLC还是会直接发送Y=1的FRMR帧,造成无线通信超时故障。
3 优化方案
FRMR帧是由数据链路层HDLC协议处理的,ATP或者RBC的上层软件对该类故障无法优化。考虑电台是透传链路层数据,是连接无线通信和有线通信的传输管道,故可对电台切换流程做定制化的修改,从而降低由FRMR帧引起的无线通信超时。优化后的电台小区切换流程见图3。相较传统的小区切换流程,优化方案中增加2个操作(图3中红色部分所示)。
图3 电台小区切换流程优化方案
电台在收到网络的Handover Command后,其内部增加挂起DS操作,可将ATP发送给电台的数据链路层的数据在电台内部缓存,不向网络发送;同时对电台此后接收到网络下发的HDLC数据丢弃,不发送给ATP;电台收到网络下发恢复电台和网络数据连接的UA帧后,其内部增加恢复数据操作,以恢复电台正常向网络发送ATP HDLC数据,也恢复将电台收到的HDLC数据透传给ATP,这样就可彻底解决在小区切换中因多种因素引起的数据链路层数据异常造成的FRMR帧问题。考虑到小区切换的时间一般在400 ms左右,该优化方案理论上小概率会丢失RR帧,但其可通过数据链路层自身的重传机制恢复,不会影响CTCS-3级列控系统的正常业务。
4 测试验证
表2是电台小区切换流程优化前后FRMR故障对比:2019年3月—2020年7月期间,车1共发生3次FRMR类型帧无线超时,其中Y=1的类型1次,Z=1的类型2次;车2共发生4次FRMR类型帧无线超时,其中Y=1的类型1次,Z=1的类型3次;2020年7月中旬完成车1和车2的电台小区切换流程优化,经过半年的测试,2列车均未发生FRMR类型无线通信超时故障。
表2 电台小区切换流程优化前后FRMR故障对比
从2021年2月始,陆续加大CTCS-3级列车测试数量,再未出现FRMR帧引起的无线通信超时,优化效果符合预期。
5 结论
本文针对CTCS-3级列控系统中产生FRMR帧的机理,在标准的无线通信协议下对电台的小区切换流程进行优化,可大大降低CTCS-3级列控系统中FRMR帧引起的无线通信超时故障。如在基站侧也做类似电台的优化处理,既可在接收方杜绝因无线业务信道硬切换引入的含大量乱码的超长Ⅰ帧,也可杜绝因电台或基站内部机制引发乱序的RR帧,从而理论上可完全杜绝FRMR帧引起的无线通信超时。在实际工程应用中,通过采用该电台小区切换流程优化方案,可以大幅降低无线通信超时故障率,进而提高铁路运营效率和经济效益。