CSD数据传输时延测试持续丢帧问题分析
2014-01-01邢小琴王惠生杨树忠郭一鹏
邢小琴 王惠生 杨树忠 郭一鹏
在综合检测列车GSM-R网络电路交换数据CSD(Circuit-Switched Data,)传输时延测试中,常常发现持续丢帧/误帧现象,有时甚至超过10 km,这样的现象在多个高铁线路上频繁发生。该问题直接导致:①无法确定出现该现象的区段网络是否真存在问题;②如果网络没有问题,而是测试软件的问题,则会影响线路的正常测试。针对这一现象,对问题原因、产生原理进行详细分析,并在此基础上提出测试方法的改进建议。
1 问题现象及原理分析
《GSM-R无线网络覆盖和服务质量 (QoS)测试方法》中,对CSD传输时延定义为:移动终端从发起数据帧传送请求,到该移动终端成功接收并返回数据帧之间的时间间隔。采用环回测试方式,移动测试终端在测试开始时,发起电路域数据呼叫,连接建立后开始向地面固定测试终端发送测试数据帧,地面固定测试终端将收到的数据环回转发给发送端,发送端对接收到的返回数据帧进行校验,对校验正确的数据帧计算传输时延。用所测时间间隔的一半作为用户数据帧的传送时延。测试数据帧长度采用30字节 (实际测试采用40字节),且要求99%以上的统计值应小于500 ms。
在CSD传输时延测试中,正常情况下,车载端发送40字节数据后,在600~1000 ms之间将收到地面端原样返回的数据。车载端发出数据后,测试系统启动定时器等待8s,若在等待过程中收到错误的数据或直到定时器超时也没有收到返回的数据,则记为帧丢失 (或帧错误),开始发送下一个测试数据。
案例,2013年11月26日,采用CRH2-150C综合检测列车,对京广高铁武汉至广州南段下行线路进行了GSM-R网络通信检测,此次测试中采用A和B车载8W通信模块同时进行CSD数据传输时延测试,对出现的长时间持续帧错误或丢失的情况进行了统计,见表1。
从表1可以看出,若不考虑测试模块的不同,则可将持续帧错误/丢失的现象分为2类。
第Ⅰ类,持续时间长,影响测试距离长,但影响的测试帧数少。见表1备注栏标记有“▲”的行。在车载测试记录中表现为发出测试帧后,没有收到地面返回的数据,等到系统设定的定时器(8 s)超时后才将该测试帧标记为“帧丢失”,同时开始发送下一个测试帧。在地面服务器测试记录中观察到,对于车载测试记录中的大面积标记为“帧丢失”的数据,在地面有接收记录,但在发送测试数据后没有返回,从而导致车载测试系统等待超时。
表1 持续帧错误/丢失现象统计
第Ⅱ类,持续时间比第一类稍短,相同速度条件下,影响测试距离也较短,但影响的测试帧数较多。见表1中备注栏标记有“△”的行。
对车载测试记录进行分析发现,这类现象中连续2个记录的时间间隔小于一个测试帧从车载端发出到接收到地面返回该测试帧所需的正常时间,而按照间隔一个记录来算,2个时间之差却正好是一个测试帧的正常测试时间。
举例说明:图1右侧记录中 (对应表中B模块测试的第8行),按照测试记录规则,第“13401”行与第“13400”的时间差值即为第“13400”测试帧的测试时间,将记录中相应的时间相减得为141 ms。而此次测试中40字节的测试帧从车载端发出到接收到地面返回的数据所需时间最小应为297×2=594 ms,平均时间为380×2=760 ms(参考表2中传输时延测试统计结果)。141 ms远小于594 ms,也就是说,此时收到的数据并非等待的第“13400”帧。而第“13402”与第“13400”的时间差值为750 ms,接近平均值水平。由此可以推断,车载测试系统应该是将接收到的网络干扰数据 (切换或是其他环境造成的干扰信号)当成正在等待的数据帧接收,并做出帧校验错误的判断,从而导致了后续多个数据的错位。
图1 干扰数据导致的帧错位
表2 2013年11月26日CSD传输时延测试结果统计
这类现象可以通过图1中左侧的时序图来说明。车载端发送第N个测试帧后,在较短的时间内收到一个来自网络的干扰数据,测试系统将该干扰数据当做地面返回的第N个帧接收,经过帧校验错误后记为帧丢失 (现有测试系统将帧丢失和帧错误统一标记为帧丢失)。同时开始发送第N+1个测试帧。在等待第N+1测试帧返回的时候,收到了地面返回的第N个数据帧,测试系统将其与第N+1帧比较,虽然帧校验结果正确,但序号不一致,因而第N+1个测试帧的测试结果被判断为帧丢失,实际上此时的第N+1帧还在传输途中。依此循序往复,直到在某次切换或干扰发生时,第N+m+1帧在传输中完全丢失后,从第N+m帧开始测试才会恢复正常。
2013年2月、3月、5月、8月、11月采用B模块对京广高铁进行了传输时延测试,并对CSD传输时延测试中的持续丢帧现象进行统计。统计结果:2月16次,3月12次,5月17次,8月21次,11月8次,总共发生了74次持续丢帧现象,其中第Ⅰ类现象所占比例为58%,第Ⅱ类现象所占比例为42%。在2013年8月的测试中总共出现21次持续丢帧现象,为各月测试中出现次数最多的一回。表3是对京广高铁测试中,每月发生的持续丢帧/错误现象总时间、持续丢帧/错误的总帧数,以及总共影响的测试距离的统计。可以看到,在2013年8月的测试中,这类现象影响测试距离累计达150 km。这样的现象在其他线路、用其他型号的测试终端也时有发生。这样的丢帧/错帧现象如果出现在C3列控系统应用中,必然会严重影响车-地通信。如果这类现象不是线路本身的原因,而是测试系统的原因,则会影响所测线路部分区段的测试。总之,这类现象应该得到解决。
表3 京广高铁采用B模块测试按月统计
2 实验验证
2.1 第Ⅰ类现象
提取2013年11月26日,采用A和B模块同时进行CSD数据传输时延测试时的地面数据传输记录,发现地面测试系统存在收到车载端发送的数据后不返回的情况,正是造成车载测试端出现成片“帧丢失”现象的原因。将地面测试软件更换为其他相同功能软件后,在2013年12月多个高铁线路的测试中,均没有发生此类现象。由此可确定为地面测试软件有问题。
2.2 第Ⅱ类现象
为了证实对第Ⅱ类现象产生原因分析的正确性,在车载端测试软件中增加了数据接收记录功能来观察数据接收情况。测试时开启该项记录功能,对数据接收过程进行跟踪。图2所示为车载测试系统接收到干扰数据的情况:①表示车载测试系统经A模块向地面发送大小为40字节的第95号测试帧(倒数第3、第4位表示帧号)。②表示车载测试系统经A模块收到地面服务器返回的测试帧,帧校验错误表明该数据在传输过程中受到了干扰。③表示车载测试系统经A模块向地面发送第96号测试帧。④表示车载测试系统经A模块收到一个干扰数据,因其帧头为7E(7E为测试帧的帧头),所以测试系统将其当成地面返回的第96号测试帧,CRC校验错误表明该帧与发送的96号帧不完全相同。此时距③中的发送时间间隔仅为32 ms。在测试记录中已将第96号测试帧记为“帧丢失”。⑤表示车载测试系统经A模块向地面发送第97号测试帧。⑥表示车载测试系统经A模块收到地面返回的第96号测试帧,校验正确,但与当前等待的第97号测试帧不相同,因此在测试记录中将第97号测试帧记为“帧丢失”。
之后的数据依此类推,即发生了测试数据大面积持续丢帧的现象。在车载测试记录中可以看到,持续丢帧结束的时候往往发生在某次切换之后。也就是说,在切换的时候,某个帧的帧头丢失或整个帧完全丢失时正好结束了帧错位现象,使得测试恢复正常。
以上实验证实了第Ⅱ类现象的发生确实与车载测试系统干扰数据的处理方式有关,并且产生的条件是干扰数据中有“7E”。
3 测试方法改进建议
图2 车载测试系统接收到干扰数据
由于第Ⅱ类现象出现的原因与车载测试系统对测试中偶然收到的包含“7E”的干扰数据的处理方式有关。为了避免这类现象的发生,可以考虑采用以下2个方案:
1.车载测试系统发出一个测试帧后,若在小于的时间内收到一个数据帧,则直接丢弃,继续等待当前测试帧。根据经验△t推荐值为400 ms。
2.车载测试系统若收到CRC校验结果正确的帧,但是与当前等待帧的帧号不同,则直接丢弃,继续等待当前测试帧。试验中,采用这种归避方法,消除了第Ⅱ类现象的发生。
《GSM-R无线网络覆盖和服务质量 (QoS)测试方法》中对CSD数据传输时延测试说明:
用户数据传输时延的定义为移动终端数据帧发起传送请求到该移动终端数据帧成功接收的时间间隔;地面固定测试端将收到的数据帧环回转发给发送端,其转发反应时间应尽可能小甚至可以忽略;在Igsm(t)接口,用开始传送移动测试终端数据帧 (发送数据帧的第一比特)到接收完从固定测试终端返回来的同一数据帧 (接收完数据帧的最后一个比特)的时间间隔的一半作为用户数据帧的传送时延;只统计成功接收到的数据帧的传送时延。
对于上述规范内容,在实际开发测试系统时会有不同的理解,会做出不同的处理。从测试记录数据中可以看出,现在综合检测列车采用的测试系统对于地面服务器返回测试数据的处理方法是,地面测试服务器软件将接收到的、来自车载端的任何数据不做任何处理、无延迟地立即返回。如果一个测试数据在地面端分两段甚至多段接收到,也会将多次接收到的数据分别返回。也就是说,地面测试服务器不分辨接收到的数据片段是数据还是干扰,如果接收到来自网络的干扰数据也会返回给车载端。地面测试服务器如果接收到错误的测试数据也会返回给车载端。地面测试服务器没有完整接收数据并校验的过程。
若先不考虑单程的话,用户数据传送时延,应该是发送端从开始发送第一个字节数据到地面端接收到最后一个字节数据的时间间隔。由于车载和地面测试系统时间不统一,不能从地面测试系统计算数据传输时延,所以需要考虑环回测试的方法。地面测试服务器等接收到完整测试数据,再将校验正确的数据返回到车载测试系统,车载测试系统计算的时延则是单程测试的2倍。这样的方式更符合测试要求,也减少了车载测试系统接收到干扰数据的几率。
4 小结
本文针对高速检测列车GSM-R网络CSD传输时延测试中的持续丢帧问题,将测试原理与实际测试中的问题数据相结合进行深入分析,找出了持续丢帧问题的根本原因,并对分析结果进行实验验证。进而对现有GSM-R网络通信检测系统中的缺陷提出了改进建议。
[1] 铁道部科学技术司,铁道部运输局.GSM-R无线网络覆盖和服务质量(QoS)测试方法(V1.0)[S].2008.
[2]ERTMS/GSM-R OPERATORS GROUP.ERTMS/GSMR Quality of Service Test Specification[S].2006.
[3] 钟章队,艾渤,刘秋研,林思雨.铁路数字移动通信系统(GSM-R)应用基础理论[M].北京:清华大学出版社,2009:214.
[4] 米尔顿.深入浅出数据分析[M].李芳译.北京:电子工业出版社,2010.
[5] Dawn Griffiths.深入浅出统计学[M].李芳译.北京:电子工业出版社,2013.
[6] 钟章队,李旭,蒋文怡,等.铁路GSM-R数字移动通信系统[M].北京:中国铁道出版社,2007.
[7] 韩斌杰等.GSM原理及其网络优化[M].北京:机械工业出版社,2009.