CTCS-3线路GSM-R网络服务质量和评估方法的研究
2015-03-03石波
石波
(北京全路通信信号研究设计院有限公司,北京 100073)
CTCS-3线路GSM-R网络服务质量和评估方法的研究
石波
(北京全路通信信号研究设计院有限公司,北京 100073)
研究GSM-R承载CTCS-3级列控数据业务QoS指标,根据实际需求,结合工程测试、业务应用情况,提出指标优化调整的建议。同时,分析目前QoS指标评估方法存在的问题,提出优化建议。
GSM-R网络;CTCS-3列控系统;服务质量(QoS);评估方法
随着近几年高铁、客专的建设,我国已建成了覆盖全国的GSM-R网络,覆盖里程达到2万多km[1],GSM-R系统为保证铁路行车安全、提高运输效率发挥了重要作用。
CTCS-3(以下简称C3)业务是GSM-R网络承载的重要业务之一,为了提高系统的可靠性,C3线路GSM-R网络采用单网交织覆盖方式,当发生设备单点故障时,相邻站点仍可提供无线覆盖,网络可继续提供业务。GSM-R网络QoS指标主要依据国际铁路联盟(UIC)规范制定,验收时按照全数、奇数、偶数基站3种网络状态进行测试[2]。
本文结合近几年客专工程实践,对GSM-R网络QoS指标和评估方法进行探讨,提出相关建议,为后续相关线路的建设和运维提供参考。
1 GSM-R网络QoS指标的研究
1.1 概述
我国GSM-R承载C3业务QoS指标主要参考UIC相关技术规范(SUBSET093)[3]确定的,如表1所示。
表1 GSM-R承载列控数据传输QoS指标
上述指标是为了保证铁路运行目标要求的前提条件下提出的要求[4]:
*至少95%的列车能够正点到达(小于5%的列车晚点)。
*列车运营晚点时间超过5 min。
*不同线路对列控系统需求不同,典型参数是:线路长度600 km,列车运行时间5 h(平均速度120 km/h)。
1.2 GSM-R网络QoS指标的确定
1)移动台发起的连接建立时延
该指标是根据GSM-R网络技术能力而确定的[5],连接时延包括端到端连接时延(如因移动终端导致的时延)。当连接时延超过10 s,则认为连接建立失败。实测中,移动台发起的连接建立时延一般为4.5~5 s。
影响该指标的主要因素:流程配置、信道指配方式以及硬件、参数配置、覆盖、干扰等。
例如,在连接建立过程中涉及到鉴权、加密(无)等流程,因此,呼叫流程的配置直接决定连接建立时间。当跨MSC呼叫,车载模块需要先进行位置更新(规范规定位置更新的优先级高于呼叫),然后延时发起呼叫,因此会增加呼叫建立时延。从实际测试结果看,测试结果可能略高于10 s。此外,对于早指配方式,需要先指配SDCCH信道,然后再指配TCH信道,而尽早指配、直接指配TCH信道,可缩短呼叫建立时间。
该指标与列车进入C3列控区段的时间以及链路中断后再次建立新的连接而占用的时间相关。根据《CTCS-3级列控系统GSM-R网络需求规范》[6],在其他等级转换为C3等级的转换区域内,GSM-R网络连接建立时间按照10 s/次,保证2次连接考虑。
当网络设计比较完善并且持续进行监控、优化和维护时,GSM-R网络能满足指标要求。
2)连接建立失败概率
该指标根据[EEIG 04E117]研究的综合推论提出,主要考虑了列车进入ETCS2(以下简称E2)列控线路时,为到达运营时间小于5 min,按照连接建立失败率的QoS要求是2×10-5/h,最终综合考虑各种因素,确定时间连接建立失败率<10-4是可以接受的。
当仅允许1次安全连接建立尝试时,连接建立失败率必须<10-4。当允许2次连接建立尝试时,列车不能成功进入E2(由连接建立失败所导致)的概率等于这2次尝试的连接建立失败率的乘积,即每次连接建立失败率<10-2,列车不能成功进入Level 2的概率是10-4=10-2×10-2。
连接建立失败的原因主要有设备硬件原因(如基站载频板故障、配线问题)、干扰等。
该指标可能影响列车进入列控区段(E2或C3)的时间以及链路中断后再次建立新的连接而占用的时间。
当网络设计比较完善并且持续进行监控、优化和维护时,GSM-R网络能满足指标要求。
3)传输时延(40 Byte用户数据块)
该指标主要根据列控系统行车许可(MA)延伸传输场景确定的。
在GSM-R传输速率为4800 bit/s、误码率为10-4、MA长度为250 Byte~500 Byte的情况下,可计算GSM-R网络传输时延。经过综合测试和统计,最后取定GSM-R网络传输时延不大于0.5 s。考虑HDLC误帧的重传等因素,要求99%情况下满足该指标要求(欧洲测试帧为30 Byte,我国为40 Byte)。
影响该指标的因素包括应用层数据包大小(数据包越长,传输时延越长)、传输速率等。
当网络设计比较完善并且持续进行监控、优化和维护时,GSM-R网络能满足指标要求。
4)连接丢失概率
根据[EEIG 04E117],在T_NVCONTACT没有超时的情况下,连接丢失影响如下:
*降低运输效率。连接丢失后列车将会进行制动,在制动过程中尝试3次重新建立连接,之后获得新的MA后进行加速。
*影响MA更新时间,导致列车运营晚点。由于连接丢失指示和重新建立列控安全连接导致的时延计入MA传输时延内(200 Byte的MA约为1 s),因此,当连接丢失时,MA延伸后的运营目标不大于12 s时延无法实现。
如果在连接丢失和连接重建之后,新的MA在列车停止之前没有到达列车,晚点时延大于5 min的QoS目标对连接丢失率有直接的影响,即连接丢失率的要求为:≤2.7×10-4/h。
如果在连接丢失和连接重建之后,新的MA在列车停止之前到达列车,列车可以重新加速。运营延迟小于5 min的QoS目标对连接丢失率有直接影响,即对连接丢失率的要求为:≤2.2×10-3/h。
在GSM-R网络中,要求连接丢失率≤10-2/h。当网络设计接近完美并且持续进行监测、优化和维护时,能够符合该指标的要求。
5)传输干扰时间Tti
传输干扰用于衡量数据传输的误码性能。对于无线信道,其数据传输性能具有不确定性,由于用户数据传输是突发的,误码率的统计值不能准确反映ETCS的需求,因此,针对一些应用消息,规定在指定时间内完成地对车的数据传输,欧洲规范建立了一种业务模型,来反映出GSM-R网络所有相关特性。
在发生无线越区切换时,会发生数据出错或者中断。Tti值的确定首先考虑涵盖列车以在运行旅程中全部“常规”数据传输错误,最差的情况是“带有强拆的小区切换”。
在这种情况下,必须在所选小区中释放掉低优先级呼叫之后,才能完成切换。在强拆低优先级呼叫过程中,切换小区中的数据传输将继续进行,假定当前通信质量较差,切换的原因是“更好小区切换”,在切换过程中,列车向该无线小区方向移动了300 ms之后,原切换小区的QoS将会更差,如图1所示。
图1 小区切换导致传输干扰示意图
可接受的最大传输干扰(Tti)持续时间假设为1 s:其中:
*释放强拆呼叫时延:约600 ms。
*切换时延:约300 ms[EIRENE SRS§3.3.4]。
根据指标统计分布特性,确定传输干扰时间Tti<0.8 s (95%),<1 s (99%)。
影响该指标的因素包括切换中断时间、传输干扰、线路长度等。当发生切换时,由于物理信道发生了变化,因此车地之间数据传输会发生丢失,该指标提出是按照列控应用层面数据传输帧考虑,因此传输干扰时间一般比越区中断时间按大于200~300 ms考虑。
在确定该指标时,切换时间按300 ms考虑(同步切换),但现阶段GSM系统基站之间为异步切换,因此,切换中断时间测试值不大于500 ms。同时,通过对C3系统车地数据通信进行分析,发生切换时,C3车地正在进行通信的概率一般为1%~10%,切换会导致车地数据包的某一帧数据发生误码,CRC校验显示错误,后续车地会重传该数据包,因此,该指标的数值可根据GSM-R网络实际性能和C3应用业务的需求进一步优化,适当调整。
此外,由于传输干扰时间是统计指标,主要与小区切换相关,但受干扰的影响,因此,正常情况下线路较长,容易达标,线路越短,越难达标。目前欧洲标准没有考虑和线路长度的关系,因此,应是对于不同长度的线路指标应不同。建议不仅考虑受到干扰影响的相对比例,还应考虑受到干扰的绝对数量。
6)传输无差错时间(传输恢复时间)Trec
传输干扰期间错误传输或遗漏的用户数据单元必须通过重传来纠正。重传将导致时延和无线信道的高负荷。因此,在传输干扰之后,必须跟随一个无错传输的阶段,称为恢复期。
在恢复之后的正常数据传输阶段,用户数据单元按照应用消息所要求的数据吞吐量传送。
传输无差错时间(最小恢复时间)Trec应至少包括一条待传输应用信息用户数据单元的时间。对于长度较长的应用消息(以500 Byte应用消息为例,将被拆为若干个帧),发送端发送消息后,发生干扰,2 s后发送端确认重传应用层消息,600 ms后发送RR帧进行确认,重传数据0.8~2 s,600 ms后,接受端向发送端发送RR帧进行确认,传输时延500 ms。
图2 “传输干扰”事件
综上所示,收到传输无差错时间约为2 s(定时器判断干扰)+0.6 s(RR帧确认)+2.0 s(传输时长)+0.6 s(RR帧确认)+0.5 s(RR帧传输时延)=5.7 s,即Trec=7 s。考虑统计分布特性,传输无差错时间(传输恢复时间)Trec>7 s(99%)。
Subset093没有说明20 s指标具体如何确定,实际是按照360 km/h、无线小区2 km考虑,推算出来每20 s切换1次。
该指标也是统计指标,主要与小区切换相关,因此对基站最小间距有明确的要求,即根据列车车速,结合该指标要求确定基站间距的最小值。
7)网络注册时延
欧洲技术规范没有对GSM-R网络注册时延指标确定的过程进行描述,根据GSM技术标准,GSM-R终端进行网络注册过程包括频段扫描和小区选择等过程,该指标根据GSM-R网络技术能力提出。
测试中采用静态测试方法,在网络设计方案完善、设备正常情况下,GSM-R网络能符合该指标要求。
1.3 GSM-R网络QoS指标优化调整建议
从C3线路联调联试来看,传输干扰时间、无差错传输2个指标达标最难,需要投入很大的人力物力。根据前述对指标来源的研究分析,在确保业务应用不受影响的前提下,结合指标实际测试情况以及业务使用要求,现提出如下修改建议。
1)传输干扰时间指标
由前述可知,该指标是在切换时间300 ms考虑(同步切换)的前提下推算出来的,而目前现网基站间的切换均为异步切换,中断时间小于500 ms。经过理论计算和实际测试、验证,切换中断时间为300 ms和500 ms,对C3车地数据通信的影响基本相同,没有本质差别。
采用异步切换时,必须是手机/车载台在收到切换命令后,连续不断地向目标小区发送handover access消息,直到收到包含定时提前量(TA)的physical information消息,或者手机/车载台的T3124超时,因此需要的时间较长。
为了缩短切换中断时间,有的厂家通过使用预同步切换(pre-sync)的方式,切换中断时间符合小于300 ms要求。该方式下,无线终端预知目标小区的定时提前量(TA),从而无线终端不需要等待目标基站下发的physical information消息,也不需要持续发送handover access消息(在预同步切换中,只需要发送4个handover access即可)。
在C3车地数据通信过程中,当发生基站之间切换时,车地数据传输会发生中断,进而导致C3数据包中的部分数据帧出错。车地数据包按10~235 Byte、传输速率按4800 bit/s考虑,可得车地消息受切换影响速度越高、站间距越小、数据包越长,影响越大,但总概率小于3%,即100个消息中有3个消息会受到切换影响。具体如表2所示。
表2 不同线路GSM-R基站切换对C3应用数据的影响概率
通过对C3线路接口监测数据进行分析,若数据帧出错,数据链路层会概率性出现FCS校验错误。当发生FCS校验错误时,通过数据重传,会保证车地正常通信。例如,提取某个车的PRI接口数据,16:08:16.514车向地发送I帧(113号),在此期间车载终端正在发生切换(见A接口切换信息),数据出错,FCS校验为错误,16:08:17.357,车载设备重传该帧,数据通信恢复正常,如图3、4所示。
综上所示,切换对C3车地数据通信影响较小,300 ms和500 ms中断时间差别不大,即使发生数据包错误,可后续重传其中某一帧数据,恢复正常通信。因此,建议结合实际情况,对传输干扰时间进行修改,若按实际切换中断时间小于500 ms考虑,该指标可修改为<1.0 s(95%)、<1.2 s(99%)。
2)传输无差错时间(最小恢复时间)
该指标Trec应至少包括一条待传输应用信息用户数据单元的时间。欧标根据HDLC数据重传性能,推出了7 s(99%)指标。
对于95%情况下,20 s指标要求较高,存在4个方面的问题:a.切换会导致应用层数据包的某一帧错误,切换完成后可重传该帧,因此应从应用角度规定95%情况下指标具体数值,而不是从GSM-R子系统角度规定指标值;b.从业务实际应用情况看,传输无差错时间大于20 s(85%~90%)时,车地通信正常,详见表3瑞士铁路测试结果;c.从需求角度计算,按照C3数据包1024 Byte(应用层)、1476 Byte(数据链路层)计算,传输无差错时间应大于2 s(定时器判断干扰)+0.6 s(RR帧确认)+3.5 s(传输时长)+0.6 s(RR帧确认)+0.5 s(RR帧传输时延)=7.2 s;d.该指标没有考虑指标与线路长度关系,线路长度越短,指标越难符合要求。此外,该指标只考虑了受到传输干扰影响的相对比例,没考虑传输干扰的绝对数量。
图3 切换中断导致C3数据传输出错(PRI接口监测数据)
图4 切换中断导致C3数据传输出错(A接口监测数据)
因此,建议结合实际情况优化调整该指标,10 s(99%)或20 s(90%),具体可进一步测试验证。
2 GSM-R网络QoS指标评估方法的研究
2.1 国内外现状
在国外,UIC建议E2线路在工程设计时,要保证无单点故障,降级模式下(如GSM-R系统的某个网元故障),GSM-R业务不中断。
表3 瑞士铁路OBB2011-2012年E2铁路QoS测试结果[7]
工程验收测试时,网络性能指标在实际运行条件进行测试,包括商业运行速度等。实际进行测试时,考虑到逐个关闭单个基站设备,需要测试的时间比较长,因此,部分国家采用关闭奇数基站或者偶数基站的情况下进行测试。
工程验收阶段,根据“高速铁路动态验收指导意见”,GSM-R系统验收内容包括:场强覆盖测试和QoS测试。采用交织冗余覆盖方式时,应在全部基站打开、奇数基站打开和偶数基站打开3种条件下分别进行场强覆盖和电路域列车控制类数据业务服务质量动态检测,不同网络状态下指标要求均相同。
2.2 存在问题
现阶段GSM-R网络QoS指标评估方法存在如下问题。
问题1:半数站对网络服务质量评估方法不能反映实际网络的真实运营状态,反而过于严格,增加了网络优化工作的难度、工作量。
在实际应用中,GSM-R网络发生故障时,一般为单个基站或直放站设备故障,或者一个传输环上的3~5个基站同时发生故障,没有奇数或偶数同时故障的场景。而GSM-R工程验收时,需要在半数站条件下对QoS指标进行测试,不能反映真实网络运营的状态,尤其是,当关闭奇数或偶数基站时,由于覆盖电平整体下降,GSM-R抗干扰能力随之下降,指标达标难度增大。
此外,QoS指标与基站数量密切相关,由于基站数量减少一半,当发生一处切换异常等,与全数站条件相比,指标不能达标的概率增大一倍。
问题2:现行评估方法没有考虑直放站单点故障情况下QoS指标的测试。
C3线路GSM-R网络覆盖采取了一系列技术冗余措施,包括基站的设置、直放站设置等。目前的测试方法只考虑了基站单点故障,没有考虑直放站单点故障时网络运行情况。
问题3:半数站情况下,无法验证基站单点故障时切换异常、基站环路承载业务异常等内容。
由于半数基站情况下,关闭了一层基站,实际应用中,单个基站发生故障,因此,根据目前的测试方法,下述情况应在工程阶段进行测试验证。
1)半数站关闭,没有测试单个基站故障时,可能存在的异常回切情况。
如图5所示,以4号基站为例,4号基站的邻区包括2号、3号、5号、6号基站。4号到3号、5号基站的切换门限(3 dB)低于4号到2号、6号基站的切换门限(如6 dB),这样车载设备从4号基站优先切换到3号或5号基站。当4号基站故障,列车从3号基站切换到5号基站。
图5 交织单网基站单点故障示意图
但是,实际应用中,车载设备应该从2号基站→3号基站→5号基站,4号基站故障时,由于2号基站和3号基站覆盖电平可能重叠,如图5所示,车载设备切换顺序为:2号基站→3号基站→2号基站,列车继续往前方运行,2号基站电平已较低,但由于2号基站与5号基站不是邻区关系,因此不能切换到5号基站,最终导致车地通信掉线。
2)半数站关闭,当单个基站故障时,可能存在的邻频干扰问题。
例如,采用的7频组复用的方式,如表4所示。
表4 7频组复用方式频率规划
全数基站情况下同频复用距离为21 km,邻频隔2个基站。半数基站情况下的同频复用距离扩展到14组(0/2/4/6/1/3/5/7基站发射,14×3=42 km),网内同频干扰的可能性降到最低,邻频隔2个基站,即2和5基站存在邻频,所以邻频干扰可能是交织型网络中比同频更大的隐患,但半数基站的验收方式也把这个问题掩盖了。
问题4:QoS测试方法中按帧发送数据(每10 ms发送1帧),对于C3应用业务,应用层较大数据包需要分帧传送,可能由于基站时钟参数设置问题导致丢帧,造成车地通信时,应用层重新组包数据不全,进而导致C3降级。对于上述情况QoS测试方法无法测试验证。
2.3 GSM-R网络QoS指标及评估方法建议
根据本报告前述研究内容,C3线路GSM-R网络验收建议不要按照全数站和半数站加以区分,而是要根据设计原则(避免单点故障)确定测试条件,并尽可能最接近网络实际运用状态,确保GSM-R承载C3业务运用质量。
建议:
1)为了测试验证单点故障时网络性能指标,可抽取一定比例的基站环或基站进行抽测,根据对2013和2014年GSM-R网络运行情况调查情况,基站故障率不高于5%,基站环故障率不高于0.5%,具体比例可根据实际应用经验确定,并适当增加。
2)补充抽取一定比例的直放站,在关闭这些直放站的条件下进行QoS指标测试。
3)补充针对C3应用层较大数据包分帧传送场景,进行业务层面QoS相关测试。
3 结束语
综上所述,我国GSM-R承载列控业务的QoS指标参考了欧洲相关技术规范确定。欧洲提出各项指标时,在一定的前提条件下,从需求出发进行推算,考虑了系统技术能力限制,结合实际测试数据,进行统计分析而确定的。目前,经过多年的实践验证和充分应用,建议进一步对指标进行适当的优化调整,确保指标确定和评估方法科学严谨、经济合理。
[1] 中国铁路GSM-R对外标准组.中国铁路对外标准工作信息简报.2013,42:11.
[2] 铁道部建设司.铁建设[2010]214.高速铁路工程动态验收指导意见[S].2010.
[3] ERTMS/ETCS-GSM-R Interfaces Class 1 Requirements. REF: SUBSET-093[S]. v2.3.0, 2005-10-10,16.
[4] EEIG ERTMS User Group. EEIG O4E177. ETCS/GSM-R Quality Service-Operational Analysis.14thoct,2005,14.
[5] ERTMS/ETCS-GSM-R Interfaces Class 1 Requirements. REF: SUBSET-093[S]. v2.3.0, 2005-10-10,23
[6] 铁道部科学技术司,铁道部运输局.科技运[2008]168号 CTCS-3级列控系统GSM-R网络需求规范[S].2008.
[7] OBB ERIG3442. ETCS L2- QoS Measurements(2011-2012)[S].2
The paper gives a research on QoS indexes for transmitting CTCS-3 train control data over GSM-R network, and puts forward the suggestion to optimizing and adjusting the indexes. Meanwhile, it analyzes the methods of evaluating the QoS indexes and presents the optimization suggestion.
GSM-R network; CTCS-3 train control system; QoS; evaluation methods
10.3969/j.issn.1673-4440.2015.02.006
2015-01-25)
中国铁路总公司科技研究开发重大课题项目(2013XDD2-A)