C3无线通信超时综合诊断分析系统设计与实现
2022-10-31罗云飞中国铁路上海局集团有限公司科技和信息化部
罗云飞 中国铁路上海局集团有限公司科技和信息化部
C3级列控系统基于GSM-R无线通信实现车地间信息双向传输,信息在传输过程中需要经过有线和无线两类传输通道,涉及信号及通信两个专业,而且为了保证信息在传输过程中的安全性,信息须经过应用层、安全层、传输层、网络层、链路层和物理层等多个通信协议层,信息传输协议的复杂性和路径节点的多样性造成C3无线通信超时的因素会有很多。因此,基于现场实际运营状况开发一套C3无线超时综合诊断分析系统,利用大数据手段进行分析研判,智能评判网络质量、智能判断超时故障及自动筛选疑难问题等就显得尤为迫切和重要。
因此,上海局集团公司高铁运维技术中心联合相关合作单位,研究开发了一套C3无线超时综合分析诊断系统,综合分析无线通信通道各节点的记录数据,列出车地通信数据流的传输时延,与规范进行比较,以确认发生无线通信超时的故障点;同时列出无线通信各节点响应时间,判断分析各节点设备信号质量,以诊断故障的发起点,从而采取相关的手段解决该问题,减少无线通信超时故障的几率,提高运营安全性。
1 无线通信通道监测数据
C3无线通信通道数据传输各节点设备由信号设备和通信设备组成,信号设备主要包括车载ATP主机、ATP的电台、地面列控设备RBC的ISDN和RBU;通信设备由地面GSM-R网络系统(含基站BTS,BSC/TRAU,MSC/IWF)组成。
现有C3无线通信通道各节点设备及各节点的数据流记录及监测情况如图1所示:
图1 C3无线通信通道各监测点
ATP安全计算机及RIM单元均记录有运行日志,该数据记录了设备本身发生故障的情况及时间,并简要记录了事件情况,不足以分析无线超时的完整信息流,因此ATP日志更多偏向于数据粗筛选,以辨识发生无线通信超时的场景,如ATP本身设备的反应:输出最大常用制动、降级等等。
AMS系统记录了ATP与电台的交互数据、电台与地面的空口数据,包括Igsm-r接口的呼叫记录表、Igsm-r接口的数据流和Um接口的数据流。
核心网三接口记录了地面基站的空口数据,包括电台的测量报告、呼叫记录、切换记录、信令;记录了车载与RBC之间Abis接口的数据,含呼叫记录、切换记录、信令;还记录了MSC与RBC的PRI接口的数据,含呼叫记录、信令。
2 无线通信超时规范及场景统计
2.1 超时规范
根据《CTCS-3级列控车载设备技术规范》,“当从监控RBC最近收到的消息的时间戳与车载设备当前时间的差大于T_NVCONTACT参数,则认为无线消息超时,车载设备应实施最大常用制动并向司机提示”。其中T_NVCONTACT为无线通信超时的判定时间,取值范围10 s~20 s。
对于无线通信超时的时延规范主要包括以下各类:
(1)网络注册时延,〈30 s(95%),〈35(99%),超过40 s为注册失败;
(2)连接建立时延,〈8.5 s(95%),〈10 s(100%),超过10 s为连接建立失败;
(3)用户数据帧(30字节)传输时延,〈0.5 s(99%);
(4)传输干扰时间Tti,〈0.8 s(95%),〈1 s(99%),传输无差错时间TREC,〉20 s(95%),〉7 s(99%);
2.2 场景统计
RBC交权区无线覆盖区域如图2所示::
图2 RBC切换区GSM-R通信电台同时工作区域
目前现场统计易发生无线通信超时的场景如下:
(1)相邻小区切换场景
(2)RBC交权场景
(3)环境有同频干扰场景
(4)电台性能下降场景
(5)电台天线驻波比超限场景
(6)地面基站发射功率降低,接收灵敏度下降场景
3 综合分析诊断系统功能实现
3.1 总体架构
C3无线通信数据综合诊断分析系统,从C3无线通信通道各节点设备间的交互记录数据出发,依据C3无线通信各节点设备的通信协议,离线分析各节点设备的通信时延及中断情况以此定位通信故障点;同时,系统依据无线通信空口射频信号质量的正常要求,对记录的空口数据进行C3无线通信质量分析,统计分析电台性能、基站性能、环境干扰情况,预测通信质量劣化趋势以便于更好的维护各节点设备,为管理预防无线超时故障发生,提供有效数据支撑。其总体结构如图3所示:
图3 C3无线通信超时诊断分析系统架构
系统采用时域分析、数据分析与图形化分析结合的方法,研究高铁C3无线通信超时综合诊断分析系统,以此实现C3无线通信超时数据的离线分析定位,确认现场通信超时故障的首先断开点。如图3所示,系统通过对ATPlog数据、AMS记录的数据、三接口记录的数据和RBC的log数据进行分析,实现对数据流的分析包括传输时间以及协议校验等,实现对信号设备应用数据包的分析,实现对无线超时发生节点设备的诊断,以此为定位引起无线超时故障的原因缩小覆盖范围。
对于C3无线通信传输通道记录的数据涵盖ATP与电台的接口数据交互,电台与核心网基站的接口数据交互,核心网内部Abis的接口数据交互,A接口数据交互,以及核心网与RBC的PRI接口数据交互,因此,根据以下方面对无线超时进行诊断定位:
(1)根据ATP记录的LOG数据及RBC记录的LOG数据初分判断设备的通信异常点及离线点。
(2)通过无线通信各层协议、信令交互机制,分析发送中断方,以此诊断定位故障引起点。
(3)根据通信建立时间、保持时间、释放时间对比传输数据流,综合分析各种记录数据,分析判断并定位发生无线超时故障时的节点设备,
(4)根据空口记录的物理信号特征,分析当前信号质量、信号发射电平、SIM卡掉网情况等异常信息,结合通信中断时间,分析判断通信故障点。
3.2 数据导入
需要导入的数据包括:AMS系统记录的车载Igsm-r和Um口的数据excel文件;核心网三接口记录的地面Abis,A和PRI接口的数据excel文件。
首先针对输入的数据表进行数据完整性检查:数据方向、时间戳、帧类型、CRC、层类型、链路层子类型、传输层子类型、安全层子类型、应用层子类型、T_Train、车地、地车、数据长度、数据内容等。
然后针对输入的数据表进行格式检查,若表格与编制规范不一致,进行报警提示。为提高系统的可用性,若表格格式不影响数据读取,报警提示后可继续数据管理及校核工作;若缺失关键数据表或表格格式与规范严重不符,则向操作人员报警提示修改数据表。
文件格式检查通过后,一键导入以上数据表,写入对应车次号、端号、时间等标签进行管理,然后对数据进行读取,读取过程如下:
(1)逐项读取所有数据表内容,将读取到的信息经时间轴校正后汇总为统一的通信会话信息。采用QHash集合存储通信会话信息,使用QT提供的集合框架来进行集合内元素的增删改查操作。
(2)系统按照时间排列顺序解析通信会话内容,得到通信相关的全部数据。系统将建立通信会话、通信会话结束等场景一一罗列。
3.3 数据分析
无线通信数据分析主要分析故障定位及异常预测,如图4所示:
图4 C3无线通信超时诊断分析界面
3.3.1 故障定位
在设备实现车地通信时,经统一时间轴校正,厘清从车载主机端发起传输至RBC的ISDN接口端的传输计时及响应计时;再反过来,从RBC的ISDN接口端发起传输至车载主机端的传输计时及响应计时。
(1)通过Igsm-r接口数据,可以知哓ATP何时控制电台呼叫GSM-R网,并且通过Um接口数据可以确定电台是否将ATP发送的呼叫指令发送出去,以此可以诊断ATP-〉电台的数据流向的正确性。
(2)通过Um接口记录的电台与地面GSM-R网的数据,可以知哓电台收到了RBC的数据,并且通过Igsm-r接口数据可以知道晓电台是否将数据发送给了ATP,以此来诊断ATP〈-电台的数据流向正确性。
(3)通过帧类型可以判断,ATP何时开始传输数据帧,ATP是否与RBC建立了连接,数据CRC校验是否正确等。
(4)可以确定ATP是否发送数据给RBC,ATP的电台侧是否收到回应,数据CRC校验是否正确等。
(5)通过核心网的记录数据可以确定核心网设备间的数据交互情况及中断情况,以及核心网设备与RBC的ISDN服务器的数据交互情况。
(6)通过AMS系统、核心网三接口记录的数据,统一时间轴,以车次号为单位进行分析,可以确定各节点的交互情况。结合C3无线通信规范,针对通信链路上各设备间的传输计时及响应计时数据,进行逻辑判断,分析诊断并定位发生无线超时故障时的节点设备,进行潜在风险点预判。
归纳各种故障类型:a)电台故障,b)ATP安全计算机故障,c)RIM/STU/STM模块故障,d)网络干扰故障,e)核心网BTS故障,f)核心网MSC故障,g)RBCISDN故障,h)RBC/RBU故障。
实测粉尘浓度通过调控装置3个参数的综合调控,表6出风口距掘进端头5 m下,司机位置处的测点质量浓度从154.6 mg/m3下降至102.1 mg/m3,相比降低了34%;而回风侧的粉尘质量浓度从139.8 mg/m3下降至99.8 mg/m3,相比降低了28.6%;出风口距掘进端头10 m下,在司机位置处的粉尘质量浓度也有明显降低,其测点质量浓度从187.6 mg/m3下降至142.1 mg/m3,相比降低了24.3%;回风侧的测点粉尘质量浓度从168.9 mg/m3下降至120.5 mg/m3,降低了28.7%。
3.3.2 异常预测
可对上行电平、下行电平、上行通信质量、下行通信质量、电台SIM卡脱网、小区切换异常、频点切换异常、邻区电平丢失等性能指标进行异常性分析。
3.4 趋势分析
系统对历史分析过的数据结果进行某一特定值历次测试的数据汇总,以便于了解某一个变量在当前段管内、局管内的无线超时趋势变化情况。系统生成的趋势分析图如图5所示。趋势分析的功能如下:
图5 趋势分析图
(1)系统可自动完成用户选定时间段内,以周、月、季度为单位从多个维护对通信故障趋势进行分析;
(2)系统可从路局、站段维度对无线通信超时及异常趋势进行分析:如指定单位时间内发生过多少次通信故障、有多少个小区发生过通信超时故障、有多少辆列车发生过通信超时故障、每种类型的通信超时故障有多少次等;
(3)系统可无线通信小区维度对无线通信超时及异常趋势进行分析:如指定时间内有多少辆列车在该小区发生过通信故障、每种类型的机车发生通信故障多少次、每种类型的通信超时故障有多少次等;
(4)系统可从机车维度对无线通信超时及异常趋势进行分析:如在指定时间内共发生过多少次通信故障、多少个小区发生过通信故障、每种类型的通信超时故障有多少次等;
(5)系统可根据趋势分析结果,自动生成图文并茂的统计报告,报告应需包含以下内容:卡号、车次、线别、公里标、小区、时间及异常情况等;
3.5 报告生成
关于故障定位、异常预测、趋势分析、统计分析的结果可自动生成分析报告。如图6所示。
图6 生成分析报告
4 应用情况
自2021年9月起至今,该套综合诊断分析系统在南京电务段车载车间进行了试运用。采用综合分析诊断系统,可以快速诊断故障原因,定位故障设备,相比于人工分析数据查找故障,不仅大大减少分析时间,而且有利于故障点的查找定位,减少人工分析工作的强度,从而采取相关的手段解决相关问题。系统导入三站两区间的无线数据,诊断分析时间控制在5分钟以内。系统极大提高了工作效率,有效降低了工作量。通过长时间的调试和使用,该套系统运行稳定、人机界面友好、功能全面,能够满足电务人员对车载无线通信数据分析工作的需求。
5 结论
系统综合信号、通信,结合物理传输、G网通信、RBC呼叫建立时序等多学科技术,对高铁C3无线通信数据进行综合一体的分析、数据筛选、故障定位,采用图形化的动态播放形式直观展现高铁列控C3运行交互场景,方便车载、通信、地面列控等专业技术人员对发生无线通信超时的场景及数据进行快速分析,从而为维护解决现场问题提供一定的手段,实现高铁列控C3无线通信超时重点问题的综合智能管理,为高铁C3无线通信超时综合诊断提供了一种高效的分析手段,从而确保高铁行车安全。