广州地铁一号线信号系统COM工作站CPU占用率研究
2015-01-01许琪
许 琪
随着地铁网络的密集,越来越多的地方能够经由地铁到达,轨道交通成为公众出行的重要选择。信号系统作为轨道交通中的重要组成部分,直接决定着城轨交通系统的准点、安全等指标。自1997年广州地铁1号线ATS运用以来,通信服务器(COM工作站)一直存在自动重启的现象。近年来为提高广州地铁1号线运营服务水平,高峰期上线列车增加为25列,全天约570列次。随着行车密度的提高,设备使用年限增长,COM工作站不稳定性明显增加,故障率呈上升趋势,给广州地铁的运营服务带来较大影响。为此,对COM工作站的工作情况进行统计,研究优化措施,以提升1号线信号系统的稳定性。
1 问题分析
通过长期的运营情况统计,广州地铁1号线COM工作站的故障主要表现为以下几个方面:
1.MMI工作站的操作缓慢,甚至出现程序出错导致工作站受干扰。
2.错误车次、跳车次故障数量陡增,增加了运营安全隐患。
3.COM工作站处理能力不足,受干扰自动重启现象增多,影响运营监控,增加安全隐患。
对COM工作站故障情况进行统计,其中主用故障为1,备用故障为66,说明COM工作站故障以备用为主,占故障总数的99%。切换系统的COM1、COM2采用主备用状态运行,故障率仍然以备用为主,没有任何改善,说明COM工作站各类故障的出现不在于硬件工作不稳定,而主要是系统软件数据处理及信息交换上存在缺陷。
为研究COM工作站的CPU占用率与行车密度的关系,对以COM工作站为核心的ATS系统进行软件测试,以达到系统优化的目的。测试内容包括4个方面:COM工作站CPU占用率的统计分析;COM工作站程序测试分析;ATS系统设备的优化措施;搭建离线编图系统。
2 COM工作站CPU占用率的统计及分析
对COM工作站的研究是基于广州地铁1号线计划时刻运营数据进行的,分别针对工作日和节假日,客流高、中、低峰的行车间隔和上线列车数量,主用COM工作站、备用COM工作站CPC占用情况进行取样统计,取样数据见图1—图4。从统计结果可以看出,主用、备用COM工作站进行相同的数据运算和处理,由主用COM工作站进行数据通信和命令发送,主用COM工作站CPU占用率比备用高出10% ~35%。
工作日,主用COM工作站在早晚高峰期25列车上线运营时,CPU占用率峰值频繁出现,峰值可达100%,平均值均在86%。节假日,主用COM工作站在高峰期24列车上线运营时,CPU占用率的最大值可达到95%,平均值在82%左右。
在当前 ATS配置下,每增加一列车上线,COM工作站的CPU占用率增加约3%左右;而当线上列车为25列时,主用COM工作站的CPU占用率的峰值可达100%,达到满负荷状态,这说明COM工作站的CPU占用率与线上列车数量有直接关系。
3 COM工作站程序测试
对COM工作站的开机自动装载程序进行测试。COM工作站共有45个自动运行的程序,逐一测试关闭程序后对COM工作站运行状态的影响,确认是否有不重要程序运行,以优化CPU占有率。
测试发现,关闭CSPV(功能未知 (数据计数监控))及PSIM(功能未知 (主电脑层模拟进程的所有任务管理))程序后,COM工作站仍保持正常工作状态,报文信息显示该程序终止 (系统未出现自动重启或停止工作的情况),2台主备用COM工作站未发现异常,模拟跑车运营测试一切正常,中央显示正常。对比关闭2个程序前后的CPU占用率,发现CPU占用率有一定优化。故为降低CPU占用率,可以考虑关闭CSPV程序及PSIM程序。
而其他43个程序关闭时,COM工作站均会停止工作或自动重启。由此可以确认,此43个程序为COM工作站维持正常工作状态不可缺失的程序。
关闭程序操作:在VICOS窗口输入指令ps-ax,要求不以终端机来区分;如,lodi程序即为系统运行的程序,其对应进程号 (PID)为1536;关闭程序的指令为Kill 1536。
4 COM工作站的优化措施
COM工作站负责信号系统所有设备监控及数据处理,在线使用的设备越多,在线运营的列车越多,COM工作站需监控/处理的数据量越大,CPU占用率也就越高。减少COM工作站的数据处理量,可有效改善COM工作站运行状态。经过研究分析有以下6项可行措施。
4.1 车次号数据优化
为控制隧道通风设备,信号系统设计中建立了信号与环控系统的数据传输链路。BAS报文即为信号系统与环控系统的接口报文,COM工作站的列车监视与追踪程序 (TMT),对在线所有列车进行监督并每30 s发送一次检测报文,即“活着报文”。报文信息包括车次号、所在区段、车底号和停在区间的时间。在MMI上对列车车次号进行删除,能起到车次号数据优化的作用,使COM工作站的CPU占用率约有1%~2%的降幅。
4.2 离线编图
广州地铁1号线ATS中央的行车模式为列车按照已经编译好的时刻表运行。目前,编图操作由SUN工作站组成的时刻表编辑器 (TTE)来运行,TTE已联入ATS中央网络直接以在线形式挂在ATS总线上进行工作,与网络中的其他中央设备保持实时的数据交换。这意味着编图工作需要在线时刻表编辑器 (TTE)来完成,编图工作的编译、存档及调整冲突均需与COM工作站、ADM工作站进行数据交换,直接增加COM工作站的数据处理负荷。
由于编图工作中的“编译”过程需要与COM工作站、ADM工作站进行数据交换,故编图过程完成进行“编译”时,主用工作站的CPU瞬时占用率将升高约15%,此过程对于ATS中央网络的冲击较大,会直接干扰COM工作站的工作,对运营组织存在隐患。
为了减轻在线编图对COM工作站造成的数据运算负荷,搭建了由管理服务器 (ADM)、通信服务器 (COM)及时刻表编辑器 (TTE)3个SUN工作站组成的离线编图网络,可有效降低在线编图对ATS关键设备造成的冲击。
4.3 自动列车调整功能优化
自动列车调整功能是在列车自动驾驶 (ATO)模式下,比较列车实际运行时分与时刻表的计划运行时分,计算偏差时间,并通过调整列车的区间运营时间及停站时间来修正偏差。由于比较及修正偏差时间的数据运算处理及结果输出均由COM工作站实现,因此可考虑在运营高峰期时关闭自动列车调整功能,这样可在一定程度上减少COM工作站的数据处理量,达到优化COM工作站状态的效果。
自动列车调整功能关闭操作步骤:①行调在MMI上的信号基本窗中,按鼠标左键点击“调度”按钮,启动ATR窗口;②在ATR窗口中按鼠标左键点击“所有列车”按钮;③按鼠标左键点击“自动列车调整关闭”按钮;④按鼠标左键点击“执行”按钮。
4.4 车辆段RTU(远程终端单元)的优化
西朗车辆段RTU原用于读取6502联锁系统的车库轨道占用状态,并把信息发送到中央通过MMI显示出来。车辆段计算机联锁改造后,6502设备已经拆除,车厂RTU已失去原有功能。因此关闭车厂RTU可在一定程度上减少COM工作站的数据处理量。
4.5 运行图优化
正常情况下,行调在3台MMI工作站上均打开运行图窗口,当运行图窗口打开时,实时向COM工作站请求运行图数据,包括计划运行数据及实际运行数据的运算,并实时更新。打开的运行图窗口越多,COM工作站需输出的数据量越大,因此减少运行图窗口打开数量,可在一定程度上减少COM工作站的数据处理量。
4.6 车辆段MMI(人机界面)优化
西朗车辆段配置了2台MMI工作站,其中MD1用于运营前进行车辆管理的信息输入,MD2用于列车出入车辆段时监控西朗站正线线路情况。COM工作站对2台MMI工作站进行状态监控及MMI上的实时图像信息传递、处理。可以考虑在运营期间不需使用2台MMI时断开网络连接,可在一定程度上减少COM工作站的数据处理量。
5 结束语
广州地铁1号线信号系统COM工作站的CPU占用率受运营列车数量和运行程序的影响较大,为提高COM工作站的稳定性,应在满足运营需求的前提下尽量减少运营列车数量,关闭不必要的程序,优化各系统的数据及功能,以降低CPU占用率。目前,对COM工作站的CPU占用率的数据分析和优化措施,已在广州地铁1号线进行了运用,并取得了满意的效果,希望能为其他线路的信号系统优化提供借鉴。
[1] 康崇皓.城市轨道交通AFC系统读写器的建设模式浅析[J].铁道通信信号,2013(3):86.
[2] 沈陈霄,万旭明,宋昊.浅析CRTC数据通信系统的安全隐患[J].铁道通信信号,2013(3):89.
[3] 刘健.CBTC信号系统无线网络的安全性研究.[J].铁道通信信号,2013(5):61.