APP下载

关于DMHS—H型转报系统时钟跳变问题的研究

2017-07-28李丽

神州·中旬刊 2017年5期

李丽

摘要:本文从时钟授时对自动转报系统产生的影响出发,阐明当时钟系统发生故障时的故障排查方法、应急处理步骤以及经验总结。

关键词:自动转报系统;服务器时间;时间跳变

自動转报系统是中国民航自动转报网络的网络节点,承载着民航相关数据信息的传递和存储工作。自动转报系统采用的是UTC时间,与北京时间相差8小时,每天早上8:00自动转报系统时间由23:59分自动变更为零时。2016年1月1日,值班员在巡检中发现主用DMHS-H转报系统服务器与IP终端时间跳变为“2015年1月1日”。由于服务器中数据库报文表的访问均与时间关联,时钟的错误导致了报文无法存储数据库,值班员立即将故障现象报告给厂家工程师,查明了原因,并手动更改时间为“2016年1月1日”,恢复了服务器系统时间,报文存储功能也随之恢复。

一、事件起因

目前网络传输室共有转报系统三套,主用为DMHS-H96路自动转报系统,该系统在2016年1月1日早8:00,时间跳变为“2015年1月1日”,值班员发现后,立即检查系统收发报文情况,确定中转报文收发均正常,所有终端用户报文能够及时准确进行传递,业务没有受到影响。但是有于时间发生了跳变,造成服务器内找不到当日的数据库报文表,所有报文数据无法进行存储,值班员根据故障现象及情况,首先报告当日值班领导,并迅速联系厂家工程师,查找故障原因。

二、事件处理过程

1、检查系统路中转电报情况。由于该套系统为主用转报系统,值班员首先检查电报中转情况,通过MNG工具实时查看系统路收发电报,返回结果如图1所示,系统收发电报正常,与终端用户联系,确定所有用户能够正常收发电报,对业务没有造成影响。于是,继续排查故障原因。

2、检查GPS时钟。DMHS-H96路转报系统使用的是GPS时钟信号,服务器自动同步GPS时间,事发当日,在巡检过程中,值班员发现两台超级IP终端时间显示为“2015年”,于是通过命令检查服务器时间,检查命令为:#date,返回结果显示两台服务器时间均为“2015年”,确定系统时间出现异常,于是,迅速检查GPS时钟状态,确定当时GPS系统运行正常,时间显示为2016年,与实际时间完全相符,可以排除是GPS问题造成。将此检查结果告知工程师,便于工程师 继续排查故障原因。

3、检查IP 终端告警。虽然电报业务可以正常中转,但是由于时间错误,造成服务器数据库找不到当日的报文表,无法进行报文存储,只能在“快速查看报文”中查看缓存中的报文数据。告警信息如图2所示:

4、报告故障信息。故障发生时,值班员将故障情况向当日值班领导汇报,并迅速联系厂家工程师,说明故障现象,配合工程师查找原因,调试远程拨号连接方式,以便工程师可以远程访问该套转报系统。

5、应急处理。在配合工程师查找故障原因的同时,值班员将备用转报系统检查并测试正常,以备当主用转报系统无法中转报文时迅速启用备用转报系统,具体内容包括:

5.1核对DMHS-M(07)转报系统资料与主用系统完全同步

5.2测试引接DYX系统路至DMHS-M(07)转报系统,并测试收发报文成功

5.3检查切换单元状态,并确保切换单元处于全通状态

三、处理结果

经过检查,最终确定造成时间跳变的原因为服务器中GPS时钟模块版本过低,造成无法识别正确年份。需要手动进行调整才可以恢复,后期再将软件版本更新,可以完全修复此漏洞,使得系统不会再出现该类问题。手动修改命令为“#date –s ‘2016/1/1 ”,执行命令后,时钟立即生效,服务器时间与IP 终端时间均显示2016年,恢复正常。

在故障期间,由于数据库无法存报,为了历史记录中不造成报文丢失,收报端联系沈阳转报室值班人员,将故障期间报文重新进行转发;发报端联系终端用户发报人员,将期间电报再次重新发送,确保了报文存储的完整性。至此,由于时间错误造成的故障彻底解决,系统运行正常。

四、经验总结

针对此次突发事件,从处置经验中可以找到需要提升的问题有以下几点:

1、定期与厂家工程师沟通,了解系统所使用软件版本信息,需要更新的软件及时进行更新,消除安全隐患。

2、认真仔细对设备进行巡视检查,发现问题,及时上报并处置,以不影响业务为前提。

3、熟知系统维护及应急处置流程,当故障发生后可以及时有效的处理故障。

4、多分析、多判断,在有限的时间内将备用的预防应急措施准备好,抢在时间前面做好准备工作。

参考文献:

[1]DMHS-H系统部署手册

[2]DMHS-H系统硬件手册

[3] DMHS-H日常软件基本维护手册endprint