APP下载

东进转报系统典型故障案例分析

2018-04-25黄顺利陈蔚刘国锋

科技创新与应用 2018年11期
关键词:排故案例

黄顺利 陈蔚 刘国锋

摘 要:民航自动转报系统在空管运行及对外服务中的重要性日益凸显,不同厂家的硬件、软件在转报系统中的使用呈现多样性,怎样排除因系统兼容性及处理机制的不同造成的报文收发不畅问题是排故工作的难点。文章以东进自动转报系统为例,对此类典型案例进行分析总结,供设备维护人员参考。

关键词:民航自动转报系统;兼容性;案例;排故

中图分类号:V351.36 文献标志码:A 文章编号:2095-2945(2018)11-0117-03

Abstract: The importance of civil aviation DMHS in the operation of air traffic control and external service is becoming increasingly prominent. The hardware and software of different manufacturers are used in the transfer system in a variety of ways. How to eliminate the problem caused by different system compatibility and processing mechanism is the difficulty of troubleshooting. This paper takes Dongjin DMHS (Data & Message Handling System) as an example to analyze and summarize this kind of typical cases, which can be a reference for equipment maintainers.

Keywords: civil aviation automatic DMHS; compatibility; case; troubleshooting

引言

民航自動转报系统作为传输飞行动态、航行情报信息、气象信息等情报的重要通信手段,其正常运行关系着飞行的安全与正常,关系着空管行业对外服务水平。《民用航空气象地面观测规范》中关于03分前发出例行观测报文的要求及2013年1月正式施行的《民航空管系统气象工作质量管理办法》中气象业务差错标准10分钟的界限,对气象服务质量提出高要求的同时对自动转报系统的正常运行时间、故障时间、排故时间都提升了一个高度。

自动转报系统除需连接本系统自带发报终端外,还需连接其他厂家的转报系统或其他设备服务器,系统的兼容性亦是转报系统维护需关注的重点,因对其他连接系统知识掌握的有限,有些内容甚至跨专业,此点也是排故工作的难点。本文以东进自动转报系统为例,对此类典型案例进行分析总结,望为日后工作提供参考,尽量避免因转报系统故障导致的管制和气象不安全事件的发生。

1 东进转报系统概述

北京东进DCTT PRO系列自动转报系统[1]是在Windows操作系统下开发的民航专用电报自动处理设备,由服务器、通讯接口设备、系统软件、客户端软件、其他外围设备组成。

阿克苏空管站使用的就是该系列转报系统,系统采用2部交换机(1部冷备份)挂接2部路由器(1部冷备份)来完成16路的转报地址路由,每1部路由可接8路RS232接口终端和8路双流接口终端[2],其中前2路路由作为转报系统中继传输使用,完成与乌市转报系统的报文交换,其系统框图详见图1。因管制情报、气象AWOS系统、气象数据库系统、自动化系统等需转报系统提供管制、气象报文信息,这几个系统服务器将连接转报系统的一个终端通道,自动转报系统发送的报文需经过此类系统的处理方可供用户使用,系统间软件的处理机制不同对转报系统排故的及时性存在一定影响。

2 故障案例一

2.1 故障现象

阿克苏空管站转报系统中继传输由1地1空保障,分别为ATM、C波段卫星,针对ATM链路端口假死现象频发、C波段卫星运行不稳定的情况,站设备保障部门与局本部协商增加平面网B网(联通)链路作为自动转报系统的第三保障链路。

对乌市航管科技转报系统、平面网B网路由器、空管站自动转报系统完成相关设置后,双方互发测试报,平面网B网(联通)链路收发报文正常。下一整点气象观测人员发布例行天气报告,报文发送成功,技保值班人员在转报监控终端发现此报文在转报系统“2通道”(平面网B网链路)循环收发,此时观测人员告知检查回报时发现多份回报,气象数据库入库时间被覆盖(报文发出时间在整点3分钟以内,因循环收发造成气象数据库入库时间超过3分钟)。

2.2 故障分析[3]

(1)系统硬件物理链接不正确,收发短路,致使电报收发死循环。

(2)各系统参数设置问题。

(3)系统软件存在BUG。

(4)其他问题引起。

2.3 故障处理

第一步:将转报系统中继传输链路恢复至ATM链路,进行收发报文测试正常,持续观测下一整点例行天气报告报文情况,未出现报文循环收发情况。

第二步:检查硬件物理连接。阿克苏空管站工作程序具有其特殊性,为规范观测员发报流程,确保例行天气报文的及时性和准确性,气象观测员需通过转报系统观测回报终端对报文发送情况进行查询,正常情况下应有4份回报,发报地址为ZWAKYMYX、ZWAKYZYX各两份,发报地址ZWAKYMYX为气象观测发报终端发送的报文产生的回报,发报地址ZWAKYZYX为气象数据库通信机设置对AFTN链路发来的报文为其自动添加ZWAKYZYX地址。

三系统连接简化框图如图2所示,由第一步将中继传输链路改为ATM系统正常可判断问题可能出在东进转报系统、平面网B网、航管科技转报系统部分。

由在发观测整点报文前用平面网B网链路与乌市进行测试报收发,显示正常,且无其他用户出现此情况,可判断东进转报系统、平面网B网、航管科技转报系统单独工作正常。

东进转报系统通过RS232接口连接到平面网B网路由器,检查测试连接线收发是否短路,显示正常,通知乌市检查其连接状况,结果正常。

第三步:检查转报软件参数设置。与乌市核对转报系统参数。

出、入冠字正确。速率匹配。

码制5号码,数据位8,发报头SOH,报尾ETX。

检查结果:两台转报系统参数设备匹配、正确。

第四步:软件情况检查。分别与航管科技、东进厂家确认软件、进程,厂家确认正常。

第五步:深入分析研究其他原因。主要考虑两转报系统与气象数据库系统兼容性问题。

站转报系统2通道原为C波段卫星中继链路,其码制、数据位、报头、报尾均与ATM通信链路一致,分别为二号码、5、ZCZC、NNNN,将2通道由C波段卫星链路改为平面网B网链路后码制、数据位、报头、报尾将作相应调整,如链路正常、参数匹配,则报文收发正常,故考虑数据库转发机制。

气象数据库系统对报文的收集和转发主要依靠通信机实现,数据库服务器仅起到存储报文的功能,则将重点放在通信机的BSB资料处理规则。

通过分析转报参数变化和数据库通信机处理规则发现,乌市航管科技转报系统在改完系统参数后,发出的报文末尾会有一个十六进制“0D”字符,由于两套转报系统品牌不同,致使我站转报系统无法解析乌市航管科技转报系统发送末尾“0D”字符,将此字符解析为特殊符号,并将解析后的报文向数据库系统通信机转發,致使通信机认为转报系统发来一份新的报文,通信机根据转发规则向我站转报系统转发此报文,转报系统根据转报规则向乌市航管科技转报系统转发此报文,乌市航管科技转报系统收到报文后再次向我站转报系统转发报文末尾累加十六进制“0D”字符的报文,以此多次循环,导致数据库入库时间被覆盖。乌市航管科技转报系统更改参数设置后,恢复正常。

2.4 故障总结

该故障是因为三系统处理机制不同,将一份报文错认为是多份新报,致使循环收发报文,循环收发的报文致使数据库入库时间超过3分钟,易误判为气象业务差错,影响气象业务服务质量。设备物理链接及软件配置是排故重点外,还应考虑不同系统的兼容性问题,深入了解各系统的工作原理、处理机制将对设备维护有重要作用。

3 故障案例二

3.1 故障现象

转报系统客户端软件的通道状态监视窗口显示3通道管制处理接收灯持续闪烁,通过报务管理查询3通道接收报文,发现转报系统持续接收3通道发送的报文,报文内容为字母乱码。

3.2 故障分析

(1)终端软件故障。

(2)系统硬件物理链接不正确。

(3)其他问题引起。

3.3 故障处理[4]

第一步:将转报系统异步单元3通道物理链接断开,避免转报系统服务器瘫痪,发现3通道报文停止接收,可判断转报系统硬件、软件正常,故障点应在3通道的物理链接或软件。

第二步:检查3通道终端发报软件。此通道发报软件并非东进发报软件,而是局本部自行研发的航管电报自动处理软件,此软件除具有收、发报文功能,还具有飞行计划制作、显示和提示功能,软件包括电报收发网关、数据处理、飞行计划显示三个部分,前两部分正常运行飞行计划显示功能方可启用。

查看此终端收发报文,发现最新航班动态信息报文未收到,一直对外发送字母乱码。因终端一直对外发送报文,无法判断接收是因为通道占用还是因为物理链接不正常导致的。

因航管电报自动处理软件为局管制人员研发,无相关培训材料,故我站设备维护人员缺乏此软件排故经验。为排除此软件故障,将软件服务禁止,采用东进发报终端或超级终端替代此发报软件,将RS232接口端收发环路,发送测试报,未收到报文,可判断故障在物理链接。

第三步:检查硬件物理连接。为延长通信距离,降低丢包率,在转报异步单元和转报终端电脑端分别安装了接口转换器,通过网线进行传输,通过测试网线通断排除网线故障,通过分别替换两个接口转换器判断转报异步单元端接口转换器故障,更换上线测试后系统恢复正常。

3.4 故障总结

该故障为硬件原因造成,因发报终端所安装软件为专用软件,需先排除软件故障后对硬件进行检查,硬件检测中因中间传输环节多且不具备接口转换器排故知识,仅能依靠替代法排故。建议尽量减少传输环节中间节点,避免增加需排除环节,并且增加传输环节的设备备件存储。

4 结束语

通过以上案例,对东进转报系统、航管科技转报系统、气象数据库软件的处理机制和硬件故障的排除方法有了更深入的了解,开拓了思路,告诉我们不但要关注单个系统,更要关注系统间的问题。

参考文献:

[1]北京东进记录科技有限公司.自动转报系统用户手册[Z].

[2]吕国祥.东进自动转报机应急系统的改造[J].空中交通管理,2011(7):48-50.

[3]李惠玲.DMHS-M自动转报系统无法自动切换的分析与处理[J].空中交通,2014(10):65-66.

[4]李安娜.贵阳蓝波ZB16/64-D自动转报机典型案例分析[J].信息与电脑,2016(10):52-53.

[5]杨奕堂.一种民航转报机硬盘I/O性能监控的设计与实现[J].科技创新与应用,2015(01):59.

猜你喜欢

排故案例
样板案例
NSE 9A-Module 4-Unit 2案例设计
民用飞机机载设备/系统排故方法研究
AIDS系统参数在排故工作中的高效应用
基于机电设备电气控制线路排故的仿真系统设计
随机变量分布及统计案例拔稿卷
“互联网+”的现实案例
难以一致的统计结果
不重实效,重广告