APP下载

民航气象数据库系统一起典型资料传输故障的分析及处理

2014-04-29俞霄靓陈齐亚梁欣兀鹏越

计算机时代 2014年12期
关键词:故障处理

俞霄靓 陈齐亚 梁欣 兀鹏越

摘  ;要: 介绍了一起典型的由于民航气象数据库通信分系统的配置文件格式错误而导致的气象数据库资料传输故障案例,采用排除法对通信系统资料传输故障进行详细分析,逐个排除,最终确定故障点为.netrc配置文件格式错误,并给出详细的处理过程。探讨了此次故障原因以及暴露出的问题,从熟练掌握通信系统的系统配置文件的内容及用途、升级改造气象数据库系统、增加日常维护经验等三个方面提出了防范整改措施,以帮助气象数据库运行维护人员对此类故障的准确排查。

关键词: 通信分系统; ftp传输; 故障处理; .netrc

中图分类号:TP3  ;  ;  ;  ;  ;文献标志码:A  ;  ;文章编号:1006-8228(2014)12-32-03

Typical troubleshooting of data transmission of civil aviation meteorological database system

Yu Xiaoliang1, Chen Qiya1, Liang Xin1, Wu Pengyue2

(1. Air Traffic Management Bureau of Northwest Regional of CAAC, Xi'an, Shanxi 710082, China; 2. Thermal Power Research Institute of Xi'an)

Abstract: A case of data transformation interruptioncaused by an error modifying configuration file has been introduced. The elimination methodis used in the detailed analysis of data transmission trouble caused by communication system. The analysis has been carried on by removing method, thefault point is determined and eliminated. The exposed problems have been discussed.The measures of prevention have been proposed frommasking configuration file of communication subsystem,upgrading the civil aviation meteorological database systemand increasingdaily maintenance experience. It can provide the directive function to operation and maintenance staffs.

Key words: civil aviation meteorological database; ftp transfer; troubleshooting; .netrc

0 引言

民航气象数据库系统是由全国七大地区中心(华北、东北、西北、西南、华东、中南、新疆)组成的分布式数据库系统,各个中心又是一个独立的数据库系统[1]。西北地区气象数据库系统通过基于民航气象广域网的MQ通信中间件与华北气象中心数据库系统进行资料交换。西北地区气象数据库系统分为通信分系统和数据库分系统两部分,通信分系统负责气象资料的接收、处理及转发,数据库分系统负责对资料进行质量控制及分类存入本地ORACLE数据库。

本文详细分析了一起民航气象数据库系统向气象局域网服务器资料传输故障及其处理过程,以供相关技术人员在处理类似问题时借鉴参考。

1 背景介绍

民航西北地区气象局域网系统是一个集资料收集、存储、服务、统计、备份功能为一体的信息系统,是民航系统西北地区气象中心业务开展和对外服务的重要平台。作为当前民航西北地区气象中心(以下简称中心)多个气象信息服务软件的主要资料来源,一旦局域网系统瘫痪会给外服务造成严重影响。因此保证气象局域网服务器资料的完整性、及时性成为西北气象中心的主要业务之一。

气象局域网系统以文件服务器为核心,以文件数据共享方式在西安咸阳机场范围内,将多类数据文件进行统一存放。这些数据资料类型主要分为报文资料、图形产品、雷达图、卫星云图、自动观测资料,其中报文资料和图形产品均由民航气象数据库系统转发,雷达图经本地雷达接收处理服务器以FTP方式上传到局域网服务器,卫星云图资料经本地卫星云图接收处理系统处理后由后端服务器以FTP方式上传到局域网服务器,气象局域网服务器通过读取自动观测服务器串口数据获取自动观测资料。西北地区气象局域网报文和图形产品数据来源如图1所示。

“控制数据”作为通信分系统的核心配置文件,包含了三种控制文件:BSB(公报说明块)、RSB(报告说明块)、TOL(时间处理表)。BSB用于决定气象公报的处理原则;RSB用于收集气象报告,确定报告的处理原则;TOL用于定时作业,也可看作定时编辑、定时转发、定时广播的时间表[2]。

通信分系统根据控制数据BSB将收集到的报文资料分成两路,一路经AFTN线路转发到局域网服务器,一路通过MQ线路转发给数据库分系统;通信分系统一方面将收集到的的图形产品资料由MQ线路转发到数据库分系统,同时根据控制数据BSB将收集到的图形产品资料通过在通信分系统中配置的一条60号FTP线路转发到局域网服务器prog目录;另外,为满足定时统计本地区缺报漏报情况的业务需求,在通信分系统上配置一条70号FTP线路,把局域网服务器bulletin目录作为公报输出路径。

<;E:\方正创艺5.1\Fit201412\图\yxl图1.tif>;

图1  ;西北地区气象局域网数据来源

2 故障现象

2014年9月2日晚18时,局域网区域管制用户反映气象信息服务系统无最新图形资料,检查发现气象局域网服务器自9月2日15:00以后无图形产品资料,报文资料、雷达图资料、卫星云图资料、自动观测资料接收正常,气象局域网系统网络线路正常。

3 故障分析

根据西北地区气象局域网数据来源分析,出现此种故障有以下几种可能。

⑴ 网络线路故障。在局域网服务器上ping气象二期数据库通信服务器,显示网络连通正常。并且,区域管制用户终端上除了无最新图形资料外,其他资料均能正常检索,说明局域网网络线路正常且区域管制用户终端工作正常。

⑵ 局域网服务器存储空间已满。检查局域网服务器空间利用率为50%,并且每月定期清理历史资料,故排除服务器空间不足情况。

⑶ 数据库通信分系统故障。检查通信分系统留底文件,显示资料转发均正常,通信分系统AFTN线路转发正常,MQ线路向数据库分系统资料转发正常,故排除通信分系统硬件故障情况。

⑷ 应用系统调整。检查《值班日志》发现,9月2日由于业务调整,通信分系统新增加一条70号FTP线路向局域网服务器输出公报统计文件,正是增加了70号FTP线路之后出现了60号FTP线路资料传输失败故障,检查60号FTP线路send目录,显示有大量文件积压。因此判断故障是由于此次系统调整而产生的。

检查新增70号FTP线路更改的通信分系统配置文件。

(a) 线路定义表MSSINI.INI。$HOME/config/mssini.ini是通信系统启动时使用的文件,其中定义了通信系统所有的线路[3]。为了能够按数据源进行留底和记录统计信息,在线路定义表中定义的线路有物理连接到路由器上的,有通过MQ通信队列连接的,还有通过网络协议FTP连接的。在MSSINI.INI线路表中查到新增FTP线路60号、70号。表1为线路定义表中的新增线路部分。

表1  ;线路定义表

从表1中可以看出,MODE列为G表示FTP线路,DIR列对应存放文件的目录号$HOME/send/sendn目录n的取值。

根据通信系统配置规则,线路定义表配置正确。

(b) 远程主机IP地址定义表hosts。

AIX操作系统/etc/hosts文件中定义了远程主机IP地址,格式如下:

QXZX 10.36.x.x

BULL 10.36.x.x

根据通信分系统配置规则,hosts文件配置正确。

(c) 公报输出需要修改BSB、TOL控制数据。

i. 修改BSB。公报需要统计西北地区所有SA、FC、FT报,输出报配置格式如下:

SACI37 1LXY  ; OUT  ;Y  ;3  ;Y

71 ZLIC  ;71 ZLLL  ;71 ZLXN  ;71 ZLXY

FTCI37 1LXY  ; OUT  ;Y  ;20  ;Y

71 ZLIC  ;71 ZLLL  ;71 ZLXN  ;71 ZLXY

ii. 修改TOL。TOL文件定义通信系统定时输出文件时间表。文件示例如下。

FN6BSM图形文件从00:00点到23:00,每6小时输出一次,共输出4次;

SA报从00:00到23:00点,每1小时输出一次,共24次;

FC报从02:00到23:00点,每3小时输出一次,共8次;

FT报从04:00到23:00点,每6小时输出一次,共4次[4];

00:05  ;FN6BSM DJLA  ;00:00  ;3  ; P  ; 56

00:05  ;FN6BSM DSLA  ;00:00  ;3  ; P  ; 56

00:05  ;SACI37  ;1LXY  ;00:00  ;2  ; N  ; 70

01:05  ;SACI37  ;1LXY  ;00:00  ;2  ; N  ; 70

02:00  ;FCCI37  ;1LXY  ;03:12  ;2  ; N  ; 70

02:00  ;FCCI67  ;1LXY  ;03:12  ;2  ; N  ; 70

02:00  ;FCCI77  ;1LXY  ;03:12  ;2  ; N  ; 70

……

根据气象数据库通信分系统配置规则,控制数据BSB、TOL文件配置正确。

(d) FTP线路相关配置文件。

i. critical文件是ftpp进程使用的参数文件,其中包括数据源目录、目标目录、远程主机名(与mssini.ini、hosts、.netrc对应)、数据源目录扫描时间间隔、传输方式、一次发送文件个数等信息。新增命令行如下:

start

$HOME/send/send6 prog put bin 1 QXZX NULL NULL NULL NULL

end

start

$HOME/send/send4 bulletin put bin 1 BULL NULL NULL NULL NULL

end

ii..netrc文件是ftpp进程进行自动ftp时使用,在IBM/AIX系统中格式如下:

machine QXZX  ;/*配置远程机器QXZX

login sync

password XXXX

macdef init

passive  ; /*设置连接模式为被动模式

空行

两段FTP线路配置信息中间需要有一行空行,并且空行不能省略,以此作为一段代码的结束符[3]。根据此规则检查通信分系统.netrc文件发现,新配置的70号ftp线路与原先的60号ftp线路之间无空行,判断是因为此命令行格式错误导致的60号线路文件FTP网络传输失败。

4 故障处理

⑴ 修改.netrc文件的配置。

将命令更改为:

machine QXZX

login sync

password sync123

macdef init

passive

machine BULL

login sync

password sync123

macdef init

passive

⑵ 重启通信程序。

对通信系统做结构调整后需要对通信系统冷启动,在通信系统根目录下输入inicold命令就开始执行冷启动,当出现要求输入定时处理的开始时间时,按格式输入时间或按回车键输入当前时间[5]。

⑶ 检查通信分系统各应用程序。

(a) 通信分系统启动完毕,在通信服务器上命令提示符后输入s_asyn检查通信线路运行状态。

(b) 输入mmi1命令,检查通信进程工作状态。

(c) 在通信服务器上输入dspmq,显示MQ队列管理器运行状态,输入showque、showchl命令检查MQ队列排队数目、MQ通道状态。

⑷ 检查通信分系统$HOME/send/send6目录下积压的文件数目,数目已经开始减少,经过2小时,积压的文件已全部转发完毕,检查局域网文件服务器prog目录下已有最新图形产品。用局域网气象信息服务系统软件检索最新图形产品,能够显示出最新图形产品。

5 故障暴露的问题

由于对通信系统配置文件进行了不正确的修改,导致气象数据库通信分系统向远程主机以FTP方式传输资料失败。

分析其原因,首先,对通信系统配置文件的格式没有作充分的了解。由于日常维护过程中很少有需要对通信系统配置文件做较大改动业务调整,因此对气象数据库通信分系统各系统配置文件运行掌握得不够透彻,需要加强业务学习及实际操作。其次,气象二期数据库是2004年建成使用的,当时厂家培训没有针对通信系统内部每个配置文件做详细讲解,并且系统配套的使用说明书也没有详细说明,不利于后期使用时运维人员对系统的修改。再次,由于系统建成时间较早,软件结构及内部配置都较为复杂,仅增加一条FTP线路就需要修改mssini.ini、BSB、TOL、.netrc、hosts、critical六个系统配置文件,每个文件都环环相扣,一个文件配置错误,将会导致线路中断,更有甚者会造成系统瘫痪,为日常维护带来很大不便,这已成为气象二期数据库系统的弊端,因此中国民航总局已提出开发民航三期数据库系统项目计划,将对二期数据库系统的结构做出较大调整,简化日常维护、系统变更、升级的步骤。

经过对这次故障的分析,加深了对数据库通信分系统的了解,掌握了通信系统配置文件互相配合使用的工作模式,对日常运行维护有了很大帮助。

6 结束语

民航气象数据库通信分系统的配置文件.netrc中定义了每条FTP线路的连接方式,通过此次故障分析排除过程,增加了对通信系统FTP线路的配置经验以及对.netrc文件内容的理解,同时,通过分析故障暴露出的问题,提出整改方案,消除了此类故障再次出现的安全隐患,但是要真正解决类似通信系统存在的问题,需要对数据库系统做全面的升级改造。本文所论述的通信系统线路配置故障的分析处理过程可供相关技术人员在处理类似问题时参考借鉴。

参考文献:

[1] 刘小魏.数据库应用系统设计与开发培训教材[M].天译计算机科技

开发公司,2005.

[2] 冯向阳.民航气象数据库通信系统解析[J].空中交通管理,2009.8.

[3] 陈齐亚.民航气象数据库通信系统[M].西安,2011.

[4] 民航局空管局.民用航空飞行气象情报发布与交换办法[Z].2009.

[5] 张迪馨.民航二期气象数据库主机维护经验总结[J].空中交通管理,

2007.8.

猜你喜欢

故障处理
试析汽轮机检修中油系统的常见故障及处理方法
智能阀门定位器的工作原理及故障处理
变电运行故障处理维护技术解析
高校网络维护与故障处理探析
电力变压器高压试验技术及故障处理
钢铁冶炼机械设备的故障诊断及处理分析
大型化工装置仪表自控系统的故障处理研究
基于计算机网络故障处理及网络维护方法研究