民航气象数据库系统典型故障维修实例
2017-03-17徐立段群
徐立++段群
摘 要
本文介绍了民航气象数据库系统故障的维修方法。
【关键词】民航气象数据库系统 故障 检修方法
1 引言
本场使用的民航数据库系统(简称为新621系统),主要由三部分组成:即通信子系统部分、数据库子系统部分、气象信息综合处理系统部分。民航气象数据库系统是民航气象部门重要的IT信息建设项目之一,是保障飞行安全的重要组成部分。鉴于此,本文将阐述民航数据库系统中的通信机服务器、数据库服务器、Web服务器典型故障及维修过程,总结故障维修经验,以提高民航气象信息系统设备保障人员的技术保障能力,确保设备正常运行。
2 典型故障现象维修及排除
2.1 通信机服务器硬盘故障与系统恢复
故障现象:REDHAT LINUX6.2操作系统不能正常启动,系统提示DIsk has many bad sectors,此时需要执行FSCK命令检查文件系统并尝试修复错误,修复完毕后正常启动,但是在备份系统文件的过程中宕机,重启通信机后出现同样情况,但已无法继续修复,硬盘彻底损坏。
故障原因分析:由于通信机以往异常断电使硬盘出现坏道,产生物理逻辑错误,致使硬盘损坏。
故障维修及排除过程:
(1)拆除故障硬盘,更换上和故障硬盘接口类型和容量大小相同的新硬盘。
(2)安装Liunx操作系统:安装前请先准备好RHEL6.2 32位的光盘,将光盘放入光驱,设置为光驱启动后,进入系统安装界面,按照步骤提示安装好Liunx操作系统。
(3)配置通信机服务器。如果在以往对通信机服务器的维护过程中未对系统做备份,就需要按照厂方技术手册安装步骤分别对MQ、MOXA卡驱动、Oracle 11gR2 clinet 、通信分系统软件包进行安装和配置。
由于本场所使用的通信机服务器已用tar命令方式进行备份过,因此,现介绍的是用tar命令备份和恢复Liunx系统文件及目录的方法。日常维护中,在通信机服务器正常运行时,防止服务器系统和配置文件数据的丢失,可对服务器进行tar命令备份整个文件系统。备份方法如下:
以root用户登录通信机服务器,进入liunx系统根目录,使用Bzip2压缩备份整个文件系统命令为:#tar -cvpjf backup.tar.bz2 /
备份完成后,在文件系统的根目录下将生成一个名为“backup.tar.bz2”的文件,可以把该文件放到移动硬盘或者其它存储介质上去。恢复系统使用命令:#tar xvpfz backup.tar.bz2 -C / ,恢复过程中会用备份文件中的文件覆盖分区上的所有文件,重启服务器后,系统会恢复到当初创建备份时的样子。
2.2 通信服务器中AB(民航气象错误公报计数)、AR(民航气象错误报告计数)数目过多的造成大量文件积压的故障处理
故障现象:开机以comm用户登录通信服务器后,使用mmi1命令后显示状态信息中AB、AR两项数目过大。
故障原因分析:由于长期未对业务进行配置和调整造成AB、AR数目大量剧增。
故障排除处理过程:使用to_bsb命令将所有不识别的报头抽出,并自动制作BSB控制。为了使用to_bsb,首先请确认$home/utl 目录下的model.bsb 文件,to_bsb 是以model.bsb 文件为制作控制数据的依据,model.bsb 文件的第一项前两个字母是报头的TT,第三个字母用于说明国外报还是国内报,C 表示国内报,O 表示国外报,A 表示对所有报的处理。其余项的含义与BSB 的文本文件相同。使用方法如下:
(1)输入mmi1 (1 可以是、2、3、4 中任一个)
(2)输入fin,,,,,,u (统计接收的不认识的报头)
(3)输入qu (退出mmi 终端)
(4)to_bsb 1 (其中1 表示mmi 号,必需与第一条对应。)
to_bsb 执行的结果是在$home/dat_bak 目录下生成bsb.new 文本文件,再将该文件附加到你原来的bsb 文本文件后面,然后再执行make_bsb 重新生成BSB 有关的控制数据并拷贝到$home/comm/msdat 目录下,并执行冷启动。
2.3 数据库服务器使用startup命令无法启动故障与恢复
故障现象:开机以oracle用户登录数据库服务器后,使用startup命令后启动数据库失败。
故障原因分析:使用df -i命令查看了/dev/sdba分区的索引节点(Inode),发现已经用满(IUsed=100%),导致oracle软件异常。
故障排除处理过程:删除TRASH目录下AWOS内无用资料后,释放出/dev/sdba分区的一部分inode后,使用startup命令启动数据库正常。
2.4 气象信息综合处理系统web网页乱码故障与修复
故障现象:打开浏览器输入气象信息综合处理系统网址,登陆后页面出现乱码,无法正常显示网页内容。
故障原因分析:由于tomcat服务异常导致网页显示乱码。
故障排除过程:以root用户登录数据库服务器,先使用 #service tomcat stop
命令停止服务,再用 #service tomcat start开启服务,用命令 #service tomcat status 来查看tomcat是否已启动,显示Tocat(8080) is running为正常,退出登录。重新刷新网页,网页内容恢复正常显示。
2.5 数据库系统服务器用户界面卡屏故障与系统恢复
故障现象:当用户logout登出用户时,有时会出现一闪变成黑屏,出现“假死机”情况。
故障原因分析:REDHAT LINUX6.2操作系統安装的是KDE桌面环境,可能是系统软件或是其它原因造成图形界面显示相关程序异常工作而导致故障。
故障排除过程:使用ctrl + Alt + BackSpace组合键后,成功回到用户登录界面。
3 结束语
民航数据库系统故障现象为数不多,但导致故障的原因多种多样,上述故障只是较为典型的实例,只要熟悉整个系统,明确维修思路,掌握正确的维修方法,就可以大大缩短故障处理时间,提高故障恢复效率,更重要的是设备维护人员要严格遵守设备操作规程,避免人为的造成设备损坏,对无法排除的故障要及时上报,必要时还需寻求厂家技术支持。
参考文献
[1]太极计算机股份有限公司.云南机场集团有限责任公司数据库系统安装手册[Z].2012
[2]太极计算机股份有限公司.云南机场集团有限责任公司通信机安装配置实施报告[Z].2012.
作者单位
云南机场集团有限责任公司西双版纳机场航务部气象台 云南省景洪市 666100