APP下载

一种关于AirNet自动化系统硬盘监控程序的设计

2020-05-25董华伦

科技风 2020年15期
关键词:离线空管硬盘

董华伦

摘 要:隨着民航的快速发展,空管自动化系统的地位越来越高,而空管自动化系统中主要由计算机系统组成。硬盘是计算机系统的存储中心,7x24小时运行。在空管自动化系统中故障的统计中,硬盘的故障率最高。为解决硬盘故障带来的影响,现在服务器都使用RAID技术。RAID技术的使用缓解了硬盘故障带来的影响,但是当前空管自动化系统中依然缺少对硬盘的监控。

关键词:AirNet;硬盘监控;S.M.A.R.T;smartmontools

AirNet空管自动化系统由成都民航空管科技有限公司自主研发的具有自主知识产权的管制中心空管自动化系统。AirNet具备冲突告警、低高度告警、常规一次、二次雷达等监视数据接入处理、雷达数据记录回放、雷达显示、飞行计划处理及显示等功能,可为空中交通控制提供自动化的管制手段,是区域、进近、塔台等单位的雷达管制必备的系统。

AirNet自动化系统的工作站使用HP Z系列工作站和HP DL380系统服务器,使用RedHat Linux Enterprise Serverr5.8或7.1的操作系统。在SMC的监控程序上都缺少硬盘状态的硬盘,无法实时监控硬盘的工作状态,存在无法及时发现硬盘健康状态不佳的安全隐患。通常是通过定期检查硬盘指示灯来判断或待硬盘故障导致系统不可用才发现,工作效率低下。尤其是当前HP工作站也使用RAID1,当其中一块硬盘故障时,在主机和显示上都无任何变化,只有两块硬盘故障才能发现,而此时系统已不可用,迫切需要一种监控程序能实时监控硬盘的健康状态。

1 S.M.A.R.T

1.1 S.M.A.R.T的概念

Self-Monitoring Analysis and Reporting Technology的简称为S.M.A.R.T,是一种自我监测、分析和报告的技术。可以通过使用硬盘上的一些指令和监测软件对支持S.M.A.R.T技术的硬盘的健康状态进行分析,比如:硬盘的磁头、马达、盘版、使用时间、电路情况、历史情况等健康状态,将检测到的数值与硬盘预设的安全值进行分析比较,当检测到的数值超过预值后,可以自动向用户提供告警信息。支持S.M.A.R.T技术的硬盘可以通过使用硬盘上的监测指令和主机上的监测软件对磁头、盘片、马达、电路的运行情况、历史记录及预设的安全值进行分析、比较。当出现安全值范围以外的情况时,就会自动向用户发出警告。

1.2 S.M.A.R.T信息收集方式

S.M.A.R.T的信息收集有两种方式,一种是在线收集方式(On-line),一种是离线收集方式(off-line)。在线收集方式,就是在硬盘在工作时,硬盘自动地实时或定时更新硬盘自身的S.M.A.R.T的数据。比如SCSI硬盘,每4分钟自动更新S.M.A.R.T数据,当在4分钟的周期里如硬盘健康状态有异常,则会将主机提供告警信息。在线收集方式不会影响到硬盘的性能。

离线收集方式,就是在主机上通过相关检测指令对硬盘进行检测。由于离线收集会让硬盘进行大量操作用以检测健康状态,在一定程度上会造成对硬盘的读写有一定的延迟,所以离线收集方式会对硬盘的性能有一定的下降。但由于当前的硬盘性能和主机性能都较好,在实际使用过程中没有明显的体现。

2 smartmontools

2.1 smartmontools是什么

smartmontools是一种硬盘检测工具,可以安装在Windows和Linux操作系统上,在Windows或Linux操作系统运行smartmontools,可以检测硬盘的健康状态。smartmontools主要由smartctl和smartd两部分工具程序组成。可以认为smartctl是离线收集,smartd是在线收集。

2.2 smartmontools参数的介绍

smartctl-a 查看S.M.A.R.T相关信息;

smartctl-s on 开启S.M.A.R.T功能;

smartctl-H 检查硬盘健康状态;

smartctl-t short 后台硬盘快速自检;

smartctl-t long 后台硬盘长时间自检;

smartctl-C-t short在前台硬盘快速自检;

smartctl-C-t long在前台硬盘长时间自检;

smartctl-X中断后台硬盘自检。

2.3 smartmontools的常用使用方法

(1)smartctl-i /dev/sda 显示设备所有的SMART信息。

(2)smartctl-H /dev/sda 检查硬盘健康状态。

3 硬盘监控程序的设计

当前AirNet自动化系统的操作系统版本为redhat5.8或redhat7.1,该两个版本的操作系统都已经安装好smartmontools。

3.1 硬盘监控程序的部署

(1)在SMC的/home/cdatc/AirNet/bin/disk_monitor目录下新建disk_monitor.sh和alarm_displsy.sh两个shell脚本程序,disk_monitor.sh为主程序,alarm_displsy.sh为告警显示程序;

(2)在SMC的定时任务中添加disk_monitor.sh的定时任务。

3.2 disk_monitor.sh内容如下

4 总结

该程序同样也可部署在莱斯自动化系统、ADS-B数据站等系统上,可移植性较高。通过该监控程序的运行,可以快速检查硬盘的工作状态,提前发现设备隐患,安全隐患零容忍落到实处,推动安全风险窗口前移,保障空管自动化系统的持续运行能力。

参考文献:

[1]360百科S.M.A.R.T(https://m.baike.so.com/doc/6778352-6994423.html).

[2]Smartmontools使用指(https://blog.csdn.net/lwprain/article/details/9819623).

[3]AirNet自动化系统相关资料.

[4]HDD SMART-百度文库(http://wenku.baidu.c).

[5]S.M.A.R.T技术(http://baike.baidu.com/view/158623.html).

猜你喜欢

离线空管硬盘
基于卷积神经网络的离线笔迹鉴别系统
智慧空管技术的进展
新版Windows 10补丁离线安装更简单
空管流量控制过程中的风险控制探析
替代你的机械硬盘吧!3款热销SSD固态硬盘对比体验
民航空管安全文化建设探析
好进难出 应对迅雷“口袋战”
一题三解,多角度解读运动学大题的解法
插拔硬盘所引起的硬盘启动顺序更改
离线发文件 不是会员也能用