APP下载

探讨基于Nagios的网络监控系统的设计与实现

2021-09-10张甫

电子元器件与信息技术 2021年6期
关键词:系统管理员插件工作组

张甫

(山信软件股份有限公司 莱芜自动化分公司,山东 济南 271104)

0 引言

Nagios作为一款开源免费的网络监视工具,可以对Windows、Linux和Unix的主机状态进行有效监控,而基于Nagios的网络监控系统具有监控范围广、操作简便、运行稳定等优势,在网络运行环境中始终扮演着重要角色,该系统的建立不仅有效解决了网络用户数据丢失的问题,同时,也给网络的安全稳定运行提供了强大的技术保障。

1 Nagios系统的工作原理

Nagios系统由一个主程序、一个Nagios-plugins插件和几个可选的ADDON组成,其中Nagios-plugins插件可以对多种系统与网络服务进行有效监控。Nagios的主要功能是:监控HTTP、SMTP、PING等网络服务,监控CPU负荷、磁盘利用率等主机资源,监控方式可以通过扩展Nagiosplugins插件予以实现,而且多种监控方式可以同步运行,一旦监测到网络服务存在异常状况,该系统常常以站内短信或者邮箱的方式,将异常信息反馈给终端操作人员,当操作人员接收到这些故障信息后,可以及时启动系统故障应急预案,使网络服务质量得到切实改善。对于Nagios系统来说,插件种类繁多,因此,可以任意选择不同类型的插件,同时,这些插件可以和自定义shell脚本并行工作,这就使得网络监控能力得到大幅提升,基于对这一灵活、多样性插件选择方式的考虑,该系统适用于不同经营发展规模的企业[1]。

Nagios系统的工作原理如下:首先,Nagios按照需求对libexec文件夹当中的插件进行调用,然后,执行命令行,对主机与网络服务进行检测,最后,检测结果直接反馈给Nagios系统。其中,Nagios系统的监控方式主要有NRPE和NSCA两种,NRPE为主动检测方式,NSCA为被动检测方式,主动检测的监控方式,其动作执行过程较为简单,但是反馈结果无法实现正常传递。而被动检测则是采取客户端向服务端主动上报监控信息的监控方式,看似监控原理较为复杂,但是,反馈信息可由多级路由予以发送,这是与主动检测方式的最大区别。通过对以上两种监控方式的分析可以看出,在实际应用过程中,应当充分发挥主动与被动检测的优势,来协同完成网络监控任务。

2 基于Nagios的网络监控系统的设计思路

2.1 网络监控系统总体部署设计

下面以某学术研究中心网络为例,对基于Nagios的网络监控系统的总体部署设计进行论述。该学术研究中心被监控的网络服务器有54台,被监控的交换机有12台,需要提供监控服务项目共有88个。为了清晰展现每一个被监控对象的运行状态,首先需要对被监控对象进行命名,无论是服务器还是交换机,自身的名字具有独立性,每一个名字不得出现重复的情况。比如以DNS为域名的解析服务器,可以命名为DNS工作组,承担学术研究中心图书馆网络监控任务的服务器,可以命名为LIBRARY工作,根据这一命名原则,服务器与交换机可以并入到11个不同的工作组当中,这样,能够直观的辨识出每一个被监控对象所在的组别。比如以SEITCH-GROUP工作组为例,该工作组一共有6台交换机,每一台交换机的名称如表1所示。

表1 SEITCH-GROUP 工作组6 台交换机名称

其它工作组中的被监控对象也是遵循表1中的原则予以命名。

2.2 监控系统任务管理设计

在网络监控系统当中,被监控对象是否存在异常运行状况,除了监控系统正常发挥监控功能以外,还需要系统管理员对系统反馈信息进行监测与处理[2]。而基于Nagios的网络监控系统的管理员一般区分为两个类别,一类属于最高系统管理员,另一类则属于普通管理员,最高系统管理员管理权限远远凌驾于普通管理员之上,可以站位至高点,对系统开发与使用的全局工作进行统筹部署。而普通系统管理员的管理权限相对较小。举例说明,对于Nagios监控系统来说,最高系统管理员具有登录访问权限、修改账号密码权限、优化系统配置权限等,但是,普通系统管理员则不具有这些权限。另外,对于一个单独的服务设备来说,其监控的服务项目一般只有一至两项,因此,在设计过程中,应当重点考虑每个服务设备所对应分管人员的任务管理职责,这样,当服务设备出现异常运行状况时,相关信息可以直接反馈给与之相对应的分管人员,如表2所示。

表2 系统管理员的管理任务分配表

从表2中可以看出,工作组别不同,所承担的工作任务也有所不同,因此,这种任务分配方法能够大幅提升工作效率。比如以NETWORK-GROUP、SWITCH-GROUP这两个工作组为例,如果这两个工作组当中的设备出现异常运行状况,系统将第一时间以短信或者邮件的方式,将信息直接反馈给最高系统管理员以及分管该组别的XYJ系统管理员[3]。

3 基于Nagios的网络监控系统的实现路径

3.1 网络监控平台的搭建条件

该网络监控平台的运行环境采用Linux操作系统,因此,基于nagios是在Linux主机上的一种开源软件,其中nagios主程序是nagios-2.9.tar.gz,监控linux主机所需软件是nagios-plugins-1.4.9.tar.gz软件与nrpe-2.8.1.tar.gz软件。该监控系统配置的防火墙是selinux,如果确认系统已经关闭,则需要通过#setenforce 0的命令来完成。

3.2 网络监控平台的搭建步骤

首先需要添加nagios来运行用户与用户组,然后将apache加入到nagcmd组当中,这样,在操作nagios时,可以具有足够的操作权限,这一执行过程需要执行的命令是#usermod-a-G nagcmd apache。编译搭建nagios平台需要经过三个步骤,第一步执行make install,以便于安装所需的程序,以及HTML等文件。第二步执行make installinit,这一过程以nagios作为运行脚本,当输入执行命令以后,系统开启。第三步执行make install-config,这一过程主要是将配置文件复制到该系统的安装目录下。当nagios系统启动以后,需要执行#chkconfig-add nagios以及#chkconfig nagios on命令,使nagios自动加入到服务队列当中。然后,程序设计人员应对主配置文件语法的正确性进行检查,当确定无误后,则开启nagios服务,接下来,通过web界面对nagios进行查看[4]。

在构建nagios监控系统环境时,需要将自定义的一套规则用于配置文件,在这一过程中,最为关键的是明确“对象”的概念,比如可以假定“性别”这个对象,这个对象的值只有两种,既“男”和“女”,当确定对象的值以后,可以定义某个具体的人为一个对象,比如确定“李四”这个人,然后再对“李四”的性别进行确定,这时,属性对象的特征便得以确定。通过对这一概念的深入剖析,对nagios环境对象定义理解难度也大幅降低。比如“监控时间段”这一基本对象,其定义是:7×24小时不间断还是周一至周五,或者自定义的其他时间段[5-6]。

4 结束语

目前,随着我国信息技术的迅猛发展,网络监控系统的监控功能日渐完善,而基于Nagios的网络监控系统,逐步在IT领域站稳脚跟,该系统在网络运行环境中的实际应用,不仅缓解了系统管理员的工作压力,减轻了工作量,同时,也营造了一个安全、稳定的网络运行环境。因此,设计人员应当始终秉持与时俱进的态度,不断对网络监控系统的各项服务功能进行优化和完善,为推进我国的信息化建设进程而做出积极贡献。

猜你喜欢

系统管理员插件工作组
肖幼率工作组赴戴家湖涵指导抢险
自编插件完善App Inventor与乐高机器人通信
32个工作组印迹 >
计算机文件安全管理系统研究与设计
基于jQUerY的自定义插件开发
磁县政协专题听取委员工作组2015年工作汇报
基于Revit MEP的插件制作探讨
百项能效标准推进工程联合工作组会议在京召开
插件体系结构软件的原理和实现
Windows 7中将采用Xml格式保存日志文件