APP下载

Nagios在企业网络监控中的应用

2014-11-11李新伟

科技创新导报 2014年23期

李新伟

摘 要:通过Nagios监测平台的搭建,运用SNMP协议来监测交换机与防火墙设备,实时掌控交换机、防火墙等网络设备端口信息、流量统计等运行信息。对网络故障突发事件,由传统的被动告知转换为主动获知。

关键词:SNMP LAMP MIB OID MRTG

中图分类号:P642 文献标识码:A 文章编号:1674-098X(2014)08(b)-0168-01

1 理解SNMP

SNMP(Simple Network Management Protocol,简单网络管理协议)是一种简单的专门设计用来管理网络节点的一种标准应用层协议。它对外提供了三种基本操作命令(set、get、trap)用于控制网络设备的管理信息库(MIB,Management Information Base)。MIB描述SNMP管理的信息集合,其中每个管理信息元素称为一个对象。使用对象标识符OID(Object Identifier)来表示。OID沿着MIB树结构,从根至对象所在位置,由沿途所经过的树枝的名字或编号以点分隔后连接形成的。MIB提供数字化OID到可读文本的映射。OID与MIB文本描述可用snmptranslate命令来转换。查询MIB信息时,注意对象与实例的区别。

一个完整的SNMP管理模型包括四个基本元素,即管理者(Manager)、代理(Agent)、管理信息库(MIB)以及管理协议SNMP。每一个支持SNMP的网络设备中都包含一个代理,此代理随时将网络设备的各种情况记录至管理信息库(MIB)中,网络管理程序可通过SNMP通讯协议查询或修改代理所记录的信息,从而达到监控网络设备的目的。

2 开启SNMP代理

开启SNMP代理主要配置设置团体字符串、访问权限及使用的SNMP版本。

Cisco交换机用snmp-server community配置命令开启SNMP Agent。开启时要指定SNMP团体字符串(Community String)。团体字符串就像密码一样来限定访问交换机上的SNMP代理。SNMP允许交换机在发生特定事件时主动通过SNMP代理发送通知给指定SNMP管理器。用snmp-server enable traps XXX来指定交换机上当XXX事件发生时,交换机主动向snmp-server host命令指定的SNMP管理者发送SNMP通告。

防火墙以Juniper SSG-550为例,进入Configuration>Report Settings> SNMP菜单进行相关设置。

SNMP代理设置完成后,在Linux上用snmpwalk 172.16.240.252-c public-v 2c验证代理开启是否成功(172.16.240.252是开启SNMP代理设备IP地址)。如果有数据输出,说明SNMP代理配置成功。

3 监控软件搭建

3.1 Nagios搭建环境

Nagios提供Web页面来监视对象状态,警告提示与日志,所以Nagios应部署在LAMP(Linux+Apache+Mysql+PHP)环境下。因使用SNMP协议监控交换机,需先安装net-snmp及net-snmp-utils包.,这样编译安装Nagios插件包时才会在libexe目录下生成check_snmp插件。

3.2 Nagios监控原理

Nagios会周期性调用插件去检测服务状态,所有插件返回的状态信息都进入队列,通过Web页面显示出来。

check_snmp插件通过-o选项指定需监控的OID参数,返回设备指定MIB实例对象的值与选项-w,-c指定的阀值进行比较来判断返回4种状态信息。如check_snmp 172.16.240.252-P 2c-C public-o 1.3.6.1.4.1.9.2.1.56.0-c 80%-w 40%监控Cisco交换机CPU使用率。当监控值小于40%时返回OK(状态正常、蓝色),在40%至80%时返回WARNING(一般异常、黄色),当超过80%时返回CRITICAL(危险预警、红色),当命令执行失败,返回UNKNOWN(不可知状态、灰色)。但遇到一些无法指定阀值的情况,如端口状态,只有UP与DOWN两种情况,用check_snmp查询端口状态时,无论它是UP或DOWN,都返回SNMP OK,它仅说明命令操作成功。此时则需要附加选项(如-r选项)来改变其返回值达到警示功能(用户可在Linux用echo $?来查询命令返回值)。

端口流量不能简单的用check_snmp插件来监视,因为MIB中保存的是端口流量累计值(count数据类型)。此时需第三方软件参与扩展,check_mrtgtraf插件可对端口流量指定阀值进行预警。它需要MRTG(Multi Router Traffic Grapher)网络流量绘制软件所提取的数据文件作为参数,用户可以让MTRG定期自动执行得到端口流量数据文件,而后把mtrg生成的log文件作为参数传入check_mrtgtraf插件中得到期望的预警效果。

3.3 Nagios的报警机制

Nagios的亮点是它的一流的报警功能。它不仅提供了基于浏览器的Web界面,方便管理人员在日常运维工作中查看系统的运行状况及异常现象。也可在运维人员节假日中,在系统或服务状态异常时通过邮件或短信报警。

4 结语

该文描述了Nagios监控平台的监控工作原理,阐述了Nagios如何通过SNMP协议对交换机、防火墙等网络设备进行有效的管理与监控,适合企事业单位信息管理部门的IT人员使用,在日常运维中提高效率的同时减少了管理人员未能及时发现问题所带来的困扰。

参考文献

[1] W.Richard StevensTCP-IP详解卷一:协议.2000-04-01.

[2] 李晨光.Linux企业应用案例精解[M].清华大学出版社,2012.

[3] 高俊峰.高性能Linux服务器构建实战运维监控、性能调优与集群应用[M].机械工业出版社,2012.

[4] 王达.Cisco/H3C交换机高级配置与管理技术手册[M].中国水利水电出版社,2012.endprint