APP下载

IP 网管技术探讨与实践

2011-06-11王道衡徐丹丹刘道记

电信科学 2011年1期
关键词:轮询网管网络管理

王道衡,徐丹丹,刘道记

(中国联合网络通信有限公司九江市分公司 九江 332000)

1 引言

随着全业务IP化的发展趋势,IP网络及设备日益增加,而IP网络的设备及网络的自动管理相对滞后,大部分网络管理人员仍习惯于使用telnet命令进行设备管控,这就导致网管人员无法及时有效地发现设备运行状况,难以实时掌握各个链路的性能状态,往往等到用户投诉才能发现问题。这就使得网络自动化管理工作日益迫切,本文将探讨IP网络协议中的简单网络管理协议 (simple network management protocol,SNMP)的基本概念以及应用 SNMP开发的IP网管系统应用情况。

2 IP网管的基本功能

传统的网管系统往往以拓扑管理为基础,以轮询为手段去查询网络现状或者结合一些网元管理器的实时报警,这种模式无论从信息搜集的全面性还是信息处理的实时性以及业务关联性方面都无法适用于IP网络,所以必须对网管系统提出新的要求。

网管系统应是以提高网络服务质量为目标、以保证网络安全生产为前提、以网络事件管理为中心的网络服务质量管理系统。因为只有以网络资源实时发生的实际事件为管理基础,才能及时准确地了解到网络环境的真实情况,才能方便地建立与业务层面的关联关系,达到网管为业务服务的目的,具体要求如下。

·基础监控必须强调全面性能。网管系统应实现对业务员所涉范围内网络设备的实时监控,实现对目前众多的应用系统在网络上使用情况的监控;监控的对象和内容应可以根据网络服务管理机构的需求进行灵活的定制,上级网络服务管理机构可以根据需要监控下级网络的状况。

·主动和预警管理。根据各级网络服务管理机构的需求在网络事件采集、分类、处理和呈现等方面进行相应的客户化定制工作,以实现对网络状况及时、高效、准确的了解。这种监控能够实现主动处理和预警功能,从而奠定服务质量管理的基础。

·技术支持全网联动。以网络故障事件处理为核心,规范和统一各级网络服务管理机构的运行操作流程,确定各级机构中网络运行操作岗位的设置和职责,实现网络故障处理的记录、升级、统计等功能。

·资源的主动管理。准确了解网络基础资源的信息,了解现网的设备种类、型号、端口,以及包括虚拟局域网(virtual local area network,VLAN)划分等资源分配情况,以全辖统一的网络资源管理的角度来规划和设计网络。并且网络资源管理系统应有恰当的接口与网络实时监控系统、网络运行操作流程和系统实现平滑地连接,以辅助实时监控功能和运行操作流程功能的实现。

·服务质量管理。在实现实时监控网络运行状况和规范网络运行操作流程的基础上,实现网络服务水平管理的目标。

3 SNMP的基本概念

简单网络管理协议(SNMP)首先是由Internet工程任务(Internet engineering task force,IETF)组织的研究小组为了解决Internet上的路由器管理问题而提出的。SNMP是一系列协议组和规范(见表1),它们提供了一种从网络上的设备中收集网络管理信息的方法。SNMP也为设备向网络管理工作站报告问题和错误提供了一种方法。

表1 SNMP的协议组和规范

从被管理设备中收集数据有两种方法:一种是只轮询(polling-only)的方法,另一种是基于中断(interrupt-based)的方法。

如果只使用只轮询的方法,那么网络管理工作站总是在控制之下。而这种方法的缺陷在于信息的实时性,尤其是错误的实时性。多久轮询一次,并且在轮询时按照什么样的设备顺序呢?如果轮询间隔太小,那么将产生太多不必要的通信量。如果轮询间隔太大,并且在轮询时顺序不对,那么关于一些大的灾难性的事件的通知又会太慢。这就违背了积极主动的网络管理目的。

当有异常事件发生时,基于中断的方法可以立即通知网络管理工作站(在这里假设该设备还没有崩溃,并且在被管理设备和管理工作站之间仍有一条可用的通信途径)。然而,这种方法也不是没有它的缺陷的。首先,产生错误或自陷(trap)需要系统资源。如果自陷必须转发大量的信息,那么被管理设备可能不得不消耗更多的时间和系统资源来产生自陷,从而影响了它执行的主要功能(违背了网络管理的原则2)。而且,如果几个同类型的自陷事件接连发生,那么大量网络带宽可能将被相同的信息所占用(违背了网络管理的原则1)。尤其是如果自陷是关于网络拥挤问题的时候,事情就会变得特别糟糕。克服这一缺陷的一种方法就是对被管理设备设置应当什么时候报告问题的阈值(threshold)。但不幸的是这种方法可能再一次违背了网络管理的原则2,因为设备必须消耗更多的时间和系统资源来决定一个自陷是否应该被产生。

结果,以上两种方法的结合——面向自陷的轮询方法(trap-directed polling)可能是执行网络管理最为有效的方法了。一般来说,网络管理工作站轮询在被管理设备中的代理来收集数据,并且在控制台上用数字或图形的表示方式来显示这些数据。这就允许网络管理员分析和管理设备以及网络通信量。

被管理设备中的代理可以在任何时候向网络管理工作站报告错误情况,例如预制定阈值越界程度等。代理并不需要等到管理工作站为获得这些错误情况而轮询它的时候才会报告。这些错误情况就是众所周知的SNMP自陷(trap)。

在这种结合的方法中,当一个设备产生了一个自陷时,可以使用网络管理工作站来查询该设备(假设它仍然是可到达的),以获得更多的信息。

4 IP网管系统的搭建与应用

本文使用的IP网管系统采用国外开放式源代码,结合本地网络现状,自行开发出本地网络IP网管系统,主要搭建步骤及注意事项如下。

(1)系统硬件配置要求

硬件要求普通品牌台式电脑,确保硬件设施运行稳定;系统配置要求较低,只需能够运行Linux RedHat 5.2以上版本即可,硬盘配置要求在200 GB以上。

(2)系统安装

下载CactiEZ 9.1版本 (中文汉化版)ISO镜像文件刻录光盘,将光盘插入光驱,电脑设置光盘启动,回车安装即可。相关步骤如下。

安装界面,按回车继续,但要注意后面的操作会清除所在硬盘上所有的文件,如果看不到这个画面,可能是ISO镜像有问题或是光盘有问题或是没有设置成光盘引导。几分钟后就安装完成了,按回车重启,记得把光盘拿出来,改成硬盘引导,按回车自动完成安装配置。安装完成后,对网卡进行配置,配置相应的IP地址。通过网页即可访问,打开浏览器访问IP地址,用户名和密码是admin,如图1所示。第一次安装需要更改密码。

图1 用户登录界面

(3)安装注意事项

·由于Linux内核为RedHat 5.2版本,在安装过程中可能会提示一些关键硬件无法识别导致安装失败,可以到网络上查找解决办法,关闭检测硬件。

·由于Linux内核为RedHat 5.2版本,一些最新的网卡无法识别,导致系统无法找到网卡,因此必须安装驱动,建议最好的办法是加装一块老版本的网卡。

(4)插件及安装应用

在CactiEZ 9.1版本中默认已经安装了控制台、图形、阈值、监视器等插件,在实际的网管中需要增加拓扑图(weathermap)、报表(reportit)、报告(nectar)、搜索(discover)、MAC 地址跟踪(MAC trace)等。

(5)网管设备的配置

①设备添加及流量监控:控制台→设备→ADD,如图2所示。

填写相关信息注意:设备网管IP以及主机对应模板、SNMP字符串必须填写正确,相关配置方法可参照网络。

添加完设备后可创建图形:点击创建图形,选定对应设备,并选择监控项目,点击创建,即完成相关配置,5 min后可以监测到图形,如图3所示。

②配置注意事项:如果监测端口流量,在选择图形类型时,建议选择 In/Out bits(64-bit counters),否则1 Gbit/s以上流量将失真。

③其他配置:可以对端口进行相关标识及描述,如端口编号、端口用途等,分别在“数据源”、“图形管理”处配置成与实际一致。

④配置图形树:可以根据设备归类进行管理。

⑤配置告警邮件通知功能:在控制台→设置→邮件/域名解析中设置邮件,界面如图4所示。在控制台→设置→报警/阈值中设置报警阈值。

(6)主要功能及应用情况

目前本地IP网络主要设备已纳入IP网管系统,总共监测164台设备,总共监控项目1 736项,能够很好地达到IP网络管理功能。

①实现设备的实时监控,业务中断或网络性能事件可以及时上报,并可以产生声音告警。通过邮件发给相关网管负责人,启用邮件短信功能,及时通过手机短信通知到人。

②实时网络拓扑监测:可以实时监控和了解网络各个节点间链路流量情况,如图6所示。

图2 设备添加界面

图3 监测到的流量情况

图4 配置告警邮件界面

图5 监控各设备示意

图6 网络各节点间链路流量情况

③查看各个设备运行历史记录:设备端口流量如图7所示。时延测试如图8所示。设备性能(CPU)如图9所示。

图7 设备端口流量

图8 时延测试

图9 设备性能(CPU)

1 谢希仁.计算机网络(第五版).北京:电子工业出版社,2007

2 Cacti流量监控系统搭建维护手册.http://wenku.baidu.com/view/a859a8eb998fcc22bcd10d79.html,2008

3 Plugins.http://docs.cacti.net/plugins

4 Cacti的常用插件.http://apps.hi.baidu.com/share/detail/9139001,2010

猜你喜欢

轮询网管网络管理
基于OpenStack虚拟化网络管理平台的设计与实现
基于等概率的ASON业务授权设计∗
电动汽车充电服务网络管理初探
给水网管的优化布置研究
基于EOC通道的SHDSL网络管理技术
依托站点状态的两级轮询控制系统时延特性分析
利用时间轮询方式操作DDR3实现多模式下数据重排
“五制配套”加强网管
网管支撑系统运行质量管控的研究与实现
卫星导航网络管理设计