网络设备故障解决一体化平台初探
2016-02-06王宁邦杜陈艳
◆徐 博 王宁邦 陈 彬 杜陈艳
(云南师范大学信息处网络科 云南 650500)
网络设备故障解决一体化平台初探
◆徐 博 王宁邦 陈 彬 杜陈艳
(云南师范大学信息处网络科 云南 650500)
移动技术方便了管理,本文针对复杂的管理环境对网络设备管理方法以及依托的技术进行了阐述,提出了网络设备故障管理一体化平台解决方案,详述了各个模块的具体内容,其中很多已经融合到了现实管理指导和各种系统的实践中。
移动技术;网络设备管理;一体化平台;解决方案
0 引言
基于ICMP[1]协议的监测技术比较成熟,具有通用性强,可靠性高,实现简单等优点,但轮询网络设备,势必会给被监测设备所在的网络注入大量的测试流量,占用的网络资源,造成网络拥塞、网络的瘫痪,同时该方法的实时性较差[2]。
基于SNMP协议的监测方法是目前比较智能化的方法,具有较高的实时性,占用网络资源少,但要求被监测的网络设备必须支持SNMP协议,通用性弱,当网管软件死机或通信链路出现问题时,告警信息无法由被管对象发送至管理端,由于故障关联性的存在,会导致系统定位不准确[2]。继承了SNMP协议智能化和ICMP协议通用性、可靠性的优点。通过构造一种事件触发与轮询相结合的模型,可以有效地克服传统方法的缺点,提高准确度和监测的可靠性,增加实时性并减少对系统资源的占用,这就是基于ICMP和SNMP协议的综合监测方法[2]。
Ping命令充分利用了ICMP协议的特点,如网络监测和查询功能,同时其参数易掌握,结果简单明确,还有多种搭配方式和返回信息值得我们进一步探究,而ICMP作为网络层的—个基本协议,如何将其功能有效地运用到更多的场合和工具中去,值得我们进一步挖掘和研究[3]。
1 解决方案
无论是针对网络故障检测还是质量保障,对Ping命令的多种搭配方式和返回信息可以进一步探究,提高准确度和监测的可靠性、增加实时性、减少对系统资源的占用、使网络及设备的维护得到保障,是今后的研究方向。同时,对网络进行轮询的操作是很有必要的,通过优化轮询算法的速度也是解决网络故障和保证质量的途径。
ICMP的使用会占用的网络资源、造成网络拥塞、网络的瘫痪、导致实时性差等问题,所以提高ICMP的使用效率如精确计算对网络Ping的次数、提高算法效率等是很有必要的。此外ICMP的使用不仅仅只与网络以及算法等问题有关,还涉及到网络维护问题,如基于ICMP的短信报警平台在设备出现故障时能够第一时间向故障维护人员提供短信报警,故障维护知识库平台能够为故障处理提供先验性知识保障,设备位置导航能够最快引导故障维护人员找到故障位置,设备故障情况的可视化可以为故障维护人员对设备的健康状况进行预处理(如提前筹备备份设备、提前维护)提供依据等,这些都可以提高网络服务的质量。
本文提出校园网络故障解决一体化解决方法,如下图1所示。
图1 校园网络故障解决一体化平台
1.1 基础信息模块
基础设施不齐全、设备老化、资金短缺、环境复杂(如强电对弱电影响很大、网络节点很多)、庞大的校园网络环境影响改造。如果不做好每一台交换机摸底工作,就会产生硬件备份不足、运行资金没有凭据、业务交叉频发、整合困难等问题。
交换机的设备地址、设备用途、管理IP地址、上级互联IP地址需要进行登记管理,其中设备地址是指所在楼层、具体楼宇等,设备用途即包括接入、汇聚、核心等,上级互联IP地址把所有IP地址管理成树状,这些IP是管理交换机登录的首要条件。
交换机出故障的时候,无法取得联系。在网络故障排查时,首先得定位交换机的具体位置,在复杂的楼宇里面,找到交换机具体位置也成为管理交换机的一部分,此时可以引入交换机的地理坐标进行管理。
1.2 配置文件管理
交换机配置文件需要以文档的形式上传保存于系统,以防由于交换机损坏无法备份导出配置清单。一旦交换机坏了,但是配置信息没有备份,就需要重新对交换机信息进行配置,影响了工作效率。
1.3 交换机故障解决知识库
知识库记录交换机故障情况、维护信息,为今后解决同一台交换机、其他交换机知识库提供保障,很好地规避了现实中只知道某一栋楼宇某一台交换机出问题,而没有对出现的问题进行处理跟踪、解决记录的情况。只能凭借记忆去解决问题往往会出现解决工具准备不齐全的问题。
1.4 设备故障情况可视化
量化设备故障情况,以可视化方式呈现,让ICMP工作范围缩小到这些经常出问题的设备上面。如设备的故障情况与断电的定量以及可视化能够为设备环境的改造提供依据。故障情况与解决办法的可视化能够为新的故障解决提供直观思路。
从可视化的情况可以知道哪些设备即将出问题,可以预先备份好配置文件,发生状况及时通过备份进行还原救灾。
1.5 故障检测监控模块
引入多叉树的数据结构形式进行存储,引入广度优先遍历算法等配合ICMP的使用,判断父节点的设备工作情况来监控整个网络的运行状况。在庞大的树形网络中,按照父节点工作则子节点工作的必要不充分条件,逐一进行监控。并在最优的监控算法[4]次数的指导下,提供设备故障位置信息。
1.6 导航模块
随着移动技术的发展,移动设备的导航也随之流行。楼宇的复杂性导致交换机所在位置往往会难以寻找,所以引入设备的位置导航,根据故障检测监控模块提供的设备位置信息,引导维护人员进入故障现场。
设备故障短信来自于网络监测平台,并将数据进行存储,如果后台检测到设备维护人员的移动客户端处于在线状态,后台轮询故障情况,则可以推送设备维护情况以及知识库给客户端,并附上导航链接,以供导航设备使用。
1.7 一体化平台物理架构
ICMP监控平台检测到网络设备不工作,则借助电信网关给维护人员发送故障信息,同时将故障信息存储到网络设备基础信息平台。平台检测移动客户端是否在线,并发送网络设备的导航信息到移动设备,维护人员便可以方便找到故障设备。解决好故障后将解决方案在网络设备基础平台反馈。物理架构如下图3。