缘何设备不能网管
2015-12-03■
■
故障现象
近日,某同事反映有一台交换机的管理地址不能正常使用。为了更好地解决问题,我们首先将设备的网络拓扑结构进行梳理,具体的网络拓扑结构如图1所示。
通过图1我们可以看到,该交换机位于网络的接入层,上联汇聚交换机和BRAS设备,然后在BRAS设备上定义了办公上网用户,其中办公上网用户采用的是PPPoE拨号的方式,那么拨号上网用户是怎样管理设备的呢?在BRAS设备上我们使用了BGP协议,然后重分发了直连路由,从而实现在BRAS设备上两个不同网段路由的通讯。
图1 网络拓扑示意图
故障排查
根据故障现象,我们在办公上网的电脑上对该交换机进行了Ping测试,结果不通。随即我们对其他和交换机同一个网段的交换机进行了Ping测试,得到的结果是正常的,由此可以得出结论,办公上网的用户和设备管理IP地址的通讯是正常的,只有这一个地址不能正常访问。
在排查过程中,同事反映该地址原来使用的交换机出现过故障,这台交换机是新更换的。得知这一信息后,我们对交换机的配置进行了详细检查,没有发现异常。在汇聚交换机上设置了一个和该交换机同一网段的地址,两台交换机互Ping是没有问题的。将该交换机更换一个IP地址后,交换机就可以正常访问,但是原来的IP地址是不能正常使用的。
故障排查到这里,问题变得明朗起来,就单一的设备管理IP地址不能使用,而且是因为该IP地址设置的交换机出现故障更换后就不能正常访问。刚才我们排查到汇聚交换机,接下来继续顺藤摸瓜向上排查BRAS。登录到BRAS设备,查看了该IP地址所在地址池和地址,该交换机的网关设置在BRAS上,是以虚拟网关的形式存在的,然后在该地址池中我们定义了起始地址和静态地址,最后将某些地址应用到相应的端口上,问题排查到这里都没有发现问题,故障的处理陷入了僵局。
故障分析
静下心来仔细分析问题,通过我们排查,其他交换机上的管理IP地址是能正常使用的,自从该IP更换了交换机后就不能正常使用了,好像和设备的MAC地址没有老化有关系,我们随即查看该管理地址配置的IP-HOST,IP-HOST即静态用户接入方式。在现实生活中有大量用户的需求是地址能够固定不变,可以静态地配置地址,针对这类需求,推出IP-HOST接入功能。当用户想要使用固定IP且运营商希望能够进行管理的场合,IPHOST类型成为最佳选择。该类型的用户,只需配置固定的IP地址、网关、DNS等网卡信息,无需拨号,简单方便。针对IP-HOST用户,用户开机时主动发ARP,触发IP-HOST用户上线,通过认证后即可进行各类网络活动。用户下线后,该IP地址为之保留,待下次上线后继续使用。这样就形成了IP地址和MAC地址的对应关系,我们更换了交换机后,BRAS并不知道该IP地址在设备上的更换,而且更换的交换机主动向BRAS发送ARP报文,BRAS收到用户的ARP请求时,首先判断该用户已配置,并且比较ARP报文与已配置的IP-HOSTv4用户信息是否相同。如果相同,则属于合法用户,允许上线。但是交换机已经更换,当然设备的MAC地址也发生了变化,当然新更换交换机MAC地址和BRAS中的信息不符,所以该交换机的IP地址不能正常使用。
故障解决
那么我们怎样才能解决这个问题呢?我们上面讲到用户可以主动发送ARP报文,请求BRAS的回应。相反的BRAS也可以主动发送ARP报文,请求用户的响应,那么我们就设置如果BRAS向用户发送ARP报文,如果不回应,则视为该IP地址已经失效,将重新等待用户的响应,接下来我们就开始对IP-HOST进行配置,具体配置步骤如下:
上面我们通过在虚拟接口模式下将该接口下的静态用户的IP地址进行主动探测,如果3次探测即发送ARP报文都没有回应,BRAS则视为该地址已经失效将重新使用。配置完我们再一次对该IP地址进行了Ping测试,结果是可以Ping通的,这样我们就排除了该网络故障。
经验总结
从得到IP地址不能正常使用的报修到我们使用Ping命令按照网路架构对故障进行排查,一步一步地缩小故障范围,后来经过分析IP-HOST工作原理,最终把故障原因找到,并在设备上进行了配置,这次故障的排除经过对现象的分析,并结合工作原理将故障完地美解决了。
作为网络管理人员,不但要有丰富的网络理论知识,还要善于分析问题,从分析故障现象入手,从而一步一步地到达问题的核心,然后再结合理论知识和排错的经验来达到解决问题的目的,只有具备了分析问题的能力,才能更好地解决问题,处理好问题,为提高用户良好的上网体验打下基础。