高校校园网汇聚层故障分析及处理
2019-01-30庞镭
文/庞镭
1 引言
随着高校信息化建设的不断推进,信息化基础设施的重要组成部分——校园网的拓扑结构不断丰富,设备数量逐年增加,校园网的稳定、高效运行给运维人员提出了更高的要求。
用户终端和接入层网络故障,易分析解决、影响范围小。但是,对于担负楼宇通信的汇聚层交换机来讲,一旦出现问题,故障点难分析、耗时久、影响范围大。因此,需要在工作中多分析积累以便快速解决问题。本文结合工作实践,详细探讨汇聚层网络出现的多个问题及解决思路和方法。
2 链路光衰过大
在采用三层组网模式的校园网物理链路中,汇聚层与核心层、接入层与汇聚层通常采用光纤连接方式。每条光纤链路需要满足苛刻且敏感的物理条件,否则,可能引发重大的网络问题。
光纤链路的光衰过大是引起链路中断的多发因素。检测链路光衰最直观有效的方法是利用光模块的DDM(数字诊断监控)功能。以思科多模模块为例,使用命令show interfaces transceiver,可得到以下结果:
Gi0/3端口Rx Power接收功率低值告警,需查看对端设备的光功率来锁定故障点。对于不具备DDM功能的光纤模块,即提示“This module doesn’t support DDM!”,则需要通过复杂的步骤来判断故障情况。
3 交换机环路引发的网络故障
交换机环路通常发生在网络节点密集的环境中,例如高校的各类计算机机房,接入的随意性较大,极易形成环路,导致用户无法正常获取IP地址,网速慢、丢包等问题。
3.1 部分vlan用户无法获得IP地址
为了便于管理,校园网楼宇每层楼用户分属不同vlan,例如1-6层用户分属vlan611—661。2-6层用户均可获得IP地址上网,vlan611的用户不能获取IP地址。分析及处理:在1楼接入交换机上,任意选择一个端口,将该端口配置到2楼用户vlan621中switchport access vlan621,可正常获取IP地址。将该端口逐个配置到vlan631、641、651、661,测试电脑均可正常获取IP地址,因此可定位问题存在于1楼接入交换机及vlan611,经排查发现一根网线两端同时接入交换机两个端口引发环路,导致用户vlan611无法获得IP地址。
3.2 交换机环路导致网速慢
一旦网络中存在环路,最直观的现象是上网速度慢,ping网关延迟高,丢包严重。登录交换机使用show interface status命令,发现有端口的状态是err-disable,交换机通常配置有环路检测功能,发现环路后会将端口置为disable,找到被关闭的端口,拔掉该端口连接的网线,环路即可消失。
4 用户无法获得IP地址
大规模校园网通常采用DHCP方式分配IP地址,DHCP可通过两种方式实现,一是配置专用的DHCP服务器,二是在楼宇汇聚交换机上通过ip dhcp pool建立地址池,由汇聚交换机分配IP地址。无论哪种方式,都需要在汇聚交换机上相应的vlan接口中,对IP DHCP helper的地址进行声明。
4.1 IP dhcp pool失效
在校园网无线AP数量不多的情况下,AP的IP地址通过在汇聚交换机上建立无线AP专用dhcp pool实现。在无线控制器、无线AP上联交换机、汇聚交换机工作状态正常的情况下,出现多个AP同时掉线的情况,通过将部分AP上联交换机端口划分到有线用户vlan的方式,AP可以正常获得IP地址,断定无线dhcp pool失效,在汇聚交换机上将无线dhcp pool删除,重新建立后故障现象消失。
4.2 IP secondary在汇聚交换机上使用
在校园网IP地址切换阶段,或者需要给某个vlan用户配置两个网段IP地址时,需要使用ip secondary命令。例如:
interface VLAN 410
no ip redirects
ip address 192.168.10.1 255.255.255.0
ip address 10.10.20.1 255.255.255.0 secondary
在思科交换机中,使用该命令时,可以达到两个网段IP地址同时使用的效果。但是,对于锐捷汇聚交换机5750,在进行以上操作时,出现vlan 410用户无法正常获得IP地址的现象。排查发现,在10.10.20.0/24网段内有部分IP地址作为固定地址绑定给打印机。
ip dhcp pool Printer
host 10.10.20.249 255.255.255.0
client-identif ier xxxx.xxxx.xxxx.49
在启用IP Secondary功能时,ip dhcp pool Printer优 先 于ip address 10.10.20.1 255.255.255.0 secondary,导致用户无法获得10.10.20.0段的IP地址。
5 结语
大规模校园网不间断运行,故障的发生不可避免,因此,需要运维人员在提高自身技术水平的同时,不断积累分析、处理故障的经验,才能更高效、及时地应对突发事件,保证校园网可靠性、稳定性,更好地实现服务教学、科研,方便应用的导向目标。