华为与思科设备互联出故障
2017-11-22
引言: 单位网络互联时,由于远端站点路由器故障,对网络拓扑结果暂时进行了调整。但在网络调试中出现了意想不到的故障。本文介绍故障的排查过程。
单位网络互联时,由于远端站点路由器故障,为了代通远端站点的网络,对网络拓扑暂时进行了调整,但在网络调试时出现了意想不到的故障。
网络结构
单位原网络拓扑如图1所示,远端站的业务通过Cisco 2960接 入,经Cisco 7204的百兆网口路由,再由Cisco 7204的POS口经华为光传输与中心站Cisco 12012联通,Cisco 4503作为核心交换机,接入中心站的业务,经Cisco 12012与外站点互联互通。
图1 原网络拓扑结构
某天,远端站网管人员打电话反映网络不通,业务中断。笔者通过网管登录到 Cisco 7204,发 现 Cisco 7204下联的百兆网卡宕掉了。询问远端站网管人员,反映百兆网卡的指示灯不正常,经远端站网管人员热插拔、重新开机及在网管软件启动,百兆网卡仍不能正常工作,笔者初步判断百兆网卡故障,若要保证远端站的网络畅通,需重新规划到远端站的网络。
与光传输管理人员沟通后,初步规划在光传输设备上配置中心站至远端站的FE口,将远端站的Cisco 2960直连至中心站Cisco 4503,在 Cisco 4503启用远端站原在Cisco 7204上的VLAN及网络配置,Cisco 2960、Cisco 4503与光传输互联的端口为Trunk模式。
故障现象
一切工作就绪后,笔者认为网络互联没有问题,远端站的业务会恢复正常。但出乎笔者意料的是,远端站网管人员反映业务还是中断。于是登录到远端站的Cisco 2960,确认配置没有问题,同时从Cisco 2960能Ping通在Cisco 4503启用的VLAN地址,于是信心满满地认为问题肯定出在远端站的接入上,并让远端站网管人员换了一根网线,但故障依旧。在向远端站网管人员了解其用的终端有三块网卡并没有配置静态路由时,果断地让其禁用两块网卡后,故障依旧。笔者在Cisco 2960重新为远端站的终端配置了VLAN接口,将终端调整此接口后,故障依旧。
问题会出现在哪里呢?无论是核心交换机还是接入交换机的配置都没有问题,远端站的Cisco 2960到中心业务都是正常的,业务怎么就不通呢?
故障解决
再次确认网络配置没有问题后,笔者把思考的点放到了光传输设备上,因为虽然到远端站的接入交换机通了,但链路上只有交换机与光传输设备,问题是否会出现在光传输设备上呢?光传输管理人员解释说,华为光传输设备以太网板内部端口和外部端口都分为Access、Tag aware和Hybird三种模式,这次链路配置的为Access模式。听到这,笔者的眼前一亮,问题可能就在这,建议光传输管理人员将链路的端口配置为Hybird模式,远端站的业务正常了。
故障分析
华为交换机以太网端口有三种链路类型:Access、Hybrid 和 Trunk:Access类型的端口只能属于1个VLAN,一般用于连接计算机的端口;Trunk类型的端口可以允许多个VLAN通过,可以接收和发送多个VLAN的报文,一般用于交换机之间连接的端口;Hybrid类型的端口可以允许多个VLAN通过,可以接收和发送多个VLAN的报文,可以用于交换机之间连接,也可以用于连接用户的计算机。
Hybrid端口和Trunk端口在接收数据时,处理方法是一样的,唯一不同之处在于发送数据时:Hybrid端口可以允许多个VLAN的报文发送时不打标签,而Trunk端口只允许缺省VLAN的报文发送时不打标签。对于华为交换机缺省VLAN被称为“Pvid Vlan”, 对于思科交换机缺省VLAN被 称 为“Native Vlan”。
而华为光传输设备以太网板内部端口和外部端口都分为 Access、Tag aware和Hybird三种模式,在配置业务时这三种模式配置的原则是收到的数据包一定有VLAN Tag,设置Tag Aware,收到的数据包一定没有VLAN Tag,设置Access,收到的数据包不确定有没有VLAN Tag,设置Hybrid。因为远端站的业务肯定是VLAN Tag的,因此华为以太网板最好配置为Tag Aware。
通过此次网络调整出现故障的解决过程,笔者深有体会:网络故障可能出在任何一个环节,到某个点通了并不代表到下个点会通,到某个点通了常常会让人迷惑下个点为什么不通,作为网管员必须全盘考虑,透过现象看本质才能解决实际中的一个个难题。