MTU不匹配闹断网
2018-03-03
故障现象
公司由于部门调整,准备增加一些新的业务网用户,因此对原有网络进行扩容。公司原网络中主要使用H3C路由器,本次扩容增加了一台Quidway路由器作为新部门的路由接入设备。Quidway路由器与H3C路由器互连,并运行OSPF路由协议。网络在试运行中发现,新增节点下的计算机无法与原网络中的计算机互通。
故障排查
登录到两台路由器上,均可Ping通自己和对端的网间网接口地址,双方连接正常。查看新增Quidway路由器的路由信息,显示没有学到OSPF路由条目;查看OSPF邻居状态,显示邻居状态机处于Exstart,OSPF协议处于中断状态;打开相应的debug开关查看报文信息,显示可以收到Hello报文,只是Quidway路由器发送DD报文(Database Description Packet)后,一直没有收到H3C路由器回应的DD报文。登录H3C路由器,打开相应的debug开关查看报文信息,发现本端DD报文已发送,而且也收到Quidway路由器发送过来的DD报文,并发送了相应的DD报文回应。
通过以上现象初步判定,两台路由器在DD报文互通上出现了问题。H3C路由器已经发出了DD报文,但Quidway路由器却没有收到。既然可以接收到HELLO报文,说明链路是通畅的,而且组播报文的收发也没有问题。分析有可能是H3C发送的DD报文有错误或者两者在DD报文收发配置上 有问题。从Quidway路由器显示的相应信息来看,并没有报告接收到错误的DD报文。查看H3C路由器显示的相应信息,发现这个DD报文大小为1850字节,而Quidway路由器默认MTU大小为1500字节,超出了Quidway路由器的默认设置。可见,故障是双方的MTU设置不一致,导致大包无法通过引起的。
故障解决
查看H3C路由器配置,发现MTU的设置为3000字节。经询问配置人员,当时将MTU的值设置大一些,在接口下开启接口发送DD报文时填写MTU值的选项,是为了减少IP封包的拆解次数,减少封包与封包传送之间的等待时间,从而优化网络性能。在配置与Quidway路由器连接的H3C路由器接口信息时,只是把其他接口信息复制过来,进行简单更改,没有注意MTU参数的设置。修改H3C路由器的MTU值为1500字节,网络通联正常。
经验总结
通过对本次网络问题进行分析和总结认识到,在查找路由器故障原因时,要充分利用好调试信息,从而快速定位故障点。在进行网络设备配置过程中,一定要认真细致,不能有半点马虎大意,不然就会因为一两个参数设置不合理造成全网故障。