操作不当致路由配置丢失
2017-03-09
单位因临时任务需要对外进行网络连接,通信信道使用的是2M专线,本端连接的网络设备是正在使用中的一台华为路由器。连接完成后,根据要求对连接端口的IP地址、路由协议等相关信息进行了管理配置。配置完成后,对各方向的网络情况进行检测,发现至各方向的网络均通畅。
故障现象
运行一周左右,接到通知,需对网络拓扑进行部分调整。负责网络调整的同事,根据要求对连接的端口进行了调整,调整完成后,对部分端口的网络参数进行了修改。修改完成后,对新调整的端口的外接网络进行了测试,新增目标网络均畅通。但约一小时后,有同事说至某个单位的文电无法送达,文电收发状态不正常,对端没有及时回执。
故障排除
根据故障现象,笔者进行了故障排除。
一是对文电无法正常送达的目标文电地址进行检查。目标文电地址无法正常到达,最可能的原因是目标文电地址无法正常解析或解析错误,还可能就是在人工手动输入目标文电地址时输入错误导致。后经检查发现,该目标文电地址可以正常解析,因该目标文电地址由上级提供,既然可以解析,又不是手动输入,那就不存在目标文电地址无法解析或解析错误的现象。
二是检查本端文电服务。故障出现,还有可能是因本端文电服务出错,重启了本端文电服务器文电服务,然后又重新给正常可以接收文电的单位和无法接收文电的单位发送了测试文电,发现还是出现了类似的故障,可以正常接收到本端文电的单位依旧可以正常接收,无法接收本端文电的单位依旧无法正常接收。由此笔者推断,可能是无法接收本端文电的单位的文电服务出现了故障,或至该单位的网络出现了中断。
三是对文电无法正常送达的目标文电服务进行了检测。笔者打电话给友邻单位,让其对文电无法正常送达的目标文电地址进行文电测试,友邻单位反馈该目标文电可以正常接收其文电。由此笔者判断,该单位的文电服务正常,很可能是本端至文电无法正常送达的目标网络出现了中断。
四是对文电无法正常送达的目标网络进行了检查。笔者在找到该单位的相关IP地址信息后,使用Ping命令进行了测试,发现至该单位的网络不通。友邻单位至该单位的网络正常,且前期本端至该单位的网络是正常的,而本级并未调整至该单位的网络参数,出现网络故障的原因很可能是通信线路出现了故障,或该单位对其网络参数进行了调整。
因为本端至该单位的通信线路为直连线路,中间有很多节点,完全有可能是中间节点出现了故障。从路由器连接的基带Modem查看其信号,发现其信号灯指示正常。那么可能是中间节点对本端进行了环路或该单位对至本端的路由器参数进行了修改。
笔者打电话至该单位,该单位反馈说其也发现至本端的文电无法正常收发,并未对路由器的相关参数进行修改。不得已,笔者对该单位的网络链路进行了回环,该单位反馈说在路由器上可以正常收环,物理链路没有故障。
唯一的可能是本端光端机至路由器的物理连接线出现了故障,遂对光端机至基带 Modem、基带 Modem至路由器的物理连接线进行了检测。经检测,发现各连接线均正常,没有出现断路和短路现象,遂又对路由器的连接串口进行了检查,发现串口也没有出现变形、短路等现象。让该单位对本端的物理链路进行环路,登录路由器进行观察,发现本端可以收环,也就进一步说明各网络硬件和通信链路都没有出现故障。
五是检查了路由器的相关配置参数。登录路由器,使用Ping命Ping该单位的网间网IP地址,发现可以Ping通。也就进一步说明,各网络硬件和通信链路确实没有出现物理故障。但是Ping该单位的网关却无法Ping通,很可能至该单位的路由出现了故障。
使用display currentconfiguration命令查看当前配置,发现至该单位的路由配置竟然消失了,但前期网络确实是畅通的,配置肯定存在且正常。有可能是配置信息丢失或给同事手动删除了该路由信息。笔者增加了至该单位的路由后,网络恢复正常。
故障原因
笔者询问了负责网络拓扑调整的同事,该同事表示,其并未删除至该单位的路由条目,只是在调整了链路和路由器的接口后,启动路由器并增加了相关参数后,保存后就重启了。
配置丢失一般有多种原因,其中最常见的原因是硬件故障和瞬间断电。而根据同事提供的信息,应该不是这两个方面的原因。后又根据同事的详细描述,笔者查阅了相关资料并电话咨询华为公司的技术人员,才得知可能是因为同事操作不当造成的。后又取了一台华为路由器进行测试,发现按照同事的操作方法确实会出现配置信息丢失的现象。
原来,当路由器的业务插板过多和配置信息过多时,在启动路由器后,如果所有的业务板还没有正常运行,其配置管理界面却有可能会生效,但此时,其原有路由器Flash中的配置文件尚未完全恢复至路由器内存中,此时,如果进行管理配置,并运行了保存命令,那么内存中不完整的配置信息就会覆盖配置文件中的配置信息,造成部分配置信息丢失。
经验总结
在路由器中,有两个配置文件,一个是Flash中的配置信息,一个是内存中的配置信息,可以通过命令display savedconfiguration查看配置文件中的配置信息,通过命 令display currentconfiguration查看内存中的配置信息。
在配置管理时,使用的是内存中的配置信息,会即时生效,当使用了保存命令后,内存中的配置信息会自动加载至Flash中的配置文件,当路由器重启后,路由器会将Flash中的配置文件恢复至内存中,以使路由器正常工作。如果内存的配置信息在配置管理后,未使用保存命令就重启,那么配置管理信息就不会加载至Flash中的配置文件中,也不会生效。
正常来说,在系统所有单板正常运行后,配置文件和内存中的配置信息应该是一致的,当增加、修改、删除配置后,配置文件中的配置信息和内存中的配置信息不一致,此时可以通过命令save来保存当前内存中的配置信息到配置文件。
在系统启动阶段,如果所有业务板还没有正常运行,即配置文件还未完全恢复到内存中,此时执行命令save保存,内存中不完整的配置信息将会将原有的配置信息覆盖掉,造成配置信息丢失,从而引发故障。