排除OLT故障一例
2015-12-03■
■
故障现象
近日,接到网管监测人员的通知,位于某乡镇的OLT设备脱离网管。同时客户服务中心也陆续接到了该辖区用户的报修。
故障分析
得知这一故障后我们立刻展开排查,首先对该OLT的管理地址进行了Ping测试,结果不通。接下来查看OLT上联BRAS的端口状态,发现端口是Down的。联系该OLT所属的维护人员,让其使用光功率计测量了下该线路的光功率,得到的值是-18db,但是我们机房BRAS侧是测量不到光功率的,这时维护人员也告诉我们,该设备上联BRAS的端口以及PON口指示灯都处于灭的状态。于是进一步使用光时域反射仪测量了整个链路的光路情况,均没有发现异常,这样就可以初步断定OLT设备出现了故障,于是指导维护人员重启OLT设备,但均没有奏效。
故障解决
到达现场后,简单查看了一下设备的工作状态,发现设备的上联口以及PON口指示灯处于灭的状态,而且设备也不能在现场正常登录,由此断定该设备需要更换。更换完设备后,由于事情发生得突然,手头没有准备该设备的配置线,就在我们一筹莫展的时候,在配置端口的左侧看到了MGMT口,该端口是一个带外管理端口即本地管理端口,在设备出厂前,该接口已经设置了一个默认IP地址172.18.3.207。
立即使用网线登录到设备上,因为这是一个新设备,没有配置文件,接下来就是配置OLT,打通设备的网关。具体配置如下:
配置完OLT设备的管理IP地址后,测试从OLT的设备上Ping BRAS设备是成功的,这样就完成了新OLT设备管理地址的配置。接下来要恢复用户的互联网业务,即配置PON口和业务VLAN,具体配置即:
通过上面的命令,完成OLT设备业务和PON口的配置,最后需要配置用户接入层设备ONU,具体配置命令如下:
按照上面的配置方法,逐一对ONU进行了配置,在机房内使用ONU测试了一下网络是可以正常拨号上网,这样我们就完成了OLT设备的更换工作。
经验总结
从接到网络监测人员关于OLT脱离管理的通知,到对设备端口的进行查看以及使用Ping命令的测试,并初步断定现场OLT出现故障,最后到现场对设备进行了更换。在更换设备后,经过对设备管理地址、PON口以及ONU的配置,最终网络得以恢复。
通过这次故障的排除,作为网络管理员除了熟悉设备的配置外,还要熟悉设备的硬件配置,在设备无法通过配置线登录时,可以通过带外管理口进行登录,从而提高了设备的配置效率。
其实,这次故障的出现是偶然的,后期为了避免或者降低设备的故障率,我们将制定定期对设备进行巡检的工作机制,同时按照设备的重要程度以及区域划分情况准备备机,从而在设备出现故障后能第一时间进行更换,特别是对于覆盖互联网用户数量比较多的设备,将逐步做到冷备份,以期达到设备出现故障后,只需更换事先配置好的设备即可,这在可以缩短网络故障排除的时间,从而为提高互联网用户的上网体验打下坚实的基础。