光纤收发器故障排除经验谈
2019-12-23陆军步兵学院石家庄校区薄鹏徐长战
■ 陆军步兵学院(石家庄校区) 薄鹏 徐长战
编者按: 笔者单位所在的校园网出现断网,经排查是光纤收发器故障导致的,在此,通过该事件笔者对如何精准定位光纤收发器故障做出一些总结。
笔者所在单位为一所大型园区校园网络,各办公楼、教学楼、实验楼及场、区、库、所终端的信息点通过接入层的交换设备连接到汇聚层的交换机,再由汇聚层交换机连接到网络中心的核心交换机,在这网络三层结构中,使用最多的除了网络交换机外就要数光纤收发器了。
某天早上刚上班接到电话说上不了校园网,通过电话指导用户排除了本机配置和网线连接问题后在网管平台中确认了接入的交换机一切正常,怀疑是连接库房的光纤收发器出现问题。笔者前往故障现场,找到上不去网的用户电脑,对端到端的网络线路进行重新排查,基本排除线路物理中断造成的网络不通,根据用户反映昨天还能正常上网,今天突然上不去,并且也没有对网络线路进行过改动。
根据多年网管经验,目光就落在了放在接入交换上的那台光纤收发器,这台收发器已使用了五年之久,在除去外观上的一层尘土后,首先将光纤收发器断电,之后对连接光纤的TX(发射口)与RX(接收口)进行重新插拔,这时要注意小心操作以防将光纤弄断。
之后对UTP网线口进行重新插拔,连接电源,收发器重启,如果是普通的长时间工作的死机故障或由于尘土导致的接触不良,这时就应该可以解决了。但还是上不去网。一般光纤收发器都是成对使用,在笔者来之前已经将机房中对应的那台收发器进行过一系列故障排除工作,确定了没有问题。
通过仔细观察光纤收发器的六个指示灯,若光纤收发器正常工作,PWR电源指示灯必须常亮,FX-LINK/ACT光纤链路指示灯、TX-LINK/ACT网络链路指示灯需常亮或闪烁。又观察了几分钟后,发现LINK/ACT左边代表光纤和网线数据传输状态的指示灯一直常亮,全然没有数据交互的闪烁状态,且光纤收发器整体散热比正常时略热。在这样的情况下,只能换掉这台光纤收发器。在更换后,六个指示灯全亮,并出现闪烁状态,又可以正常连网了,故障排除。
这次遇到的属于光纤收发器的“硬故障”,笔者曾排除过关于光纤收发器的诸多问题,如何精准定位故障所在,给大家作一个经验总结。
一、网络完全不通的情况
1.检查PWD电源指示灯是否常亮,常亮说明供电正常,进行下一步排除。
2.一般最常见的问题是光纤收发器中LINK/ACT左边分别代表FX-LINK/ACT光纤链路、TX-LINK/ACT网络链路的两个指示灯有不亮的,那么网络肯定是不通畅的,需检查链路是否连线正常,我们可以一点点排除,如果代表光纤链路的LINK/ACT不亮,可以将光纤接口TX(发射端)、RX(接收端)重新插拔,检查光纤连接器是否完好插入设备接口,看能否解决。
如果还不亮,将TX和RX上连接的光纤接口调换一下位置再重新插上。如果是网络链路TX-LINK/ACT灯不亮,这时重新插拔后没有解决的话,用网线检测仪测一下网线的通断。
完成上述操作后故障还没有解决的话,可以考虑光纤或网线可能存在物理断路(也有部分光纤收发器只有在光纤链路接通后双绞线指示灯才会亮)。光纤收发器都是成对使用的,排除故障时记得要两个收发器都按照排除故障流程走一遍。
3.检查设备传输长度是否与距离匹配,如果链路过长光损耗过大(建议用用光功率计仪表检测光衰),超过设备接收范围,也会造成链路指示灯不亮。
4.检查设备传输速率是否匹配。如果完全不匹配,会造成网络不通。当有半双工的设备时,光纤的传输距离就有一定的限制。
二、网络时通时断的情况
1.光路衰减太大,没有超出范围,但是已经在接收敏捷度范围四周。这是网络丢包严重,打开网页会非常慢。建议查检收发器这间的通信链路。
2.收发器的端口与网络设备接口,或两端设备接口的双工模式不匹配。建议做成一致的工作模式来排除故障。
3.可把收发器两端接笔记本电脑(不要通过交换机或其他网络设备),两端ping没问题后,从一端向另一端传送一个较大文件,观察其速度,如速度很慢(100M以下的文件传送10分钟以上),可基本判断为收发器故障,使用此方法的前提是端对端的光纤链路没有问题。
4.光纤收发器自身的温度过高,或外界的温度过高。光纤模块受环境温度的影响较大,虽然其本身内置自动增益电路,但温度超出一定范围之后,光模块的发射光功率受到影响而下降,从而削弱光网路信号的质量而使丢包率上升,甚至使光链路断开。
5.如不同品牌的收发器相互的兼容性事前没做过测试则也会产生丢包、传输时间过长、忽快忽慢等现象。建设成对使用的收发器使用同一品牌相同型号。
三、光纤收发器重启后一切正常,使用一段时间后出现网络不通故障
此现象一般由交换机引起,交换机会对所有接收到的数据进行CRC错误检测和长度校验,检查出有错误的包将丢弃,正确的包将转发出去。但这个过程中有些有错误的包在CRC错误检测和长度检验中都检测不出来,这样的包在转发过程中将不会被发送出去,也不会被丢弃,它们将会堆积在动态缓存(buffer)中,等到buffer堆积满就会造成死机。通常重启之后就可以使通信恢复正常。建议检查交换机中大量CRC校验错误的产生原因。
以上就是笔者在网管中关于光纤收发器出现问题的一些经验总结,希望大家遇到类似问题时能够精准定位故障所在,节省排除故障时间,少走弯路。