APP下载

OPTIX传输设备误码问题的分析与处理

2018-09-30崔颖马增耀

商情 2018年40期

崔颖 马增耀

【摘要】误码问题是传输设备维护中经常遇到的问题。误码的出现会给传输设备造成很大的安全隐患,如何及时准确的判断引起误码的故障点及故障原因是我们今天所要探讨的问题。现就在文安环网上出现的几个典型误码问题案例进行分析。

【关键词】误码 交叉板 VC4温度

误码问题是传输设备维护中经常遇到的问题。虽然有时候小误码问题不会对传送的业务造成影响,但出现误码时,说明传输系统中局部已经出现性能劣化,需要尽快处理,否则可能发展成为业务中断的重大事故。尤其是当误码块数量达到一定数量时,必定会影响到业务质量,这就需要引起特别关注。在实际维护过程中,误码性能表现的形式多种多样,在实际处理误码性能问题时,我们通常需要采用告警、性能事件分析法加之丰富的障碍处理经验,关注误码发生的时间、频度、误块数量等从而快速处理一些较难判断的误码问题。

我们通常将误码产生的原因归结为光纤损耗;光纤接头不清洁;设备接地不好;设备附近有强干扰源;设备温度高;光功率过载;线路板、交叉板、时钟板等设备故障引起。

现就我们日常维护中遇到的一些典型误码原因引起的障碍进行分析:

一、交叉板故障导致部分通道误码

首先,这是我们在日常维护中,华为optixl55/622SDH设备组成单向通道保护环出现误码导致业务中断的一个典型案例。组网图如下:

某日,文安622M南环小务、石桥、大齐观出现BIP误码过量告警,其上部分2M电路出现T-ALOS告警,集中站点文安站的部分PDl单板上个别通道出现远端误码秒、远端背景块误码等性能事件。以上告警均时断时续,频繁出现,且各点2M业务中断每次不是同时出现,给告警原因的判断造成困难。业务走向为文安一孙章一卢各庄一澎耳湾一小务一石桥逆时针方向,大齐观为澎耳湾站点下挂无保护链。各站点均为到文安的集中型业务。

处理此故障时,我们只能尝试关断某一方向的激光器,强行中断业务,使业务倒换到备用通道,观察业务是否能迅速恢复。我们选择关闭澎耳湾到小务的激光器,此时发现小务和石桥的2M业务恢复,但大齐观的2M电路业务未恢复,由此可判断故障点应在文安到澎耳湾之间,重新选择关闭卢各庄到澎耳湾的的激光器,交换网管监控到以上故障电路业务全部恢复。此时收集故障信息,通过历史告警查询到中断的2M业务均在第2个VC4中,查询全环业务,除故障站点中断的2M业务外,环上其他业务均未开在第2个VC4中,由此可判断是文安到澎耳湾之间的某一站点的光线路板或交叉板故障。在孙章、卢各庄、澎耳湾站点使用第2个VC4各做一条2M业务。发现孙章、卢各庄2M无告警,澎耳湾2M告警未消除。此时,故障已经可以定位到盧各庄和澎耳湾的光线路板和交叉板。更换卢各庄的主用交叉板,故障恢复。由此判断该次故障原因为卢各庄主用交叉板穿通有问题。

在此案例的故障处理过程中,有以下几点需要引起我们的注意:

1、当类似误码类故障出现时,若不能及时迅速找出故障点,我们可以采取关断某站点激光器的方法,使业务迅速恢复,缩短障碍历时,这样可以有充分的时间整理思路,判断故障点。

2、此故障在去年夏季也曾出现过,因为是瞬断,且各站点2M业务中断每次不是同时出现,未能及时找出故障点,今年夏季再次出现,我们据此怀疑是否因为温度过高造成某传输设备单板出现问题,而不是某段传输段光路问题,这就加快了问题的判断。

3、其实为了进一步验证对故障原因的准确性,可将某一条故障通道的业务由第2个VC4改到其他VC4中,则说明第2个VC4通道故障。故障点可能是交叉板或光线路板。进一步可以使用环回法定位单板故障,在卢各庄站SL4光线路板环回,若故障未消失,说明故障点在交叉板。此时可复位交叉板或进行主备倒换,或直接更换交叉板,最终确定故障原因判断的准确性。

4、对误码的处理要各个击破,不要被太多的通道误码干扰,一定要找到有误码业务的共性(例如,经过某站的业务;终结于某站的业务;到某块支路板的业务;经某块光线路板穿通的业务等),进行经验判断,进而从中跟踪一个2M,通过环回法,来逐步确定故障的范围;确定为某站时,再使用单板替换法来定位并解决故障。

二、另外色散过大也是导致光路误码的一个原因

比如说在一次障碍处理中出现过这样的现象:接收光功率值满足要求,但误码偏大。经查找发现,相邻故障站的物理距离在80公里左右,因激光器的色散受限距离不能满足要求,导致信号在长距离传输过程中出现较大的色散,色散值已经超出可辨别的范围,从而导致了大误码。

在排除误码故障时,首先需要有网络长期运行的性能数据,从中分析误码的特点:是持续的小误码、突发的大误码、还是零星小误码。对于每15分钟性能都有误码的情况,可以马上通过自环线路板,或更换单板来定位问题所在;对于突发或零星误码,较难定位,但大多为外界干扰有关,检查地线及设备运行环境等。线路误码一般与光线路板及光缆有关,也可能与时钟板和交叉板有关;支路误码一般与支路板及交叉板有关,但不排除例外情况。为确定误码是由光线路板产生的,还是由光缆段产生的,大致可采用以下两种方法粗略定位:

1、将有误码的相邻两站的光线路板进行东西向对换,观察误码是否是跟着光线路板走,还是固定在某个方向。

2、将一段光路的收、发两个方向的光缆芯纤进行对换,观察误码跟着光板走,还是跟着芯纤走,也可以大概定位误码产生的原因。

三、温度过高也是误码频发的主要原因

例如,我们在维护中发现某一站点的一块PDl板有告警,到现场准备更换该单板,发现该单板温度很高,检查发现子架风扇的防尘网严重堵塞。本次故障的原因是由于该机房环境较差,而且维护人员对风扇的清洗不及时,导致子架温度过高,使支路板性能劣化从而产生误码。对于温度问题我们一定要引起重视,日常维护中要经常清洗风扇,并定期从网管上查看设备环境温度,从而及时采取降温措施,避免给设备安全造成隐患。