浅谈波分系统日常维护及故障处理
2013-10-10聂荣盛中国电信龙岩分公司龙岩364000
聂荣盛 中国电信龙岩分公司 龙岩 364000
0、波分系统的原理介绍及其优点
0.1、波分系统的原理
波分复用(WDM)是将两种或多种不同波长的光载波信号在发送端经复用器汇合在一起,并耦合到光线路的同一根光纤中进行传输的技术;在接收端,经解复用器将各种波长的光载波分离,然后由光接收机作进一步处理以恢复原信号。这种在同一根光纤中同时传输两个或众多不同波长光信号的技术,称为波分复用。
0.2、波分复用技术的优点
各种复用技术的应用都是为了扩大传输容量、提高传输效率和降低成本。WDM技术之所以得到迅猛发展是因为它具有下述优点:
0.2.1、传输容量超大,可节约宝贵的光纤资源。
0.2.2、对各类业务信号“透明”,可以传输不同类型的信号,并能对其进行合成和分解。
0.2.3、网络扩容时不需要敷设更多的光纤,也不需要使用高速的网络部件,只需要换端机和增加一个附加光波长就可以新增业务或扩容。
0.2.4、在网络节点使用光分插复用器(OADM)或者使用光交叉连接设备(OXC),可以组成具有高度灵活性、高可靠性、高生存性的全光网络。
0.2.5、可以进行有效的网络管理,与现有的网管标准兼容,可以实现SDH及DWDM网管的统一,系统升级容易。
1、波分系统组成及日常维护
要做好WDM网络的维护工作就必须熟悉波分网络的基础知识。波分网络中设备包含的主要单板有:波长转换单元(OTU)、光放大(OA)单元、光复用/解复用单元(OMU/ODU)、光监控(OMON)单元、主控单元及其他辅助处理单元。下面针对每种单板的维护要点进行详细描述。
1.1、波长转换单元(OTU)的维护
维护人员需要每天从网管系统收集各OTU的历史性能数据、当前性能数据及告警信息。OTU的性能数据主要包括:接收光功率、发送光功率和B1误码数量。一般情况下,如果发送光功率出现问题,可以尝试更换单板来解决;接收光功率异常则需要在整个再生段内查找原因;若是误码问题,则首先需要判断误码是由波分侧故障引起的,还是由客户侧故障引起的,如果由波分侧故障引起,则需要在整个再生段内进行排查。
1.2、光放大(OA)单元的维护
实际中OA单元用得最多的是掺铒光纤放大器(EDFA),具体包含3种类型:功率放大器(BA)、预放大器(PA)和线路放大器(LA)。OA单元的性能数据主要包括:输入光功率、输出光功率和偏置电流。一般情况下,如果输入光功率发生变化,可以从以下几方面定位故障:(1)是否发生掉波,如果是,则需要排查掉波的原因,如发端OTU故障等;(2)检查上游放大单元输出功率是否发生变化,依次前推,找到最开始的功率发生变化的站点,排查原因;(3)如果上游放大单元的输出光功率正常,则需要更多地关注线路的劣化。
1.3、光复用/解复用单元(OMU/ODU)的维护
OMU/ODU一般有3种:分波器、合波器和光分插复用器。在日常的维护工作中,可以通过网管定期查看分/合波器的历史性能、当前性能及告警。性能事件主要关系到分波器的输入光功率及合波器的输出光功率。若分波器的输入光功率发生了变化,首先应该查看其信号流上游放大器的功率是否发生变化,如果有变化,则可以根据放大器问题的处理思路来解决;如果无变化,则需要考虑放大器至分波器间直连尾纤的问题,如弯曲、挤压和接口不清洁等。若合波器输出光功率发生了变化,首先应该查看是否为单波输入光功率问题,如果是,则按照上述OTU故障处理思路来解决;如果各个OTU发光功率没有变化,则需要考虑OTU至合波器间的直连尾纤是否出了问题;如果尾纤及光接口、接头没有问题,再考虑单板自身插损问题。
1.4、光监控(OMON)单元的维护
光监控通路(OSC)在WDM系统中是一个特别重要且相对独立的子系统。当OSC出现问题或确有必要检查光接口实际余量时,可对其输入、输出光功率进行测试,以判断光功率是否工作在正常范围内。维护人员可以定期通过网管查看单板光功率、误码及告警情况。
1.5、光谱分析单元
WDM设备的光谱分析单元可为系统提供内置式在线光谱分析和监测功能。通过光谱分析单元可对WDM系统的OMU/ODU或OA单元输出的各波光信号的波长、功率、信噪比进行不中断业务的监控,并上报主控单元和网管,便于设备的例行维护。如果某路信号光功率明显降低,则要根据信号的流向,找出光功率下降的根本原因。
1.6、主控单元
主控单元是WDM波分网元的控制中心,承载大量的配置数据。当主控板发生故障时,一般情况下不会影响WDM网络的正常运行。但是,在日常维护中还需注意以下几点:(1)更换主控板之前需要上载数据到网管;(2)更换主控板时需要保证更换前后单板ID拨码一致;(3)更换主控板后需要重新下载配置数据,并同时备份数据库。
2、波分系统故障处理方法
在WDM的故障定位过程中,最简单、最常用的方法是:一分析、二测量、三替换。当故障发生时,首先要根据信号流向对产生的告警信息进行综合分析,初步判断故障区段;然后,通过各类测量仪表对实际参数进行检查;最后,更换故障设备或单板。故障定位的基本思路是:能够尽快、准确地将故障点定位到单站。故障定位有几种常用的方法:告警性能分析法、仪表测试法、替换法、环回法和经验法。在进行故障处理的过程中,要建立起分类的概念,即可大致将故障分为:光功率方面的问题、嵌入控制通道(ECC)问题、设备互连问题和误码问题。
2.1、几种常用的故障定位方法
2.1.1、告警性能分析法
网管能监视、管理整个网络中所有运行的传输设备,因此通过网管可以获知全面的故障情况,不仅有单站或单板的故障情况,也有全网的故障情况。网管在故障处理中有非常重要的作用。在分析告警时,应首先分析级别高的告警,如紧急告警、主要告警;然后再分析低级别的告警,如次要告警和一般告警。如果你所在的站点没有网管,你可以通过观察设备或单板的指示灯来获得告警信息。这也是一种获得告警信息的简单有效的方法。
2.1.2、仪表测试法
我们现有的测量仪表已经比较完备,常用的有:光功率计、光谱分析仪和综合分析仪等,通过这些仪表,我们首先可以测试接收光功率,如果正常,可进一步测试并分析频谱,最后,可用综合分析仪对误码特性进行测试。对于M40、D40、OAU、OBU等单板的“MON”口,均可以在线测试主信道光谱。如果受到影响的业务是主信道的所有业务,则可以重点分析OAU、OBU的光谱;如果受损的业务只是主信道中的一路业务时,重点分析M40和D40的光谱。通过使用仪表测试法分析定位故障,说服力比较强。缺点是对仪表有需求,同时,对维护人员的要求也比较高。
2.1.3、替换法
替换法就是用一个工作正常的物件去替换一个被怀疑工作不正常的物件,从而达到定位故障、排除故障的目的。这里的物件,可以是一段光纤、一块单板、一个法兰盘。替换法适用于排除传输外部设备的问题,如光纤、SDH设备、路由器、供电设备等;也可将设备上工作正常的同类型光板对调,检查是否故障转移。
2.1.4、环回法
当系统出现误码的时候,有时从告警和性能数据可能分析不出来,这时,可以像SDH中的故障处理方法一样,对业务信号逐段环回来进行故障定位。环回可以在收发的OTU单板上进行,也可以在收发光放之间加上衰耗器来进行;可以在本站环回,也可在对端站环回,但需要注意的是:采用这种环回法有可能会中断业务,所以环回前应该先在SDH上做强制倒换,对业务进行保护后再进行断纤环回。
2.1.5、经验处理法
在一些特殊的情况下,通过复位、插拔单板,单站掉电重启,重新下发配置等手段,可有效地及时排除故障,恢复业务。
2.1.6、下表给出了几种常用的故障定位法的适用范围及操作特点。
?
2.2、故障定位的过程
2.2.1、排除外部设备故障:光纤、接入SDH设备和电源供电等问题。
2.2.2、故障定位到单站:将故障定位到单站,最常用的方法就是“告警性能分析法”和“环回法”。环回法通过逐站进行外环回和内环回,定位出可能存在故障的站点或单板。告警性能分析法通过网管逐站进行告警性能分析,查看各站的光功率,与已经保存好的性能数据(正常情况下)比较,分析差异,定位出可能存在故障的尾纤或单板。综合使用这两种方法,基本都可以将故障定位到单站。
2.2.3、故障定位到单板并最终排除:故障定位到单站后,进一步定位故障位置最常用的方法就是替换法。通过替换法可定位出存在问题的单板和尾纤。
2.2.4、故障处理的各个过程及其常用的方法
?
3、波分系统常见故障
当网络发生故障时,如何尽快判断故障原因、故障性质和发生区段,是排除故障的关键。由于在实际的光传输网络中,SDH与WDM设备之间是相互关联的,对于WDM系统而言,SDH设备变成了它的边缘节点;而对于SDH系统而言,可以将WDM系统看成是多套SDH系统共用的智能化的光纤。二者通过传送的业务信号流紧密地结合在一起。当某一设备或线路发生故障时,往往会引起与之相关的多个设备同时上报告警。然而,目前光传输网络的管理通常是由各自独立的网元管理系统来完成的,即各个设备的告警信息相对独立。这使得光传输网络的故障诊断变得较为复杂,往往就只能依靠具有丰富经验的网络维护人员来完成。我们在日常维护中碰到的最常见的故障主要有光信号中断和误码两种。
3.1、发生光信号中断时,分析处理规则如下:
3.1.1、当OTU盘、OA单元收无光时,其发光器也会自动关闭(ALS功能);
3.1.2、单、双纤故障的情况都会存在,而且在光缆发生故障时,双纤同时中断的概率更大,单纤故障则更多发生在尾纤或连接器上;
3.1.3、无源器件对光信号的传输性能会有影响,但只影响某一波的概率是很低的。
3.2、发生光信号误码时,分析处理规则如下:
3.2.1、误码告警以每一个光通道为基本单位;
3.2.2、 OTU盘本身具有再生段误码检测的功能;
3.2.3、设备能够检测出误码,说明此时光路未中断;
3.2.4、双向通道同时劣化的概率不大,基本上只考虑单向误码的情况;
3.2.5、在WDM系统中,如果发端OTU检测到B1误码,则收端OTU肯定也会检测到误码,当二者检测出的误码数量相同时,说明在收发OTU之间的光路上再没有产生新的误码;
3.2.6、当所有共用WDM的SDH都产生了B1误码时,可认为故障发生在公用部分,如光复用、解复用或光线路。
4、总结与建议
波分设备,目前来说,维护手段还是很有限的,本文结合WDM系统各单元,介绍了设备维护的一些要点,以及对WDM系统进行故障定位的一些常用方法,实际上就是对经验丰富的网络维护专家的经验和知识进行了提炼和总结,以帮助维护人员理论结合实际,做好日常维护工作,提高自己的波分维护技术水平。综合WDM、SDH系统的网管系统所提供的告警,自动分析出WDM网故障的原因和位置,从而全面、快速、准确地监视全网的运行状况。
[1]武文彦,《光波分复用系统与维护》,电子工业出版社,2010-04-01
[2]卜爱琴,《光纤通信》,北京师范大学出版社,2009年8月
[3]袁国良,《光纤通信原理》,清华大学出版社,2004-07-01
[4]Optix BWS 1600G产品手册
[5]Optix BWS 320G故障处理手册