干线传输网络故障判断及维护
2013-08-22卓可喜
卓可喜
【摘 要】随着传输网络的不断升级和发展,网络规模也不断扩大,这对传输网络维护水平也提出了新的要求。如何在发生故障时,在最短的时间内判断故障并及时进行维护处理是每位维护人员值得思考的问题。本文详细阐述了干线传输网络故障的判断与定位方法,并指出故障判断的盲点,最后给出了维护建议。
【关键词】传输网络;故障;判断;电路环回;维护
近年来,随着传输网络的不断升级和发展,以及网络规模不断扩大,对维护人员维护能力的要求越来越高。如何在实践中,在最短时间内定位并处理故障是每一位维护人员应该具有的业务素质。传输网络的日常维护工作经常要求我们对各类故障进行定位并及时排除。为了使故障定位准确,这就需要对故障产生的原因、故障判断方法有一个清晰的认识,这样才能够达到事半功倍的效果。
1.网络故障的判断与定位
1.1 告警和误码判断
由于广电干线网络覆盖广,涉及光缆、机房条件复杂,网络故障、割接、调整频繁,目前广电传输网络的网络管理采用大区管理,日常维护中就存在大量告警。
由于传统的网络模式中,承载网业务是架设在SDH网络上,因此,维护中更关心该层面网络中的告警信息,并且SDH网络中的告警大部分是基于业务通道层面的,传输维护网管工程师对于基于G.707的这些告警都比较熟悉,能很快判断和处理故障。
而对于WDM方式,大部分的告警都是基于用户线路光缆侧的,或者说大部分都是基于波分侧的,由于波分侧的数据结构基本是基于G.709协议的,而传统的SDH帧信号在OTN网络中是被看作负载穿通的,WDM网络只能检测SDH帧信号中的再生段和复用段的部分开销字节。因此就要求传输维护网管工程师熟悉G.709帧开销产生的告警含义,从而判断根据OTN段层的不通告警来判断故障的段落。
1.2 故障的定位方法
传统的SDH网络的故障定位方法除了通过告警直接定位和端口环回外,还可以利用SDH设备业务交叉的灵活性,在设备上配置相应的电路环回,而不影响其他正常运行的电路。
而对于WDM方式,由于大部分2.5G的IP电路都是捆绑在线路侧10G的通道内传输,如果单条IP电路发生故障,维护工程师需要进行环回判断时,无法对该单条2.5G电路进行环回,而需要对整条10G电路进行环回,从而会影响其他三条正常运行的电路,因此在波分网络中出现故障时的环回操作需要更谨慎操作,如果不是特别紧急的故障,建议得到客户的同意后,选择安全时间操作定位。但广电的2.5G的IP电路没有捆绑在线路侧10G的通道内传输。
2.故障判断的盲点
目前无论传统的SDH系统或是逐渐演进的WDM系统的传输网络都可以给上层业务(IP承载网)提供基于通道或线路级别的保护,在光缆线路发生故障的时候,所承载的业务能基本无感知地迅速地进行自动倒换继续运行,从而不中断业务。用户在平时维护中的光缆调整、波道调整、换板等操作可能引起一些纤缆错联的情况,对于传统的SDH网络,由于有着成熟的复用段倒换机制作保障,验证两端设备的复用段节点号,因此光纤的错联基本不会造成业务中断。即便是线性1+1复用段系统,在光纤错联后,倒换都能自动恢复,由于不同系统之间业务配置的不同,在相应线路侧也会上报相应的AU_AIS或AU_CMM告警,用户也能及时发现传输通道存在问题。
而对于广电传输干线WDM网络,其配置的保护模式是光缆线路成环网保护,主要设备基本上都是同一个厂家的设备,因业务都是采用广播式业务发展形式,当XX中继段之间光缆线路中断时是或倒换恢复的判断条件是线路侧信号是否存在SF或SD条件或线路侧的SF或SD是否消失。
两个WDM网络波长环网保护系统的简单示意图,主用通道为顺时针工作方向,不详细画出,自动保护环是承载在WDM系统上,经过了环网上的N个OTM/REG站点,广电的设备基本上都是同一厂商的。正常情况下,该【A站----B站】属于单向通道保护环由两根光纤来实现,一根光纤用于传业务信号,称纤1;另一根光纤传相同的信号用于保护称纤2。单向通道保护环使用“首端桥接,末端倒换”结构。
业务信号和保护信号分别由纤1光纤和纤2光纤携带。例如,在节点A,进入环以节点C为目的地的支路信号(AC)同时馈入发送纤1光纤和纤2光纤,即所谓双馈方式(首端双发)。其中,纤1光纤按ABC方向将业务信号送至节点C,纤2光纤按ADC方向将同样的信号作为保护信号送至分路节点C
接收端分路节点C同时收到两个方向支路信号,按照分录通道信号的优劣决定选其中一路作为分路信号,即所谓末端选收。正常情况下,以纤1光纤送来信号为主信号。
同时,从C点插入环以节点A为目的地的支路信号(CA)按上述同样方法送至节点A,即光纤1所携带的CA信号为主信号在节点A分路。
当BC节点间光缆被切断时,两根光纤同时被切断,在节点C,由于从A经纤1光纤来的AC信号丢失,按通道选优准则,倒换开关将由纤1光纤转向纤2光纤,接收由A节点经纤2光纤而来的AC信号作为分路信号,从而使AC之间业务信号得以维持,不会丢失。
因此,在对WDM系统的保护倒换机制,存在着OTU纤缆连接错误,而倒换正常且无异常告警的故障盲点,在维护中尤其需要注意。对于有基于单波硬件维护的操作,操作完成后一定需要验证连纤的正确性。可以通过关断激光器或下插告警的方法来进行验证。
3.波分电路的跨厂家跨平面特点
在SDH时期,广电传输干线的所有承载IP承载网电路的SDH设备都是华为的,传输维护工程师基本上在华为的网管上就可以完成对于电路的故障处理,并且由于同一厂家设备的告警、性能等特性和定义都是一致的,因此处理电路故障时较为简便,故障表现得比较明朗。
而当IP电路承载到WDM系统上后,由于华为的WDM设备只涉及东部北方和东部南方省份,因此,一条IP电路可能就穿越了多个厂家的波分设备。其次由于多数波分电路在设计时穿越了同一厂家的多个平面。
因此当承载网电路波分化后,跨厂家和跨平面的特性表现比传统的SDH网络显著,对于传输维护工程师而言,就需要更熟悉波分网络,并经常要更新波分电路资料,当电路出现故障时,能快速根据电路资料判断出故障是否是华为设备引起,如果不是还要善于利用客户去推动友商解决问题。
4.维护建议
当广电的基础网络逐渐转向WDM后,绝大部份传输设备的端口和数通设备的端口都是通过SDH标准的接口对接,虽然两者端口的数据结构和开销一样,但是传输设备端口的告警表示却和数通设备POS端口上告警表示不同,因此对于网络维护工程师来说,需要同时了解两种设备的告警。
比如传输维护工程师熟悉的MSAIS告警,在数通设备上表示为LAIS,数通设备PRDI代表的其实是传输HPRDI的含义。因此在WDM的网络模式下,为了能快速定位电路故障的区段,需要网络维护工程师同时理解数通POS口告警性能的含义,同时结合传输设备上不同开销字节告警的定义,来定位故障区段是发生在数通设备侧、局内对接还是线路侧。
5.结束语
总之,随着传输网络规模的日益扩大,设备类型越来越多,维护工作相应变得复杂。对于我们传输系统的维护工作者来说,为了及时地定位故障、找出故障源并消除故障,不仅需要不断学习新的知识,把握各种设备的原理、熟悉网络结构,而且对平时工作中维护经验的积累也是非常重要的。
参考文献:
[1] 王成.传输网络维护案例分析[J].科技致富向导,2011年12期.
[2] 代红.浅谈SDH系统常见故障处理及维护方法[J].内蒙古科技与经济,2007年08期.