APP下载

SDH传输故障及处理方法

2013-04-12李志安屈伟平

中国信息通信 2013年2期
关键词:排除方法故障定位维护

李志安 屈伟平

摘 要 本文主要介绍了SDH光纤设备常见的故障和其产生的原因,并在此基总结了解决该类设备常见问题的方法,最后列举了SDH故障的案例,并对其进行分析处理。

关键词 SDH 故障定位 排除方法 维护

1 引言

SDH(Synchronous Digital Hierarchy,同步数字系列)是PDH的改进版,它的发明是电信传输体制的革命之一,原因在于它可以对同步信号进行传送、分插、交叉连接和复用,不仅可以通过卫星、光线,还可以微波等进行传送,是一种新的传输体制。

SDH光纤通讯技术的广泛应用为军队的资源共享做出了巨大贡献,而且在不断迅速发展,但是要想光纤传输的正常,就必须保证网络设备的正常运转,但是设备的故障在所难免,因此,有必要提高对网络设备的维护能力,出现问题可以及时解决,这样就能使其更好的为军队的网络建设和信息传输服务。

因此,有必要提高通信维护人员的理论水平,提高其的业务熟练度,比如:掌握和SDH相关的基本理论知识、出现问题时各种警告代号的含义和解决措施和警告信号的来龙去脉和影响等等。同时还要熟悉网络的基本概念,比如系统配置,数据的采集和传输,同时加强分析故障和解决故障的能力。

1 传输故障成因分析

引起SDH传输故障的原因主要有:工程质量问题、维护操作不当、设备自身问题和外部设备问题等。

1.1 工程质量问题

施工期间的不规范施工和偷工减料很有可能导致SDH的传输故障,但是这些问题并不一定能及时暴露出来,有的可能施工时就能发现,有的是在工程竣工后发现,有的可能在设备运行期间才能被发现。要想彻底根除这类故障,必须严把工程质量关,施工期间要加强监管,项目验收时要认真细致。因此竣工调试和测试十分必要,同时做好测试报告,方便日后的设备维护。

1.2 维护操作不当

由于维护工作人员的操作不当和失误都有可能导致SDH的传输故障。引起造作不当的原因很多,比如对系统的具体情况了解不够,不规范操作,不按照规程对设备进行检修。还有新老设备的不同或者系统版本的新旧导致的操作不当,因此,这方面一定要加强维护人员的基本素质和维护技能。

1.3 设备的自身问题

比如设备的故障和损坏都有可能导致SDH传输故障,比如:元器件的损坏、系统故障和网线故障等。

1.4 设备外部问题

比如:传输线路故障、系统配置的不合理、电缆的接触不良、供电不足、设备的对接失败和突然断电等也有可能导致SDH的传输故障,因此,出现问题时要从多方面考虑不能片面,这样才能快速排除故障。

2 故障常见处理方法

在SDH设备的维护过程中,为了快速准确的发现问题和解决问题,因此,有必要对发生的故障及时定位,定位越准确越有利于故障的排除,比如定位到单板。这这也对维护人员除了更高的要求,首先,必须了解各故障的表现;其次要了解各故障的成因;再次,要了解问题处理的原则;最后,要掌握常见故障的处理方法,这也是重中之重,因此有必要重点介绍,下面我们就详细介绍各种故障处理法。

2.1 报警分析法

由于SDH传输设备的广泛使用,因此,随时都有报警的发生,正确掌握各种报警的含义和特征有利于故障的定位和解决。因为,系统故障时,网管都会记录各种报警,包括发生的时间、位置以及其他设备的表现,根据这些特征结合开销字节和警告原理机制,对故障的排除十分有用。怎样才能更好的使用报警分析法,关键是及时准确获取报警信息。因此,有必要了解故障的来源,故障的来源一方面是网管的记录,这个来源非常容易也比较详实,而且可以前后对比,通判考虑,方便故障的排除;另一方面是观察和记录设备的指示灯。虽然这种方法具有时效性,但是比较片名,不能反映设备过去情况,不够全面。因此在运用报警分析法时一定要综合考虑。

2.2 环回法

环回法也是通常判断设备故障的常用和有效的方法,因为,通常情况下传输的信号都可以形成一个回路,这也环回法应用的基础,也是环回法名称的来源,这种方法在电路增开和电路调度方面应用广泛。环回法的优点是不需要对警告信息的分析就能实现对故障的快速定位,而且操作简单易学测。当然,有利就有弊,回还法也有其缺点,就是影响正常业务的进行,这也是此方法轻易不使用的原因。

环回法可分为硬件环回与软件环回。其中硬件环回彻底,但是不能远程操作,也不方便。软件回环则恰恰相反,方便也可以远程操作,但是对故障的定位不如硬件回环准确。

如图1所示,在该链形组图中,A站为业务集中型网管中心站,即A站和B站和C站都有业务联系。下面我们就举例分析回环法的应用。某天,网管发现和A站和C站之间业务中断。利用回环法,利用误码测试仪监测A站和C站之间的业务联系,发现业务中断;再利用环回法对C站进行软件内回环,发现业务正常,由此可得C站存在问题;在C站的接口转换板等处再做硬件内回环,发现业务失常,因此表明,C站的接口转换板、电缆、支路板或者设备背板有问题。通常情况下,为了避免对该板其他业务的影响,在更换支路板之前,应首先测试电缆和电缆端之间的连接是否正常,如果正常,就说明是支路板的问题,更换后即可排除故障。

2.3 数据分析法

利用网管平时记录的报警信息和性能数据,在分析SDH的传输故障时可以对故障进行初定位和“定型”。通常情况下警告信息的获取方法有网管系统和涉笔的运行指示灯。

利用报警信息和性能数据可以方便我们了解设备的运行状况和故障先兆,把故障扼杀在萌芽状态。当故障出现时,通过这些信息可以知道设备出现问题前的运行状态和报警信息以及其他设备的症状等。但是在用数据分析法时,一定得核对系统的时间设置,时间正确的话可以上报,时间不统一的话可以进行时差转换之后进行上报。

同样如图1所示,A站为网管站,A与C之间业务中断,且不能在A站登录C站,B站东(E)有MS-RDI警告和HP-RDI警告,A站与才站之间有LP-RDI警告。通过上述警告信息我们可以得知C站无法接收B站所发出的信号,B站可以接收C站所发的信号。因此故障的原因可能是E向光板信号发送失常;C站光板无法正确接收信号根;C站所接收信号有问题;还有就是光路问题。

2.4 替换法

如果拔插法还不能解决故障的话,替换法也是一种选择。所谓替换法,就是用正常工作的元件去替换被怀疑有故障的元件,从而实现对故障的定位,达到排除故障的目的。这里所提到的元件是指任何设备,无论是复杂到一个设备或者是小到一段线缆。

替换法主要用于排除用以传输的外部设备问题,比如电缆、供电设备、光纤和交换机等,或者排除某个单站内的单板问题。举例如下:当某一个站的光板出现警告,有可能是收、发光纤的正反接错问题。互换接收线,如果报警消失则说明确实是光纤接反导致的。如若支路板的信号有性能超值或者信号丢失的警告,有可能是中继线或交换机的问题,可以与其他工作正常的通道互换,若警告转移,则可以证明中继线或交换机的问题,若不是,则可能是传输故障。该方法的优点是简单实用。

2.5 断开光路法

当传输网是环形时可采用断开光路法进行故障诊断。如图2所示,A站也为集中型业务中心站。某天发现B站和C站的通道中有大量TU-AIS和信号丢失警告,而且指示灯频繁闪烁,影响了B站和C站的ONU设备的正常工作。但是网管处监测是正常的,可以进行初步判断,说明问题出现在B站或者C站的交叉板上。首先断开A站与C站之间的连接,报警依旧。回复A站和C站之间的连接,再断开B站和C站之间的连接,C站业务显示正常,B站警报不断。利用网络拓扑图,初步判断是B站的问题,B站的交叉板更换之后业务正常。

2.6 更改配置法

在出现故障时,对系统更换设备有可能有利于故障的定位和排除。该法主要用于排除由于配置错误引起的故障。更换配置包括更换配置的内容包括板位配置、时隙配置和单板参数配置等。如若怀疑故障出现在某通道或者支路板上,可以进行时隙配置更换,把业务换到其他通道或者支路板,以解决问题;如若怀疑某个支路板的槽位问题,通过板位配置更换可以进行故障排除;如果系统升级或者扩建之后出现问题,怀疑是配置问题,则可以进行重新配置以检验是否配置问题。

2.7 仪表测试法

该方法主要用于排除外部设备问题或者设备的对接问题。例如怀疑供电电压不正常,可以用万用表进行测试;如若怀疑设备的接地问题,则可以用外用表测试相关通道之间的电压值,如果超过0.5V,则可说明是接地问题。总之,仪表测试法在分析故障时准确方便,但是对维护人员要求较高且对仪表的性能有要求。

2.8 经验处理法

在通常情况下,如果故障出现问题,但是无论怎么检查都发现不了问题,没有警告也没有配置错误。此时可以通过经验来进行判断,对故障进行定位。比如供电异常、电磁干扰和通信中断等都可以用此方法进行故障定位。但是此方法对维护者有要求,必须是老练或者经验丰富的人员,新手或者业务不熟练者则不行。

3 SDH传输告警故障案例分析及处理

为了加强对传输故障何其解决方法的进一步理解,掌握常见问题的解决思路和方法,下面就举几个案例进行分析,具体如下。

3.1 光路出现阻断

当光路出现阻断时,网管上会有OFF、RS-LOS和LOF等光路警告。倘若是单纤断,B网元就会收到OOF、RS-LOS、LOF等报警,A网元则会出现MS-RDI等报警,相应指示灯会闪烁指示。出现这类问题时,维护人员可以根据报警信息并用光功率计测量接收对收方向的光纤,倘若有信号,有可能是光盘、入端光尾纤或者本端光接头的问题;反之,可能是光缆阻断的问题,以此来对故障进行排查,方便故障的定位,进一步用OTDR进行故障的确定。另外,接收端没有信号输入,也有可能出现当R-LOS报警,此时应根据报警进一步进行故障鉴定和定位。

3.2 误码告警

产生的误码主要包含于B1、B2、B3和V5等字节中,网管方会产生BBE、SES、ES和UAS等报警。这些报警课进一步分为近端报警和远端报警。B2类的误码报警通过M1字节告知对端次报警的;而B3类的误码通过G1字节的b1~b4比特回送;还有,V5 类的b1b2误码报警通过该字节的B3比特进行回送,与此相对应,对端在回送后在会产生MS-REI、HP-REI和P-REI报警。

如若是B1与B2误码报警,则可以通过本地终端或者网管系统登陆报警网元,如果只是单端误码,则通过核对本站S16盘的相应光接口的接收功率是否正常,如果不正常则进行相应处理;如若是双端误码,可以对光纤进行测试,但是通常情况下光纤不会出问题。

如果B3与V5出现误码,可以用SDH无码分析仪进行相应测试并进行回环处理,直至找到故障点,然后再进行相应的检查处理。有时,传输维护过程中也有误码现象的产生,而且报警种类多,因此有必要熟练掌握各个无码报警的含义及其解决方法,并不断进行经验积累,结合误码信息进行障碍的迅速排除。

3.3 UNEQ报警

例如,UNEQ报警,此报警是通道未装载业务时的报警。该报警在高阶通道时的信号标记由C2监测并产生,其值为00H,此时警告为HP=UNEQ。与之相对应,其报警由V5的b5b6b7沉声,此时,同时报警为LP-UNEQ。

从UNEQ的产生原理我们可以知道,当光路接受不正常时便会产生此报警,因此我们可以核查该段业务路由的连接,如果有错误便对其修改,如若有遗漏便进行增补,并删除所有路由时隙,并重新进行数据的下放。如:某网管的PD1盘的某个接口出现LP-UNEQ报警

3.4 T-ALOS告警

TT-ALOS报警比较常见,产生的原因是本端的2M盘无法接收用户的报警所致。如果是链接交换设备,则可以核查交换机的DDF架;如果是交换机未有信号送来,则可以检查交换机的一方;如若信号发出但是没有收到,则可以认真核查每个相关的接口,必要时可以用万用表进行测试。

3.5 AIS告警

由于高阶通道出现故障时,下游站点会受到该站点发送的当“1”码,而且本地端口有TU-AIS报警,对应端口产生LP-RDI报警。所以出现此类报警时,首先核对高阶通道是否有报警产生,再进行下一步处理。若只是2M上有这种情况,应首先检查本地接收通道的各环节。

3.6 HP-SML及LP-SLM告警

当接收端月发送端的信号不一致则会有HP-SLM报警出现,进而出现报警:高阶通道信号标记字节失配。与此相对应,在低端时,则会出现LP-SLM报警。

处理此警告时,首先要查看报警的优先级,应先处理优先级高的报警;如果只有这种报警产生,则查看是对端与本端机盘开销字节的内容一致性,通常情况下,该问题是由于双端的信号不同所致,只需进行字节的重新设置即可解决。需要注意的是,误码也有可能产生此报警。由于J1、J2 和C2字节的修改会导致电路的中断,因此不能轻易修改其值。此通道主要用于设备开通时的通道测试。

上述问题都是SDH维护过程种的常见问题,由于篇幅所限,这里仅仅给出常见警告的处理方法。当警告很多时,要根据经验综合考虑,并认真分析其产生机理和特征,以方便日后的故障排除。

4 结语

由于SDH的光通信传输设备所出现的故障多种多样,因此处理起来就比较复杂,这就需要维护人员加强自身知识和技能的学习,同时不断总结经验,理论和实践相结合,并具体问题具体分析,这样才能做好SDH光纤设备的维护工作,同时使自己在工作中得到提高。

猜你喜欢

排除方法故障定位维护
测控区和非测控区并存的配电网故障定位实用方法
高压电机轴电流的危害及排除方法
探讨智能配电网故障快速定位与故障恢复
柴油机功率不足的故障原因及排除方法
铁路信号智能电源屏故障监测与排除方法
论汽车刹车系统故障及排除方法
电力电缆故障定位的探讨
发射台中央控制系统典型故障分析及维护
1938年法入侵西沙 日军积极“维护”中国主权