铁路客运专线SDH系统支路误码问题分析定位
2014-01-18宋志永
■ 宋志永
铁路客运专线SDH系统支路误码问题分析定位
■ 宋志永
铁路客运专线SDH系统是GSM-R、动环、防灾、客票、视频监控等系统的传送平台。当SDH电路产生误码后,承载的业务可能会受到不同程度的影响,如控制信号出错、视频画面质量下降、通话语音质量下降、数据业务丢包等,是维护中常见的问题,但是维护人员处理误码时往往感觉无从下手。系统总结误码问题故障处理的检测原理及处理思路、方法、步骤,有利于维修人员在处理误码故障时的分析定位。误码,则将导致复用段、高阶通道、低阶通道出现误码。由于高阶误码会导致低阶误码,因此在处理误码问题时,应按照先高阶后低阶的顺序来进行处理。
1 误码故障
1.1 SDH误码性能检测字节
1.3 误码性能事件与对应的告警
表2列出了SDH传输设备检测或上报的误码性能事件。若本端上报BBE性能事件,则表示本端接收侧检测到了误码,远端发和本端收之间的通道存在问题。若本端上报FEBBE性能事件,则表示远端接收侧检测到了误码,本端发和远端收之间的通道存在问题。
与MSFEBBE、HPFEBBE、LPFEBBE三个误码远端性能事件对应的还有三个误码远端告警事件,分别为复用
在STM-N帧结构中,用于误码检测的字节是B1、B2、M1、B3、G1、V5。开销字节B1、B2、B3、V5分别用于监视再生段、复用段、高阶通道和低阶通道的误码(见表1)。
1.2 误码检测
SDH设备中按分段分层的思想对误码进行全面系统的检测。具体有B1再生段误码、B2复用段误码、B3高阶通道误码、V5低阶通道误码,相互关系见图1。
由图1可以看出,如果只是低阶通道有误码,则高阶通道、复用段和再生段将监测不到该误码;如果再生段有段远端差错指示MS-REI、高阶通道远端差错指示HP-REI以及低阶通道远端差错指示LP-REI。通过这些远端告警事件的观察,也可以判断远端是否检测到了误码。当误码较大,突破预设的性能门限时,将上报误码越限/劣化告警事件。
表1 SDH开销字节的用途
图1 误码检测关系及检测位置
再生段:再生段误码越限告警(B1OVER)。
复用段:复用段误码越限告警(B2-OVER)、劣化告警(B2-SD)。
高阶通道:高阶通道误码越限告警(B3-OVER)、劣化告警(B3-SD)。
低阶通道:低阶通道误码越限告警(BIP-OVER)、劣化告警(BIP-SD)。
缺省情况下,误码越限对应的门限是1×10-3;误码劣化对应的门限是1×10-6;表3给出了与误码相关的性能和告警事件,以及检测位置与作用。
2 误码原因分析
误码是因为在传输过程中码元发生了错误,SDH系统产生误码的因素有很多种(见表4)。
2.1 线路B1误码
线路B1误码常见的原因是:光功率过低,在灵敏度附近;光功率过高,在过载点附近;光功率正常,色散过大;光纤的问题,包括光缆、尾纤;光纤头不清洁或连接器不正确;或线路板故障,时钟模快故障或网络时钟质量下降。
2.2 线路B2、B3误码
线路B2、B3误码常见的原因是:单板的故障;时钟同步性能不好等;机房条件,包括温度、电源稳定性以及接地情况等。或有高阶误码如B1误码。
2.3 支路上的V5误码
如果只有V5误码,即低阶通通误码,常见的原因可能是外界干扰引起,如设备接地不好,设备附近有大的干扰源,EMC屏蔽不好(主要针对34M/45M/155M高频信号)等;设备工作温度过高也可能引起支路误码。也有可能是交叉板与支路板之间配合有问题、支路板有问题等,可检查支路板或交叉板。
表2 SDH传输设备检测或上报的误码性能事件
表3 误码越限告警及性能事件检测位置
表4 误码问题的常见原因
3 误码问题故障定位方法与思路
3.1 误码定位常用方法
对于误码的处理,常用的方法是先分析、后环回、再替换。
3.1.1 告警、性能分析法
由于环回法对正常业务有影响,因此处理误码问题时,一般主要通过对误码、性能事件的仔细分析,定位出故障点。
3.1.2 逐段环回法
当然,若条件允许,可使用环回法快速定位出故障站点。
注意:环回有可能造成ECC不通,要认真分析ECC,确认不会影响网管管理后再进行环回操作。
3.1.3 替换法
对于设备器件性能不良或性能劣化的情况,替换法通常都是故障定位和检验故障定位准确性的很好方法。替换对象包括光纤、光器件、电路板等。
3.2 误码故障定位思路
3.2.1 检查光功率
线路板的光功率异常是引起误码的常见原因。当光功率过大或过小,都会导致接收光模块接收光信号不正常,并同时引起B1、B2、B3、V5误码;所以,设备上报大量各种类型的误码时,首先要测试本端站接收光功率是否正常。对于S16板,具有光功率检测功能,可以直接查询光功率值。
如果接收光功率超过光接口板的允许范围,应该检查光接口板的类型是否一致,或在接收端加上适当的光衰减器。
如果上报误码站的光接口板接收光功率过小,应检查的项目包括:(1)上游站的对应发光功率是否正常;(2)ODF、衰减器、法兰盘、光接口板的接口是否连接紧密;(3)ODF、衰减器、法兰盘、光接口板的接口是否清洁;(4)光纤是否被挤压;(5)光纤弯曲半径是否过小;(6)光接口板的类型是否一致。
3.2.2 检查电缆
连接到传输设备电缆劣化,通常会引起误码。检查连接到设备上的电缆是否正确;防止电缆的漏焊、虚焊、接触不良。
在OptiX设备与其他设备对接时,如果对接设备报误码,应该检查对接电缆是否正常。
3.2.3 检查外部干扰
造成误码的外部干扰主要有:(1)外界电子设备带来的电磁干扰,如传输机房内的开关、风扇、空调、各种射频器等;(2)来自设备供电电源的电磁干扰,如浪涌电压、工频干扰等;(3)雷电和高压输电线产生的电磁干扰。
防止外部电磁干扰,主要是做好预防工作,对于机房内的用电设备要进行良好的接地。对于射频器,其干扰程度应符合要求。为了防止干扰,传输设备最好使用独立的电源。供电电源要配置防浪涌和工频干扰的大电容器滤波。机房也要避免建在雷电多发和高压输电线的附近,并做好防雷措施。
3.2.4 检查接地
机房内的各种设备、电缆接地不良,也会引起误码。所以在定位误码原因时,要注意检查以下接地情况:(1)传输设备机柜的接地;(2)传输设备机柜的正门和侧板的接地;(3)子架接地;(4)信号电缆的接地;(5)DDF、ODF的接地;(6)网管设备、各种用电设备的接地;(7)对接设备是否共地。
3.2.5 检查环境温度
机房的环境温度必须达到规定的标准,机房的温度过高和过低,都有可能引起误码。下列情况会引起环境温度异常:(1)子架风扇故障;(2)子架风扇防尘网积尘过多,设备通风不畅;(3)机房内空调故障。
3.2.6 设备原因
OptiX SDH设备中的下列电路板发生以下故障时,通常会引发误码:(1)光(电)接口板;(2)时钟单元;(3)交叉单元;(4)支路板。在设备上报误码后,要分析误码产生的特点,逐步定位故障到单站。可以通过环回法,将故障定位到某站的电路板,然后再采用替换法,对怀疑有故障的电路板进行复位或更换。
接口板劣化故障。如果线路出现B1、B2和B3误码,一般怀疑与光(电)接口板和时钟单元有关。首先检查接口板是否有告警产生,若只是东向或西向接口板报B1、B2、B3误码则可能是线路板的问题。光(电)接口板劣化,往往是该接口板的某个或几个VC-4通道发生劣化,这时与这些VC-4相连的对端站应上报误码。在定位该类误码时,要注意误码的上报特点,如果误码总是出现在某几个VC-4中,而这几个VC-4又是由某块光(电)接口板发出的,首先要怀疑这块电路板是否有问题。
时钟单元劣化故障。时钟单元引起的误码,常常具有如下特征:本、下游站上报大量的指针调整;本站的光接口板报B1、B2误码;相邻站与本站相连的光接口板报B1、B2误码;本站的支路板上报通道误码;5.穿通本站,终结于下游站的支路板会报通道误码。首先检查时钟单元的配置是否正确,检查全网的时钟配置是否正确。如果时钟单元配置正确,就要检查是否时钟单元劣化导致的误码。
交叉单元劣化故障。交叉单元劣化引起的误码,其特征与时钟单元一致;不过交叉单元产生的误码通常有个特点,即误码总是出现在某几个VC-4或VC-12中。
支路板的劣化故障。本站如果有低阶业务上下,当支路板发生故障时,通常会报低阶误码(V5)。所以如果全网仅仅有低阶误码上报,通常怀疑是交叉单元或支路板有问题。
3.2.7 检查配置错误
时钟配置错误也会导致误码和指针调整。在外部原因检查没有发现问题时,则要检查是否时钟配置错误。
4 结束语
铁路客运专线SDH系统作为基础传送平台,是数据网、核心网、无线G网等所有业务网的安全运行基础,保障其稳定运行是运维管理工作的重点,充分理解和掌握误码性能事件,是做好SDH系统维护的基础。
[1] 顾生华. SDH设备原理及应用[M]. 北京:北京邮电大学出版社,2009.
[2] 肖萍萍. SDH原理与技术[M]. 北京:北京邮电大学出版社,2006.
宋志永:华为公司交通系统部交付与服务部,经理,北京,100077
责任编辑 杨倩