SDH告警产生原理分析与故障排查
2016-10-14王刚
王刚
摘 要:SDH光传输网设备大量应用在电力通信系统中,在运行过程中会产生大量的告警,通信运维人员熟练掌握SDH帧结构和SDH告警产生原理能有效提高工作效率、减少故障排查处理时间。文章介绍了SDH光传输网设备在电力通信系统的应用情况,分析了SDH帧结构的组成以及SDH的工作原理、SDH告警产生和传递机制,并结合实际工作经验探讨常见SDH告警产生的原理和故障排查方法。
关键词:SDH;告警;电力通信系统;故障排查
随着电力系统朝着现代化、智能化方面日益发展,电力生产过程中自动化控制系统、变电站视频监控系统、变电站办公网络、软交换电话系统等业务对于通信传输资源的需求不断增长,电力通信网络在电力系统的重要性被提升到了前所未有的高度。SDH光传输系统作为目前光通信领域一项成熟且稳定的技术,已被广泛应用在电力通信系统中,以多种组网方式组成了链形网、环形网和多环网,复杂的组网方式势必增加运维人员进行故障定位及处理的难度,笔者根据实际工作经验联系SDH告警原理,对SDH光传输设备的告警产生和故障定位进行了分析探讨,为电力通信系统运行维护提供参考。
1 SDH基础知识
1.1SDH帧结构
SDH帧结构(本文“SDH帧结构”均指SDH基本传输单位STM-1的帧结构)是由270列和9行字节组成的块状结构,如图1所示。图中,帧结构中的字节是从左至右、自上而下按顺序传送的,帧长度为2430(270×9)字节,帧频率为8kHz,信号比特速率为155.520Mbit/s。
1.2SDH段开销结构及其功能
1.2.1 SDH段开销结构
SDH段开销结构如图2所示,其中RSOH为再生段开销、MSOH为复用段开销、POH为通道开销。RSOH对整个STM-N整体信号进行监控,MSOH对STM-N中的某个STM-1信号进行监控,RSOH、MSOH、POH组成SDH层层细化的监控体制。
1.2.2 SDH段开销与告警
SDH系统借助于丰富的开销字节传递告警和性能事件,具有很强的在线告警和误码监测能力。因此了解开销字节的含义,可以更深层次地理解SDH告警及误码监测机制。
A1、A2字节用于定位STM帧的起始位置,正常情况下A1、A2的值恒为F6H、28H,如果帧同步器连续5帧监测到错误的A1、A2值,将上报帧失步告警OOF,如果OOF告警持续3ms,则上报帧丢失告警LOF,并下插全“1”信号。在LOF状态下,若连续1ms以上又处于定帧状态,那么设备又回到正常状态。
J0字节用于确认再生段两端处于连续的连接状态,要求收发两端的J0字节完全匹配,如果不匹配,则会上告J0_MM追踪识别符失配告警。
B1为再生段误码监测字节,如果从STM-N信号中恢复出的B1字节和接收到的前一个STM-N帧中的BIP-8计算结果不一致,则上报B1误码。如果B1误码超过门限10-3(默认值),就产生B1_EXC告警。
B2为复用段误码监测字节如果从STM-N信号中恢复出的B2字节和前一个STM-N帧(除再生段开销外的所有比特)的BIP-24计算结果不一致,则上报B2误码。
K1、K2为自动保护倒换通路字节, 如果检测到K2字节中b6-b8是111,则上报MS_AIS告警并下插全“1”信号。如果检测到K2字节中b6-b8是110,则上报MS_RDI告警。
2SDH告警产生机制
SDH传输系统中,告警均由单板产生,单板将告警上报给主机软件,主机软件将告警上报网管软件,用户通过网管软件查询告警。其中主控板、光接口板、业务板、交叉板等均能产生告警。
根据信号处理和告警产生的过程可以将SDH设备进一步分解成以下模块:
高阶部分:帧同步器和再生段开销处理器、复用段开销处理器、指针处理器和高阶通道开销处理器
低阶部分:高阶通道适配器、低阶通道终端、低阶通道适配器、异步物理接口
下面我们将以这些功能模块为索引对高阶告警信号产生流程和各开销字节处理作介绍,其中流程如图3所示。
2.1帧同步器和再生段开销处理器
告警信号流程如下:
1)光接收
光模块对接收到的光信号进行检测,如果发现输入信号无光、光功率过低或光功率过高以及输入信号码型不匹配时会上报R_LOS告警。
2)A1、A2字节检测
帧同步器接收到从光电转换模块发来的STM-N信号后,根据该信号中的A1、A2字节来对帧进行定位, 正常情况下,A1值恒为F6H,A2值恒为28H,但如果连续5帧检测到错误的A1、A2值,将上报R_OOF告警。如果R_OOF告警持续超过3ms,则上报帧丢失告警R_LOF并下插全“1”信号。
3)B1字节检测
再生段开销处理器提取STM-N信号中的其它再生段开销字节进行处理。其中最重要的为B1字节。如果从STM-N信号中恢复出的B1字节和接收到的前一个STM-N帧中的BIP-8计算结果不一致,则上报B1误码。
2.2复用段开销处理器
信号流程如下:
1)K1、K2字节检测
复用段开销处理器提取STM-N信号中的复用段开销字节进行处理,利用K1、K2字节和主控单元、交叉单元共同实现MSP保护功能。
如果检测到K2字节中b6-b8是111,则上报MS_AIS告警并下插全“1”信号。如果检测到K2字节中b6-b8是110,则上报MS_RDI告警。
2)B2字节检测
如果从STM-N信号中恢复出的B2字节和前一个STM-N帧(除再生段开销外的所有比特)的BIP-24计算结果不一致,则上报B2误码。
2.3指针处理器和高阶通道开销处理器
信号流程如下:
1、H1、H2检测
指针处理器根据每一路AU-4的H1、H2字节进行指针解释和指针调整,完成频率和相位校准以及容纳网络中的相位抖动和漂移的功能,同时定位每一路VC-4并送到相应高阶通道开销处理器。如果检测到AU指针H1和H2字节全为“1”,则上报AU_AIS告警,并下插全“1”信号。如果H1和H2字节代表的指针值非法(不在正常范围0~782内),连续8帧收到非法指针,则上报AU_LOP(管理单元-指针丢失)告警并下插全“1”信号。
2、J1、C2、B3和G1字节检测
高阶通道开销处理器对接收的N路VC-4中的高阶通道开销HPOH字节进行处理。对其中各字节处理方式如下:
如果检测到J1字节和预定值不同,则上报HP_TIM告警,并下插全“1”信号。
如果检测到C2字节为00,则上报HP_UNEQ告警,并下插全“1”信号。如果检测到C2字节和预定值不同,则上报HP_SLM告警,并下插全“1”信号。
3SDH常见告警的分析及处理方法
SDH光传输技术通过丰富的开销来对不同的功能层进行层层监控,下面简单介绍日常维护中常见的告警,通过SDH测试仪、光功率计、光源、光衰耗器、OTDR等仪表来判断告警产生的原因,以及常见告警的处理方法。
3.1LOS告警
LOS告警是非常常见的严重告警之一,由于光接收模块检测不到光信号、光功率过高或
过低引起的。主要有以下常见原因:
1)接收光方向光路中断或衰耗过大
2)本端光接收模块故障
3)对端光发送模块故障
处理LOS告警的关键在于排查故障点,使用光功率计在各个关键节点检测接收光功率,
通过与标准光接收功率做对比即可判断故障点,一般先在本端接收光口和对端发光口收光排除光模块的故障,若为光模块故障则更换光模块即可,若为光路故障则须进行光路调整或者对光路进行抢修,两端设备的收发光正常后LOS告警消除。
3.2LOF告警
LOF告警是由于帧同步器连续5帧检测到错误的A1、A2值而产生。可使用SDH传输测试仪在高阶监测点监测接收SDH帧结构中A1、A2字节,如果正确,可能是本端相关单元的硬件或者软件有故障,若不正确,则说明故障在对端。
也可将本端设备收发光加光衰后自环,若告警消失则为对端故障,若告警不消失则为本端故障。
3.3AIS告警
AIS告警又叫全“1”码告警,俗称上游告警,一般是对端设备检查到LOS或者LOF等严重告警后下发到对端,或者是高阶层检测到严重告警后下插至低阶。所以产生AIS告警后一般先去查看对端设备或者高阶的告警。
3.4EBER告警
EBER告警一般是由于光路衰耗过大造成较大误码而产生,光纤连接器和光收发模块有灰尘、光纤弯曲角度过大均会造成光路衰耗过大。通过OTDR可以查看光路的衰耗情况,进而判断故障点,通过用酒精或无尘纸擦拭光纤连接器等方法可以处理故障,光路衰耗恢复正常后告警消失,若无法处理则须进行光路路由调整。