APP下载

ECC路由不通导致传输网元脱管故障分析及排除

2011-02-02袁福桥裴俊芳

铁道通信信号 2011年12期
关键词:网元传输网网管

袁福桥 裴俊芳

ECC路由不通导致传输网元脱管故障分析及排除

袁福桥*裴俊芳*

嵌入式控制通道(ECC,),用于SDH网元间通信,传送TMN信息,实现网管对非网关网元的管理。通过对一例ECC路由不通导致传输网元脱管的故障进行分析,了解ECC原理,掌握ECC故障处理的方法和技巧。

嵌入式控制通道;通信;信息

嵌入式控制通道(ECC,Embedded Control Channel),用于SDH网元间通信,传送TMN信息,实现网管对非网关网元的管理。在2个SDH网元之间光纤连接时,一般使用段开销的再生段DCC字节传送TMN信息。网关网元和非网关网元的通信过程:首先网管和网关网元通过TCP/IP协议传递信息,然后网关网元和非网关网元通过ECC通信,最后实现网管和非网关网元的通信。下面对一例ECC路由不通导致传输网元脱管的故障进行分析,了解ECC原理,掌握ECC故障处理的方法和技巧。

1 故障现象

如图1所示,站点A和站点B是网关网元,传输设备为华为OSN3500。其余站点为非网关网元,传输设备为华为OSN2000。站点1至站点5采用的主用网关网元是站点A,备用网关网元是站点B。ECC子网内有主备2个网关。站点1—站点2—站点3—站点4—站点5构成二纤双向复用段保护环,传输光缆采用双径路组环保护,传输设备主要板件采取冗余或“1+1”保护。

2011年6月,值班人员巡视传输网管发现站点3收站点4有R_LOS告警,且站点4、站点5传输网元脱管。复用段倒换状态正常,业务未受影响。当R_LOS告警消除,网元脱管现象也恢复正常。过了不久,再次发生站点3、站点4、站点5传输脱管,业务未受影响。复位站点3的主控板后,脱管告警消失。

图1 二纤双向复用段保护环组网示意图

2 原因分析

ECC通道是通过发端并发、收端选择方式建立路由。选择的原则是根据最短路径建立路由,最短路径不是指地理上的距离,而是逻辑表中的逻辑距离即间隔站点的数量。比如,网管登录站点5有2条路径,一条是从站点5-1-2-A的短路径;另一条是从站点5-4-3-2-A的长路径,以间隔站点的数量来确定长短路径。在环网中,如果站点1至站点5的短路径有问题,网管可以通过长路径登录站点5。所以不能以能否登录网元来判断ECC是否正常,应在网管中查看ECC路由,发现走长路径时就应查找原因。

2.1 排除外部原因

ECC路由不通,有外部原因,比如供电电源掉电、供电电压过低;或光纤传输性能劣化,损耗过高或中断,尾纤头脏或者松动,会在光路上产生大量的误码。首先应排除外部因素,然后检查设备SCC板、光板。对于ECC问题,可从不能登录的站点入手。如果站点4、5不能登录,故障可以定位到站点5和站点1。不仅分析登录不上的站点,还要分析其上游站点。

2.2 检查SCC板

1.检查站点5的SCC板是否硬件故障,主要是查看SCC板的红绿灯闪烁是否正常:红灯长亮表明SCC板硬件故障,绿灯快闪表明SCC在复位,绿灯长亮表明SCC板死机。如果有以上情况,按SCC的“RST”按纽或拔插一下,再观察,还不行则须更换SCC板。

2.如果SCC板闪灯正常,也可以尝试复位SCC板。先复位站点5的SCC板,若无效则复位站点1的SCC板。

复位方法:网管进行软件复位,按SCC板的“RST”复位按纽;硬件复位,拔、插SCC板。

3.若复位SCC板还无效,可将SCC板拔出,使ECC通道在本站穿通。即从西向光板直接穿通到东向光板,不经过SCC板。检查线路板穿通DCC字节是否有问题。

2.3 检查光板

检查光接口板有没有告警,如有告警应先查明告警原因,如光功率过低或光功率过高,否则用互换法、替换法,更换光接口板。

3 故障排除

站点4、站点5传输网元脱管,但是传输业务未受影响,说明这2个网元没有发生掉电或是断纤,查看网元ID也正常。网元脱管恢复正常后,用cm-get-chanerror命令查看站点5和站点1,RECV-ERRORS数值为0,说明光板无误码。

正常情况下无论是站点3或站点4出现故障,在复用段保护倒换成功,业务不受影响的情况下,从出现故障的后几个网元可以通过并发选收的ECC路径登录网元,根据最短路径建立路由。

1.查询光板状态。确认每个光板是否正确分配了通道,用命令行cm-get-bdinfo查询站点5光板通道分配情况,如表1所示。

表1 查询站点5光板通道分配情况

返回结果是站点5对应站点1的28槽光板的D1-D3字节为收发正常。查询站点5对应站点1的DCC通道使能,且通信状态收正常,用cm-getchaninfo命令确认通道信息是否正常。返回结果如表2所示。

表2 查询站点5通道信息

返回的DNEID值(目的网元ID)为0,说明站点5西向光板对应的目标网元为0,站点5—站点1没有ECC路径。通过网管查询站点5网元ECC链路管理,只有1条且距离为0,目标网元号为站点4的ECC链路,而目标网元站点1的距离不为0。说明ECC走了长路径。同理:查询站点1对应站点5的DCC通道使能,且通信状态收正常,查询站点1网元ECC通信链路时,查询不到距离为0目标网元站点5的链路。没有遵循最短路径原则。故障定位在站点5和站点1之间。

2.检查站点5和站点1的SCC板状态灯。显示正常,通过复位2个网元的SCC板后,站点5到站点1的短路径仍旧不通。为了进一步判断故障原因,分别将站点5和站点1的SCC板拔出,使ECC通道在本站穿通,查看故障现象仍未消除。

3.故障定位在站点1东向光板和站点5西向光板之间。对这2个光板分别复位,再做倒换测试,查看各站登录情况。对站点1东向光板复位,故障依然。对站点5西向光板复位,故障消除。说明是站点5西向光板接触不良所致,复位即可消除故障。

4 处理思考

实际上,有很多情况会导致网元虽然有光纤相连,但ECC却不通,在处理ECC不通故障时要注意以下几个方面。

1.拔插光板将导致相关业务中断,慎用拔插和复位光板,建议在夜间小业务量时进行。

2.线路误码及系统工作环境温度,可能引起系统光板和SCC板间DCC配合时序混乱及软硬件死锁,会导致系统ECC单向通或ECC全断,因此通过复位主控板或线路板解决ECC不通的问题。

3.ECC路由的分配与业务配置无关,但与光接口板的环回状态有关,在对远端站点进行VC-4级别的远端环回时,若是对第一个VC-4环回,也可能会切断ECC通信,因此在环回第一个VC-4时需要特别注意。光纤相连的2个网元的对应光口是否设置了环回,设置了环回是不能进行ECC通信的。

4.如果所有网元无法登录,故障不会出在网元之间的ECC通信,而是在网管计算机和网关网元之间。检查计算机和网关网元的IP地址,重启计算机,PING对方的IP地址等方式可解决问题。

5.拔出SCC板使ECC穿通。在ECC故障定位到某站的SCC板后为减小ECC故障的影响范围,可以先将该站的SCC板拔出,使ECC通道在该站穿通,相当于跳过了该站,这样网管可以继续登录下游站点。

环网中网管通过网关网元登录其他网元,所走的路径为收发一致路由。若路由一切正常,网管通过网关网元登录非网关网元,走环网上的短路径;若短路径不正常,走环网上的长路径;若长、短路径皆不正常,则不能登录。因此,不能以是否能登录网元判断ECC正常与否,应在网管中查看ECC路由,发现走长路径时就应查找原因,排除故障。

Embedded control channel is used for SDH network element communication to transfer TMN data,realizing the network management of non-gateway network elements.Through analyzing a failure case of transmission network element getting out of network management due to ECC route disconnection,it help the understanding of ECC principles,master ECC troubleshooting methods and techniques.

Embedded Control Channel;Communication;Information

*广州通信段长沙南高铁通信车间助理工程师,410000长沙

2011-10-13

(责任编辑:诸红)

猜你喜欢

网元传输网网管
虚拟光网络中NFV资源分布式调度设计
一种全网时钟同步管理方法
浅析干线传输网升级改造勘察注意事项
给水网管的优化布置研究
卫星通信系统中网管信令传输优化及仿真
OTN传输网的建设及应用探究
昭通市全覆盖数字电视直放站综合网管系统建设技术方案
“五制配套”加强网管
寿光电力SDH传输网优化设计
OTN在福建高速公路传输网中的应用