ATM设备及用户的故障处理分析
2012-10-08吴艳辉
吴艳辉
(中国联合网络通信有限公司四平市分公司,吉林 四平 136000)
吉林省的ATM网络采用加拿大NORTEL NETWORK PASSPORT15000 和 PASSPORT7480系列。目前我省ATM网覆盖全省九个地市共计70余个节点。在同一地点存在PP15K和PP7K的设备又称为PP15KVSS,中间由155M多模板及多模光纤连接。
我省的ATM网由省网骨干层和区域核心节点组成。省骨干网由省内九个地市各设1个节点,长春和吉林两地骨干节点采用PASSPORT15000,其余地市骨干节点采 PASSPORT15000VSS,节点间采用2.5G SDH/DWDM双环结构互连,分为东部环和西部环。东部环由长春-四平-辽源-通化-白山-延吉-吉林-长春组成,西部环由长春-松原-白城-长春组成。区域核心节点主要是由PASSPORT7K组成,配置155M光口板用于中继连接。ATM在吉林省已运行10个年头,以下是在几年的处理障碍过程中总结的几种常见故障处理的方法,主要分为两种:局端节点故障处理和用户端障碍处理。
1 局端节点故障处理
1.1 中继故障
1.1.1 查看光口情况
光口作环测试:lock lp/1 sdh/0
set lp/1 sdh/0 test type external(端口向外部打环,外部测试)
1.1.2 与传输联系查看光路情况
1.1.3 查看光口的发光、收光功率
1.1.4 如果光口损坏,更换端口
1.2 CP板损坏
1.2.1 一块CP损坏
判断板卡是否损坏:(1)节点机上的一块CP指示灯,红灯亮。(2)执行d fs,文件系统未同步。(3)执行d fs disk/*,此块disk为disable状态
操作:将此板卡拔出,更换新的CP,磁盘会自动同步。
1.2.2 两块CP同时损坏
判断:分别用两块CP单独引导节点重启,此节点都不能正常启动。
操作:将此节点的备份数据恢复到一个正常的节点上,然后使用此CP引导瘫痪节点,激活备份数据。
1.3 节点时钟不同步
对于PP15K,厂家规定都要采用BITS时钟接入,PP7K提取线路时钟,来保证全网的时钟同步。帧中继、ATM电路不要求时钟,而电路仿真则要求严格的时钟同步,时钟不同步将引起电路出现误码及滑码。
1.4 MSA板卡损坏
某块MSA上的用户都不能正常工作,有时板卡的红灯亮。(1)重新插拔此MSA板卡,如不正常,更换MSA板卡。(2)如仍不正常,进行CP主备倒换 (特别注意:此命令会使所有用户掉一下线,不要轻意做。)
2 用户端障碍
原则:发生用户电路故障时,按照先局内后局外,先本端后对端;先传输后系统,先硬件后软件,先重点后一般,利用网络资源,通过迂回、重建等工作进行恢复。
2.1 常用测试方法
2.1.1 端口作环
set lp/2 e1/1 test external(端口给用户做环,在用户端测试,3处打环是个软件环),此环是在处理障碍中常用的方法。)
(1)在3处端口用环线自环,保证端口正常。(2)在 2处打环,测试局端MODEM正常。(3)在1处打环,测试用户线路及用户端MODEM正常。
3 电路故障处理
3.1 ATM电路或帧中继电路
接到用户电话称电路不能正常通信,
①首先查看端口状态,假设端口为JLSPPP7K01 LP/13 E1/5 1>d lp/13 e1/*
如果端口为UP状态,说明端口状态正常;如端口为DOWN状态,像第6口那样,则为此端口没有正常接收到数据,即排查端口外的用户线情况,如2.1.1步骤的分段作环测试。首先找传输机房进行线路测试,如果确认线路没问题,就要查端口数据是不是配错。但是在最近一次障碍中,我们发现,端口UP状态,也不定说明线路就没问题,我市工行英城所,FRATM电路,2M光纤到户,用户端的光端机有线路告警,但在网管上查看端口正常;到用户端,首先把发光那根纤拔掉,端口正常,然后把收光那根纤拔下,把发光那根纤插上,端口为DOWN状态,最后换了一根收光的纤,恢复正常通信。此障碍说明单根纤有问题时我们在网管上也能看到通路是UP状态,容易误导我们处理障碍的思路。
②查看LMI本地管理端口
此端口LMI为不正常状态,问题出在本地,需查看:
·端口的DLCI与用户端路由器的设置是否相同,是否都采用相同的Procedures。
·E1端口采用的line type=ccs、crc4Mode=on、chan采用的timeslots的时隙
与MODEM的配置是否一致。
·如果是出省帧中继电路,为远端用户作硬件环,需要将协议去掉,即:
Set fratm/20 lmi procedures none,将协议置NONE。
4 实际工作总结
4.1 人寿保险公司帧中继电路
我们在给人寿保险公司开帧中继电路的时候,就遇到了很多困难:我们把MP猫接到5口上,6口起来,把猫接到6口上,5口起来,当时我以为是线接反了,于是与112对线,分段排查,最后确定线不但没接反,也没有任何问题。然后查口数据,口数据也没问题。在实在没有办法的情况下,我们开始查ATM交换机,最后在ATM交换机上找到了答案,原来是把5口的发接到了6口的收上,把6口的收接到了5口的发上了,这是当时施工队的一个小小错误,结果使我们开这条电路费了很多周折。
端口正常以后,开始调电路,用户要求的是点对多点的连接方式。结果在用户端调电路的时候发现,只能有一条电路通信,不允许有多条电路同时通信。我们首先想到数据做的不对,我仔仔细细地检查了数据,没有发现错误,然后查用户的路由器配置是不是正确,没有发现错误,我们求助于省网管中心,也没有发现错误,找北电工程师,还是没发现错误。无奈之下我们决定在局端模拟一个局域网,模拟完之后,跟在用户端的现象一样。我们又开始一步一步的查,最后查到IP地址,与用户又仔细核对,原来我们的工作人员把IP地址写错了,配到了同一网段,所以只有一条电路能通信。但是在用户端并没有配错啊,最后我们把我们的路由器拿到用户端,正常通信。可是换上用户自己的路由器又不好使了,最后请厂家人来,原来是路由器的串口坏了。更换路由器后,恢复正常通信。
这是一个非常典型的障碍,每一个障碍点的故障都不是很大,但却非常难找,通过这次障碍,我发现,处理障碍时,头脑必须清醒,而且必须一步一步的查,每一个地方都不能放过,最重要的一个发现就是在局端模拟用户端,一切都调通后,再拿到用户端,这样可以不用让用户等待,如果我们自己有问题,也能在第一时间尽快解决。
结束语
以上只是简单的介绍了ATM设备的维护和故障处理的方法,然而在实际工作中面对的问题是各种各样的,大家应采取灵活多变的处理方法和手段,在工作中不断积累经验、不断钻研,才能更好的保障通信网络的安全与畅通。
[1]通信工程师.信息产业部邮电通信人才交流中心,2007年6月.
[2]高新华,欧洋,马彦恒.ATM设备SNMP代理的设计与实现[J].无线电通信技术,2002-04-30.
[3]熊立人.ATM设备2000年问题探讨[J].电脑与信用卡,1999-01-15.