多接口模式下的数字电路专网故障排查及其处理对策
2015-05-30贾卫平马晓悦
贾卫平 马晓悦
【摘要】 本文以多接口模式下的数字电路为依托,介绍了网络故障排查和解决的基本方,并以E1-E1接口为例详述故障处理步骤,从而为普遍情况下的数字电路专网故障排查和处理提出相应策略。
【关键词】 数字电路专网 网络故障排查 解决方案
一、前言
数字电路专网是指用户租用以2M带宽为单位的SDH、PDH、MSTP线路组建的专网,传输线路采用E1(G.703)、V.35、CPOS接口与用户路由器对接。一般情况下运营商承担传输线路DCE线缆(数据传输线缆)网络接口以上部分的维护,路由器/交换机的DTE线缆(数据终端线缆)以下部分的维护主要由用户承担,运营商配合处理。
二、查找故障的基本方法
在处理故障时,一般应遵循一“查看”、二“询问”、三“思考”、四“动手”的基本方法。
(1)查看。首先到達现场后查看出现故障的现象,即查看设备的哪一部分出现故障,有何种告警产生,严重程度如何,造成多大危害等,才能透过现象看本质。
(2)询问。观察完现象后,应询问各阶段现场人员,是何种原因造成了此故障或者,比如是否有人修改了数据、删除了文件、更换了单板、停电或雷击、误操作等等。
(3) 思考。问明情况后,透过现象、原因等,根据自己的知识作思考、分析,判断何种原因可能引起该种故障等,作出较为正确的判断。
(4) 动手 。根据前面三个步骤找出故障点,通过修改数据、更换单板及芯片等手段解决、排除故障。
三、排除故障的基本原则
故障排除的基本原则:应遵循“先抢通后修复、先外部后传输、先单站后单板、先线路后支路、先高级后低级”的原则。
(1)在出现故障时,系统维护者要首先抢通业务然后进行故障修复。
(2)在定位故障时,应先排除外部的可能因素,如光纤断、终端设备故障或电源问题等,再考虑设备的问题;
(3)在定位故障时,要尽可能准确的定位出是哪台设备的问题,再将故障定位到单板;
(4)群路板的故障常常会引起支路板上的异常告警,因此在故障定位时,先考虑群路,再考虑支路;
(5)在分析告警时,应先分析高级别告警,再分析低级别告警。
四、解决故障的基本方法
(1)观察分析法。当系统发生故障时,在设备、网管或命令行上将会出现相应的告警信息。通过观察设备上的告警灯运行情况,可以及时发现故障;当故障发生时,网管上会记录告警事件和性能数据信息,通过分析这些信息,就可以初步判断故障类型和故障点的位置。
(2)环回测试法。当通过观察法不能解决故障时,我们可以考虑用逐段环回法来排除故障。在进行环回操作时,应该先将故障业务通道的业务流程进行分解,画出业务路由图,将业务的源和宿,经过的网元,所占用的通道和时隙号罗列出来。然后逐段环回,定位故障网元。故障定位到网元后通过线路侧和支路侧环回基本定位出可能存在故障的单板。最后结合其他处理办法,确认故障单板予以更换排除故障。
(3)插拔法。对最初发现某种电路板故障时,可以通过插拔或拨动外部接口插头的方法,如尾纤、同轴头、转接插头等,排除因接触不良引起的故障。但是一般不建议遇到问题马上就插拔单板,因为这样有可能忽略掉故障的真正原因,并且对下一步排除故障原因,带来影响。
(4) 替换法。替换法就是使用一个工作正常的物件去替换一个被怀疑工作不正常的物件,从而达到定位故障、排除故障的目的。这里的物件,可以是一段线缆、一块单板或一个设备。 替换物件,也可以替换线路,将正常的线路与故障的线路进行替换,用以缩小故障范围。
(5) 仪表测试法 。仪表测试法表测试法指采用各种仪表,如误码仪、光功率计、光时域反射仪、SDH分析仪等来检查传输故障。一般用于排除传输设备外部问题以及与其它设备的对接问题。例如:用2M误码仪测试业务通断、误码;用万用表测试供电电压,检查电压过高或过低问题。
五、故障处理步骤
数字电路专网根据所提供网络接口的不同主要划分为以下几类:E1-E1、V.35-V.35、E1-V.35、CPOS-E1/V.35。以E1-E1为例,故障处理步骤如下:
假设用户节点B线路出现故障,A点路由器所对应的B点WAN口为S0/0,处理步骤如下:
步骤1:查看局端、用户端设备是否掉电。如果供电正常,进入步骤2;
步骤2:查看局端PDH光端机LOS灯(光路指示灯)是否告警。如果LOS灯告警(红),检查并修复光路。如果LOS灯正常(绿),进入步骤3;
步骤3:看局端PDH光端机LOF、AIS、E-3、E-6等常用告警指示灯是否异常。若无告警进入步骤4;
步骤4:开始环回测试。在B点将PDH光端机DCE线缆的BNC接头使用2M对接头进行对接,即对整条线路进行硬环回测试。在A点的路由器查看S0/0端口状态。A点路由器配置模式下输入Show interface s0/0,如果显示Serial0/0 is up,line protocol is down(looped),则说明传输线路状态正常,用户检查路由器配置或硬件是否正常。
如果显示Serial0/0 is up,line protocol is down,进入步骤5;
步骤5:在B点通过PDH光端机的拨码开关对远端(即A点)进行软环回测试,A点路由器如果显示Serial0/0 is up,line protocol is down(looped),则故障点可定位于B点PDH光端机与用户路由器之间连接的DCE电缆。检查同轴电缆及两端BNC接头。
如果显示Serial0/0 is up,line protocol is down,则按照步骤4、步骤5的环回测试方法逐级向上排查,直至找到故障点。
以上是E1-E1接口组网方式的故障处理步骤,其它类型接口的故障可参考该步骤排查。
六、小结
总之,在处理故障的过程中,我们一定要透过故障的表象找到其本质,才能实现故障的准确定位并迅速排除。这就需要我们了解故障定位的基本原则,明确故障处理的思路,掌握常见的故障处理方法,从而从容应对各种异常现象,提高故障处理的效果。
作者简介:
贾卫平,男,1981年4月生,陕西商洛人,本科学历,陕西广电网络传媒(集团)股份有限公司,数据业务运营公司集团销售部总监,工程师。
单位地址:西安市曲江行政商务区曲江首座大厦,邮编 710061
联系电话:87991134
马晓悦,女,1987年11月生,陕西西安人,博士研究生,西安电子科技大学经济与管理学院,讲师。