C&C08交换机故障案例分析
2011-08-15张淑艳
张淑艳
(中国铁通通化分公司,吉林 通化 135001)
1 引言
程控交换机一旦出现故障就需要网络管理人员快速准确地查找和排除故障,本文就日常维护遇到的问题和处理经验加以归类,以便在以后出现类似故障时能更快的解决故障,使交换设备更加稳定。
2 交换机故障如何分类
2.1 故障如何分类
程控交换机是由计算机控制的实时交换系统,它主要由硬件系统和软件系统组成。所以交换机的故障可分为硬件故障和软件故障。
2.1.1 硬件故障一般有交换机电源、背板、模块端口、用户系统故障等
(1)中心模块故障:硬件单板故障;内部连线错误;时钟连线错误。
(2)交换模块故障:单板故障;内部连线故障;NOD/HW配线故障;内部光纤接反。
(3)用户系统故障包括外线故障和内线故障,其中外线故障有断线、混线、接地、话机故障。内线故障有用户板损坏和交换机数据错误。
(4)电源故障。如果面板上的POWER指示灯是绿色的,就表示是正常的;如果该指示灯灭了,则说明交换机没有正常供电。这类问题很容易发现,也很容易解决,同时也是最容易预防的。另外要保证地线良好,还要检查保安器是否正常,否则在雷雨天发生故障小到几个用户大到整个模块或配线架。一般硬件故障的排除要经过下面阶段根据告警进行故障分析;检查相关的硬件配线;倒换单板、更换单板;与华为技术人员联系。
2.1.2 交换机的软件故障
交换机的软件故障是指系统及其配置上的故障,它可以分为以下几类:
(1)系统错误。交换机系统是硬件和软件的结合体。在交换机内部有一个可刷新的只读存储器,它保存的是这台交换机所必需的软件系统。这类错误和我们常见的 Windows、Linux一样,由于当时设计的原因,存在一些漏洞,在条件合适时,会导致交换机满载、丢包、错包等情况的发生。所以交换机系统提供了诸如Web、TFTP等方式来下载并更新系统。
(2)配置不当。对于新开端局,网管人员为了放号方便会一次性把所有电话号开放。端口被错误地关闭,对于无效用户不删除而是做成停机状态,另外交换机和网卡的模式配置不匹配等原因。这类故障有时很难发现,需要一定的经验积累。
2.2 故障处理与分析
案例一:
(1)现象描述。32模用户模块一机架行灯亮黄灯告警,但告警台上无指示,观察机架单板运行指示灯显示正常,更换告警灯、级联线等均无法找出灯亮原因。
(2)原因分析。告警灯亮说明有电经过构成回路,应逐段查找电的来源,并结合告警台上无指示这一现象进行分析。
(3)处理过程。①将用户板拔出,告警灯亮且台上有告警;将二次电源级联告警线拔出,告警消失,插上又告,说明告警电源来自二次电源板PWX,量二次电源板后电压约为11 mV。理论上,电压为零,告警灯就不会点亮,遂用比较法量其他正常的二次电源板后电压约为0 V;②将二次电源板PWX掉电插拔,开电,再量板后电压约为0 V,接上级联告警线,黄灯灭,故障恢复,同时,告警台上也有相应显示。
(4)建议与总结。二次电源板PWX接触不好导致行灯告警且告警不上报,同时面板灯又显示正常,给故障定位、查找增加难度。所以解决问题应冷静分析,从多方位考虑、分析故障可能出现的原因,认真测量测试以定位确切的故障点。
案例二:
(1)现象描述。铁通辉南经营部交换网是端局站,该局忙时发现振铃早释达20%,用户忙占20%,应答率只有40%。
(2)原因分析。通过数据检查发现有大量欠费、呼入受限、外线故障、被叫停机作了无应答信号的送音处理,产生了大量的振铃早释。
(3)处理过程:①要求网管人员开放欠费用户所有呼入权;②做欠费的失败处理送被叫欠费通知音,避免用户重拨;③对于外线故障做新业务无条件前传,同时要求维护人员尽快处理;④由于该局一直在扩容,有近1 000左右的用户数据已作,但相应的 RSA点却暂未开通,用户都处于故障态,呼入时回送LOS消息,对局听忙音;与用户停机一样,容易造成恶性重拨。同时做失败处理,对停机用户和故障用户中继送语音提示,避免恶性重拨;⑤删除未放号的用户数据。
3 结束语
由于故障多样不能一概而论,所以要具体问题具体分析,这就需要日常维护人员要有较高的维护水平,要想达到较高水准,维护人员除了要加强学习,还要在故障处理过程中能很好地掌握故障处理的方法、步骤,并能灵活、有效的运用,总结经验,只有善于总结经验,善于发现问题和解决问题,不断提高维护工作效率和维护水平,才能取得用户的信赖,电信运营商才能取得更多的利益。
1 袁春生.C&C08数字程控交换机工程师培训手册.深圳华为技术有限公司,1999
2 杜海源.现代交换原理[M].北京:人民邮电出版社,2003