APP下载

交换机的系统结构与维护故障排查

2012-08-15毅,凌

湖南邮电职业技术学院学报 2012年2期
关键词:程控交换机软件

谭 毅,凌 敏

(长沙通信职业技术学院通信工程系,湖南长沙 410015)

随着通信技术不断发展,单一的语音信息不能满足人们的需求,这就要求通信运营商与开发商建立一个能提供更加丰富满足人们业务需求的通信网络,而交换机的作用在整个网络中尤为突出。当程控交换机在运行时出现系统故障,首先要对故障进行准确定位,找到位置;然后再对所出现的故障现象进行正确的分析判断,找出原因;最后对症下药,排除故障,让交换机恢复正常运行。由于程控交换机的迅速发展,现在已达到对程控交换机实行有条件的无人看守和集中管理的维护模式,以减少开支。这就要求维护人员有一定的专业知识并能掌握常用的维护方法。

1 交换机系统的体系结构及功能介绍

1.1 交换机的体系结构

采用间接控制方式的交换系统(包括程控交换在内)可分为两大部分:话路设备与控制设备。其中话路设备主要由提供接续通道的通话网络组成;控制设备集中接收、储存及分析用户的选择信号,控制通话网络接通。

有三种常见的交换机体系结构:纵横制式(cross-bar)、共享存储器(shared-memory)和高速总线(high-speed bus)。

1)纵横制式交换机

在机电式交换机中,最具有代表性、性能也较完善的是纵横制自动电话交换机。该交换机自诞生以来,在电话发展史上引起一次重大的改革,是它最先采用间接控制方式,其控制原理被当今最先进的程控交换机所采用。纵横制式交换机的输入/输出端口可以看作是几条在一些交点上交汇的街道。信息流量少时,数据在转发前不必存储,这称为“直接”传输。然而,当交点处繁忙时,纵横式交换机要求每个端口的输入缓冲器存储数据,这种情况称为“阻塞”。虽然它价格低廉,最早进入市场,但结构过于简单,无法有效地把低速接口(以太网和令牌环网)转换成高速接口(ATM和FDDI)。

2)共享储存器交换机

随着经济的增长和通信技术的日新月异,人们对获得信息的速度要求越来越高,所以在高速路由器中,采用输入排队机制的交换结构(crossbar)和共享存储器交换结构应用广泛。输入排队机制的交换机的优点是交换核心的速率与输入/输出速率一样,但存储器的利用率较低;共享储存器交换机把输入/输出缓冲器合并,使之变为一个全局缓冲池,交换机首先把输出的数据放在存储器中,然后发送出去。这种方式称为“存储—转发”。共享存储器交换机的优点是存储器利用效率很高,但要求核心速率要远高于各端口线速率,对于存储器运行速度要求很高。

3)高速总线交换机

高速总线交换机把ASIC连到一条高速数据总线上,在总线连接端口处,数据被转换成适合在总线上传输的标准格式后,由总线把它送至目的地。由于总线可以同时处理每个端口的全部传输,没有数据路径瓶颈问题,因此常被称为是一种“无阻塞”的交换机。下面就以中兴ZXJ10程控交换机为例详细阐述。ZXJ10的组成主要有硬件结构和软件结构两个部分。ZXJ10采用模块化结构,全分散的控制方式,可由一到数十个模块组成,根据不同的容量调整不同的模块与之对应。主要模块有:消息交换模块、中心交换网络模块、操作维护模块、近端外围交换模块、远端外围交换模块、分组交换模块、远端用户单元。ZXJ10的软件系统分为两个部分:前台软件和后台软件。前台软件主要处理接续和交换数据,包含了操作维护模块软件。后台软件只要执行人为输入的命令。

1.2 交换机的功能

通俗的讲,交换机具有物理编址、网络拓扑结构、错误校验、帧序列,以及流控的功能。目前,交换机还具有一些新的功能,如对VLAN(虚拟局域网)的支持,对链路汇聚的支持,甚至有的还具有防火墙的功能,还可以灵活的对网络进行增加、移动和改变,对网络广播流量进行控制。归纳起来可以用一句话表示:交换机能够帮助用户提高网络性能并简化网络的操作和管理。

2 交换机操作与维护

程控电话交换机是用计算机控制的实时信息交换系统,它由硬件设备和软件系统两大部分组成。由于交换机在复杂的环境中运行,外部信息是随机发生的,交换机内部要求实时处理,而且通信网络上的各类故障状态也会反应到交换机中。为保障交换机的安全、可靠的运行,采取必要的、行之有效的维护手段必不可少。通过日常的维护工作,有针对性地对设备的软件、硬件、运行环境等进行系统的排查。做到及时发现故障现象,分析故障原因、消除故障,从而保障设备运行状态良好。

2.1 日常维护的分类

按照维护目的的不同,可将设备维护分为例行维护和故障处理。2.1.1例行维护是一种预防性的维护,它是指在加电运行的设备的中由操作系统启动,之后将使用时间表自动启动预先定义的测试类型,能及时检查并纠正设备所存在的缺陷或隐患,是为了保持设备能够长期可靠、安全、稳定运行的维护,是一种预防性的措施。

2.1.2 交换机硬件和软件故障处理

故障处理是指在设备硬件或软件发生故障时,为保证设备正常运行和全程全网业务的运行,减少或挽回损失而采取的一种补救性措施。

2.1.2.1 硬件故障处理

1)硬件故障检测

在设计硬件电路时应包括硬件监督电路,硬件故障一旦出现,硬件监督电路应能立即检测出来,以避免故障扩散到其它部件单元。

2)硬件故障处理

当一个硬件故障被检测出来后,对于怀疑有故障的部件,其在总线上的接口禁止位要被设置,同时激活连接到每个处理机的系统故障线,与故障有关的其它信息和故障的位置被送到相应的告警寄存器中。

硬件故障处理进程激活后,先用诊断程序验证错误,对不可验证的偶发性故障,若不再重复出现,系统就会容忍它并重新启动该部件,但故障信息将会存到历史文件中去,同时故障处理进程将对错误进行统计,对于统计结果达到一定阈值的故障部件,不需要验证错误再次出现,系统就直接将该部件的状态置为不可用。对于确认的故障部件的状态也置为不可用,系统还根据故障类型以及对系统的影响,选择适当的恢复级别。故障信息同时传到操作维护终端盒历史文件中,告警也会出现在告警板上。故障消息包含被怀疑有故障的模块名,这样交换机现场或维护人员就能分析错误,准确定位故障位置,立即更换故障模块。

在报告故障的同时,系统状态分析程序也会接到有故障的通知,硬件故障处理进程还根据发生故障的不同部件以及故障的出现频率,采用不同恢复动作来纠正错误。

2.1.2.2 软件故障处理

1)软件故障检测

软件故障可由硬件设备检验出,如在基本处理机的访问控制部件中,用硬件电路来检查访问授权和内存区域的保护特性,用它监督对内存的存取操作是否被允许。但软件故障主要是由软件来检测,通常有以下几种软件设计方法:

(1)在程序设计时,利用程序设计语言本身提供的功能,如:利用编译程序的语法检查,避免程序中的结构、格式和语句的错误;

(2)采取防范性措施,对关键性的数据和错误易扩散的危险区域采用写保护方法,对采取访问进行检验,对无授权访问的不允许操作;

(3)用检查程序审查软件错误;

(4)用实时系统监督在固定时间周期内某些进程是否已经执行过,方法是设置字符串表,每个进程对应字符串表中的一位标志位,执行过的进程标志位为1,系统监督程序读标志位,若标志位已设置说明系统运行正常,否则就要采取补救措施。系统监督程序还判定一个进程是否处于死锁状态,它向进程发送一个消息并等待进程的响应,如果没有响应,就认为进程已死锁,有软件错误。

(5)用系统状态分析程序分析交换机系统中是否有多个处理机发生故障,硬件开关的设置是否有误,各部件单元的配置状态是否正确,若不正确则重设,使假错的设备可以再启动。系统状态分析程序是在使得系统处理能力降低的重配置后被启动的,或在固定时间间隔内周期性启动,也可以用人机命令启动和修改执行程序的时间间隔。

2)软件故障处理

软件故障不可能象它出现一样被自动修改,只能采取一些补救措施来消除错误的影响,而将错误报告提交给程序开发人员,供他们进行脱机的故障分析并修改错误,通过打补丁的方式,将修改后的软件送入正在运行的交换机中。

软件故障处理程序在启动后先分析故障现场情况,根据从中断处理程序传来的故障信息来判定错误类型以及故障定位。

为了确保恢复工作的有效性,软件故障处理程序必须保留故障统计信息,它要统计那些导致系统重启动的错误出现频率和执行恢复工作的频率,并监督在一定的时间周期内统计值是否超过预先定义的阈值,若超过就要恢复工作的级别并逐步升级。

2.2 维护实施方法

针对设备运行情况,实施不同的维护方法很有必要。设备的维护方法一般可分为正常维护和非正常维护。正常维护是指对设备运行状态进行仔细观察、测试和分析,从而做出相应的技术维护处理。非正常维护是指通过人为的制造故障发生条件,从而观察设备运行过程中元器件的性能和功能是否出现老化和性能不良。如检测某一模块功能时,通过对该模块实施人为干扰条件,再检测模块应有功能发挥情况,从而对模块的性能进行判断。

2.3 交换机日常维护注意事项

2.3.1 机房温湿度

如果机房内有温度计和湿度计就查看温湿度计,如果没有就查看后台告警界面上的环境信息,机房的温度范围是:15℃-25℃,湿度范围是:30%-70%,如果温湿度超过范围,应及时上报并记录。

2.3.2 检查交换机运行状态

l)查看后台服务器及维护终端界面是否有错误告警,界面切换是否准确及时,如有类似问题,应与本局技术人员联系,定位故障,或直接与厂家维护人员联系。

2)检查机架温度是否明显过高,机房是否有异味,机房环境可否符合本地要求。如有问题,应及时上报并记录。

3)检查前后台通信状况。查看告警界面是否存在通信中断;使用文件管理分别显示各模块MP文件,显示返回结果应准确、及时。如命令超时或返回结果较慢,检查原因或与厂家维护人员联系。

4)检查前台MP主备状态。在后台告警界面机架状态图中,点击备用MP后弹出状态图,多次点击“状态”按钮,观察状态显示是否准确及时。如超时或结果上报较慢,说明主备通信状态不正常,应与本局技术人员联系,定位故障,或直接与厂家维护人员联系。

5)查看后台服务器及各终端工作状态。在服务器及各操作维护终端上进行简单修改操作,命令执行是否准确及时,如不能正常使用,应与本局技术人员联系,定位故障,或直接与厂家维护人员联系。

6)测试告警上报状况。在维护终端上复位对业务无影响的某一单板(如备用SP板),看告警箱是否有相应声光告警,后台告警界面中,信息总览页面是否有相应告警条目,机架图是否显示相应告警色彩。如有相应现象则正常,否则有问题,应与本局技术人员联系,定位故障,或直接与厂家维护人员联系。

7)查看当前告警。后台告警界面中,选中某一模块,信息查询页面中“类别选定”为当前告警,“告警级别”选定为所有告警,点击开始查询按钮,结果显示是否有不正常告警,如有必须详细记录落实,应与本局技术人员联系,定位故障,或直接与厂家维护人员联系。依此方式查询所有模块。

8) 查看前一天历史告警。后台告警界面中,选中某一模块,信息查询页面中“类别选定”为历史告警,“时间设定”为前一个24小时,“告警级别”选定为所有告警,点击开始查询按钮,结果显示是否有不正常告警,如有必须详细记录落实。应与本局技术人员联系,定位故障,或直接与厂家维护人员联系。依此方式查询所有模块。

3 总结

随着经济的快速增长、通信技术的日新月异,极大地推动和刺激了通信行业的发展和进步。人们对通信的要求不仅是通信网络中信号的稳定、可靠,还要能满足人们对不同业务的获取。而交换机在通信网中起着不可替代的作用,交换机安全、稳定和可靠地运行是通信信号稳定、可靠和人们获得业务的基本保证。其体系结构从纵横式到共享存储式到高速总线式,经历了漫长而曲折的过程。不管采用什么结构体系的交换机,一旦投入使用,就要求其在通信网络中能不间断的进行工作,保障通信不中断,所以对交换机的日常维护和外部环境的监控是维护人员要高度重视的长期而复杂的工作。

[1]张文冬.程控数字交换技术原理[M].北京:北京邮电大学出版社,1994.

[2]沈金龙.现代电信交换和网络[M].北京:人民邮电出版社,2001.

[3]黎连业.交换机及其应用技术[M].北京:清华大学出版社,2004.234.

[4]陈维言.电话交换技术[M].北京:人民邮电出版社,1995.78. .

[5]叶敏.程控数字交换与交换网[M].北京:北京邮电大学出版社,2003.96.

[6]李大来.S1240程控交换机操作与维护[M].北京:人民邮电出版社,1994.204.

[7]张曙光,李茂长.电话通信网与交换技术[M].北京:国防工业出版社,2002.105.

[8]索红光,王海燕,赵清杰,于峰,石乐义.现代通信技术概论[M].北京:国防工业出版社,2005.24.

猜你喜欢

程控交换机软件
禅宗软件
软件对对碰
基于Multisim10和AD603的程控增益放大器仿真研究
修复损坏的交换机NOS
使用链路聚合进行交换机互联
程控增益射频宽带放大器
基于STC89C52的程控移相器的设计
PoE交换机雷击浪涌防护设计
谈软件的破解与保护
一种程控功率因数可调开关电源设计