VCS3020系列语言通信交换系统席位无线按键失效的研究与分析
2020-11-04陈勇
陈 勇
(民航华东空中交通管理局技术保障中心,上海 200335)
1 现状及问题
VCS3020系列语音通信交换系统是欧洲公司出产的一种全数字无阻塞的数字语音通信系统。该公司一直从事生产可靠性和安全性要求非常高的用于大型民用和军用空中交通管制中心的语音交换通信系统。语音通信交换系统(Voice Communication Switching System),民航内部简称为内话系统。它实际上是一种专用的交换机,可以接入无线电甚高频/高频设备、各类电话设备、网络设备,同时提供触摸屏席位(OP),上有3D模拟的按键,管制人员通过按下这些按键操作各个无线设备与飞行机组通话(地/空通信),操作电话设备与其他空管部门管制人员进行协调(地/地通信)。由于民航空管的工作特点,因此对设备的实时性可靠性要求比较高。
VCS3020语音通信交换设备版本很多,是一个系列,但是它们的系统框架都是一样的,只是在一些具体的板卡上有改进。VCS3020系列设备的硬件结构是一个以交换模块为中心的星型拓扑结构。交换模块由两套子系统Syetem A和System B组成。 无线(Radio)有线(Telephone)接口和席位(OP)通过外围处理接口(GPIF)连接到两个核心交换系统A和B。
交换模块内部结构分为A、B两个子系统,每个系统由CIF板,JIF板还有数据总线构成。CIF板位于数据总线的一端,控制数据总线的运行,JIF板挂在数据总线下,通过四芯的PCM电缆与接口机框(drawer)和席位相连。每块CIF板控制一条数据总线,每条数据总线下挂最多15块JIF板。根据用户的需求每个子系统中最多可以有8块CIF,控制8条总线。CIF板之间也有一条总线,带宽622MB/s,用于数据总线之间的数据交换。在A、B系统的CIF板之间有数据同步和时钟同步数据传输。交换模块的A、B两个子系统结构功能完全相同,同时运行,互为冗余备份。
图1 席位、接口机框与JIF板连接示意图
JIF板与席位和接口机框的连接如图1所示,每块JIF板有8个PCM电缆接口,席位触摸屏(TED,touch equipment device)连出两条PCM电缆分别接入A、B两个子系统的两块JIF板,接口机框(drawer)左右两端各有一块外围处理板(GPIF),每块GPIF板连出两条PCM电缆分别接入A、B两个系统的两块JIF板,即每个接口机框有四条PCM电缆和中央交换模块的JIF板相连。
从上述框可以看出VCS3020系统有两套独立运行的交换系统,信号和数据分布处理,每套交换系统连续运行并有相同的优先级,如果某一系统发生故障,信号和数据可以走另外一路。外围话音和数据具有多重链路,可以确保将某一部件故障影响控制在最小范围内。
经过多年的运行考验,VCS3020系列设备的可靠性是很不错的,但近期有技保部门反映在管制员使用过程中席位触摸屏上有时一些无线按键会突然失效,影响管制指挥,存在安全隐患。笔者所在部门最近刚好安装了一套VCS3020X系统,该系统还没有正式投入使用,正好可以用来测试一下,看看故障是否能模拟出来,同时分析故障产生的原因
2 测试方案与测试过程
在了解了其他技保部门所反映的故障信息后,笔者设计了模拟故障的方案。首先将交换模块系统A的一块JIF板拔出,观察安装于监控室的席位op17、op18的状态,触摸屏各个无线按键及各个无线板的工作状态是否有异常,使用操作是否正常,监控系统TMCS上的告警信息是否有异常。然后再将席位的a、b两路PCM电缆分别拔出观察席位状态,重复几次观察状态的不同。
查阅技术手册,无线接口机框RIF01连出的四根PCM电缆分别接到系统A的JIF1a的两个接口和系统B的JIF1b的两个接口上。席位op17、op18则是接在JIF4a和4b上。当拔出系统A的JIF板1a时,监控系统TMCS上有JIF1a的连接(connection)告警,RIF01的两块GPIF a路(connection)告警。两个席位状态正常操作正常,席位op18上所有接在无线接口机框RIF01上的频率按键从灰色变成白色,按下无反应已经按键失效。席位op17上所有RIF01机框上的频率按键则在灰色白色之间不停地变化,即按键从正常的灰色变成失效的白色,几秒钟后再变回灰色然后再变成白色,然后再变成灰色,白色不停。根据以上现象分析,可能是该系统的席位和无线接口机框虽然同时连接到A、B两个系统,A、B两系统也同时在运行,但实际上信号只在某一路系统中传输或是说完整的传输。当JIF1a拔出后,RIF01机框就只连接到系统B,op17、op18虽然各有两根PCM电缆分别连接系统A、B,但op18话音数据开始走于系统A,RIF01只连在系统B上,连不到系统A,所以在op18上RIF01上的按键就是失效的。op17的状态就比较奇怪,RIF01上的按键在灰色和白色之间不停的变化,好像是在切换,但切换不成功又切回来。拔掉op17连接系统B的PCM电缆强制席位信号数据走系统A后RIF01的按键变白失效,再插回B路PCM电缆后RIF01上的按键一段时间后就恢复成正常的灰色,操作也正常了,好像切换成功,再拔掉a路PCM电缆,RIF01的按键状态正常,工作正常。这时拔掉op18a路PCM电缆,强制op18的信号和数据走系统B,RIF01的按键也恢复状态正常。将席位的PCM电缆和JIF1a插回,等重启完成告警消失后再次拔出,这次op17、op18上RIF01上的按键状态都正常,因该是经过前面的操作op17、op18的信号数据都走在系统B上,拔出JIF1a系统A与RIF01的链接则被强制中断,但和席位的信号数据交互并没有影响。其后又进行了多次相同的模拟故障操作,席位上按键的状态变化都上述类似。
3 分析与结论
VCS3020系列语音通信交换系统是一个全数字无阻塞的冗余双系统独立并行运行的先进的语音交换系统,共享资源的双重配置,具有多重话音数据通道,容错的星型拓扑结构,分布处理各种通信业务,有很高的可靠性。但也正是由于其双系统独立运行,两套系统之间只有时钟控制数据同步信号交互,信号和数据虽然也在两套系统中同时传输,但席位正好在两套系统的交叉点上,为避免冲突,只能从一套系统收发信号数据,当其出现故障时再切换到另一套系统上。如果接口机框和席位收发信号数据不在同一系统就会连不通,这也就是为什么当一路JIF板拔出后,席位op18上出现RIF01按键失效的现象。
至于为什么在同样拔出一块JIF板,部分影响RIF01机框的连通的模拟故障情况下,在两个席位上RIF01的按键状态却有不同,并没有一个令人信服的解释。笔者在模拟故障恢复过程中发现两个席位从故障中恢复时间有较大的差异。在将席位的PCM电缆拔出后再插回的过程中发现席位op18在PCM电缆插回后27秒显示PCM连接恢复,59秒按键恢复正常;席位op17则是在PCM电缆插回2分03秒PCM恢复,2分40秒按键恢复。两个席位硬件上没有区别,维护人员可设置的参数也相同,这种差异只能是其系统内部不同造成的,可能两个席位的内部优先级不同,也可能与席位当时的工作状态有关,具体的原因还要咨询厂方的技术人员。