APP下载

地铁车辆MVB 网络故障分析及解决措施

2021-10-09张晓杰

上海节能 2021年9期
关键词:网络故障寄存器管理器

张晓杰

上海轨道交通设备发展有限公司

0 引言

上海地铁11号线自开通运营以来,发生过因列车MVB 网络瘫痪导致的清客或救援事件。上海地铁5 号线也曾多次发生因网络不稳定的情况,HMI的网络界面不定期出现设备故障或离线的状态。其他城市的轨道交通也发生过此类问题。因列车网络风暴发生的频率低,且故障不可复现的特点,给故障原因的分析带来了巨大挑战。经过长时间的深入调查和分析,找到了故障发生原因,并提出了相应解决方案。

本文进一步阐述MVB网络通信原理、网络故障实例,以及如何避免网络故障的技术措施。

1 MVB网络通信原理

列车控制与监视系统的MVB 实时通信协议基于IEC61375标准[1,2]。采用EMD电气中距离介质,传输速率为1.5 Mbps,每段允许的设备数量最大可达32 个,传输距离可达200 m,其基本的通信原理如下:

1.1 周期轮询

在MVB网络总线拓扑中,通常会设置一个总线管理器(BA),也称主设备,一般由列车控制与监视系统TCMS 中的主控制器VCU 担任,控制整个MVB通信过程。

总线管理器对设备端口进行周期轮询,将轮回的时间分为固定时间片,称为基本周期Tbp。基本周期范围:1.0 ms≤基本周期≤2.5 ms。其中每个基本周期包括4个阶段。

● 周期阶段,用于过程数据传输。

● 监管阶段,用于网络管理器监控各MVB 子设备和传递管理器权限。

● 消息阶段,用于消息数据传输。

● 空闲阶段,预留一定时间,用于保证下个基本周期的正确开始。

基本周期的4个阶段见图1。

图1 基本周期的4个阶段

在MVB 总线正常运行前,要建立端口参数值及主设备读端口的顺序,定义每个端口特征周期。为了总线同步,特征周期T_ip(i)= T_bp× 2n ,n=(0~10)。特征周期不应超过1 024 Tbp。主设备在特征周期T_ip内轮询每一个周期数据,按照周期扫描表发送一个预先定义好的主帧序列,最长的特征周期叫宏周期,最大不超过1 024 ms。

1.2 数据交换

当主设备周期性地发送一个过程数据请求主帧报文(Process_Data_Request)时,相应的唯一一个源设备响应主帧,该设备读取其源缓冲区的内容,并用一个不可分割的操作将此内容以从帧报文(Process_Data_Response)发送。如果主帧报文中的F_code 指定帧长度不同于该逻辑地址设置的长度,设备将不响应。该从帧报文可被一个或多个宿设备接收。接收过程数据的宿设备,当其标识符出现在Process_Data_Request 中时,用一个不可分割的操作将在总线上接收到的帧的内容存储到相应缓存区并覆盖掉缓存区的先前内容。仅总线管理器可发送主帧报文,所有其他的MVB 设备必须遵循MVB 网络管理器的轮循访问。MVB 数据的交换严格按照从帧报文跟随主帧报文的形式执行。过程数据报文如图2所示。

图2 过程数据报文

2 MVB故障机理及实例

2.1 MVB网络故障机理

MVB网络为共享介质的通信网络,即所有的数据都将在同一个物理层线路上进行传输。这就必须保证所有的设备都按照规定的协议传输数据[3]。否则,一旦有某一个设备或多个设备出现故障不按照协议传输数据时,整个MVB 网络将出现异常,甚至瘫痪。

MVB设备的通信受环境影响,比如超出工作温度范围、电磁干扰(EMI)、供电质量等。如果MVB设备所工作的环境超出了适用范围,可能会发生通信故障等问题,也可能导致MVB控制器的寄存器内容和通信存储器的数据丢失,甚至导致MVB网卡电子部件硬件的损坏。

MVB 网卡内部寄存器和存储器的数据丢失,或者硬件损坏将导致MVB设备的故障。MVB数据将无法发送和传输。设备与MVB 总线的通信中断,其故障对于总线上其余网络设备的MVB 通信没有影响。

但通常情况下,通信数据混乱不是因为发送和接收参数丢失,而是这些参数被修改,导致了非法的MVB传输。相对于丢失参数和通信中断,这种情况下故障的MVB设备将会干扰网络通信。

比如当网络管理器发送过程数据请求主帧后,正常的设备A 将响应从帧,如果此时故障的某一个设备B 也同时响应从帧,则出现双从帧故障。当两个从帧报文叠加在一起时,该报文将无法被识别,那么设备A的通信也将受到干扰。

2.2 故障实例

2.2.1 MVB网卡故障

上海11 号线列车发生了多起空调控制器的MVB 网卡模块(PC104 卡)故障和一起制动系统网卡模块(PC104卡)故障,具体情况如下:

●两次故障引起MVB网络完全瘫痪

●多于两次故障引起MVB网络部分系统故障

在所有的故障案例中均发现MVB 接口模块上的芯片有高温灼伤痕迹。如图3所示。

图3 MVB接口模块上芯片高温灼伤

2.2.2 MVB连接器问题

1)MVB线缆接线问题

由于MVB 电缆的接线问题而引起的MVB 故障比较多,每次网络故障时,均出现类似的故障状态,部分子系统受到持续的短暂影响,导致列车限速运行。

经调查后发现,在多个设备上的MVB插头都出现了不规范的接线,有的电缆线芯触碰到了MVB插头的外壳导致接地,有的电缆则连接松动,接触不良,如图4所示。

图4 MVB连接器接线问题

2)MVB连接器内阻抗处理不当

因近期项目的MVB 网络连接器大多采用HARTING 公司的D-SUB MVB 专用连接器,其电路图见图5。

图5 MVB连接器电路图

终端电阻包含在连接器内,当设备在整个网络中处于中间设备时,连接器内的BRA 和BRB 需要剪断;当设备处于每段网络的终端时,A线连接器内的 BRA 需保留,BRB 应被剪断,而 B 线连接器内的BRB需保留,BRA应被剪断。保证终端电阻和线路阻抗匹配。

如果电阻配置不当,线路阻抗和终端电阻不匹配,则会影响网络信号的传输。

3 避免网络故障的措施

通过MVB一致性型式试验、采用供电稳压电路的MVB板卡、MVB看门狗功能、标准的MVB接线工艺、网络检查等措施,可以避免MVB网络故障。

3.1 MVB一致性型式试验

为保证MVB 网络的可靠通信,所有接入MVB网络的微机控制单元,在装车前均应由其供应商负责对MVB 通信部分进行一致性试验[2]。该试验的目的是验证被测试的MVB 设备是否符合相应的要求和标准。通过这些测试,可以规范设备的机械和电气设计,确定数据输出波形、接收信号的能力以及系统整体表现是否符合TCN 标准。因此可以有效避免由于设备的设计不符合TCN 通信规范而导致的MVB故障。

3.2 提高设备的抗干扰能力

在上述案例中发现PC104 网卡有不同程度的灼伤痕迹。经调查发现,空调控制板提供给PC104网卡的5V 供电电源(额定值:4.75~5.25 V)出现16.1 V的尖峰电压。

由于控制板的供电出现很高的EMC干扰,导致PC104 网卡完全损坏或者部分芯片受损。因此对PC104网卡进行了硬件升级,以提高自身的抗干扰能力[4]。网卡版本从S25659-B2231-A140更新为S25659-B2231-A142。

3.2.1 增加网卡供电稳压电路

对网卡的5 V 输入电压增加了额外的稳压电路。5V输入电压稳压电路见图6。

图6 5 V输入电压稳压电路

3.2.2 增加引脚抗干扰元件

对所有的地址总线、数据总线和控制总线增加瞬态抑制二极管和电阻(见图7),增强引脚的抗干扰能力。

图7 引脚增加抗干扰元件

3.3 看门狗功能

看门狗功能是避免MVB 网络故障的主动性措施。当设备(主应用程序) 检测到MVB 网卡的故障时,将激活看门狗功能,使MVB网卡停止工作。

MVB控制器在完成初始化后,仅能基于存储在通信存储器中的参数与通信存储器进行数据交换。因此,MVB控制器无法验证自身寄存器的设置以及通信存储器内部数据的完整性。

因此在MVB 控制器完成初始化后,主机应用程序(主CPU)必须监测MVB 控制器的寄存器内容和通信存储器内部数据的完整性。当主CPU检测到相应问题时,MVB 网卡激活看门狗功能,保证该网卡停止接收和发送数据,与MVB 网络进行有效隔离,从而不影响其他MVB 设备的正常通信。

3.3.1 看门狗计数寄存器

对于使用西门子MVB PC104卡或MVBCS1芯片[6]的应用都可以且必须启用看门狗功能。在MVBCS1 芯片中设置有1 个16 位的看门狗计数寄存器,见图8。

图8 看门狗计数寄存器

在激活看门狗功能后,主CPU 需周期性写入一个非“0”值到看门狗计数寄存器。该寄存器的数值将自动递减(根据TB 值,每1 ms 或每32 ms递减)。

因此,当主CPU持续给看门狗计数寄存器写入非“0”值时,可保证该计数器始终为非“0”状态。如果出现故障情况,或主CPU 检测到相应故障,则主CPU停止“喂狗”操作,也即停止给看门狗计数寄存器写值。当看门狗计数寄存器的数值降为“0”时,将触发看门狗功能,此时MVBCS1芯片将停止接收和发送数据。

3.3.2 触发看门狗的故障

对于使用MVB PC104卡或MVBCS1芯片的应用而言,西门子提供了API 函数[6](应用程序接口)。API 函数需写入主CPU程序中,并且可支持过程数据,消息数据和控制数据。应用系统所执行的API函数示例见图9。

图9 开门狗API函数示例

在MVBIdle()函数中,将有8 个返回值体现故障。

●通信存储器未初始化

●MVBC芯片在复位模式

●MVBC芯片在初始化

●通信存储器中的端口索引表(PIT)与配置不一致

●通信存储器中的某一个端口的大小设置与配置不一致

●通信存储器中的某一个端口的数据类型设置与配置不一致

●MVBC 的寄存器的内容在下一个地址中未镜像

●MVBC 的寄存器的内容在配置运行后产生了更改

当上述故障发生时,主CPU需要在函数MVBCRetriggerWd()停止触发看门狗(停止写入非零值到看门狗计数寄存器)。

3.4 增加网络通信检查

按照规范的MVB连接器制作工艺完成MVB线缆接线,使用FLUKE DSX5000 线缆测试仪检查MVB线缆的线缆拓扑、特性阻抗等特性是否超标[5]。MVB线缆检查见表1,MVB通信质量检查见表2。

表1 MVB线缆检查

表2 MVB通信质量检查

通过TCN 协议分析仪接入MVB 网络,在网络没有人为干扰(接设备、断电等)的情况下监视并记录MVB 总线数据10 min,连接电脑打开分析仪软件选择MVB 分析功能。通过协议分析仪进行端口扫描、周期扫描、丢帧错帧统计、AB 线状态监视等测试。

4 总结

由于列车控制与监视系统在轨道交通车辆中的重要性,MVB网络的稳定与否直接关系到运营效率,在设计中应尽量避免网络风暴发生。预防网络风暴(网络故障)的措施如下:

1)接入MVB 网络的设备在装车前均须通过MVB一致性型式试验;

2)增强MVB网卡自身抗电磁干扰的能力;

3)启用各MVB控制单元的看门狗功能;

4)规范MVB接线工艺,排查终端电阻阻抗匹配情况,并进行相关的线缆及通信质量检查;

5)列车采用硬线紧急牵引功能。为了最大可能降低清客救援事件,提高运营质量,车辆设计时可实施硬线紧急牵引功能作为备份,即当列车发生整个MVB网络故障无法动车时,可使用列车硬线牵引功能达到动车的目的。

猜你喜欢

网络故障寄存器管理器
启动Windows11任务管理器的几种方法
应急状态启动磁盘管理器
Lite寄存器模型的设计与实现
常用电子测速法在某数字信号处理器中的应用*
移位寄存器及算术运算应用
计算机网络几种典型故障的处理及维护方法
用好Windows 10任务管理器
在Win 7下利用凭据管理器提高访问速度等