APP下载

MIL?1394B总线故障隔离方法研究和实现

2019-07-08张振刚

现代电子技术 2019年13期
关键词:端口总线组件

张振刚

摘  要: MIL?1394B总线在国内外航空电子系统中应用越来越广泛,而MIL?1394B总线采用菊花链的物理层,单个节点的复位故障会导致整个网络的复位扩散,使整个网络不能正常通信。针对MIL?1394B总线在综合化航空电子设备的应用中故障难以隔离,提出一种通过先验信息隔离故障的方法。首先分析复位故障的原理,从而结合MIL?1394B总线在航空电子系统中预先分配节点号的先验信息,获取、分析AS643总线的SELF?ID包建立链接的信用值机制,设计一种检测信用值的方法,并改造节点的硬件设计,使节点链接的信用值低于阈值后可关闭错误链接,从而实现MIL?1394B的网络故障检测和隔离。该设计方法和机制通过实物系统进行验证,可用于高度综合化的航空电子系统中。

关键词: MIL?1394B总线; 航空电子系统; 错误检测; 故障隔离; 总线网络; 复位扩散

中图分类号: TN915.04?34; TP336                    文献标识码: A                 文章编号: 1004?373X(2019)13?0015?04

Research and implementation of MIL?1394B bus fault isolation method

ZHANG Zhengang

(Southwest China Institute of Electronic Technology, Chengdu 610056, China)

Abstract: MIL?1394B bus is widely used in avionics system at home and abroad, but it adopts physical connecting mode of chrysanthemum chain, whose reset fault of a single node will lead to the reset diffusion of the whole network and the communication abnormality of whole network. Since the fault of MIL?1394B bus is difficult to isolate in integrated avionics device, a fault isolation method using prior information is proposed. The principle of reset fault is analyzed, and then the prior information of node number in avionics system is pre?assigned in combination with MIL?1394B bus to acquire and analyze SELF?ID packet of AS643 bus, and establish the mechanism of link credit value. A method of detecting credit value is designed, and the hardware design of node is reformed to close the error link while the credit value is lower than the threshold, which can realize the fault detection and isolation of MIL?1394B network. The designed method and mechanism were verified by a physical system, and can be used in highly?integrated avionics system.

Keywords: MIL?1394B bus; avionics system; fault detect; fault isolation; bus network; reset diffusion

0  引  言

航空电子系统已经从传统的联合式架构逐步演进到先进的综合化架构、高度综合化架构。随着综合化程度不断提高以及机载传感器技术的发展,航空电子系统对作为系统关键技术之一的机载总线网络也提出了新的要求,早期的MIL?STD?1553B,ARINC429等总线技术已经无法完全满足高带宽、低延迟和高确定性的应用需求。很多新型商用总线在做了一定修改和限定后开始被应用到军用航空电子系统,如美军在F35的航空电子中采用一种基于1394总线改进形成MIL?1394B总线。MIL?1394B总线网络在1394总线的基础上增加了应用限定和改进,保留了1394总线即插即用、传输带宽高等特点,又增加了时间确定性等特点,使其更适用于军用航空领域[1]。

国内也展开了MIL?1394B总线技术在航空电子系统中的研究和应用,并给出几种节点设计的解决方案和网络实现方式[2?4]。然而,MIL?1394B总线采用菊花链的物理连接方式,节点和链路传输的不稳定性将会影响整个网络的传输过程,甚至导致机载设备的部分功能失效,文献[5]提出增加网络互联复杂度,文献[3]提出完全备份网络的多余度网络设计来解决高航空航天电子系统中高可靠性的需求。而随着综合航空电子技术的发展,以高度综合化通信导航识别系统[6]为例,系统要求更小的体积、重量来实现原有的功能,并且不能降低可靠性。因此完全备份的方法已经不能满足此类设备的需求。

本文采用获取1394总线原生的SELFID报文以及网络物理连接的先验信息,通过软件自动探测、隔离不稳定的节点及链路,使网络中未失效的处理通道正常运行,最大化地提高设备的利用率,在保证可靠性的前提下,提升综合化后的重量、体积等性能。

1  MIL?1394B总线特点

1.1  物理链路冗余

在IEEE?1394B?2002总线标准中,允许总线网络中存在物理环路冗余。在MIL?1394B协议标准中利用该特性实现了第一级物理链路冗余,很多系统中利用该特性实现网络冗余。

1.2  网络集中运行控制管理

在MIL?1394B网络协议中,网络上的节点分为中央控制节点(CC node)和远程节点。中央控制节点负责下发时间基准,维护整个网络的时隙同步。远程节点接收中央控制节点的时间信息,并按照分配好的时隙发送和接收消息,通过这种机制提高通信的时间确定性。在机载设备中,通常将中央控制节点作为网络管理单元。

1.3  确定性的通道地址

MIL?1394B总线上的节点在初始化过程中实现通道号分配,总线网络上的每个参与通信的节点通过分配通道号完成地址识别,实现通信传输。不同于1394B网络依靠自标识完成各个节点的识别,不同的识别过程各个节点的ID号存在不一致的可能性,而在航空电子系统中由于确定性的需求,MIL?1394B总线建立时同一节点的通道号是预先分配的,不会动态变化。默认中央控制节点的通道号为0通道。

1.4  自标识报文机制

总线上所有节点的物理层都会向网络上发送自标识报文SELFID,各个节点根据自标识报文的内容以及上报自标识包的顺序完成物理连接关系的识别,并建立树状拓扑结构。

2  故障隔离原理和方案

2.1  总线故障现象

由于MIL?1394B总线采用IEEE?1394B?2002总线的物理层,在新的总线节点接入时,通过向总线上发送BUS_RESET,使总线上的所有节点进入总线初始化过程,初始化完成后进入树标识过程,树标识过程完成后总线的初始化工作结束,才能进行正常通信。该特性也导致总线上的各个节点如果不断产生复位,将会影响整个网络的正常通信。

如图1所示,当整个网络中存在一个故障节点,且该节点的故障现象是不稳定的连接,将使整个网络处于反复的初始化过程,导致整个网络的通信受到影响。同时,由于整个网络的时间同步源也受到影响,整个网络的时间基准将会不断重复建立和发布,MIL?1394B基于时间的确定性也会受到影响。为了区别一般可恢复的复位,定义这种复位形式为错误复位,显然这种复位对总线网络是有害的。

图1  MIL?1394B总线网络复位机理

2.2  故障检测、隔离方法

2.2.1  错误复位故障检测、隔离原理

节点的大部分故障可以通过报文传递过程和报文内容进行隔离[7],然而不稳定的连接和节点的反复复位引进的故障失效,通过MIL?1394B网络协议本身[8]和一般的状态自检信息无法检测和隔离。但根据实际工程经验和节点的失效模型,为了解决此类问题,可以利用MIL?1394B总线网络物理连接具有先验信息的特点。而现有的MIL?1394B软硬件实现[2?4]通常无法实现错误复位故障的检测与隔离,通过对节点的软硬件设计和网管程序的改进可以实现。引入总线节点和连接的复位信用模式,判断复位是正常复位或者是非正常复位,对总线网络采取不同的处理方式,完成错误复位故障的检测、隔离。

2.2.2  故障隔离硬件设计

如图2所示,在改进后的网络实现中,不同于一般MIL?1394B的FPGA设计,RN节点和CC节点的逻辑设计不但要完成MIL?1394B协议解析,还增加了端口信用管理组件,每个节点都可以通过CC分发的配置信息记录各自节点的端口信用度,并通过硬件设计的端口控制线实现端口的开/闭。在端口信用管理组件发现节点失效后也可以完成对物理层芯片的关闭。在物理层芯片关闭后该节点不会重新入网。

图2  改进后的MIL?1394B网络实现

2.2.3  基于CC节点的故障隔离软件设计

CC节点的网络管理程序组成如图3所示。

图3  网络管理程序的组成

网络管理程序各组成部分中,与本文的研究内容相关的主要有邏辑拓扑生成组件、逻辑树拓扑登记库组件、信用管理组件及物理拓扑控制组件。逻辑拓扑生成组件:根据系统中的网络连接信息生成可能的所有拓扑;逻辑树拓扑登记库组件:将逻辑拓扑生成组件中的逻辑树形成登记并建库;信用管理组件:计算并记录各个逻辑拓扑的信用;物理拓扑控制组件:根据逻辑拓扑的信用值释放和关闭各物理链路。

2.2.4  故障隔离工作机制

CC节点根据建立的物理连接关系以及通道号的预先配置特性,完成所有可能实现的逻辑拓扑登记,记为logicTree{[n]},其中,[n]的取值范围为1到所有可能的最大数。logicTree中记录了包括树状结构下当前逻辑连接对应的节点间建立的物理端口连接,例如link.cc2R1=cc.a_R1.B,并记录了当前物理连接的信用值link.cc2R1.credit。

网络启动运行后,如出现错误复位故障的节点,导致总线复位次数过多,超过设置的阈值,关闭可复用的端口,形成唯一的logicTree,如果故障复位依然存在,CC节点上的网络管理程序开始记录每一次复位后的SELFID值以及SELFID上报的顺序,根据logicTree的记录判断出每次复位节点的当前网络复位完成后的物理端口连接关系。由于不稳定节点的连接在不同的复位后存在不能持续出现的现象,一旦某次复位初始化完成后,某个节点的连接未上线,就会被网络管理程序减少记录连接的信用值。随着不稳定的复位反复出现,不稳定的连接信用值不断降低,当该条连接的信用值降低到设计的规定值后,该条连接对应的物理端口将会被网络管理程序中的信用管理组件通知端口信用逻辑组件进行关闭。关闭信用值较低的连接后,总线网络开始在所有的可用物理连接上实现节点的通信,保证正常节点的通信。

3  测试与验证

测试主要验证发现、隔离错误复位故障的能力和整个过程的时间,依靠搭建原型验证系统,并在节点中通过向逻辑代码发送复位指令摸拟注入错误复位故障。

图4的测试验证环境由两个RN节点及其嵌入式主机、一个CC节点及其嵌入式主机和MIL?1394B總线分析仪组成。总线分析仪可向主机上报统计总线上的复位数据和显示拓扑信息。除和总线分析仪的连接外,验证系统存在3条总线连接,分别为link.cc2R1,link.cc2R2,link.R12R2。link.cc2R1,link.cc2R2构建的是网络逻辑拓扑logicTree1;link.cc2R1,link.R12R2构建的是网络逻辑拓扑logicTree2;link.cc2R2,link.R12R2构建的是网络逻辑拓扑logicTree3。为了测试方法的有效性,在link.cc2R2的连接上不断注入错误复位故障。各连接的信用初值设为11,设置总线阈值为10。

图4  测试验证系统

复位故障检测数据如表1所示。从表1中的数据可以看出,当注入复位故障次数超过一定的数值后,故障连接的信用降低为0,验证系统将关闭存在故障连接的逻辑树注册,仅支持唯一的无故障连接logicTree2,整个网络不再重复复位,可以进行正常通信。

表1 复位故障检测数据

4  结  论

针对现有的MIL?1394B总线拓扑识别机制主要是基于1394包的拓扑识别,虽然能够在一定程度上解决系统设计和验证工作,但并没有充分利用MIL?1394B总线的信息,使系统在应用此总线时存在难以识别具体故障节点的问题。本文提出的设计方法通过分析MIL?1394B协议的本身特性以及1394报文的原有信息,可确定上报各节点的逻辑连接关系并能自动检测非稳定故障节点,完成隔离故障节点并据此实现系统的重构。在某型综合化通信航空识别系统中应用稳定,支持了该系统的综合化实现。同时,该技术可应用于系统在线测试过程中,实现系统总线网络的自检等功能。

参考文献

[1] IEEE Computer Society. IEEE?1394B interface requirements for military and aerospace vehicle applications SAE aerospace standard 5643 [S]. US: IEEE Computer Society, 2004.

[2] 赵彬,田泽,杨峰,等.基于AS5643协议的接口模块设计与实现[J].计算机技术与发展,2013,23(8):100?102.

ZHAO Bin, TIAN Ze, YANG Feng, et al. Design and implementation of MIL?1394 module based on AS5643 protocol [J]. Computer technology and development, 2013, 23(8): 100?102.

[3] 赵彬,易宁宁,郑斐,等.航电1394总线节点设计实现[J].电子技术应用,2016,42(6):13?16.

ZHAO Bin, YI Ningning, ZHENG Fei, et al. Design and implementation of avionics 1394 node [J]. Application of electronic technique, 2016, 42(6): 13?16.

[4] 马宁,王宣明,郑斐.飞机管理系统1394总线AS5643协议的设计与实现[J].航空计算技术,2013,43(6):122?124.

MA Ning, WANG Xuanming, ZHENG Fei. Design and implementation of vehicle management system 1394 bus AS5643 protocol [J]. Aeronautical computing technique, 2013, 43(6): 122?124.

[5] 周庆瑞,孙辉先.IEEE1394网络拓扑结构的可靠性研究[J].宇航学报,2008,29(4):1403?1408.

ZHOU Qingrui, SUN Huixian. Research on reliability of physical topology for IEEE 1394 [J]. Journal of astronautics, 2008, 29(4): 1403?1408.

[6] 何志强.综合化航空电子系统发展历程及重要支撑技术[J].电讯技术,2004,44(4):1?5.

HE Zhiqiang. Development and important supporting technology of integrated avionics system [J]. Telecommunication engineering, 2004, 44(4): 1?5.

[7] 朱良,杜承烈.通用航空总线测试与分析软件的设计和实现[J].微电子学与计算机,2007,24(7):125?127.

ZHU Liang, DU Chenglie. Design and realization of universal avionics bus testing and analysis software [J]. Microelectrnics & computer, 2007, 24(7): 125?127.

[8] BAI Haowei. Analysis of a SAE MIL?1394B based high speed avionics network architecture for space and defense applications [C]// 2007 IEEE Aerospace Conference. Big Sky: IEEE, 2007: 1344?1352.

[9] 辛永利,田泽,杨峰.机载UMS 系统二余度1394B总线网络设计[J].计算机技术与发展,2015,25(3):197?201.

XIN Yongli, TIAN Ze, YANG Feng. Design of dual?redundancy 1394B bus network for airborne UMS [J]. Computer technology and development, 2015, 25(3): 197?201.

猜你喜欢

端口总线组件
无人机智能巡检在光伏电站组件诊断中的应用
一种端口故障的解决方案
新型碎边剪刀盘组件
U盾外壳组件注塑模具设计
基于PCI Express总线的xHC与FPGA的直接通信
机载飞控1553B总线转以太网总线设计
端口阻塞与优先级
初识电脑端口
风起新一代光伏组件膜层:SSG纳米自清洁膜层
8端口IO-Link参考设计套件加快开发速度