APP下载

一种机载计算机故障分类管理策略研究

2019-05-10张弛毛宁谢宇辰中国航空工业集团公司西安航空计算技术研究所

数码世界 2019年4期
关键词:瞬态关联管理策略

张弛 毛宁 谢宇辰 中国航空工业集团公司西安航空计算技术研究所

在机载计算机应用领域,为确保系统的高可靠性和强测试性,设计时分别会从系统、硬件、软件等角度进行故障模式分析,找出影响系统安全的所有故障,并对故障进行检测和管理。通常会在软件中进行BIT测试,包括上电BIT、初始化BIT、周期BIT等,检测和定位计算机自身的各种故障,首先会将故障信息进行存储,存储内容涉及故障编码、故障时间、故障信息状态等;其次会根据设计好的故障管理策略,采取适当的措施,以保证系统发生故障时,将性能损失降低到最小,从而保证飞行安全。

本文介绍一种机载计算机故障分类方法,可从不同维度对故障进行判定和管理,在系统检测到故障发生时,根据故障分类的不同,软件采取不同的管理办法,有效保证了故障管理的正确性和可靠性。

1 故障设置及判别

为方便进行故障查询、记录、传输、管理和维护,设计时应对每条故障都设置一个唯一的故障编码。故障发生,首先则会置故障标志并存放在以故障编码为检索索引的连续内存区域中。故障按照严重程度可以被划分为不同等级,等级越高表明故障越严重。各种故障信息,既可以通过各类通讯接口发送给其他机载计算机或设备,同时如果该故障需在内部非易失存储器中存储,则将该故障写入。

不同的故障检测可在软件的不同部分进行,例如可以在初始化程序、后台任务、实时任务中进行。一般大多数故障检测是在实时任务中完成的。而在实时任务中,又可以根据故障检测所需要的频繁程度将故障分置在不同的周期任务中。

2 故障分类及管理策略

因为故障的发生可能是偶然因素导致或是“硬伤”导致,不同故障对系统的影响程度也不同,且许多故障往往具有很强的关联性和诱发性,因此需对所有故障建立不同的分类,从各个维度进行故障类型标记,建立并实施不同的管理策略。根据故障发生的频繁程度,可以分为瞬时故障和永久故障;根据故障发生对系统产生的影响,可以分为一般故障和严重故障;根据故障之间的因果关系,可以设置关联故障。

2.1 瞬时故障和永久故障的管理

机载计算机的故障从故障时间或者故障特性角度分为瞬时故障和永久故障。瞬时故障一般是由于外界扰动引起的,短时间内可恢复正常的故障;永久故障是指机载计算机不可恢复的硬故障。

瞬态故障和永久故障的判断可以采用双阈值方法进行,不在设计时进行预设,其中,较低的阈值用于永久性故障的判断,较高的阈值用于瞬态故障的判断。当某条故障由于持续多个周期发生而较快达到故障时延,则该故障为永久性故障;当某条故障经过多次反复才达到故障时延,则该故障为瞬态故障。瞬态故障和永久故障的判断流程见图1所示。

2.2 一般故障和严重故障的管理

机载计算机的故障从故障信息状态或者系统控制角度分为一般故障和严重故障。一般故障是指机载计算机的某个通道或通道中的某个模块故障,仍可对系统进行控制情况下的故障;严重故障是指计算机的故障,导致其丧失对系统进行控制的能力。一般故障和严重故障是设计时预设的。

当机载计算机的一般故障发生时,只需对故障进行记录和上报操作,对故障可能造成的影响,利用预设的安全值进行保护输出。

机载计算机严重故障一般包括CPU故障、FLASH校验和错误、SRAM访问错误、周期任务超时、堆栈越界、软件跑飞导致看门狗报警、重要参数无法获得等,这些故障一旦发生,一方面需要在非易失存储器中进行故障编码记录,另一方面应进行产品自动复位和复位次数纪录,若复位次数未达到预设的上限,且在复位重启后产品工作正常,不再有任何的严重故障发生,则无需再对产品进行复位或其他操作,若复位后又不断有严重故障发生,一旦达到预设上限,则产品无需继续不断复位,将进入保护模式,可以只进行输入信号的采集,不应再对外输出,因为这时产品被认为是不可靠的。无论是否达到复位次数的预设上限,一旦复位次数不为零,就应通过通讯接口将故障信息发送到维护设备中,可以进行故障分析和处理,保证产品的安全可靠。

图1 瞬态故障和永久故障的判断流程

2.3 关联故障的管理

关联故障是为了提高产品的测试性而设计,可以避免某个故障的发生导致其他故障一起发生时,所有故障都被记录和显示,造成故障定位的困难。其含义可解释如下:若B、C……故障可引起A故障的发生,则将B、C……故障标记为A故障的关联故障,这样的关联关系是设计时预设的。利用关联故障可以将一些触发条件较多的故障细化,同时避免不必要的故障记录占据存储单元。当某故障的一条或多条关联故障发生时,该故障不会被记录,只会记录其关联故障,计算机产品认为该故障是由其关联故障引起的,但是该故障及其关联故障均应通过通讯接口送到维护设备中进行检查。

3 结语

本文通过预设或实时监测的方法,对瞬时故障和永久故障,一般故障和严重故障,以及关联故障进行了描述,通过对不同故障增加类型标记,可以在故障发生时,采取有效合理的管理策略,这样的分类方法可以广泛应用于机载计算机领域。

猜你喜欢

瞬态关联管理策略
房建工程招标组织与合同管理策略
论减税降费背景下的企业财务管理策略
建筑工程管理策略探讨
建筑施工安全管理策略的应用探索
激发态和瞬态中间体的光谱探测与调控
高压感应电动机断电重启时的瞬态仿真
“一带一路”递进,关联民生更紧
奇趣搭配
基于改进HHT的非高斯噪声中瞬态通信信号检测
带旋转孔容腔瞬态演化与建模方法研究