APP下载

一种机载计算机故障信息记录方法

2021-08-18刘宵辰李兴智

山西电子技术 2021年4期
关键词:排查计算机测试

刘宵辰,李兴智,王 俊,闫 稳,赵 刚

(航空工业西安航空计算技术研究所,陕西 西安 710065)

0 引言

在机载计算机设计中,通常使用非易失随机访问存储器(NVRAM,Non-Volatile Random Access Memory)进行产品故障信息记录。NVRAM可实现持久化信息存储,即在产品断电后仍能保持所存储的数据不会丢失。

近年来,随着机载电子系统综合化程度的提高,机载计算机产品的故障排查过程也变得愈发复杂[1-3]。而传统的故障记录方式往往仅对计算机接口是否发生过故障进行记录,远不能满足现有综合化系统的故障诊断、分析及定位需求。

本文介绍了一种机载计算机故障信息记录方法,该方法具有维护效率高、可移植性强、灵活性高的特点。通过计算机发生故障的时间顺序对故障进行“日志式”滚动记录,为系统故障排查提供故障现场复原,从而提高排查效率[4]。

1 方案设计

本文设计的故障记录方案主要用于机载计算机故障信息存储,并为计算机产品的工作情况分析、故障定位及故障排查提供了依据。

第一,需根据产品配备的NVRAM存储容量、BIT测试项目数量、单项BIT故障信息记录格式所占存储容量等,进行NVRAM区域划分。

第二,在NVRAM中分别设置信息区域及索引区域。信息区域用来记录各类BIT的故障内容,索引区域用于记录每类BIT的实时记录位置。本方案假定产品自测试(BIT,Built-in Test)类型包括上电BIT、周期BIT及维护BIT,则NVRAM内容分布如图1所示。

图1 NVRAM内容分布示意

第三,当发生一项BIT测试故障时,首先根据此项测试的BIT类型,进行该类BIT的记录索引查找;其次,将发生的BIT测试故障的故障时间、故障分类、故障现场等信息写入NVRAM对应的索引中;最后,对该类BIT的记录索引进行更新,以备下次记录使用。

2 具体实现

第一,根据产品设计的接口BIT机理情况,制定该产品的BIT故障信息记录格式。

一个典型的故障信息记录格式包括:

1)故障发生/消失时间;

2)故障项编码;

3)故障发生次数;

4)故障机理类型;

5)故障机理信息;

6)其它故障辅助信息。

第二,根据产品配备的NVRAM容量,进行NVRAM区域划分。

假定产品的NVRAM为128KB,可将0KB~100KB设置为信息记录区域,而将索引区域设置在101KB~128KB范围中。考虑到在产品工作过程中,几类BIT检测的故障发生频次为周期BIT>维护BIT>上电BIT,因此可按BIT分类将信息记录区域参照7:2:1的比例进行划分。

NVRAM区域划分示例见图2。

图2 NVRAM空间划分示例

第三,一次BIT测试故障的信息记录过程应包括:

首先,在产品上电后,对NVRAM中存储的信息记录索引的有效范围进行判断。如果某项索引未在预先设定的范围内时,将该项索引重置至对应有效范围的首条处。

其次,当发生一项BIT测试故障时,首先判断此项测试的BIT类型,并根据类型进行记录索引查找。其中,如果查找到的索引未在预设范围时,将进行索引重置。

再次,将该项BIT测试故障的发生/消失时间、故障项编码、故障机理等信息按照规定的故障信息记录格式写入NVRAM中,并将相应BIT类型的索引进行更新。

最后,在产品下电时,将各类BIT对应的记录索引存储至NVRAM的索引记录区域中。

第四,在进行故障记录时,可结合产品接口的具体工作状态和BIT测试运行情况,为单次产品上电时各接口的故障记录次数设置上限,以避免出现某种测试故障反复发生而大量占用NVRAM存储资源的情况。此外还需注意,如果同一时刻发生多项故障时,应根据产品处理能力,在不影响正常运行功能的前提下进行酌情记录。以某个离散量输出接口为例,其解析出的故障信息记录为:

表1 故障信息记录实例

3 结语

NVRAM中存储的接口BIT故障信息,在产品发生故障后对系统故障的诊断、分析及定位具有重要的参考价值。使用NVRAM的出发点是为了更好的记录信息、还原故障现场。

本文提出的故障信息记录方法灵活可靠、可移植性强。通过对产品故障信息进行“日志式”滚动记录,可进行故障信息快速复原,极大降低故障排查的分析及定位难度,为产品高效维护提供了有力保障,并为产品后续的健康状态监控奠定了基础。

猜你喜欢

排查计算机测试
高层建筑消防安全排查情况及处理对策
计算机操作系统
幽默大测试
基于计算机自然语言处理的机器翻译技术应用与简介
计算机多媒体技术应用初探
配网二次回路故障的排查分析
给家中来个危险排查吧
“摄问”测试
“摄问”测试
“摄问”测试