APP下载

一种基于失效场景的故障记录方法

2024-03-05刘宵辰王晓航

山西电子技术 2024年1期
关键词:排查区域故障

宋 丫,刘宵辰,王晓航

(中国航空工业集团公司 西安航空计算技术研究所,陕西 西安 710065)

0 引言

机载电子设备,例如机电管理计算机,通常使用非易失随机访问存储器(NVRAM,Non-Volatile Random Access Memory)进行产品故障信息记录。主要由于NVRAM可实现持久化的信息存储,即在产品断电后仍能保持所存储的数据不会丢失,从而在故障发生后的第一时间读取历史信息,复原故障现场。

由于现代飞机功能设计越来越丰富,各接口部件间的交联关系也愈发复杂,一起故障的发生往往是由于多重因素导致。传统的故障记录通常按照接口类型逐一列举,这种遍历式的记录方法虽然可以覆盖硬件接口,但由于缺乏对重要接口及故障场景的区分,导致数据冗余,排查人员将大量时间耗费在读取并筛选数据上,同时要求排查人员精通项目设计,能够从大量平铺式数据中甄别出异常以及相关联系。这远不能满足现有综合化系统的故障诊断、分析及定位需求。

本文提出了一种基于失效场景的故障记录方法,该方法具有维护效率高、可移植性强、灵活性高的特点。通过对失效场景下相关信息的综合分析,快速排查故障可能诱因,节约时间及人力成本。

1 设计方法

本文设计的故障记录方法主要用于机载电子设备故障信息存储,并为设备的工作现场复现、故障分析、定位提供了依据。在进行具体的案例设计时,可以从以下几个步骤入手:

1) 根据不同机载设备对失效场景的需求设计NVRAM模块,例如对参考电压的监控,看门狗报警,机翼折叠展开控制,火警告警等。另外,产品自测试(BIT,Built-in Test)作为一项重要的故障检测手段也需要记录在内,方便排查接口的硬线故障。

2) 根据设备配置的NVRAM存储容量、失效场景种类、接口BIT数量、单项故障信息记录格式所占存储容量等,进行NVRAM区域划分。

3) 在NVRAM中分别设置信息区域及索引区域。信息区域用来记录各类故障信息,索引区域用于记录每类故障信息的实时记录位置,方便读写的同时防止信息覆盖。本文方案设计如图1所示,BIT分为上电BIT、周期BIT、维护BIT,失效场景有参考电压异常监控,看门狗报警,火警告警。

图1 NVRAM区域划分

4) 当发生一项故障时,首先根据此项故障类型,进行索引查找,获取该条记录应该的存储地址,而后将发生该类故障的故障时间、故障分类、故障现场等信息写入NVRAM对应位置中,最后更新索引为下一次记录地址。

2 实现过程

首先,根据产品设计需求,确定故障记录的格式,即一条记录包括哪些内容。本文采用的故障记录格式如图2所示。

图2 故障记录格式

其次,根据设备配置的NVRAM容量,进行NVRAM区域划分。例如NVRAM为128 kB,可将0 kB~100 kB设置为信息记录区域,而将索引区域设置在101 kB~128 kB范围中。综合考虑几类故障发生的频次,为高频次的故障类型预留更多的记录空间。本文为上电BIT、周期BIT、维护BIT,参考电压异常,看门狗报警,火警告警分配的空间占比为1∶5∶1∶1∶1∶1。

另外,在进行故障记录时,可结合设备的具体工作状态和是否为重复单一型故障,为各类型故障设置单次上电记录上限,以避免出现某种故障反复发生而大量占用NVRAM存储资源的情况,尤其是周期BIT的故障记录,当某一接口反复出错时,只需要记录一次故障状态,若后续故障消失,则记录为非持续性故障。此外还需注意,如果同一时刻发生多项故障,应根据设备的处理能力,在不影响正常功能运行的前提下酌情选择记录。

最后,完整的故障记录过程应包括:1) 产品上电后,判断现存的NVRAM索引区域范围是否有效。如果某项索引未在预先设定的范围内,则将该项索引重置到对应范围起始地址,开始新一轮的记录。2) 当发生某类故障时,根据类型进行索引查找并记录到索引位置,如果查找到的索引未在预设范围内,则进行索引重置,将该项索引重置到对应范围起始地址。3) 将该类型故障的发生/消失时间、故障项编码、故障机理等信息按照规定的故障记录格式写入NVRAM中,并将相应类型的索引进行更新。

3 总结

在设备发生故障时,NVRAM中存储的故障信息对系统故障的诊断、分析及定位具有重要的参考价值。使用NVRAM的出发点是为了更好地记录信息、还原故障现场。本文提出的故障信息记录方法灵活可靠、可移植性强。通过对故障信息进行分类记录,可快速还原失效场景,极大降低了故障排查、分析及定位难度,节约人力及时间成本,为设备的高效维护提供了有力保障。

猜你喜欢

排查区域故障
高层建筑消防安全排查情况及处理对策
故障一点通
配网二次回路故障的排查分析
给家中来个危险排查吧
如何排查并改错
奔驰R320车ABS、ESP故障灯异常点亮
分区域
故障一点通
基于严重区域的多PCC点暂降频次估计
江淮车故障3例