APP下载

基于DSP的故障记录与解析的设计与实现

2022-05-25金道源赵熠邝安玄

中国新通信 2022年7期

金道源 赵熠 邝安玄

摘要: 在机电系统中,接口单元模块承担着信号采集、传输、控制等复杂任务,导致该模块内部外部接口众多、软件规模大、信号种类多样,故设备运行时故障产生的原因不可预测,发生故障后,对故障的定位与排查也非常不便。本文以搭载TI公司高性能DSP芯片的接口单元为例,阐述了接口单元模块管理软件的统一故障管理方式,包括故障数据记录、故障解析工具设计、文件生成。大大方便了设备以及系统故障的定位与排查,极大降低了设备排障与后期维护的成本。

关键词:故障记录与解析;NVRAM;DSP

一、系统概述

在复杂机电系统中,接口单元模块承担着机电管理任务的执行,需要为系统提供各类接口,如模拟量输入输出、离散量输入输出、总线接口等,且需要在系统中的不同位置实现不同配置,完成系统的状态信息采集与上传,响应上位机输出控制指令完成对子系统的控制与维护,同时为系统健康管理提供BIT(自测试)信息支持,针对以上特点,接口单元核心处理芯片采用TI公司的高性能DSP芯片。

驻留在其上接口单元管理软件作为整个接口单元模块行为的控制核心,为硬件提供资源的配置、检测、管理与控制功能,与模块硬件共同完成接口单元任务的执行,相应的,该管理软件的需求复杂、软件规模大,所以管理软件分为三层结构,分别为应用软件层、协议解析层和驱动程序层,如图1所示。

接口单元实施并参与系统的功能控制管理、信息管理和健康管理有关的信号采集、信息传输、输出控制和BIT检测等任务,与系统各设备之间相互交联、物理、逻辑接口复杂、信号种类繁多,故设备正常运行时,发生故障的时机不定、类型不定、数量不定、位置不定,所以作为接口单元管理软件的一部分,故障管理功能同软件三层结构均有交联关系,如图1所示,为了故障排查与后期维护的便利,统一的故障记录与直观的故障解析十分必要。

二、故障记录

故障统一管理的目的是故障排查与后期维护的便利,首先需要针对模块运行中可能出现的不同类型、不同位置、不同发生时机的故障进行格式统一的记录。

(一)故障类型

故障类型主要分为上电BIT(PuBIT)故障及周期BIT(PBIT)故障,其中上电BIT在模块上电时对自身控制器相关硬件、供电及部分接口以及周期任务中不能检测的电路进行快速检测,以确认是否可以进行最基本的正常控制工作。如果上电检测出接口故障,置相应故障状态,向接口本次上电故障记录NVRAM地址写入故障值,直到重新上电后再次上电BIT检测可被新的检测结果覆盖。测试接口包括看门狗测试、模拟量输出接口测试、离散量采集接口测试、电源测试、RS422测试、RAM测试、FLASH测试、NVRAM读写测试、FPGA握手测试等。

周期BIT是设备正常周期工作中,在对接口进行控制的同时,以不干扰正常工作的方式,对设备各工作接口的工作状态进行周期性检测。如果周期BIT测试接口的故障值有效,则向接口周期故障记录NVRAM地址写入故障值。测试接口包括模拟量采集接口测试、离散量采集接口测试、温度测试、离散量输出接口测试、供电测试、配置信号测试等。

(二)故障数据记录

由于故障的不确定性,需要及时将故障发生瞬间的时间、故障现场等相关数据记录在不易丢失的存储单元中,以便事后故障分析。NVRAM(Non-Volatile Ram),非易失性随机访问储存器,断电后仍能保持数据,由于故障的多样性、不确定性、偶然性,用该储存器作为故障记录的介质最为合适。

将NVRAM作为扩展存储空间外挂至DSP芯片外部储存的外扩区域,用以储存故障相关信息,如图2所示。

为了区分故障種类,便于后续故障解析,预先在NVRAM中定义各类故障区域,当故障发生时,故障可快速写入到对应的故障记录内。NVRAM故障记录包含两个部分,第一部分为公共部分信息记录,主要涉及本次上电后整机的全局信息,包含上电测试,各类信号等,这部分内容记录在NVRAM的最前端;第二部分为各个故障的记录,包括上电BIT、周期BIT等故障数据信息,依次进行记录。在进行故障记录时,为降低开发难度、提升软件复用性、便于故障解析,将不同类型的故障数据以及相关故障现场数据以相同的数据格式记录在NVRAM中,首先列出接口单元运行周期中可能出现的所有故障,针对每种故障整理引起该故障的数据或受该故障影响的数据作为故障现场数据。为每个故障在对应类型故障空间中分配地址,故障数据以32字节为记录单位记录,记录内容包括故障发生时间,产品上电次数,故障接口、故障通道号、故障类型、故障发生次数,以及故障现场相关数据,故障数据记录格式整理如表1所示。

故障数据记录的流程如下图3所示。

模块上电后,首先在设备初始化中对设备上电总时间、上电次数等公共信息进行记录,其次进行上电BIT检测并对故障接口进行记录,最后周期任务中进行周期BIT检测,并对故障接口进行记录。

三、故障解析

故障记录完成之后,需要将NVRAM中记录的信息进行解析输出,所以将NVRAM中故障数据下载至本地,并设计分析工具对下载的故障数据进行解析,最后形成故障分析报告文件。

(一)NVRAM数据下载

记录故障数据的NVRAM挂载在DSP芯片外扩区域之上,故使用芯片提供的串行通信接口(SCI)外设模块对NVRAM数据进行读取,通过串口通信传输至本地PC,本地应用串口助手接收并捕获NVRAM下载数据。

(二) NVRAM数据解析

设计NVRAM数据解析工具,对下载的NVRAM故障信息在本地进行解析并形成故障分析报告,解析流程如图4所示。

将下载至本地PC的数据文件导入解析工具,找到数据起始位置并解析公共信息部分;然后依据故障类型对故障进行区分,依据地址信息对故障定位,依据该故障对故障现场数据的定义解析相关现场数据;解析完成后选择是否形成解析文件。

(三)解析工具

解析工具使用Microsoft Visual Studio2010开发环境,设计简单应用界面,实现NVRAM数据文件的导入、解析,解析报告文件的生成。该工具使用MFC开发,集成了接口单元产品型号的选择,NVRAM数据文件的导入与校验,NVRAM数据文件解析,部分重要信息与故障的显示,NVRAM数据解析结果报告的生成。

四、试验验证

故障记录、解析工具设计完成后,进行试验验证。通过人工强制在软件内置故,且使用预先定义好的故障现场进行测试,将记录数据使用工具解析并导出,若导出结果和与置故现场数据一致,则故障记录与解析功能正确。

(一)测试环境

在应用软件中对某些接口进行插桩置故,并设置故障现场数据,将测试软件固化至接口单元,运行稳定后下载NVRAM数据,导入解析工具中,对NVRAM数据进行解析。在试验中,使用测试设备对产品进行供电与总线数据通信,测试PC与产品用串口线相连。将置故测试软件通过串口固化至目标机,上电稳定运行,下电后对目标机模式配置信号进行切换,切换至信息下载模式;PC端打开串口助手,目标机重新上电,应用串口助手捕获NVRAM下载数据至本地,下载原始数据捕获;最后依据NVRAM数据解析流程,进行故障解析以及生成故障分析结果。

(二)解析结果

使用工具导入下载NVRAM数据文件,点击解析,数据结果如图5所示。

查看故障后,点击导出将故障信息导出文本,如图6所示。图中最上方显示上电后设备公共信息及重要故障,后方为其他故障信息,包含故障类型、通道、上电次数、故障次数以及故障现场数据。经对比,工具解析结果和报告呈现结果与测试软件设置的故障完全一致,可以认为故障解析与故障记录功能正确。

五、结束语

经过上文对不同故障统一的故障记录以及解析方式,后期维护时,开发维护人员可以很直观地看到发生故障的接口,故障发生时间,以及发生故障时与该接口相关的现场数据,极大方便了接口单元及系统故障排除以及维护。

作者单位:金道源    赵熠    邝安玄    航空工业西安航空计算技术研究所

参  考  文  献

[1] 李宝龙, 陈雪巖. DSP外扩FLASH接口技术实现[J]. 哈尔滨商业大学学报. 2016(03).

[2] 张楠, 张达亿. 基于DSP与NAND Flash的大容量存储器设计[J].工业控制计算机,2018(01).

[3] 郭警涛, 郭建奇. 机载机电管理系统数据下载与分析设备设计[J].信息通信, 2016(10).

[4] 胡宝雷, 韩毅博. 多功能控制面板的设计与实现[J].电脑编程技巧与维护,2019(05).

[5] 刘宗福. 片上FLASH存储器接口的设计[J]. 电子世界, 2016(03).