测控装备故障定位研究∗
2018-11-26邹德智卢其龙
蒋 敏 邹德智 陈 庚 卢其龙
(91913部队 大连 116041)
1 引言
随着科学技术的快速发展,特别是数字技术及各种超大规模集成电路的广泛应用,电子装备尤其是测控电子装备结构越来越复杂,功能越来越完善,自动化程度也越来越高[1]。随着靶场职能使命的拓展,测控装备在试验中发挥越来越重要的作用。同时,在装备使用过程中,发生故障在所难免,装备发生故障后,就会使装备的效益受损,同时也会产生测试流程复杂、测试时间长、维修保障困难、维修费用高等诸多问题,严重影响了电子装备的完好性和寿命周期。如何有效地对装备进行故障定位分析,及时高效地排除装备故障,实现测控装备的科学化、精细化管理,为装备建设提供优质高效的决策信息,对于提高装备的保障能力具有重要的意义[2]。
2 引起装备故障的因素
目前,测控装备主要有遥测、雷测、光测、通信等电子装备,主要担负飞行器的飞行轨迹测量、光学跟踪、时统通信等使命任务,但是受诸多因素影响,装备也呈现了不同程度的故障率,严重影响了装备的效益,甚至会影响试验任务的顺利完成。一般来说,装备故障的成因主要有以下几个因素。
1)人为操作不当引起故障
对于测控装备来说,其操作顺序都有严格的要求,不能随意操作,特别是对于事关安全的操作来说,更要慎之又慎。进行装备操作时,未熟练掌握操作规程的操作手、错误的操作、参数设定等因素都有是损坏装备的最直接“杀手”。例如:部分岗位操作手没有经过严格的培训就上岗,或者对装备的基本操作规程不熟悉;没有进行开机前的通电三检查;忽视警告标志、警告信号;操作错误,机械超速运转;没有检查电源相序;没有及时观察装备的天线角度信息导致天线限位等,这些都是由于人为的操作不当引起的装备故障。
2)环境因素引起的故障
环境因素主要表现为温度对装备的影响[3]。很多测控装备长期处于温差变化很大的复杂环境,受温差影响较大,当温度在上、下限温度循环时,电子装备交替膨胀和收缩,会使装备中产生热应力和应变。如果某些电子装备产品内部有瞬时的热梯度(温度不均匀性),或产品内部邻接材料的热膨胀系数不匹配,则这些热应力和应变将会加剧。这种应力和应变在缺陷处最大,它起着应力集中的作用。这种循环加载使缺陷长大。最终可大到能造成结构故障并产生电性能故障。
3)设计不合理引起的故障
由于技术知识水平所限,经验不足,可能没有采取必要的措施而犯了设计考虑不周或疏忽大意的错误。装备设计不合理包括硬件和软件两个方面。硬件设计不合理主要有:强度计算不准,材料选用不当,装备外观不安全,结构不合理,操纵机构不当,未设计安全装置等。即使设计人员选用的操纵器是正确的,如果在控制板上配置的位置不当,也可能使操作工混淆而发生操作错误,或增加了操作工的反应时间而忙中出错。软件设计不合理主要有:功能设计不完善,存在破坏正常运行能力的问题或隐藏的功能缺陷;操作界面布局不合理,易遭受病毒攻击,风险估计不足等,这些都有可能导致装备发生故障。
4)装备使用磨损引起的故障
测控装备在使用过程中,由于输进能量而运转,产生摩擦、振动,致使相对运动的零部件实体产生磨损,这种有形磨损即称为使用磨损[4]。使用磨损结果的一般表现为,装备零部件尺寸、几何外形改变,装备零部件之间公差配合性质改变,导致工作精度和性能下降,甚至零件损坏,引起相关其他零部件损坏而导致事故。例如,装备在转场至野外站点便会由于摩擦、振动等因素导致装备受损;装备在野外站点或内场进行调试时也会产生使用磨损。
除以上因素外,测控装备寿命期内,由于自然气力的作用或因保管不善而造成的锈蚀、老化、腐朽,自然环境的变化,维修不专业等都可能导致故障。
3 两种常用的故障定位方法
从装备管理的角度来说,有很多技术可以实现对装备故障的定位、诊断、分析以及排故,现在主要介绍两种方法。
1)基于OLE技术的故障诊断软件平台
目前,很多测控装备都有相应的软件平台对其进行故障诊断、定位以及分析。基于OLE技术的故障诊断软件平台的主要机理:针对不同型号的测控装备,根据故障分析理论融合先进的虚拟仪器测试技术、人工智能分析方法、专家知识库,采用OLE、COM等先进的技术,通过COM接口搭建功能框架,然后在框架内根据需求添加各种功能模块,从而研发一套可以进行实时诊断的故障诊断软件平台[5]。此平台可以完成测控装备故障电路板型号统计和元器件统计分析、故障趋势分析和预测试功能,实现故障诊断测试、信息分析反馈的融合,达到对各类型数字、模拟及数模混合电路板进行测试、分析和诊断的目的。这类软件平台各模块的添加具有相对的独立性,通过主框架程序进行数据交换,并且可进一步改进或者添加新的功能模块。
2)基于故障树的装备排故训练方法
故障树是将抽象的树形结构以图形化的方式显示出来,使用户可以更直观地看到排故思路[6]。操作信息则是用户在拖动排故工具到检测点时,系统反馈给用户的提示。为增强排故模块的实用性,采用以单台装备的信息流程图为基准,采用页面脚本技术模拟整颗故障树,实现了在一系列装备实物图片上通过虚拟仪器工具完成故障检测、定位与修复的功能。仿真过程中,以历史故障现象作为节点,以装备信息流程为主线,映射可能引起故障的相关节点,以不同类型的装备为单位生成一整颗故障树,故障树的各级子节点包含了各种故障原因分析和检测修复方法。由于故障树的操作存在大量的人机交互需求,所以,一般采用页面脚本技术来模拟整颗故障树,以实现装备排故的技术仿真[7]。
4 一种基于神经网络的故障定位方法
对于装备的状态来说,可以将其定义为两种状态:正常状态和故障状态。在正常或故障状态下,装备可以集中体现为一系列测量信号特性的集合,如电流变化情况、AGC电压值等,我们将这些可以测量的部位称为测量点,测量点测得的信号特性为测量值(测量点和测量值一般不止一个)。当装备处于正常工作状态时,各测量点的测量值是一定的;当装备处于某一故障状态时,我们可以测得一系列测量点的测量值,对于不同的故障点,各测量值也不尽相同[8]。结合以往装备的故障特点,假设装备的测量点有n个,经过对以往故障样本进行统计分析,当装备共发生过m起故障时,即装备共有m个故障点,我们可以定义如下矩阵Fm×n,用来描述不同的故障点,如式(1)所示:
其中,aij(i=1,2,…m,j=1,2,…n)表示装备第i个故障点第 j个测量值。
装备在不同故障点的n个测量值是装备发生故障的客观反映,故障定位的实质是多属性决策问题,是一个“黑箱”或者说是“灰箱”问题,之所以不能明确地分配各属性之间的权重,是因为不能明确地描述它们之间的关系,更无法用定量关系式来表达它们之间的权重。所能提供的只是某个故障点的测量值(根据已知测量数据获得训练样本)。如果仅根据这些训练样本就能对故障进行定位,就可以把故障定位时的不确定因素降到最低,这正是所需要的,也正是神经网络可以做到的,因此可以用神经网络方法建立数学模型[9]。
基于以上分析,我们可以构建故障矩阵,用单位矩阵表示,如式(2)所示:
其中,矩阵Rm×m的第 j列表示装备处于第 j个故障点(j=1,2,…m)。
需要说明的是,用单位矩阵表示装备处于哪一故障,是神经网络建模的常用方法,例如,对于矩阵Rm×m来说,第 j列的第 j个数用“1”表示,其他数值用“0”表示,其意义为装备处于第 j个故障,而不属于其他故障。其实这一概念是所谓有竞争的学习,设想这样一种输出模式[10]:对应任何一组输入,所有输出单元中,只允许有一个处于激发态,即取值为1,其它输出单元均被抑制,即取值为0。一种形象的说法是,对应任何一组输入,要求所有的输出单元彼此竞争,唯一的胜利者赢得一切,失败者一无所获,形成这样一种输出机制的网络学习过程,称为有竞争的学习。建立有竞争的网络学习方法,由此产生的网络可用来将一组输入样品自动划分类别,相似的样品归于同一类别,因而激发同一输出单元,这一分类方式,是网络自身通过学习,从输入数据的关系中得出的。
根据以上分析,我们可以按照如下步骤建立基于神经网络的数学模型[11]。
1)选取训练样本。样本是以往历史数据的集合,它直接关系到计算结果的可信度问题,可以对其进行合理的取舍,为了使计算的结果符合实际,文章以各故障点的一系列测量值Fm×n为神经网络输入值,以构建的单位矩阵Rm×m作为输出值。
2)归一化训练样本
在神经网络训练之前,为使得各训练样本度量单位统一,首先应对原始样本做归一化处理,各指标在[0,1]间取值。
3)定义网络误差和最大训练次数
在训练的过程中,必须度量网络收敛到期望值的程度即为网络误差。对于给定的训练样本集合来说,期望值是已知的。当网络误差小于事先给定值时,神经网络满足精度要求,此时神经网络具备了识别能力。
最大训练次数的选取应该根据训练误差的收敛情况进行合理取值,取值过大,收敛速度慢,取值过小,则有可能达不到网络允许的误差要求。因此,需要在样本训练过程中实时进行调整。
4)进行神经网络训练
编写神经网络应用程序,利用反向传播算法进行训练,反向传播算法的基本思想是调整权值使网络误差最小,也称梯度下降法[12]。为验证建立的神经网络模型的精确性,可以重新将样本数据Fm×n作为模型的输入,然后求得其输出值,与构建的单位矩阵Rm×m进行匹配,对其进行方差分析。
通过有竞争的学习,建立神经网络模型后,我们最终的目的是通过对以往的测量值(样本数据)进行分析,找出他们之间内在关系,当装备发生故障时,获取测量点的信号特性,得到一系列测量值作为神经网络模型的输入,得到输出结果,对其进行判断分析,找到装备的故障点,从而可以达到故障定位的目的[13]。
5 结语
文章根据测控装备故障特点,提出了一种基于有竞争的学习方式的神经网络建模方法,此模型考虑了收敛速度、拟合效果等多种因素。这种方法比较适用于故障样本数量比较多的情况,此方法具有定位速度快、效率高的特点,同时较好地解决了在装备定位过程中可控因素与不可控因素之间的关联,对于提高装备故障管理水平、提高装备的保障能力具有重要的意义。