面向状态评估的装备测试数据处理
2018-08-16徐廷学王瑞奇
安 进,徐廷学,李 凯,王瑞奇
(1. 海军航空工程学院,烟台,264001;2. 93968部队,乌鲁木齐,830075)
0 引 言
状态评估是装备状态监测和基于状态的维修(Condition based Maintenance,CBM)工作的中心环节,而测试参数收集与处理则是决定状态评估效率和准确性的基础[1]。由于测试技术手段限制以及人员、管理等因素影响,通过测试设备自动或人工获取的初始测试数据存在种类多样、量纲不一、数据冗余、维数灾难、不完备等问题[2]。目前研究中对测试参数处理多为针对单项问题的单一处理,缺乏系统方法和完整过程;在实际操作中多依据专家判断或操作人员主观意见进行简单增删、选择。
本文首先将测试参数分为开关量和模拟量两类数据,针对模拟量参数数据进行初步处理,之后对数据作归一化操作,在此基础上,分别运用改进的时间序列算法对数据进行完备化处理、采用主成分分析法提取状态评估关键参数,最后通过算例证明数据处理完整过程的有效性,处理后的装备测试数据可更加有效应用于装备状态评估。
1 测试参数分类
随着状态监测和CBM工作需求的提高,各类装备检测设备和手段得以发展。新列装装备均配备相应的分系统和整装测试设备。现有测试设备条件下,测试参数主要由开关量性能特征参数及模拟量性能特征参数组成[3]。
1.1 开关量性能特征参数
开关量性能特征参数是指测试值只能表现为工业部门规定的标准值或特定的故障值的性能特征参数,即当开关量性能特征参数测试结果正常时,其测试值表现为固定的标准值;当开关量性能特征参数测试结果故障时,其测试值表现为相应的故障值。由于开关量性能特征参数的测试值只能取既定的“开关量”,因而难以利用开关量性能特征参数来表现装备的状态退化情况,因而主要用于装备两状态的初步判定。
1.2 模拟量性能特征参数
模拟量性能特征参数是指测试值可在规定阈值范围内连续取值或在规定阈值范围外任意取值的性能特征参数,即当模拟量性能特征参数测试结果正常时,其测试值可为规定阈值范围内的任意数值;当模拟量性能特征参数测试结果故障时,其测试值可为规定阈值范围外的某一故障值。由于测试结果正常的模拟量性能特征参数可在规定阈值范围内任意取值,因而可利用模拟量性能特征参数测试值偏离标准值的程度来表征模拟量性能特征参数当前的状态。
2 数据预处理
2.1 测试信息初步处理
装备测试信息存在冗余性,会导致后续状态评估、故障诊断和质量监测等工作在时间和空间上的浪费。测试信息清洗的目的是删除与研究对象无关或无影响的信息,从而减少存储空间。假定测试设备测试数据完全有效,出现超差测试信息时,可直接判定装备故障并进行相应处理;只有正常测试信息可反映非故障状态下的装备状态。因此可将超差测试数据和正常测试信息进行分类,分别作为故障诊断和状态评估的依据。另一方面,在进行某些分系统或关键部件的状态评估时,同样需要对测试数据进行清洗,去除无关数据,提高状态评估效率。
测试信息合成与整理主要是对重复信息进行处理,进一步减少存储空间。例如超差测试信息中可能存在两次或两次以上测试信息对应的故障部件和超差测试参数相同的情况,信息的合成在于消除重复记录,每次记录时比较该条信息与信息库已有的超差测试信息是否相同,若相同,则将该超差测试信息记录的出现次数加1;否则,记录新的超差测试信息的故障部件与该部件相关的所有测试参数。
2.2 归一化处理
装备状态可通过相应测试结果远离工业部门给出的规范值的大小进行表征,其远离工业部门给出的规范值越远,状态退化越严重。各性能特征参数的量纲、阈值范围等基本均不相同,通过测试得到的各状态参数偏离标准值的大小也差异甚大,因而为便于下一步状态评估中对各性能特征参数进行状态融合,需对各性能特征参数的测试数据做归一化处理,利用归一化值对性能特征参数的状态进行表征。在归一化各性能特征参数测试数据的过程中,可令归一化值随着性能特征参数测试数据偏离标准值程度的加大而增大、缩小而减小,此时归一化值可以较好地反映出相应性能特征参数的当前状态。
设有n个测试参数,则第 i(i = 1,…, n )个参数的归一化值iλ为
3 测试参数完备化处理
由于测试设备、人为因素等原因,测试参数往往存在缺失的情况,称为不完备测试信息。不完备性影响可靠性与正确率,如果将不完备测试信息进行简单地删除处理,可能会丢失有用的状态信息,导致结果错误,因此,需要保留这些不完备信息,并将这些信息中的缺失值用“*”标记出来。
3.1 测试参数完备化
对不完备知识表达系统进行完备化处理时,主要有扩展法、删除法和补齐法3类方法[4~6]。补齐法(填充法)作为其中主流方法是利用已有的历史数据或经验值,采用一定方法对缺失值进行推导、填充,使其完备化。专家估值法、基于上下近似集的空值填补法、均值补齐法、组合补齐法等都是目前常用的信息补齐法。其中,讨论较多的是均值补齐法和组合补齐法。
对于装备来说,由于定期测试与任务测试交叉,测试数据大多不连续,且测试间隔时间不固定。本文采用基于改进时间序列的方法对不完备信息进行填充。假定装备状态变化符合如图1所示的状态退化规律[7],则采用如图 2所示的测试参数时间序列变化函数。和根据装备的实际退化数据及专家经验确定得到。
图1 装备性能状态退化Fig.1 State of Equipment Performance Degradation
图2 时间序列函数Fig.2 Time Sequence Function DiagramT—装备服役时间;K—测试值偏离程度,即实际测试参数值与标准值之差
若t1时间测试数据偏离程度为k1,则可将t2时间的缺失测试数据偏离程度补全为
则缺失测试值可补全为
式中 B表示该项测试参数的标准值。
3.2 基于主成分分析法的参数优化
测试设备的发展使得可获取的状态信息急剧膨胀,以某型导弹为例,可获取的模拟量性能特征参数就有400多项,多次测试累积造成的数据维数增加造成状态评估的输入维数灾难问题,这就使得测试参数指标优化成为状态评估前的必要步骤。
关于指标的优化问题,国内外许多专家学者分别从主客观两个方面进行了大量的研究工作,除了基于主观偏好进行筛选以外,在客观方面的理论研究成果重点聚焦消除指标的相关性方面[8]。目前在各类方法中,主成分分析方法因其原理简单,优化效率高,易于软件实现等特点,得到广泛应用。
主成分分析法是将多个指标转化为少数几个综合指标的一种多元统计分析方法,这些综合指标是互不相关的[9]。设有n个样本,即装备的n次测试结果,每个样本由p个指标描述,可得原始数据矩阵:
系数由下列原则确定:
对于新的综合指标来说,有:
通过上面的转换过程,可以确定的综合指标iF称为原始指标的主成分。这样,原始指标所包含的较大部分的信息量就可以用前边的一部分不相关的主成分进行反映。进而在分析和解决原始问题的过程中,指标的维数得以减少,当数据组数增大时,可以避免维数灾难的问题。
因而,前k个主成分的方差贡献率为
指标综合一般是采用加权算术平均的方法,权重则选用各主成分的方差贡献率进行确定,即:
进一步可以得到各样本的综合评估值,并以此作为比较和排序分析的依据。
4 实例分析
某型装备某分系统的6次测试数据如表1所示。
表1 某分系统测试数据Tab.1 Test Data Sheet
4.1 初步处理
对表1中的数据进行初步筛查,发现第3年测试得到的参数2为30.021,超过误差限,属于故障数据,因此应予以剔除,加入故障统计数据集进行后续处理;同时,测试2结果与测试5结果完全相同,存在数据冗余,应予以合并处理,这里仅保留测试2结果。综上,初步处理后的数据表为剔除了测试3数据和测试5数据的数据表。
4.2 归一化处理
按照式(1)将原始指标数据进行标准化处理,得到归一化后的测试数据如表2所示。
表2 归一化的测试数据Tab.2 Normalized Test Data
4.3 完备化处理
如表2所见,测试4中的参数5为不完备信息,采用本文方法进行缺失信息的补全。根据历史数据和专家经验,这里取和分别为(2,0.05)和(10,0.75),得到补全值为0.944,填入表格中。
4.4 参数优化
将各变量约束条件及数据输入到SPSS软件中,由于主成分分析法要求变量是正向的[10],因而首先进行正向性检验,系数相关矩阵结果显示该组数据可以进行主成分分析。设置最大收敛性迭代次数为 25,在SPSS中开始进行主成分分析。根据表3所示“解释的总方差”及图3所示“主成分碎石图”可见,前两个主成分的累积贡献率达到 90.788%,其所构成的矩阵可对初始评估指标进行阐释。
表3 解释的总方差Tab.3 Accumulated Variance
图3 主成分碎石Fig.3 Principal Component Scree Plot
进一步可得到2个主成分的系数矩阵,如表4所示。
表4 主成分矩阵Tab.4 Principal Component Matrix
基于主成分分析法进行指标优化,将8个测试参数降为 2个主成分,有效降低状态评估维数,且降低指标间的相关性,使后续状态评估更加简洁高效。
5 结束语
通过对装备测试模拟量参数的清洗、合成与整理和归一化处理,基于时间序列和状态变化函数对缺失数据进行补全,保证状态评估指标数据来源的完备性,并且通过主成分分析对状态指标进行降维处理,为后续状态评估指标体系构建、模型建立以及评估和监测决策工作的开展提供基础条件。同时,对装备测试数据的规范化处理有利于装备全寿命数据库的构建,从而促进装备质量管理工作进一步向智能化、在线化迈进。