贫信息背景下复杂装备的加速系数确定模型
——基于灰色关联与失效相似度
2021-11-04董学平邹龙春章恒陶良彦
董学平,邹龙春,章恒,陶良彦
(南京航空航天大学 经济与管理学院,南京 211106)
近年来,我国航空产业飞速发展,诸如C919等里程碑式项目的推进令人兴奋不已。在航空产业迅速发展的背后,质量与可靠性领域的研究是重要的一个理论支撑模块。装备研制过程中,无论是先期的设计阶段,还是后期的研发、优化、验收阶段,都需要对装备进行合理的可靠性设计、规划,并通过相关的实验数据进行辅助分析。然而,就可靠性而言,航空产业的很多装备具有大型复杂装备的共通特征:一方面,装备的复杂结构难以通过建模精确表征;另一方面,试验成本、代价高昂,可获得的试验数据较少。因此,如何充分利用现有的贫信息、小样本充分对系统的可靠性进行挖掘成为了一个重要的课题[1]。
考虑到上述复杂装备可靠性的研究背景,为了在节约成本的前提下增进对装备可靠性的理解,信息挖掘与融合自然成为了一个重点的研究方向。其中可靠性加速试验是一种目前广泛采用的方法,被众多学者进行了深入研究。
周源泉等人[2]根据加速系数的定义,深入研究了加速系数的性质,指出了这些性质与失效机理不变的条件间的本质联系,给出了各种常见寿命分布失效机理不变的条件。随后其又在装备失效服从计数过程时,根据加速系数的定义,详细地讨论了加速系数的性质,给出了各种常见的用计数过程表示的可靠性增长模型失效机理不变的条件[3]。赵志草等人[4]改进了已知加速模型,建立了处理变化使用应力的优化模型,对产品在变应力实验条件下的处理有一定的借鉴作用。傅惠民等[5]在装备失效服从计数过程时,根据加速系数的定义,详细地讨论了加速系数的性质,给出了各种常见的用计数过程表示的可靠性增长模型失效机理不变的条件。
在上述理论探索的基础上,考虑到工程的实际需要,部分学者开始不懈探索如何具体确定特定装备在不同环境下的加速系数。Qiang等人[6]考虑利用加速系数折合而成的数据对AMSSAA模型的拟合优度来确定最优的拟合系数。Ortigueira等人[7]的方法是通过确定使AMSAA拟合优度的检验统计量变异性最小的加速系数来作为最优的加速系数的解。洪东跑等人[8]利用风险比例模型来描述环境与可靠性之间的关系,进而给出了环境对装备可靠性影响的统计推断方法。除此之外,部分学者从实践出发,将复杂系统视作元器件组合,通过元器件层面加速系数的加权求和,确定系统层面各环境下的加速系数[9]。
事实上,从信息挖掘与信息融合的角度考虑,上述列举方法普遍存在两点缺陷:过分注重可靠性增长模型的地位,将模型视作客观的约束,从而决定数据的融合方式;数据挖掘、融合方面仅仅考虑了单个装备的不同环境、不同层级,然而对于特定装备来说,这样的融合并不一定有明确的实际意义。简言之,这些方法普遍具有一定的经验色彩[10],并且缺乏对历史数据的挖掘,很大程度上忽视了部分可利用数据的宝贵价值。基于目前研究存在的这些缺陷,文中致力于立足实践基础,基于目前广泛运用的灰色关联理论,充分挖掘历史数据,提出一种新的贫信息背景下确定复杂装备加速系数的方法。
在数据融合层面,文中采用的底层思想是目前工程上广泛运用的相似度思想。例如杨续昌等人针对产品设计时间通过传统预测方法难以准确预测的情况,利用灰色关联分析手法,计算装备之间的相似设计技术,从而对新装备的设计时间进行了准确预测[11]。本文改进了其方法,通过灰靶决策与定义新的装备失效相似度系数,对复杂装备的失效特征进行了更为细腻与精确的刻画。姚军等人[12]的研究指出,装备在正常应力和加速应力下必须具有相同的失效机理,这是进行加速寿命试验设计的重要前提,并提出了一种基于灰色理论的失效机理一致性检验方法。该方法可用预试验数据进行失效机理一致性检验,在一定程度上为文中的研究奠定了理论基础。
1 问题描述与灰色关联方法
装备的加速系数指的是其在两者环境下的失效率之比,即:
式中:A表示环境a相对环境b的加速系数,或称环境折合系数;λa与λb则为装备在两者环境下的失效率;MTBFi为装备在环境i下的平均故障间隔时间。
复杂工程(如C919等制造项目)从设计研发到制造生产,过程中的数据都具有贫信息、少样本的特点,且实验成本昂贵,无法获得更多有效的数据。如何从这些少量的信息中测量复杂设备的可靠性就成了当下的研究难题。在实践过程中,经常遇到的情形是需要确定新的装备在各种环境下相较正常环境的加速系数。但在这种情况下有的往往仅仅是历史类似装备的相关数据,包括在不同环境下的加速系数ai与失效时间数据Xa=(xa1,xa2,…,xap)等。因此,文中致力于构建一个可以挖掘历史相关数据,从而确定新复杂装备加速系数的方法。针对问题特点,主要采用了灰色关联方法。
灰色关联方法与数理统计中的主成分分析、回归分析类似,都是用来进行系统分析的方法。与传统方法相比,灰色关联方法最大的特点就是不要求样本服从某个特定的概况分布,不要求有大量数据等。同时灰色关联方法计算量较小,十分简洁,基本不会出现定量与定性分析不一致的情况。灰色关联的基本思路是通过序列几何曲线的相似程度,判断对应特征联系的紧密程度。当曲线接近时,对应的序列之间的关联度越大,反之则越小。
经典的灰色关联分析方法步骤如下所述[13]。
步骤1:确定原始序列{X0(k)},k=1,2,…,n与比较序列{Xi(k)},k=1,2,…,n,且1≤i≤j。
步骤2:对各序列进行归一化处理。此步骤的目的是为了消除各组序列不同数据之间的量纲,使之具有可比性。此步骤应根据实际情况选用适当的初值化算子。
例如令:
其中:k=1,2,…,n,且i=0,1,2,…,j。
步骤3:求各组数据之间的差序列并求极差。
步骤4:计算各组数据之间的关联系数:
步骤5:计算各组之间的序列关联度:
2 基于灰色关联度的系数确定
基于灰色关联与失效相似度复杂装备加速系数确定的基本思想是:对于任何一类装备,在确定其在各种环境下的加速系数时,可以利用的数据不仅仅只有当前装备的若干设计、试验数据。事实上,具有类似结构、设计的同类装备的历史信息均可被用来进行新装备加速系数的估计。特别地,若同类装备与新装备在利用FEMA模式分析时,表征出来的失效模式相似度越高,那么就有理由相信,在失效特征保持一致性的前提下,历史装备则能为新装备加速系数的确定提供更多的相关信息。
基于灰色关联与失效特征相似度的加速系数确定流程如下:首先根据专家经验,选择需要进行筛选的装备集,然后采用灰色关联系数计算该装备与新装备的相似度,判断是否相似。如果不相似,则排除此样本;如果相似,则进一步计算环境的相似度,从而判定是否可以进行融合。如果相似度未超过阈值,不能进行融合,那就排除在这个环境下的信息;如果可以进行融合,则计算装备失效特征的相似度作为融合权重进行信息融合,并最终计算得到新装备的加速系数。具体流程见图1。
图1 新复杂装备加速系数确定的步骤 Fig.1 Steps to determine the acceleration coefficient of new complex equipment
2.1 相似系数的确定
在利用灰色关联算法计算装备相似系数时,首先要根据专家经验构造以研究对象为核心的特征集。假定对于待研究装备,专家判定其具有N个典型特征,其中由M个为容易量化的特征,例如核心部件数量、装备研制费用等。剩余的N-M个特征则是定性的特征,例如装备设计复杂程度、装备主要的工作环境等。对于定量的特征,可以考虑利用灰数来表征。例如利用区间灰数刻画装备设计复杂程度的论域,其中数值越高,表示装备复杂度越大。如果专家判定某装备的设计复杂程度较高,可以用定量刻画装备的复杂程度。由此可知,对于待判定装备的N个特征,显然均可以采用一般区间灰数或白数加以量化,则可得待研究装备的特征序列X1=(x11,x12,…,x1N)。类似地,也可以求得需筛选装备集中任意装备的特征序列Xi=(xi1,xi2,…,xiN)。至此,对于待研究装备与需筛选装备的特征集合均已求得,则可利用灰色关联方法求得待研究装备与任意待筛选装备特征的关联度γ1i(区间灰数可利用核进行运算)。
定义 1:当待研究装备的特征序列X1=(x11,x12,…,x1N)与需筛选装备的特征序列Xi=(xi1,xi2,…,xiN)的灰色关联度γ1i超过依经验设定的相似度阈值时,即时,则称待研究装备与需筛选装备相似,并将需筛选装备的相关信息纳入后续计算。
2.2 装备环境相似度的确定
在计算装备环境的相似系数时,可以采用类似的方法将各种实验环境进行量化,例如温度、湿度、振动频率等因素。然而考虑到灰色关联系数的几何意义,直接采用环境的特征序列来定义装备之间的环境相似系数并不十分合理。因为若仅考虑特征序列的几何序列,低温、低湿度环境序列的几何形状很可能与高温、高湿度环境序列的几何形状十分类似,然而这两种环境作用对于装备的加速系数可能差距却较大。因此,在定义装备环境的相似系数时,相比考虑装备环境序列内部的关联性,更应该考虑不同序列直接的绝对距离。因此,可以采用灰靶的思想进行相似环境的筛选。
设装备i的试验环境α的特征序列为,其中m为环境特征的个数,ei为常用来描述加速试验环境特性的特征量,为区间灰数或白数。为了保证综合考虑环境的各项特征,记为经过归一白化后的序列,即其中各项特征值均在[0,1]之间。
定义2:当某装备i的环境特征α与待研究装备的环境特征β的灰靶距离满足则称装备i的环境特征α与待研究装备的环境特征β相似。其中参数R2由历史数据、专家经验和实际需求综合确定。例如当历史各装备的实验环境差距较小,且对融合要求更严格时,可取较小的R2。
2.3 装备失效特征相似系数的确定
装备失效特征系数是为了表征在相似环境下不同装备失效之间相似度的概念。装备的失效行为可以被认为是一种受内外部复杂因素造成的结果,通过装备表现出来的失效特征(失效类型与失效频率)的相似度可以衡量不同装备之间的失效相似度。有理由相信,在失效特征和试验环境相似的前提下,历史的失效数据和加速系数可以被用来作未知装备加速系数的预测。因此定义装备的失效特征相似系数如下:设在给定试验环境下,装备i有已探明失效机理的历史失效数据ki个,经FEMA分析后,这些失效的失效机理可被归为j类(j为所有试验装备的所有失效机理情况)。则对于装备i有其失效数据集:。其中为其依序递增的失效时间序列。
同时对于装备i有其失效机理数据集,其中不bn为装备失效数据中失效机理为第n类的失效的数量。同时对于所有装备,归类标准均应保持一致,即失效机理数据集中的第n类失效机理应当是一致的,且第j类失效应为其他失效或未探明原因的失效。
再考虑历史样本数据的复杂性,在灰色关联分析的背景下定义灰色截尾关联度,以便于实际分析。
通过此定义,最大化地利用了原始数据的内涵。
定义4:对于待研究装备,其与任意相似装备i之间的失效特征相似系数ρ1i定义为
2.4 新装备加速系数的确定
综上所述,可得新装备的加速系数确定步骤如下:
1)确定待研究新装备,确定其主要特征,并对其量化,得其特征序列。
2)确定历史待筛选装备集,求其中各装备的特征序列。计算新装备与各历史待筛装备的装备相似系数γ1i,与设定的特征阈值相比较,相似度超过阈值的进入下一步筛选。
3)确定待研究新装备与历史经筛装备的各环境特征序列,与各环境下的失效数据集和失效机理数据集。对新装备的各实验环境,将其与历史各装备的实验环境进行对比,判断环境特征相是否相似,确定新装备在各环境下的待融合数据。
4)计算新装备某一特定环境下与历史装备相似环境的失效特征相似系数ρ1i,则新装备某一特定环境对正常环境的加速系数为:
式中:n为与新装备某一实验环境相似的历史实验环境个数;ρ1i为该环境历史装备与新装备于此环境的失效特征相似系数;ai为该装备历史环境对其正常环境的加速系数。
3 仿真数据分析
设某大型客机组成部件A在研制过程中受试验经费与试验时间限制,希望利用可靠性加速试验来达到节约时间与成本、压缩整体可靠性实验规划的目的。为了对部件A的寿命与失效率进行预测,现需要求得的关键参数为部件A在各复杂严苛试验环境下对正常实验的加速系数。现根据经验得到需初筛类似装备11件,希望利用此类历史装备的经验来对部件A的各环境下的加速系数进行一个初步的估计。现经过初步数据处理得到各装备数据,见表1。
表1 装备特征序列 Tab.1 Equipment feature sequence
计算各装备与待求装备之间的相似系数,进行初步筛选。对于区间灰数,考虑采用其核作为其白化值,并求其他装备特征序列与装备A特征序列的灰色关联度。以γ= 0.85作为相似度的阈值,选取适当的归一化算子,利用灰色关联度算法求得γA5=0.69,γA6=0.74,γA8= 0.82,而其他装备与待求装备的相似度均高于0.85。故在后续分析中排除装备5、6、8,将其他装备纳入后续分析,见表2。
表2 环境特征序列 Tab.2 Environmental feature sequence
计算其他各装备、环境与待研究装备A各环境的相似系数,选取特定的融合环境。例如,为了计算待研究装备A的实验环境aA的相似环境,利用表2中同类数据中的最大值对每组环境的特征序列进行归一化。然后利用灰靶算法测算表2中各环境序列与环境 Aa的距离,并设定相似阈值20.1R=,得装备2、3、4、10、11对于环境对应的相似度分别为0.04、0.07、0.02、0.07、0.03,落在灰靶限定的相似度以内。在后续步骤中,用以上装备对应的相似环境下的失效数据进行后续融合。装备A其他环境bA,cA,dA的相似环境判断标准同理。下面以装备A 的环境aA为例,进行信息融合。
利用2.3中算法,结合表3数据求得装备A与上述各环境的相似系数依次为:ρA2=0.62,ρA3= 0.68,ρA4=0.72,ρA10= 0.51,ρA11= 0.84,并查得相应的各环境下的加速系数历史数据分别为:a2=4.2,a3= 6.5,a4= 7.1,a11= 4.8。
表3 失效特征序列 Tab.3 Failure feature sequence
将上述数据代入公式,求得装备A环境a相对于正常环境的加速系数:
即新装备A环境a相对于正常环境的加速系数为5.6。
与传统工程实践中通过信息融合确定加速系数的方法相比,此方法不需要通过芜杂的计数工程来将子系统或元部件的可靠性进行融合,具有简便的特性。传统方法的融合方式不考虑各子系统之间的耦合关系,数据融合方法较为粗糙,缺乏合理性;而本方法的融合结果则充分基于历史数据的基础上,实现了对贫信息、小样本的充分挖掘利用。
4 结语
传统确定加速系数的方法往往依靠经验,事实上,关于既定的加速系数,也难以以一套非常客观公正的标准来判定其精确度。考虑到可靠性加速试验在工程中的广泛应用,针对不同装备判定其在不同环境下的加速系数仍然是具有充分价值的。文中提出的方法是利用历史同类装备作为参考。然而与同类文献比较,该方法不仅仅依赖装备的相似度作为判定指标,并对环境进行筛选,无疑提升了方法的精确度与判断的准确性。应用的简便性与方法的可迁移性也保证了此方法易于广泛运用。另一方面,更客观、合理的加速系数评价方法与系统层面的加速系数、可靠度的融合方式也非常值得进一步研究。