设备健康状态评估指标体系约简方法*
2022-01-26魏曙寰
魏曙寰,曾 强,黄 政
(1.海军工程大学动力工程学院,武汉 430033;2.解放军91697 部队,山东 青岛 266400)
0 引言
健康状态评估是设备管理的关键环节,通过分析不同功能特性指标的变化,判定设备的健康状态程度,可以为设备的设计、使用和维修保障提供重要的决策依据[1-3]。为了保证产品能够达到规定功能的要求,技术规格书对功能特性指标进行了详细的规定,涉及产品输入、输出以及内部状态变化的诸多方面[4]。因此,设备的健康状态评估是一个多属性、多层次、多变量的复杂问题。目前比较常用的健康状态综合评估方法包括层次分析法[5]、D-S 证据理论[6]、支持向量机[7]、灰色类聚法[8]、贝叶斯网络法[9]等,这些方法的共同特点都是对不同功能特性指标进行主观或客观赋权,然后多指标合成确定设备的状态。
大数据时代随着数据量急剧增加,数据分析前降低属性维数是一项重要的预处理工作[10]。粗糙集[11-14]作为一种常用的属性约简方法,可以在保持系统分类不变的前提下,克服权重确定的主观性,将一些隐形属性或者对决策影响不大的属性进行剔除,被广泛应用于智能控制[15-17]、医疗诊断[18]、决策分析[19-20]、故障检测[21-22]等各个领域。对于设备的健康状态评估问题,不同指标对设备健康状态的影响不同;按照技术规格书确定的指标具有相关性,会对评估结果产生干扰。因此,在保证精度的条件下,对评估指标体系进行约简,保留最能反映设备健康状态变化的指标,是一项重要工作。文献[6]和文献[23]将粗糙集与D-S 证据理论相结合,通过粗糙集理论对技术状态评估指标进行约简,然后再运用D-S 证据理论进行多指标合成,得到设备的健康状态。这种方法减少了评估的不确定性,有效提高了决策的可信度。文献[24-25]指出将粗糙集理论与遗传算法、粒子群算法等启发式算法相结合,能大幅提高属性约简的效率。在上述研究基础上,本文提出基于粗糙集和遗传算法的设备健康状态评估指标约简方法,并应用于某燃气轮机健康状态评估指标体系的约简。结果显示,该方法能够在不失其代表性、系统性的前提下,将复杂指标体系约简为较为简洁、明了的指标体系,大幅减少健康状态评估所需的信息量和工作量。
1 粗糙集基本理论和概念
1.1 知识库基本理论
定义1 假设存在论域U 和等价关系集R,根据等级关系集R 对论域U 进行知识分类的过程记为U/R。论域U、等价关系集R 与U/R 共同组成关于论域的知识库。
粗糙集理论模型是在上述集合的基本理论上,以上近似和下近似关系,将现有对象划分到相应集合的计算模型。设(U,R)为近似空间。则有:
式(1)和式(2)分别称为X 的R 下近似集和R上近似集。
定义2 信息系统是一个四元组S=(U,A,V,f),满足:
式中,C 和D 分别为信息系统的条件属性集和决策属性集;VC表示信息系统的条件属性值,VD表示信息系统的决策属性值;f 为信息函数,其目的是将信息系统中对象的属性赋予一个值。
显然,式(4)中IND(B)是一个等价关系。
1.2 属性约简与属性核
1.3 属性依赖度
2 基于粗糙集和遗传算法的指标约简算法
引入粗糙集属性约简的概念,将健康状态评估指标体系作为信息系统,各项指标作为该信息系统的条件属性,健康状态等级作为该信息系统的决策属性。利用等距离离散化方法对指标数据进行离散化处理,得到指标约简的决策表。以决策属性对条件属性的依赖度越大和条件属性中包含的指标数量越少为目标,利用遗传算法进行寻优,以此简化健康状态评估的指标体系。
2.1 指标数据的离散化方法
设备的功能特性指标往往是连续性指标,在进行指标体系约简前,应对指标数据进行离散化处理。本文利用等距离离散化方法对指标数据进行离散化处理。等距离离散化方法具有简洁、快速的特点,其主要步骤如下:
步骤1 根据要求确定属性值离散化的区间数目K;
步骤2 根据区间数目K,将属性的值域[Xmin,Xmax]划分成每段距离都相等的K 个区间,每个区间的距离都为d=(Xmax-Xmin)/K;
步骤3 获得属性上的断点Xmin+id,(i=0,1,…,K);
步骤4 将各个属性值划分到对应的区间内,获得离散化结果。
2.2 遗传算法的编码方式
遗传算法主要包含编码、初始种群设定、适应度函数选择、选择操作、交叉操作和变异操作等基本步骤[26]。
2.2.1 编码方法
编码是指将一个问题的可能解,从其解空间转换到遗传算法能处理的搜索空间的转化方法。如何进行编码是运用遗传算法求解首要考虑的问题。不同的编码方式会影响交叉和变异过程,编码方法对种群的遗传进化效率也有一定的影响。本文选用二进制编码方法进行编码。使用固定长度的二进制字符串表示群体中的个体,等位基因由{0,1}组成。例如,用字符串01101 表示一个个体,其染色体长度为n=5,染色体中每一位数字对应一个条件属性;若某基因位置为1,则表示选择该位置对应的条件属性,若某基因位置为0,则表示不选择该位置对应的条件属性。
2.2.2 适应度函数
适应度函数主要用于计算种群中个体对环境适应能力的大小。种群中个体的适应度值通过适应度函数来确定,并以此判断个体的优劣程度,选择适应度值高的个体遗传到下一代。根据评估指标体系约简的要求,适应度函数的目标是在保证评估结果准确性的同时使得指标体系中的指标个数尽可能少。因此,在选择适应度函数时,将属性依赖度和条件属性个数也考虑其中。
2.3 算法流程
基于粗糙集和遗传算法的设备健康状态评估指标体系的约简算法主要步骤如图1 所示。
图1 粗糙集和遗传算法指标约简步骤
输入:由评估指标构成的信息系统S=(U,C∪D,V,f);
输出:评估指标信息系统S=(U,C∪D,V,f)约简后的指标体系。
步骤1 由指标数据构成的信息系统,经2.1节中介绍的离散化方法离散化处理后,得到指标约简的决策表。
3 健康状态评估指标体系约简案例
步骤4 将决策属性D 关于条件属性C 的依赖度γ(C,D)的最大化和条件属性C 中条件属性个数最少作为目标函数,利用遗传算法对其求解。
步骤5 初始种群由随机产生长度为|C|(条件属性的个数,指标体系中包含指标的数量)的二进制字符串所代表的个体组成。
步骤6 根据式(7)计算上述产生个体的适应度值。
步骤7 根据种群中个体的适应度函数值,进行遗传操作。
步骤8 判断目标函数值是否连续几代不再进行变化,如果是,则终止计算,输出约简结果;如果不是,则返回步骤6,继续循环。
采用本文提出的方法,以某舰用燃气轮机本体为例进行评估指标体系约简。按照技术规格书的规定,该舰用燃气轮机功能特性指标有12 项。其中,动力性能指标4 项,输出功率A1(kW)、低压转速A2(r/min)、高压转速A3(r/min)、动涡转速A4(r/min);运行稳定性指标7 项,低压振动A5(mm/s)、高压振动A6(mm/s)、动涡振动A7(mm/s)、高压压气机后空气压力A8(Mpa)、低涡后燃气压力A9(Mpa)、排气温度A10(℃)、燃气轮机排气总压A11(Mpa);经济性指标1 项,燃油消耗率A12(g/(kw·h))。
3.1 功能特性指标数据离散化处理
从监测软件和工作登记薄中,收集整理得到10组额定工况下的各项功能特性指标样本数据,脱密处理后的数据见表1。对表1 中的数据进行离散化处理,结果见下页表2。
表1 功能特性指标数据
3.2 功能特性指标的约简
利用本文提出的约简算法对离散化后评估指标体系进行约简。考虑动力性能指标是燃气轮机功能特性最为直接的体现,将动力性能指标单独约简,运行稳定性指标和经济性指标一起约简。根据表2 中的离散化结果,建立动力性指标体系约简决策表,见表3。将指标A1,A2,A3,A4作为条件属性,健康状态等级D={d}作为决策属性。d=0 表示状态等级为“差”;d=1 表示状态等级为“中”;d=2 表示状态等级为“良”;d=3 表示状态等级为“优”。根据图1 中基于粗糙集和遗传算法的指标体系约简步骤,对表3所表示的动力性指标决策表进行约简,其迭代过程如图2 所示。约简后得到最优个体为{0 1 0 1},即动力性指标的约简结果为{A1,A4},分别为低压转速A2和动涡转速A4。计算得到动力性指标(决策属性)d 对约简后最优个体{0 1 0 1}(即约简后的指标体系)的依赖度为1,表示约简后得到的指标,低压转速和动涡转速能很好地对燃气轮机的动力性进行反映。按照相同的方法对表2 中的稳定性和经济性指标进行约简,运行稳定性和经济性共8 个指标可以约简为3 个指标,分别为低压振动A5、低涡后燃气压力A9、排气温度A10。
图2 动力性指标约简寻优迭代过程
表2 功能特性指标离散化结果
表3 动力性指标决策表
从上述约简结果可以看出,原动力性指标体系中的输出功率A1(kW)、低压转速A2(r/min)、高压转速A3(r/min)、动涡转速A4(r/min)4 项指标,被约简为低压转速A2(r/min)、动涡转速A4(r/min)2 个指标。针对燃气轮机而言,低压转速A2和高压转速A3两者息息相关,可以通过相关计算公式相互换算,故在约简时仅保留了其中1 项指标,保留低压转速A2而非高压转速A3,由其约简样本所决定。动涡转速A4与输出功率A1密切相关,故约简后只保留指标动涡转速A4。同理,针对运行稳定性指标和经济性指标进行了约简。由此,约简后的指标体系与原指标体系具有一致性,能定性地反映燃气轮机健康状态。
4 结论
设备健康状态评估涉及的评估指标多、指标间关系复杂,给评估信息的收集带来巨大工作量,指标间的相关性带来的干扰也增加了评估结果的不确定性。本文针对上述问题,提出基于粗糙集和遗传算法的设备健康状态评估指标体系约简方法,利用粗糙集和遗传算法对状态评估指标进行约简,剔除冗余、保留最能反映设备健康状态变化的指标。某燃气轮机健康状态评估指标体系的约简案例显示,该方法能够在不失其代表性、系统性的前提下,将复杂指标体系约简为较为简洁、明了的指标体系,达到大幅减少信息收集工作量,提高评估结果准确性的目的。