APP下载

基于回归算法的装备健康度预测方法

2022-12-30吕婷婷王清柏林元

火炮发射与控制学报 2022年6期
关键词:指标体系装备预测

吕婷婷,王清,柏林元

(陆军工程大学 野战工程学院,江苏 南京 210007)

随着装备信息化水平的不断提高,其维修保障和作战训练的难度也在持续增加,为保证装备战斗力持续生成,在装备的使用与维护中,其健康度的预测精准度对于是否能顺利完成任务至关重要。近年来诸多学者在健康预测方面进行了深入研究,文献[1]针对齿轮箱健康状态的好坏,提出了相对健康度的评价模型,将齿轮箱的健康度划分到0-1的范围,实现了齿轮箱健康状态的量化评估。文献[2]针对风机叶片开裂的问题,使用了机器学习的两种方法对其进行健康预测,为风机叶片的健康状况的检测提供了参考标准。文献[3]使用机器学习中逻辑回归、支持向量机和深度神经网络对哮喘早期预测均有明显优势,其预测的准确性也大大提高。大部分装备健康度主要停留在定性分析与评估层面[4],虽然能一定程度上解决装备健康度等级划分的问题,但是仍然存在分类标准不统一、评估结果粗糙、主观性较大、准确性较低等问题,对装备缺乏精细化管理。针对当前装备健康度预测现状,在原有装备科学分类的基础上,结合装备结构本身特点及运行机制,以一种定量的方法对装备健康度进行细化管理,即建立一种可以进行连续值输出的装备健康度回归预测模型,从而实现根据现有装备健康状况预测未来装备的健康状态。

1 装备健康度预测指标体系构建

1.1 指标体系分析

装备的结构组成复杂,不同的零部件和子系统都具有不同的健康运行状态,在对装备进行健康度预测前应建立装备健康度评估指标体系,确定其预测指标,统一预测标准,方可得到准确的预测结果。影响装备健康度预测的因素较多,这些因素从不同角度、不同层次反映了装备运行情况的好坏。在装备健康度预测指标体系中,指标选取的并非越多越好,而是从基于预测指标的代表性出发,即尽量选择最能反映装备健康状态好坏的典型指标,剔除相对次要的指标,并且保证每个指标的可测性、完备性、独立性、客观性、灵敏性及一致性[5]。笔者综合考虑装备寿命、使用维修情况、装备及其子系统健康状况的特点,构建了装备健康度预测指标体系,并将其分为两大类,分别是装备总体健康度和装备子系统健康度,具体指标体系如图1所示。

表1 装备健康度预测指标体系

1.2 装备健康状态等级划分

在以往的装备健康状态等级划分中,一般将装备的综合健康度分成优、良、中、差、故障5个类别,为区分同一健康等级下装备的具体健康度,采取更加精细化的连续分值表示。基于此,建立装备健康度回归预测模型,将简单的装备健康度的分类分级评估转为实数回归,结合客观评估规则和专家评判法最终确定装备健康度[6],以0~100分值表示,具体划分范围如表2所示。

表2 装备健康状态划分范围

2 基于回归算法的装备健康度预测模型

机器学习回归算法是一种有监督的算法,用来构建自变量和应变量之间的关系,从而实现对数据的连续预测。常用的回归算法有线性回归(LR)[7]、K近邻分类算法(KNN)[8]、支持向量机(SVM)[9]、决策树(DT)[8]、随机森林(RF)[8, 10]、梯度提升决策树(GBDT)[11]、Adaboost算法[12]、Bagging算法[13]和极端随机树(ET)[14]等。由于各类算法在同一应用场景下效果不一,为论证机器学习回归算法在本问题研究中的实际运用情况,笔者基于以上典型回归算法构建装备健康度预测模型。

根据前文分析,装备健康度中子指标机器健康度的计算方法基本一致,因此可采集不同种类装备的健康运行数据构建数据集,将其作为原始数据集用于后续回归预测,以提高模型准确性。

装备健康度预测是对装备的综合健康度进行预测,笔者所建立的基于回归算法的装备健康度预测模型具体步骤如下:

1)根据装备健康度评估指标体系进行装备的健康状态监测,从而获取健康数据,得到数据集样本特征值。

2)使用表2中的客观评估规则和基于主观描述的专家打分,对装备健康度进行实数打分,得到数据集样本标签。

2018年度第五届法国INNODESIGN PRIZE国际创新设计大奖颁奖典礼于11月7日在法国梅斯隆重举行。活动得到了法国梅斯市政厅、法国创意与设计专业委员会及中国驻斯特拉斯堡总领馆的大力支持。今年大奖注重设计与生态、科技、环保、商业相结合,坚持多元与融合的审核标准下,法国INNODESIGN PRIZE国际创新设计大奖专业评审团共收到各国参赛设计作品1607套,其中中方(含港澳台地区)设计师成果丰硕,获得提名作品162套,在平面设计、产品设计、空间设计类等方面获奖作品36套。

3)对划分后的健康度数据进行数据清洗,得到数据集T。

4)将数据集T划分为训练集D和测试集S,并且D、S中各健康等级的样本比例保持基本一致。

5)基于机器学习中的典型回归算法构建装备健康度回归预测模型,使用训练集训练模型(使用交叉验证)并用测试集预测。

6)重复步骤4和5共100次,得到预测结果,取平均值。

7)将预测结果与真实专家评分结果进行对比分析,验证装备健康度预测方法的有效性。

基于回归算法的装备健康度预测模型如图1所示。

3 实验分析

3.1 数据集

为验证模型效果,选取3 285台装备健康度作为数据集样本,其装备健康度评估类别分布如图2所示。

根据装备健康度预测指标体系得到装备健康状态的各项指标值,以及使用客观评估规则结合专家打分法得到装备健康度的实数评分,如表3所示。

表3 装备健康度评估采集部分数据示例表

3.2 预测模型评估指标

由于各类不确定因素影响,实验结果不可避免存在预测误差,预测误差是指预测值与实际值之间的差距。常用的评价标准如以下所示:

1)平均平方误差,就是对误差的平方和取平均值,可表示为

(1)

式中:n为样本量;yt为实际值;ytp为预测值。

2)平均绝对误差,可表示为

(2)

3)均方根误差,可表示为

(3)

4)模型解释度R2,可表示为

(4)

MSE值越大,证明真实值与模型预测值差值越大,误差越大;从MAE表达式中绝对值可以看出,其损失函数有不可导点,因此,其目标函数不能被优化,不利于模型的评估,并且该指标对离群点以及噪点都不敏感;RMSE表示模型误差的标准差,其值越小则模型的性能越好;R2表示的是评估模型的拟合优度,反应回归算法中自变量对因变量波动的可解释程度,该值在0~1之间,其评估参数值越接近1,模型的回归效果越好,可解释性就越强。

3.3 实验结果与分析

为验证所建模型的有效性,将机器学习中常用的Adaboost、Bagging、ExtraTree、DT、GBDT、KNN、LR、RF、SVM共9种回归算法代入到模型中进行实验。

数据集按照7∶3划分训练集和测试集,采集交叉验证的方法,并且保证每份中各类类别所占比例一样,为避免结果随机性的影响,将各算法对应的回归模型均运行100次,评估指标采用前述MSE、RMSE、R2来进行评估,并获取其最大值、最小值和均值,分析结果如表4所示。

表4 回归预测模型的评估指标

3.3.1 模型有效性分析

从表4中的R2指标可以看出,模型对数据的拟合优度可达到0.98以上,即使拟合效果最差的KNN算法也达到0.86以上,说明基于机器学习回归算法所构建的装备健康度预测模型能较好的拟合专家评分结果,可有效拓展到实际运用中。

3.3.2 模型算法优选策略分析

根据最优化理论中的“没有免费的午餐”定理,机器学习在不同应用场景或特征下各回归算法优劣性不一,针对笔者提出的装备健康度预测评估指标体系,表4展示了笔者选用的9种常见回归算法实验结果优劣。

Bagging、RF、GBDT和DT算法都是集成算法,综合考量了多个分类器的预测效果,泛化能力较强,表现总体较好;Adaboost的弱学习器数目难以确定,相比其他集成办法,其预测精度下降;SVM、LR、KNN容易被异常值所影响,而采取专家打分法的装备健康度标签具有一定的人为影响,难以完全避免异常值出现,因此效果不太理想。综上所述,Bagging算法的实验结果最理想,其次是RF、GBDT和DT,因此在后续装备健康度预测研究中,若采取与本文类似的装备健康度预测指标体系,可优选以上4种算法构建回归预测模型。

3.3.3 结果可视化

为进一步验证算法的性能,取测试集中的前100项数据样本,对Bagging、RF、GBDT和DT这4种算法构建模型的预测结果与真实值进行绘图对比,结果如图3所示。

由图3可知,Bagging、RF、GBDT和DT这4种算法对装备健康度的拟合效果较好,未出现明显的过拟合与欠拟合现象,进一步说明了其对应的模型具备较高的实用价值。

4 结束语

为克服传统装备健康度评估粗糙的缺陷,笔者以通用装备为研究对象,针对装备的健康度预测,结合装备的结构特点和运行机制,提出了装备健康度预测指标体系,构建了基于常见机器学习回归算法的装备健康度预测模型,通过实验数据验证了所建模型的有效性,并经过数据分析给出了模型对选用算法的优选策略,提高了未来装备健康度预测效率,为装备健康度科学预测和装备的视情维修提供了依据,同时也在任务装备优选及平时装备优化保障方面具备一定参考价值。

猜你喜欢

指标体系装备预测
无可预测
这些精锐与装备驰援泸定
2022城市商业魅力指标体系
港警新装备
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
防晒装备折起来
网络空间攻防对联合作战体系支援度评估指标体系构建
建筑工程造价指标体系构建与应用探究