一种基于XGboost的战储航材品种确定方法
2021-12-06张敦成阳菲宇
张敦成 阳菲宇
摘要:为了解决传统品种确定方法人为因素影响较大、准确性低等弊端,笔者以XGboost理论为基础,提出一种基于XGboost的战储航材品种确定方法,对提高战储航材品种确定的准确定具有重要意义。
1算法介绍
XGboost算法又叫作极限梯度提升算法,是由GBDT算法发展而来的一种以Boosting集成学习为核心的提高树算法。XGboost算法不仅在预测方面具有较高的准确性,而且在运算效率和容错率方面也优于其他算法,可结合实际问题对其算法进行相应调整,这使得XGboost算法被广泛应用于多种领域。
1.1 XGboost树的定义
XGboost算法符合前向分步加法,是由个基础模型累加而成的加法模型,其第t棵树的训练模型如下所示:
其中表示迭代t次后样本i的预测结果,表示前课树的预测结果,為第t棵树的预测模型。
1.2 XGboost的目标函数
XGboost算法的loss函数由真实值和预测值构成,实质上是预测指与真实值的偏差。
其中,n表示样本数量。
众多周知,模型的精确性同时受偏差和方差的影响,模型的偏差由loss函数表示,为了减小模型的方差,还需要在目标函数中加入正则项。正则项可以用来控制模型复杂程度,模型复杂性越低,其泛化性就越高,应用范围就越广。因此,XGboost的目标函数由loss函数和正则项共同组成,其表示方法如下所示:
式中,为正则项,在数值上等于前t棵树的复杂度的累加和,用来避免模型出现过度拟合现象。
2建立评价指标
本文以精确度、储备率、期望准确率以及的值作为XGboost分类模型的评价指标,各指标的计算方式如下:
式中,表示需列为战备储备的样本中被列为战储航材的样本数量;表示需列为战备储备的样本中没有被列为战储航材的样本数量;表示不需列为战备储备的样本中被列为战储航材的样本数量;表示不需列为战备储备的样本中没有被列为战储航材的样本数量。
3 XGboost分类模型的基本步骤
基于XGboost算法理论基础,根据某机型航材执行任务期间消耗数据,给出该机型战储航材品种确定方法,其流程如下:
1)对某机型执行任务期间的航材消耗数据进行收集整理,分析其消耗规律,并对航材数据进行归一化处理。
2)分析战储航材品种确定影响因素,对样本航材各因素的属性值进行分析。
3)对航材样本进行分组,设置训练集和测试集对算法进行训练,用折交叉验证法确定航材样本的分组数,最终确定最优分组。
4)用XGboost算法对各影响因素的重要度进行排序,选取对战储航材品种确定影响较大的因素,建立战储航材品种确定决策和规则库。
战储航材品种确定基本流程如图1所示。
参考文献
[1]宋传洲,王瑞奇,孙岩,刘战,孟凡娜.面向任务携行航材品种确定和消耗预测的特征选择分析[J].兵工自动化,2021,40(06):80-86.
[2]阮旻智,傅健,周亮,王俊龙.面向任务的作战单元携行备件配置优化方法研究[J].兵工学报,2017,38(06):1178-1185.