APP下载

基于核近邻非参数回归的航材消耗预测

2019-02-16薛永亮陈振林

海军航空大学学报 2019年6期
关键词:航材消耗曲线

薛永亮,陈振林

(海军航空大学,山东烟台264001)

航材保障能力是形成作战能力、遂行多样化军事任务的物质基础,航材供应的及时性影响着航空部队战斗力的生成。航材预测是航材精细化保障的重要工作,已有较多学者进行了研究[1-5]。对某型直升机航材消耗建立模型时,该机型较新、服役时间短,难以获取足够数据。同时,该机型备件国产化水平低,大部分要依靠进口,对该机型航材消耗,不仅要预测T+1时刻,还要预测T之后较长步幅的区间。本文参考多种分类、预测方法,针对上述问题,使用非参数回归算法建立模型。非参数回归是一种不对模型参数做任何假设的回归算法[6],在预测的过程中,不对模型做先验假设,按照算法约定探究数据自身规律,仅规定一些一般性条件,近年来该算法在多学科运用较为广泛[7-13]。根据航材消耗序列转化为消耗变异系数与序列突变系数[14],将航材分为消耗平稳型航材、突变型航材、离散型航材。本文针对平稳型航材波动性、离散性较小的消耗特点,使用核近邻非参数回归建立消耗预测模型。

1 核近邻非参数回归

核近邻估计是最经典的非参数回归算法,由Nadariyu 和Watson 提出,它的核心算法为在估计f(x0)时,给予接近观测点x0更高的权重。同时,给予远离观测点更低的权重[15]。令:

式(1)中:zi表示第i个观测值x与聚焦点x0之间存在正负区别的距离;h表示估计带宽,通过调整核函数的宽度来控制非参数回归曲线的光滑程度。

当带宽h过大时,得到的回归函数会失去数据曲度的一些细节,导致回归估计过平滑。当带宽h过小时,回归估计过于密切拟合数据,导致回归曲线粗糙,并且容易受到异常因素影响[16]。因此,需要在光滑度与拟合度之间做有效的平衡,其方法就是选取适合的带宽h。定义一个核函数k(z),将最大的权重靠近焦点x0的观测,而后随着 ||z的增长令权重对称、平滑降低。得到权重[15]:

计算可得:

式中,yi表示第i个月份航材消耗数。

2 基于可变带宽的核近邻非参数回归航材消耗模型

2.1 核函数选择

在核近邻估计算法中,常用的核函数包括:三角核函数、余弦核函数、beta族核函数、高斯核函数等[16]。

核函数的选择依据是根据距离分配各个样本点不同贡献程度的密度值。文献[17]中指出,在核近邻回归中,核函数的选取对于回归模型拟合效果影响较小。但通过航材消耗预测实验,由于数据特点多样,对于不同类型的航材消耗数据,选用不同的核函数有较大影响,针对平稳型航材,利用Quartic核函数,回归曲线能较好拟合数据。Quartic核表达式为:

2.2 带宽选择

当带宽h相对较小时,曲线拟合较好,但曲线的光滑性较差,峰值谷值突出,随机性影响较大,出现过度拟合;当带宽h相对较大时,曲线的光滑度很高但平均化作用过于明显,导致拟合不足,无法描述曲线趋势性变化,预测效果较差[18]。

基于核近邻回归对平稳型航材建立消耗模型,针对两端极化较大、边界带误差较大的问题,设计带宽h为可变带宽,在两端带宽较小,使得曲线与实际值较为贴近,在序列中端利用经典推论。例如,最优拇指带宽或交叉验证最优带宽等。

利用高斯核函数,将对称轴选在序列中间值,其数学表达式为:

式(5)中:h0是拇指带宽或最优带宽计算结果;N为样本容量。

设拇指带宽计算得出h0=0.5,取某型航材6年消耗记录,以月份为单位,N=72,可变带宽最大值最小值之比为1.6,为进一步强化带宽在序列两端的拟合效果,将带宽公式调整为:

带宽变化更为明显,在序列两端带宽较小,曲线拟合时,更加接近样本数值。

3 仿真对比试验

由于多种因素,某型直升机在役数量波动较大。为方便研究,本文将机群消耗数量转变为单机消耗数。同时,根据调研结果,可以假定该机型每年训练量、训练环境相近,因而可以假设其服役强度一致。某型航材72个月份消耗数据序列见表1。

表1 航材消耗序列表Tab.1 Sequence table of material consumption

由表1可见,该型航材消耗有一定波动,整体呈上升趋势,数据离散程度相对较小,消耗序列突变不大。

为做充分对比,分别利用拇指法,则带宽与可变带宽非参数回归(Non-Parametric Regression)对某型平稳型航材建立消耗预测模型,并对比支持向量机回归(Support Vector Regression)、最小二乘法(Least Squares)3 阶、4 阶等方法。为有效、精确评价模型预测效果,利用以下2 个指标分析对比不同模型的预测准确性。

1)均值百分比误差MAPE,其数学表达式为[10]:

2)均方根差RMSE,其数学表达式为[10]:

式(7)、(8)中:yi为实际值;ŷi为预测值。

仿真实验对比多种预测模型,预测结果见表2。利用MAPE 与MRSE 对预测效果进行对比,如表3 所示。利用基于可变带宽的核近邻非参数回归模型,对比原回归方法,仿真结果如图1所示。

表2 预测结果详表Tab.2 Table of prediction results

表3 预测结果评价表Tab.3 Comparison table of prediction results

图1 非参数回归对比图Fig.1 Contrast figure of nonparametric regression

由图1 可以看出,核邻近非参数回归在序列两端偏差较大,受起始点位置影响较大。利用可变带宽,在两端带宽较小,使得回归曲线接近数据样本,对数据信息更为敏感,较好地对原方法进行了优化。

利用改进的核近邻非参数回归模型对比参数回归模型3阶、4阶最小二乘算法,仿真结果见图2。

对于平稳型航材消耗数据,4阶最小二乘、非参数回归模型都能较好拟合消耗规律,预测航材趋势性变化,而3阶最小二乘曲线过于光滑,拟合效果不佳。

对比支持向量机回归,仿真结果见图3。

利用支持向量机回归建立模型时,消耗序列呈上升趋势,因而通过逐项训练对比,即前一数据为后一数据的训练集,得出拟合函数,再用后12 项数据进行预测,仿真效果不佳,未对航材趋势性变化做出有效预测。

图2 回归算法对比图Fig.2 Comparison figure of regression algorithm

图3 支持向量机回归对比图Fig.3 Comparison figure of support vector machine regression

4 结论

由于航材消耗相对平稳、呈上升趋势,使用核近邻非参数算法出现边界带误差较大、中位数据权重较大的问题。针对这一问题,基于高斯函数建立可变带,在两端带宽较小,使得曲线与实际值拟合更为紧密,减小中部数据权重较大的问题,对比多种预测模型,证明基于可变带宽的核近邻非参数回归对于平稳型消耗航材预测效果较好。

猜你喜欢

航材消耗曲线
未来访谈:出版的第二增长曲线在哪里?
转炉炼钢降低钢铁料消耗的生产实践
基于FCM算法的航材聚类研究
航材共享模式研究
浅析二手航材在中国的使用
幸福曲线
学会爱自己
从“人”的角度浅谈对航材管理的认识
If We Burne d All the Fossil Fuel in the World
梦寐以求的S曲线