一种灰色SVR珩磨尺寸组合预测模型
2019-10-08高远宁会峰程金祥
高远,宁会峰,程金祥
(1.兰州理工大学机电工程学院,甘肃兰州730050;2.中原内配集团股份有限公司,河南焦作454750)
0 引言
珩磨是一种精加工方法,对其尺寸序列进行预测并进行自适应补偿具有重要意义[1]。传统预测方法如指数平滑法(Exponential smoothing,ES)、自回归积分滑动平均模型(Autoregressive integrated moving average model, ARIMA)存在非线性处理能力差,预测误差大的缺点[2,3]。智能预测方法如人工神经网络 (Artificial neural network,ANN),存在建模样本多、耗时长、小样本泛化能力差等缺点[4]。
GM(1,1) 灰色预测模型以小样本、贫信息的不确定系统为建模对象,建模方便,应用广泛[5,6]。但是GM(1,1) 采用近似替代法进行参数估计和预测方程求解,在一定程度上影响了其预测精度。SVR 是一种建立在统计学习理论基础上的小样本机器学习方法,具有很强的非线性系统处理能力,广泛应用于各个领域[7,8]。但是SVR 模型参数的选择对其预测精度的影响很大,一般采用群智能算法进行优化[9]。
本文提出了结合GM (1,1) 和SVR 优点的GSVR 组合预测模型。首先,利用累积法改进的GM(1,1)(Accumulation GM(1,1),AGM(1,1))模型进行等维递补预测,得到等维递补AGM(1,1) 模型(Equal -dimensional complement AGM (1,1),ECAGM(1,1));其次,利用灰狼优化算法(grey wolf optimizer,GWO)对SVR 参数进行优化,得到灰狼优化支持向量回归机 (Support vector regression with grey-wolf optimization algorithm,SVRGWO)并对ECAGM(1,1)模型残差进行预测;最后,利用SVRGWO 残差预测值对ECAGM(1,1)模型预测值进行修正,得到灰色支持向量回归机模型(Grey support vector regression,GSVR),并将其应用于柱塞套内圆珩磨尺寸的预测。
1 ECAGM(1,1)模型
1.1 GM(1,1)模型
设原始非负时间序列:x(0)(k),k=1,2,L,n,其一阶累加生成序列为:
令x(1)(i)在[i-1,i]区间上的背景值序列为:
得GM(1,1)模型的基本方程:
其中,a 为发展系数,b 为灰作用量。
GM(1,1)模型对应的白化微分方程为:
对GM (1,1) 模型参数进行最小二乘法估计得:
取初值为x(0)(1),得GM(1,1)的白化响应预测值:
1.2 AGM(1,1)模型
累积法直接基于样本数据估计参数,属于线性无偏最小方差估计,利用累积法对参数a、b 进行估计可消除最小二乘假设所产生的估计误差。对式(3)两边实施1 至2 阶累积和得:
则模型参数估计值为:
GM(1,1)模型预测公式由其白化方程而不是基本方程得来,存在结构性误差,经推导可得AGM(1,1)模型的基本预测公式[10]:
1.3 ECAGM(1,1)模型
为了使AGM(1,1)模型能及时捕捉数据的变化趋势,将最新预测数据实时补充到建模数据中,进行动态等维递补预测,具体步骤如下:
(1) 确定AGM(1,1)建模维数m,利用第1 至m 个原始数据进行AGM(1,1)建模并预测第m+1个数据,得其预测值(m+1)。
(3)重复步骤(2),直至完成要求的所有预测。
2 SVRGWO 模型
2.1 SVR 模型
SVR 的基本思想是基于结构风险最小化的原则,通过非线性映射φ(x)将输入空间的非线性原始样本数据映射到高维特征空间中进行线性回归估计,其回归方程为:
引入ε——不敏感度损失函数来定义拟合精度:
从而得经验风险方程:
考虑到拟合误差,引入松弛因子ξi≥0、ξ*i≥0,并引入惩罚因子C>0 惩罚拟合误差,标准ε-SVR 可表示为:
引入核函数k(xi,xj)=〈φ(xi),φ(xj)〉,采用对偶原理求解式(14),得式(11)中的参数向量w:
其中,βi、为Lagrange 常数。
从而得SVR 回归方程:
核函数用低维空间的直接运算代替高维空间的内积运算,决定着SVR 的性能,本文选取径向基核函数,其表达式如下:
其中σ 为径向带宽。
2.2 GWO 算法
GWO 算法是一种基于迭代模式的群智能优化算法[11],该算法从已知数量的具有随机位置的灰狼开始求解问题。假设d 维搜索空间中包含N个个体,第i 个个体的位置Xi为:
包围猎物过程建模如下所示:
t 表示当前迭代次数,Xp表示猎物位置,X 表示某个灰狼位置,A 和C 表示系数向量,计算公式是:
其中a 的分量在迭代过程中从2 线性减少到0,而r1、r2表示取值范围为[0,1]的随机向量。
假设α、β 和γ 分别为目前为止获得的前三个最佳个体,并强制其他个体ω 根据最佳个体的位置更新其位置。灰狼的狩猎过程建模如下:
2.3 SVRGWO 实施步骤
利用GWO 优化算法对SVR 的参数(C,ε,σ)进行优化,并用SVR 模型进行预测,具体步骤如下:
(1)初始化运行参数。
确定种群规模N,设置最大迭代次数tmax或适应度误差限eps 和搜索范围。
(2)适应度评价。
以负平均绝对百分比误差值作为种群中每个个体的适应度值fiti(t):
式中,yi与fi分别表示实际值与预测值,n 为预测数目。
(3)最优更新。
根据适应度值大小,确定前三个最佳个体的历史最优位置Xα,Xβ和Xγ。
(4)个体位置更新。
利用式(23)更新个体位置,得X(t+1)。
(5)重复步骤(2)~(4)。
(6)判断是否满足停止条件。若达到最大迭代次数或要求精度,输出全局最优解Xbest;否则,返回步骤(2)。
3 GSVR 组合预测模型
将ECAGM(1,1)模型与SVRGWO 模型相结合,用SVRGWO 模型对ECAGM(1,1)模型的预测残差进行修正,得到GSVR 模型,具体步骤如下:
(1)ECAGM(1,1)模型预测
利用ECAGM(1,1)模型,得预测序列x(0)(i),i=1,2,L,n。
(2)计算残差序列
(3)SVRGWO 模型预测残差序列
以e(0)(i),i=1,2,L,l 为SVRGWO 建模数据,划分训练集和验证集,利用SVRGWO 模型预测残差(i),i=l+1,l+2,L,n
(4)残差修正
4 实例验证
4.1 珩磨尺寸数据
以文献[12]中的柱塞套内径珩磨尺寸原始数据为实测值进行建模与预测,对GM(1,1)、AGM(1,1)、ECAGM(1,1)和GSVR 模型的预测性能进行比较。实际值如表1所示。确定GM(1,1)建模维数m=15。将原始数据划分为两部分,前20 组数据用于建模与拟合,后4 组数据用于测试,即l=20。
表1 原始数据
4.2 珩磨尺寸预报
4.2.1 ECAGM(1,1)珩磨尺寸预报
利用累积法求得灰色模型参数a=0.057, b=24.2878。对实测数据进行预测,得ECAGM(1,1)预测序列(1)~(20)和(21)~(24),分别如表2和表3所示。
表2 ECAGM(1,1)预测值(1-20)
表3 预测值(21-24)
4.2.2 SVRGWO 残差预测
根据上述方法,计算得到ECAGM(1,1)模型预测残差序列划分ECAGM(1,1)模型残差序列e(0)(1)~e(0)(16)为训练集,e(0)(17)~e(0)(20)为验证集,利用GWO算法求得SVR 最优参数 (Cbest,εbest,σbest)=(20.587,0.0015,0.0375),并在最优参数下训练建立SVRGWO 模型,残差预测序列(20)~(24),如表4所示。
表4 残差预测值
4.2.3 GSVR 组合预测
4.3 预测结果分析
为比较GSVR 模型的预测性能,在同等条件下利用表1数据进行GM(1,1)和AGM(1,1)预测,预测值如表3所示。为评价GM(1,1)、AGM(1,1)、ECAGM(1,1)和GSVR 模型的预测精度,对其预测结果进行均方根误差 (Root mean square error,RMSE) 和平均绝对百分比误差 (Mean absolute percentage error, MAPE) 统计分析,RMSE 和MAPE 值如表5所示。将GSVR 模型预测值、RMSE 和MAPE 值分别与GM (1,1)、AGM(1,1)、ECAGM (1,1) 三种预测模型的预测值、RMSE 和MAPE 值进行比较,图1为四种方法的预测曲线对比图。
由图1可以看出,与GM(1,1)、AGM(1,1)和ECAGM(1,1)三种模型相比,GSVR 模型与原始数据最接近。
由表5可以看出,与GM(1,1)、AGM(1,1)和ECAGM(1,1)三种模型相比,GSVR 模型的RMSE和MAPE 值最小,其值为0.2826 和4.73%,RMSE 值分别降低了76.61%、73.76%和58.73%,MAPE 值分别降低了76.87%、74.05%和58.73%。图1和表5表明,GSVR 模型对珩磨尺寸的预测精度明显优于GM(1,1)、AGM(1,1)和ECAGM(1,1)模型。
表5 预测结果统计分析
图1 预测曲线对比
5 结论
通过对灰色GM(1,1)模型进行改进并与SVR模型进行组合,以珩磨尺寸预测进行实例验证,得出以下结论:
(1)ECAGM(1,1)模型充分利用了最新数据信息,提高了GM(1,1)模型的预测精度。
(2)SVRPSO 模型能够有效地预测ECAGM(1,1)模型的残差。
(3)GSVR 组合预测模型修正了ECAGM(1,1)模型的预测残差,提高了预测精度,具有工程应用价值。