APP下载

基于次邻近度的组合预测模型研究及其应用①

2019-08-08郭海艳李燕飞

关键词:预测值线性安徽省

郭海艳, 李燕飞, 吴 涛,b

(安徽大学a.数学科学学院,b.计算机智能与信号处理教育部重点实验室,安徽 合肥 230039)

0 引 言

对安徽省GDP的精准预测对于安徽省未来经济规划和城市建设都具有重要指导意义。单一的单项预测模型容易造成部分有用信息丢失,1969年,Bates J.M 和Granger C.W.J[1]首次提出了组合预测的概念,组合预测模型具有信息互补性,提高了预测结果的精准度和可靠度。唐小我[2]认为不同的模型都能提供不同的有用信息,组合预测模型能够综合利用这些信息,并且阐述了加权系数对于组合预测的重要意义,证明了非负最优加权系数向量的确定问题的解存在且唯一的问题[3]。张号等[4]指出了在数据量较小且仅部分信息已知时,将GM(1,1)模型与其他模型结合起来的优越性。本文首先在邻近度[5]的概念指出其计算中的不足并对其进行改进,提出了次邻近度的概念,对样本数据分别采用指数预测、一元线性回归预测、GM(1,1)灰色预测模型三种单项预测模型,用线性规划方法以次邻近度最大为目标计算出各单项预测权重,建立基于次邻近度的线性平均组合预测模型,充分利用了三种单项预测结果的差异,有效提高了预测精度。

1 基于次邻近度的线性组合预测模型的建立

1.1 邻近度的概念

1.2 次邻近度

在上述的邻近度定义中,若预测误差εt过大,则会导致φ(εt)非常小,可能会使得出的结果超出计算机的计算能力且求得的邻近度数值不便于比较。因此为了保证求解过程的可行性,需要对εt进行标准化处理,使φ(εt)落入一个特定的区间。基于此对邻近度做出以下改进。令a表示与最大误差值有关的调节变量,若实际值与预测值的最大误差数量级达到100,则令调节变量a=1002,若实际值与预测值的最大误差数量级达到1000,则调节变量a=10003,基于标准化原始数据的思想提出次邻近度的概念如下:

文献[5]提出的邻近度的3个性质次邻近度同样满足。

1.3 模型的建立预测精度

在上式中,t表示某一时刻,t=1,2,…N,xt表示第t时刻的实际值,xit表示第i种预测方法在第t时刻的预测值,bit表示第i中预测方法在第t时刻的预测精度,i=1,2,…m。

线性组合预测模型为

(1)

在上式中,ft为在t时刻集结了m种单项预测方法的线性组合预测的预测值,li为第i种单项预测方法的加权系数(i=1,2,…m),xit为第i种单项预测在第t时刻的预测值。由于基于次邻近度的加权线性组合预测邻近度越大,预测精度越高,所以用线性规划方法求解最优组合预测权系数。

1.4 模型有效性评价准则

采用以下四个常用评价指标对三种单项预测以及建立的线性组合预测模型的预测结果在预测效果上进行评价,比较优劣。误差平方和:

(2)

平均绝对误差:

(3)

平均绝对百分比误差:

(4)

均方百分比误差:

(5)

2 实例分析

选取2001-2018年安徽省GDP数据作为研究样本,数据来源于国家统计局,分别对样本进行指数预测,一元线性回归预测,GM(1,1)灰色预测,并且基于以上三种单项预测建立基于次邻近度的线性组合预测模型,并比较分析各项评价指标。

2.1 单项预测模型

2.1.1 指数预测模型

将安徽省2001-2018年GDP作为因变量y(单位:亿元),自变量为时间t,t∈(1,2,…,18)建立指数预测模型:

lny=0.1399×t+7.9350

将该模型应用于安徽省2001-2018年GDP预测且预测结果和预测精度如表1所示。

由图5可以看出,3种氧化剂都具有良好的除硫效果,随着氧化剂浓度的增加,除硫率明显增大,当氧化剂浓度达到一定程度后除硫率不再变化,说明氧化剂氧化效果基本饱和。3种氧化剂的氧化效果为:Cl O2>NaClO>H 2 O2。因此,优选ClO2作为水处理工艺的添加剂,使用质量浓度为50 mg/L,在此质量浓度下除硫率可达到95%。

2.1.2一元线性回归预测模型

将安徽省2001-2018年GDP作为因变量y(单位:亿元),将2001-2018年全国GDP作为自变量x(单位:万亿元)(数据来源于国家统计局),建立一元线性回归模型:

y=0.0344×x-1051

将该模型应用于安徽省2001-2018年GDP预测且预测结果和预测精度如表1所示。

2.1.3 GM(1,1)预测模型

将安徽省2001-2018年GDP作为原始时间序列,并对其作一次累加生成运算,得到新的生成数列,且新的数列y1近似的服从指数规律,建立GM(1,1)微分预测模型,白化形式如下:

将该模型应用于安徽省2001-2018年GDP预测且预测结果和预测精度如表1所示。

通过对比分析表1各项数据,可以看出指数模型在后期对原始值拟合效果越来越差,GM(1,1)预测模型在前期数据拟合上精度较低,一元线性回归预测模型相较于其他两个单项预测拟合结果较好,但预测精度有波动,起伏较大。整体来看,三种预测模型对数据都不能进行高精度预测。下面用线性组合预测模型对数据进行预测,以得到预测精度更高的模型。

2.2 组合预测模型

根据表1计算得出的三种单项预测结果,建立基于次邻近度的线性组合预测模型,首先,用matlab求解线性规划的最优加权系数,得到最优解为l1=0.0220,l2=0.8299,l3=0.1480,将求得的最优权重代入线性组合预测模型(1),并用该组合预测模型计算出预测值和预测精度,如表2所示。

由表1和表2对比分析可知,建立的线性组合预测模型提高了整体的预测精度,使得约半数的预测精度达到99%以上,且组合预测的最低预测精度也都高于三种单项预测模型的最低预测精度,所以,通过对比分析可知,组合预测模型明显优于三种单项预测模型,因为它使得预测更稳定,预测精度更高,预测结果更有效。

表2 基于邻近度的组合预测值及预测精度

表3 模型误差评价

对三种单项预测及建立的线性组合预测这四种模型的预测效果和精度进行比较之后,再采用误差平方和(SSE)(2),平均绝对误差(MAE)(3),平均绝对百分比误差(MAPE)(4)和均方百分比误差(MSPE)(5)这四种评价指标对各模型进行进一步评价,评价结果如表3所示。

3 结 语

采用的线性组合预测模型是最基本的组合预测模型,但其预测效果却往往很好。由表3可看出,基于次邻近度的线性组合预测模型在四个评价指标上的评价结果都优于各单项预测模型,预测精度较各单项预测模型也得到了较大提高,说明了本文的组合预测模型的预测效果的准确性和有效性。准确预测GDP,准确计算GDP增速对安徽省经济发展趋势、经济运行总体分析,安徽省经济健康稳定发展具有重要意义。

猜你喜欢

预测值线性安徽省
渐近线性Klein-Gordon-Maxwell系统正解的存在性
成长相册
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
安徽省家庭教育促进条例
线性回归方程的求解与应用
安徽省家庭教育促进条例
安徽省家庭教育促进条例
AI讲座:ML的分类方法
二阶线性微分方程的解法