基于向量投影测度的区间型组合预测模型2
2024-03-25谢小军薛申芳龙彩燕
马 虹,谢小军,薛申芳,龙彩燕
(1.广东金融学院金融数学与统计学院,广东,广州 510521;2.广州工商学院通识教育学院,广东,广州 510850)
对时间序列进行预测的核心问题是寻找具有 更高精度的预测方法,自1969 年Bates 等[1]首次提出组合预测方法,组合模型越来越受到研究者关注,通过实践表明组合模型能够更好地利用各单一方法的有效信息,弥补各单项预测方法的不足,规避预测的风险,并且具有更好地稳定性和优越性,因此吸引了许多研究者针对组合模型的理论以及应用进行研究,目前已取得部分研究成果[2-6]。前期对组合预测方法的研究对象大多数是实数,但因事物预测模糊性和不确定性,很多时候是以区间数形式表示,近几年对于区间数组合预测方法研究比较多。在区间数组合预测方法中,如何确定各单项预测方法的权重,进而得到更加精确的组合预测值,一直是研究者所关注的核心问题。已有相关文献给出了一些区间型组合预测问题中求权重的不同方法,主要通过结合一些诱导算子构建某个准则下最优模型[6-18]。例如文献[6]引进诱导有序加权平均(ⅠOWA)算子,提出了以区间中心位置误差平方和与区间长度误差平方和的凸组合为准则的区间组合预测模型。文献[7]引入诱导广义有序加权对数平均算子(ⅠGOWLA),建立了以误差平方和为准则的最优组合预测模型。文献[8]基于连续区间有序几何加权平均Power 算子,建立了以广义绝对误差λ次和为准则的最优化区间型组合预测模型。文献[9]引入广义诱导有序加权平均(GⅠOWA)算子,然后以灰色趋势关联度作为最优准则构建了最优化区间型组合预测模型。文献[10]引入诱导有序加权几何平均算子(ⅠOWGA),以区间中心和区间半径预测误差绝对值之和最小为准则,建立了基于L1 范数的ⅠOWGA 算子的区间组合预测模型。文献[11]引进连续有序加权平均算子(COWA),以相关系数为最优准则建立了优化组合预测模型。文献[12]通过引入诱导连续有序加权平均算子(ⅠCOWA),以预测有效度为最优准则构建区间组合预测模型。文献[13]引入诱导有序加权几何平均算子(ⅠOWGA),以三角模糊数左右区间的相似度作为最优准则的构建最优化模型。文献[14]引入诱导有序加权连续区间广义有序加权多重平均算子(ⅠOWC-GOWMA),以指数支撑度为最优准则构建区间型组合预测模型。文献[15]引入诱导广义有序加权多重平均算子(ⅠGOWMA),以广义向量夹角余弦为最优化准则构建区间型组合预测模型。文献[16]通过信息熵的不同形式,给出了三种可行研究方法来确定区间型组合预测权重。
鉴于向量投影是一个综合性测度,既能反映两个向量指标对象之间距离,又能反映他们之间的夹角,文章引入已有研究者提出的一个向量标准化投影测度公式,又提出一种新的向量标准化投影测度公式。在向量标准化投影测公式的基础上,定义了区间数向量标准化投影测度的概念,用来描述两个区间数向量的接近程度。然后以组合预测区间数序列与实际区间数时间序列的标准化投影测度为最优化准则,构建了两个基于标准投影测度的全新区间型组合预测模型。并通过两个实例进行了分析,一是与已有文献的组合预测方法的结果作对比研究,验证本法提出的两种基于标准投影测度的区间型组合预测模型的有效性。二是利用构建的组合模型对我国风力发电量序列进行拟合和预测建模,结果显示,四个预测误差指标在数值上都明显小于灰色GM(1,1)预测模型、线性回归预测模型和BP 神经网络预测模型各单项预测方法,进一步说明了本法构建的组合预测模型是有效的,具有一定的可行性和实用性。
1 相关概念
定义1[6]设,其中,且满足0 ≤a l≤au,则称a为区间数。当al=au时,即a退 化 为 普 通 实 数。令c=(a l+au) 2,r= (a u-al) 2,r称为区间半径,c称为区间的重心,区间数可等价表示为a=(c;r),根据r,c反过来可求得区间的下界和上界:al=c-r,au=c+r。设任意两个区间数,则有以下运算关系:
2 区间型组合预测模型的建立
其中
根据定义3 可知NPX(Xˆ )越大,表示组合预测区间数序列Xˆ 与实际际区间数X越接近,即预测效果越好。将式(6)代入式(7)、(8),则NPX(Xˆ )均为加权系数w1,w2, …,wm的函数,因此可分别建立以下基于区间数序列标准投影测度的组合预测优化模型。分别如下:
(1)基于区间数序列标准化投影测度的组合预测优化模型Ⅰ
(2)基于区间数标准化投影测度的组合预测优化模型ⅠⅠ
3 实例分析
3.1 模型的评估方法
为了对研究提出的组合预测模型作出客观评价,进一步验证本研究模型的有效性,选取下列区间数绝对误差和区间数相对误差评价指标进行预测效果评价,四个误差指标计算公式如下[16]:
3.2 与已有的文献的预测方法进行对比分析
为了更好地验证模型的有效性,接下来将与已有文献的预测方法的结果作对比研究,本研究选取文献[6,16]中实例分析中数据作为基础数据,具体数据见表1。
表1 实际区间数值和各单项预测区间数值Table 1 Actual interval value and individual forecast interval value
将表1 数据利用式(10)计算m种单项预测方法在第t时刻的的组合预测区间数序列,分别由式(7)、(8)两种方法计算组合预测区间数序列与实际区间数时间序列的标准化投影NPX(Xˆ ),然后分别代入建立的两个优化模型中,利用Lingo11 计算求得对应的最优权系数,结果见表2。通过求解得到的表2 所建立的两种模型的最优权系数,进一步计算得到组合预测区间数序列以及等价表示,结果见表3。
表2 组合预测模型的最优权系数Table 2 Optimal weight coefficient of combined forecasting model
表3 实际值与组合模型预测值及其等价表示Table 3 Actual value and predicted value of combined model and their equivalent representation
根据表3 中实际值区间数和两种基于标准化投影的区间型组合预测值区间数及其等价表示,依据上述区间数绝对误差和区间数相对误差等公式计算出各种预测方法的预测效果评价指标值,具体计算结果详见表4。
表4 各预测方法预测效果评价指标Table 4 Prediction effect evaluation indicators of each prediction method
从表4 中各预测方法预测效果评价误差指标来看:
(1)本法提出的基于区间数标准化投影测度的两种区间型组合预测模型要优越于所有单项预测方法。两种基于区间数标准化投影测度的区间型组合预测模型中MSEP、MSEL、MSEI、MRIE四个误差指标在数值上都明显小于各单项预测方法相应的误差指标。
(2)两种基于区间数标准化投影测度的区间型组合预测模型也优越于文献[6]中提出的区间型组合预测方法。两种基于区间数标准化投影测度的区间型组合预测模型中,MSEP、MSEL、MSEI的误差指标在数值上都明显小于文献[6]中提出的区间型组合预测方法相应的误差指标值,MRIE误差指标在数值上与文献[6]中提出的区间型组合预测方法相应的误差指标值非常接近。
(3)两种基于区间数标准化投影测度的区间型组合预测模型与文献[16]中提出的三种基于熵值的区间型组合预测方法效果表现各有优势。两种基于区间数标准化投影测度的区间型组合预测模型中,MSEP误差指标在数值上都小于文献[16]三种基于熵值的区间型组合预测方法;两种基于区间数标准化投影测度的区间型组合预测模型中,MSEL误差指标小于文献[16]相对熵区间型组合预测方法,大于文献[16]Shannon 熵和联系熵的区间型组合预测方法;两种基于区间数标准化投影测度的区间型组合预测模型中,模型ⅠⅠ的MSEI误差指标在数值上小于文献[16]相对熵和Shannon 熵的区间型组合预测方法,大于文献[16]联系熵的区间型组合预测方法,模型Ⅰ的MSEI误差指标在数值上小于文献[16]相对熵的区间型组合预测方法,大于文献[16]Shannon 熵和联系熵的区间型组合预测方法;两种基于区间数标准化投影测度的区间型组合预测模型中,MRIE误差指标在数值上小于文献[16]联系熵的区间型组合预测方法,略大于文献[16]相对熵和Shannon 熵的区间型组合预测方法。
(4)两种基于区间数标准化投影测度的区间型组合预测模型中,组合预测模型Ⅰ中MSEP、MRIE误差指标在数值上小于组合预测模型ⅠⅠ,组合预测模型ⅠⅠ中的MSEL、MSEI误差指标在数值上小于组合预测模型Ⅰ。
综上可知,本研究提出的两种基于区间数标准化投影测度的区间型组合预测模型能有效减少预测误差,提高单项预测方法的预测精度,是一种非劣性区间型组合预测模型。
3.3 对风力发电量进行预测
在全球实现碳中和目标的共识下,新能源时代已经到来,低碳化的能源发展模式正在加速转型,绿色多元的能源供应体系正在加快建立,风电作为清洁、低碳、安全、高效的新能源之一,在全世界范围内取得了突飞猛进的发展成就,而准确预测风力发电量是风能有效利用的基础和关键[22-23],可以有效避免“弃风”现象的发生,避免风资源浪费,并且有助于提高国家电力系统的调节能力及运行效率,对于国家电网设备的建设和发展也起到了一定的促进作用[24]。研究通过在国家统计局(https://data.stats.gov.cn/)上收集了2010-2022年我国每月风力发电量当期值(亿千瓦时)、把每年的12 月数据中的最小值、和最大值分别设置为区间数的下界和上界,从而得到我国2010-2022 年风力发电量区间数序列,详细结果见表5。
表5 灰色GM(1,1)和线性回归预测模型拟合结果Table 5 Fitting results of grey GM(1,1)and linear regression prediction model
本研究用2010-2020 年的数据构建模型,用2021-2022 年的数据检验模型的预测效果。首先将区间数序列等价转化为区间的重心、半径序列,对重心、半径序列分别构建灰色GM(1,1)预测模型、线性回归预测模型和BP 神经网络预测模型,拟合结果见表5 和表6 所示,拟合效果良好。然后基于三种单项预测方法的基础上,构建本文基于区间数标准化投影测度的区间型组合预测模型,利用lingo11 计算得到本研究两种组合模型的对应的权重系数见表7,拟合结果见表6。各拟合模型的误差如表8 所示,其中加粗的为同类误差中的最小值。
表6 BP 神经网络模型和组合预测模型拟合结果Table 6 Fitting results of BP neural network model and combination prediction model
表7 两种组合预测模型的最优权系Table 7 Optimal weight coefficients of two combined forecasting models 数
表8 各模型对风力发电量序列的拟合误差Table 8 Fitting error of each model to wind power generation series
从表8 可知:
(1)本研究提出的基于区间数标准化投影测度的两种区间型组合预测模型,对风力发电量的拟合效果均要优越于灰色GM(1,1)预测模型、线性回归预测模型和BP 神经网络预测模型各单项预测方法。两种基于区间数标准化投影测度的区间型组合预测模型,对风力发电量的拟合值中MSEP、MSEL、MSEI、MRIE四个误差指标在数值上都明显小于灰色GM(1,1)预测模型、线性回归预测模型和BP 神经网络预测模型各单项预测方法相应的误差指标。
(2)基于区间数标准化投影测度的区间型组合预测模型ⅠⅠ总体上要优于组合预测模型Ⅰ。组合模型模型ⅠⅠ中MSEP误差指标略大于组合预测模型Ⅰ,但是组合模型模型ⅠⅠ中的MSEL、MSEI、MRIE三个误差指标明显小于组合预测模型Ⅰ,因此组合模型模型ⅠⅠ更适合对风力发电量序列进行预测。
利用本研究基于区间数标准化投影测度的组合模型模型ⅠⅠ对2021-2022 年风力发电量进行预测,并与灰色GM(1,1)预测模型、线性回归预测模型和BP 神经网络预测模型各单项预测方法进行预测对比分析,预测结果见表9,预测误差见表10。
表9 各模型对风力发电量序列的拟合误差Table 9 Fitting error of each model to wind power generation series
表10 各模型对风力发电量序列的预测误差Table 10 Prediction error of each model for wind power generation series
从表10 可知,灰色GM(1,1)预测模型、线性回归预测模型和BP 神经网络预测模型,各单项预测方法中,线性回归预测模型的预测误差很大,这说明线性回归预测模型不适合对风力发电量序列进行预测,从表8 中也可以看到线性回归预测模型对风力发电量序列的拟合误差也是最大的。灰色GM(1,1)预测模型和BP 神经网络预测模型对风力发电量序列的拟合和预测效果均要优于线性回归预测模型,这是因为风力发电量序列中既包含了线性关系,也包含了非线性关系,而线性回归模型无法提取其中的非线性信息。而组合模型能够弥补了各单项预测方法的不足,并且具有更好的稳定性和优越性。本研究构建的基于区间数标准化投影测度组合预测模型对风力发电量序列的预测,MSEP、MSEL、MSEI、MRIE四个预测误差指标在数值上都明显小于灰色GM(1,1)预测模型、线性回归预测模型和BP 神经网络预测模型各单项预测方法,因此本法构建的基于向量标准化投影测度组合预测模型更适合对风力发电量序列进行预测建模,这也说明本法构建的组合预测模型是有效的,具有一定的可行性和实用性。
4 小结
通过对区间型组合预测模型进行研究,区间型组合预测模型的核心问题是如何确定各单项预测方法的权重。从一个全新的角度,通过引入向量投影测度公式,并提出一种新的标准化投影测度公式,然后定义了区间数向量标准化投影测度的概念,用来描述两个区间数向量的接近程度,最后以组合预测区间数序列与实际区间数时间序列的标准化投影测度为最优化准则,构建了两个基于向量投影测度的区间型组合预测模型,并通过两个实例分析验证了本法所构建的组合预测模型是有效的。一是与已有文献的组合预测方法的结果作对比研究,验证本研究提出的两种基于标准化投影测度的区间型组合预测模型的有效性。二是利用构建的组合模型对我国风力发电量序列进行拟合和预测建模,结果显示,四个预测误差指标在数值上都明显小于灰色GM(1,1)预测模型、线性回归预测模型和BP 神经网络预测模型各单项预测方法,进一步说明了本研究构建的组合预测模型的可行性和实用性。