APP下载

基于二次分解和自适应鲸鱼优化算法的碳价格混合预测研究

2023-10-12杨众志

电力科学与工程 2023年9期
关键词:鲸鱼模态精度

孙 薇,杨众志

(华北电力大学 经济管理系,河北 保定 071003)

0 引言

温室气体的大量排放对全球气候已经造成了显著的负面影响。二氧化碳是温室气体的重要组成成分。对二氧化碳排放量进行控制的研究已经受到了世界各国的重视。为了达到二氧化碳的减排目标,欧盟在2005 年提出了排放交易体系,通过市场机制调节碳排放量,以达到温室气体的减排目的。精准的碳价格预测有助于市场参与者对碳交易价格波动规律的掌握和理解,有助于相关政策的有效实施和市场的稳定运行,同时对于市场参与者规避风险有着关键性作用。综合而言,进行精确的碳价格预测具有重要意义。

目前,对碳价格进行的预测方法可分为计量模型和人工神经网络2 种。

计量模型中,马尔可夫链[1]、自回归移动平均模型[2]和自回归综合移动平均模型[3]被广泛应用于碳交易价格预测。文献[4]根据碳价格历史数据分别建立计量时间序列、制度转换和多元向量自回归模型。传统计量统计模型虽然在时间序列预测领域的应用已经较为成熟,但传统计量统计模型并不能很好地处理非线性问题。碳价格时间序列有着高非线性和复杂性的数据特征,因此传统计量统计模型在碳价格预测方面的应用受到了限制。

神经网络模型具有较强的非线性映射能力,在处理非线性问题方面有着独特的优势。相较于传统的神经算法,极限学习机(Extreme learning machine,ELM)拥有更快的收敛速度,受到外界干扰的程度更小,并且可以大大缓解梯度下降问题[5]。ELM神经网络经常被用于非线性问题的预测[6,7],将其用于短期碳价格预测时表现出了较小的预测误差。

ELM 作为人工智能神经网络模型,其相关参数的选取会极大地影响预测性能。利用参数优化算法,通过学习迭代对预测模型进行参数寻优,可以获得最优参数进而提高后续模型的预测性能。鲸鱼优化算法是一种并行随机搜索最优化方法。文献[8]将鲸鱼优化算法优化的反向传播神经网络用于锂离子电池状态预测,并将预测结果与BP(Back propagation)神经网络进行了比较。结果表明,WOA(Whale optimization algorithm)能够提高BP 神经网络的预测精度。文献[9]提出利用WOA 算法避免ELM 神经网络提前收敛,所得优化后模型的预测效果比优化前更令人满意。文献[10]评估了混合神经网络算法在机械故障预测中的性能,认为对于高度非线性、随机性的时间序列而言,鲸鱼优化算法通过寻找神经网络的最佳组合为预测此类数据提供了可能。

由于碳价格的高度复杂性和非线性,有学者提出通过单分解方法分解原始数据以提高预测精度。文献[11]证明了使用EMD 作为分解方法可以很好地捕获具有不同特征的几个组件。实践证明EMD 能够降低非线性时间序列预测的难度,但是其分解出的IMF1 可能是限制模型预测精度提高的因素之一。文献[12]发现不包含IMF1 的预测结果的预测精度可以稍微提高。文献[13]认为IMF1的不规律性影响了模型精度。

在实践中,二次分解被提出解决上述问题。文献[14]将二次分解应用于PM2.5 浓度预测的预处理。该模型提出了结合小波包分解和变分模态分解的二次分解方法,并证明其有效提高了模型预测结果。文献[15]采用二次分解算法来减少原风速序列的间歇性从而降低风速预测难度。文献[16]指出EMD 分解得到的IMF1 是否规则与原始时间序列的非线性存在一定的关系,这将导致预测难度显著增加。根据现有资料,二次分解方法尚未在碳价格预测中得应用。

为了进一步提高WOA 的全局寻优能力,本文采用自适应权重来改进WOA,以下称为AWOA(Weighted whale optimization algorithm)。将采AWOA 优化后的ELM 神经网络用于预测,以提高模型的预测性能。为了更好地预测碳价格,本文提出一种混合预测模型。本文主要的贡献如下:

1)提出基于二次分解算法和神经网络的碳价格混合预测模型。

2)提出用结合改进完全自适应噪声集合经验模态分解和变分模态分解的二次分解方法简化数据,从而有效降低碳价格预测的难度。

1 计算模型的选取

1.1 改进的完全自适应噪声集合经验模态分解

完全自适应噪声集合经验模态分解算法是一种信号分解算法,其特点是通过引入高斯白噪音较好地解决了经验模态分解等传统分解方法存在的模态混叠现象。

虽然CEEMDAN(Complete ensemble EMD with adaptive noise)解决了模态混叠问题,但是所有模态分量依旧保留着白噪声的影响,这会导致分解结果出现虚假模式,在实际意义上存在问题。

ICEEMDAN(Improved complete ensemble EMD with adaptive noise)信号处理方法由CEEMDAN发展而来。不同于CEEMDAN 在分解过程中直接添加高斯白噪声,ICEEMDAN选取白噪声被EMD分解后的第K个模态分量,从而使数据在不同尺度之间具有连续性,进而产生新的极值点。

1.2 变分模态分解

变分模态分解(Variational mode decomposition,VMD),是一种使用了Wiener 滤波和Hilbert 转换的全新非递归分解方法。参数的设定过程如下。

1)使用Hilbert 变换分解输出数据序列,计算每种模式的分析信号以获得相关的单边频谱。

2)应用指数调谐算子计算出模态函数频谱并将其与中心频率进行混合。

3)应用解调信号梯度的H1 高斯平滑度(L2范数)来估计每种模式的带宽。

此外,分解结果也必须满足分量总和等于输出数据序列的约束条件。

1.3 AWOA

鲸鱼优化算法的寻优思想模拟了捕食中的鲸鱼的3 种不同的行为(围猎、环绕和随机出击),从而实现位置更新。

在生物启发式算法中,权重的大小决定了搜索的精度。较大的权重有利于全局范围的搜索,而较小的权重则更有助于细致的搜索。固定权重对鲸鱼优化算法的搜索能力造成了一定局限。受粒子群优化算法的启发,本文通过引入自适应权重来增强WOA 寻优能力,提出了一种自适应权重鲸鱼优化算法。

1.4 ELM

极限学习机在解决非线性问题上表现出学习速度快、训练误差小、泛化能力强等优点。ELM的具体框架如图1 所示。

图1 ELM 模型结构Fig. 1 Model structure diagram of ELM

学习过程可以用下式表示:

1.5 自适应权重鲸鱼优化极限学习机

为避免参数设立对极限学习机预测精度的影响,采用自适应权重鲸鱼优化算法对极限学习机进行优化。将ELM 的隐含层节点数和阈值作为AWOA 的寻优对象,以获取最优相关参数。AWOA-ELM 模型主要流程如下:

步骤1)将数据集划分为训练集与测试集2部分。以ELM 的隐含层节点数和阈值作为鲸鱼个体坐标,将算法初始化。

步骤2)使用训练集数据,将不同鲸鱼个体坐标对应的模型均方根误差作为个体适应度,并记录最结果。

步骤3)在每次迭代中,对鲸鱼个体即ELM模型的相关系数进行迭代,并且完成全局最优和当前最优的迭代,直到所有迭代次数结束或达到精度条件则迭代完成。

步骤4)输出最优结果对应的各个参数,将输出的超参数代入ELM 模型中,使用测试集进行预测和检验。

2 碳价格预测模型构建

本文提出的混合预测模型的总体思路是:将非线性的数据进行分解,得到原始数据的子序列;分别对子序列进行预测,将各子序列的预测结果求和,从而得到对原始数据的预测结果。图2 是所提出模型的计算流程图。

图2 所示算法的具体流程如下:

步骤1)采用改进的完全自适应噪声集合经验模态分解将原始碳价数据序列分解为n-1 个本征模态函数(Intrinsic mode function,IMF)和1 个残差分量R。

步骤2)用变分模态分解将IMF1 进行进一步分解,并且将分解结果与其余的本征模态函数和残差分量进行排序。

步骤3)采用AWOA-ELM 作为预测模型预测所有分解分量。

步骤4)将每个分量的预测结果相加,得出最终的预测结果。

图2 预测模型流程Fig. 2 Flowchart of the proposed prediction model

3 实验及结果分析

3.1 误差评估指标和模型参数

为了评估预测结果的有效性,使用以下误差评估指标对实验预测结果进行评估:决定系数(R2),平均绝对百分比误差(Mean absolute percentage error,MAPE)和均方根误差(Root mean squared error,RMSE)。

3.2 数据来源和描述

以湖北省碳交易试点市场的数据作为算例进行研究。数据来源为中国碳排放交易网。

数据的起始日期采用湖北区域试点交易市场的市场正式交易起始日,收集数据截止日期为2021 年3 月22 日。

表1显示了湖北省数据集的描述性统计指标。JB 检验、ADF 检验和BDS 检验分别是常用的检验序列是否符合正态分布、数据是否稳定和数据是否存在线性关系的检验手段。由表1 可以发现,湖北碳交易价格序列的JB 检验显著,ADF 检验不显著,BDS 检验显著(在0.05 水平下)。

综上所述,碳交易价格序列符合正态分布并且存在显著的不稳定性和非线性。

表1 湖北碳交易价格序列描述性指标Tab. 1 The descriptive indexes of carbon trading price series in Hubei

3.3 数据分解

3.3.1 第一次分解

使用ICEEMDAN 算法对原始碳价格序列进行分解,得到10 个分解分量。将各分量按低频到高频进行排序,如图3 所示。

图3 数据集的ICEEMDAN 分解结果Fig. 3 ICEEMDAN decomposition results of datasets

由图3 可知,与原始碳价序列相比,分解后子序列波动更加规整。

对分解分量进行样本熵计算,衡量序列复杂性,结果如图4 所示。

图4 分解子序列对应的熵Fig. 4 The entropy of the decomposed subsequence

图4 结果表明,IMF1 是所有子序列中复杂性最高的。降低IMF1 的复杂性,可以进一步降低预测难度。

3.3.2 第二次分解

由ICEEMDAN 将原始的时间序列分解为9个模态分量和1 个残差分量后,本文再通过VMD进一步分解IMF1。通过进一步分解IMF1,可以将非线性程度较高的IMF1 转化为若干个规律性较强的分解分量。将第二次分解产生的分量与第一次分解的剩余分量按低频到高频进行排序。

数据集二次分解的最终结果见图5。

图5 碳价序列二次分解结果Fig. 5 The result of secondary decomposition of carbon price series

对分解得到的子序列进行预测的难度低于直接对原序列进行预测的难度,从而有利于进一步提高预测精度。这一点将通过实证分析进行验证。

3.4 比较实验设计

本文提出碳价格预测模型(ICEEMDANVMD-AWOA-ELM),将原始数据进行2 次分解后,利用自适应权重鲸鱼优化算法优化的极限学习机对碳价格进行预测。

为了验证该模型的有效性和二次分解算法在碳价格预测中的作用,选择了LSSVM(Least squares support vector machines)模型和ELM 模型进行比较试验。比较试验共分为3 种情景:未改进、第一次改进、第二次改进。

在“未改进”情景下,使用LSSVM 模型对原始数据进行预测。

在“第一次改进”情景下,先通过ICEEMDAN将原始数据分解为10 个子序列,再用AWOA-ELM模型预测。此时,模型变为ICEEMDAN-AWOAELM。

“第二次改进”情景是在分别使用EEMD 和ICEEMDAN 基础上,使用VMD 进一步将IMF1分解为多个子序列后,使用预测模型分别对所有子序列进行预测。该情境下使用的模型为EEMDVMD-AWOA-ELM、ICEEMDAN-VMD-SSA-ELM、ICEEMDAN-VMD-GWO-ELM 和ICEEMDAN-VMDWOA-ELM。

3.5 实验结果分析

对于二次分解得到的20 个分解分量,分别使用AWOA-ELM 预测模型进行预测,然后将分量的预测结果加总,得到最终预测结果。

算例碳市场的预测结果如图6 所示。表2 展示了模型预测的误差评价结果。

图6 各个模型的预测结果Fig. 6 The predicted results of each model

表2 预测模型误差指标Tab. 2 Predictive model error indexes

综合考察图6 和表2,可以得出以下结论:

1)本文提出的ICEEMDAN-VMD-AWOAELM 具有最高的模型预测性能。如表2 所示,在各模型对比中,ICEEMDAN-VMD-AWOA-ELM模型的预测结果最精确,模型的MAPE 值和RMSE 值是比较模型中最小的,同时提出模型R2的值最接近1。根据表2 展示的具体结果,以湖北市场的数据为样本时,ICEEMDAN-VMD-AWOAELM 模型预测结果的MAPE 值为5.87%,R2值为0.964,RMSE 值为1.28。

根据上述结果,可以认为所提出的模型可以进行有效的碳价格预测。

2)ICEEMDAN 作为分解方法能够有效地降低数据复杂性,提高模型预测精度。从表2 可以看出,模型结合了ICEEMDAN 算法后,其预测性能对比结合EEMD 算法的模型有了显著提高。对比EEMD-VMD-AWOA-ELM 模型,ICEEMDANVMD-AWOA-ELM模型的MAPE 值降低了1.05个百分点,R2值提高了2.65%,而RMSE 值降低了13.51%。

碳价格的高度非线性、复杂性和混沌性很可能导致直接预测碳价格的误差较大。因此,可以认为将分解算法应用于碳价格预测中是合理且有效的。

3)二次分解能够再次提高预测模型的精度。在一次分解的基础上,模型的3 个指标又分别有所改进。从该结果可以看出,在一次分解已经显著提高模型性能的前提下,二次分解确实能够再次改进模型性能。该实验结果证明了对IMF1 进一步分解的方法可以降低预测误差,表明了二次分解算法对的模型性能的提高程度高于一次分解算法。本文引入的二次分解方法是合理的,为未来的碳价格预测提供了思路。此外,本文提出的将ICEEMDAN 分解算法和VMD 进行结合的二次分解方法最优。

4)自适应鲸鱼优化算法可以有效地优化ELM 神经网络的模型性能。为了验证集合模型在碳价格预测上的优越性,在对比实验中,将自适应鲸鱼优化极限学习机与 4 个混合预测模型(WOA-ELM、GWO-ELM、SSA-ELM 和SSALSSVM)进行性能对比。结果显示,自适应鲸鱼优化极限学习机的预测精度最高。实验结果表明,利用自适应鲸鱼优化算法对ELM 神经网络模型进行优化是十分必要的。

4 结论

本文提出了一种新的碳价格预测混合模型。该模型结合了改进的完全自适应噪声集合经验模态分解、变分模式分解、自适应权重鲸鱼优化算法和极限学习机。将ICEEMDAN 和VMD 结合的二次分解的方法引入碳价预测中以提高预测精度。利用AWOA 优化ELM 模型,缩短了收敛时间,提高了模型性能。在模型对比实验中,利用湖北省碳市场的数据,通过比较预测结果,验证了模型的有效性。综上所述,根据实证结果,可以得出以下结论:

1)本文提出的ICEEMDAN-VMD-AWOAELM 碳价格预测模型是有效的。通过以湖北省市场为算例的模型对比实验可以发现,对于具有非线性和混沌性的碳价格时间序列而言,一方面采用二次分解方法可以有效降低碳价格数据的高度非线性和复杂性,有效地提升模型的预测精度;另一方面,采用自适应鲸鱼优化算法优化的极限学习机可以更好地捕捉碳价格数据的波动,可进行更加精确的碳价格预测。

2)二次分解能够有效提高预测模型的精度。本文通过比较实验验证了二次分解算法可以显著提升碳价格预测的精度。本文创新性地将ICEEMDAN分解算法和VMD 分解算法结合,将ICEEMDAN分解得到的IMF1,通过VMD 对序列进行进一步分解。结果表明,在一次分解已经显著提高模型性能的前提下,二次分解能够再次提高预测模型的精度,并且对模型性能的改进效果明显。实验结果证明,对IMF1 进一步分解的方法是可行且有效的。对于具有非线性和复杂性的碳价格而言,二次分解是一种提高预测精度的有效方法。

猜你喜欢

鲸鱼模态精度
小鲸鱼
迷途鲸鱼
鲸鱼
鲸鱼岛——拖延症
基于DSPIC33F微处理器的采集精度的提高
GPS/GLONASS/BDS组合PPP精度分析
国内多模态教学研究回顾与展望
基于HHT和Prony算法的电力系统低频振荡模态识别
改进的Goldschmidt双精度浮点除法器
由单个模态构造对称简支梁的抗弯刚度