APP下载

基于ARMA-BP组合模型的碳排放交易价格预测
——以福建省为例

2021-04-22谢旭升严思屏

龙岩学院学报 2021年2期
关键词:残差神经网络误差

谢旭升,严思屏

(福建师范大学 福建福州 350117)

自第二次工业革命以来,人类活动产生的CO2等温室气体的排放导致全球气候持续性变暖[1]。直至21世纪的今天,全球气候变暖已成为影响国际社会经济发展和环境治理的重大制约因素。中国作为一个经济结构转型过程中的发展中国家,温室气体排放的问题同样使得我国在能源消耗和生态保护方面面临着双重压力[2]。目前,为了维持经济发展的可持续性和生态环境的再生性,国内已先后成立了包括福建在内的8个碳排放交易市场。

一个成熟的碳交易市场能够分别在经济和生态上带来巨大效益[3]。但由于我国碳交易市场的建设起步较晚,仍存在诸多问题,大多数企业仍持观望态度。究其原因,一方面,碳排放权的市场定价机制不够完善,交易市场缺乏活跃性[4],市场风险监管难度大[5]。另一方面,碳排放市场本身就容易受到来自多方面客观因素的影响,比如气候变化公约、能源价格波动和金融危机等等,这使得碳价波动频繁,且呈现出非线性、不确定性、综合性和动态复杂性等复杂系统的典型特征[6]。主客观上的一系列问题导致碳价预测分析也变得越来越艰难。对未来碳价的准确预测不仅可以帮助市场参与者有效规避风险,节省企业运营成本,还可以帮助监管部门加强碳市场的风险防范,从而建立起碳市场价格预测机制和风险管理系统,分析碳市场价格的不确定性和剧烈波动。因此,寻求碳排放交易价格的准确预测方法具有重要的现实意义。

关于碳排放交易价格数理模型的预测,国内外学者进行了大量研究。这些预测方法主要分为以下几种。其一,通过单一模型进行预测。CHEVALLIER J and BENOIT S通过利用HAR-RV高频波动率模型对欧洲气候交易所期货合约的第二阶段碳价进行动态预测[7];蔡文娟通过网络搜索变量,运用DCC-MIDAS模型对我国碳价进行预测[8];BYUN分别利用GARCH、k-最近邻模型和隐含波动率对碳期权价格进行预测,结果发现GARCH模型的预测表现更好[9]。其二则是在原有预测模型的基础之上,通过改进模型的算法以优化预测精度。王娜基于Boosting-ARMA模型对碳价进行预测发现,该模型的预测准确性高且便捷[10]。其三是针对碳价的波动性和多尺度等特征,通过组合不同类型、频率的模型对其进行预测。ZHU提出了一种将经验模式分解(EMD)、遗传算法(GA)和人工神经网络(ANN)相结合的多尺度集成预测模型,其所建立的模型要比未经处理或单一模型的预测效果要好[11]。张晨等分别采取NAR、WMN、SVM、GARCH不同频率下的模型组合起来,对碳价进行预测,结果发现多频率组合模型的预测精度更高[12]。

通过以上文献的分析发现,目前大多数学者都是运用时间序列和机器学习这两种数理模型来对碳价进行预测,其中时间序列模型包括ARMA和GRACH模型等,机器学习包括支持向量机和神经网络等。此外大多数研究发现组合预测模型要比单一预测模型的预测效果要好,尤其是在预测碳价的非线性和随机性等方面。在这些预测模型当中,ARMA模型是通过历史数据的线性关系来进行短期预测,而BP神经网络则是通过重复的训练来模拟数据的非线性特征,因此本文将ARMA模型和BP神经网络——以最优权重和残差优化两个视角——组合为ARMA-BP模型,通过拟合福建省碳排放交易价格的线性和非线性趋势来进行预测,并比较ARMA模型、BP神经网络和ARMA-BP模型的预测精度,来考察组合模型是否比单一模型的预测结果更优。

1 模型设计

1.1 ARMA模型

ARMA(p,q)模型指的是自回归移动平均模型,是由自回归AR(p)模型和移动平均MA(q)模型线性组合而成。ARMA(p,q)模型的一般形式为:

(1)

其通用形式为:

xt=φ1xt-1+…+φpxt-p+εt-θ1εt-1-…-θqεt-q,

(2)

具体建模步骤如下:

第一步:平稳性检验和白噪声检验;首先对原始数据进行单位根检验判断原序列是否平稳,若不平稳则可进行差分后再检验,序列平稳后需继续在相关图计算Q统计量,检验是否为白噪声序列,若为非白噪声序列则进行下一步;

第二步:序列定阶;通过观察序列的自相关图和偏自相关图是否为拖尾和截尾初步判断p和q的阶数,再根据不同模型参数以及AIC、SC准则来选择合适模型;

第三步:模型建立与残差检验;选择合适模型之后,需对所建模型的残差进行白噪声检验,若为白噪声则说明模型的相关信息提取完全,若为非白噪声序列则需重回第二步,并对模型进行改善。

第四步:模型预测;将确定好的模型对福建省碳排放收盘价进行预测。

图1 BP神经网络拓扑结构图

1.2 BP神经网络预测

BP神经网络是目前应用比较广泛的人工神经网络之一,它是一种按照误差来进行逆向传播算法训练的多层状型前馈网络,其拓扑结构包括输入层、隐含层和输出层(如图1所示)[14]。BP神经网络的基本思想是梯度下降法,在正向传播时,信号由输入层逐层传递和处理到输出层,若得到的实际输出值与期望输出值不符,则进行误差的反向传播,根据各层的误差信号来调整各单位的权值,使得误差沿梯度下降。经过反复训练得到的误差平方和为最小值时停止 ,此时输入样本数据,就可以得到误差最小的输出值[15]。

1.3 ARMA-BP组合预测

为准确地对福建省碳排放交易价格趋势进行预测,通过组合ARMA模型和BP神经网络模型,充分发挥两者在线性和非线性预测方面的优势,来弥补单一模型的不足,以提高模型拟合精度。本文通过参考刘春红等[16]的做法,以最优权重和残差优化两个不同的角度来组合ARMA模型和BP神经网络。

1.3.1 ARMA-BP最优权重组合模型

最优权重组合模型指的是通过两个模型分别对原序列进行预测,根据两者的平均绝对误差(MAE)来确定两个模型的权重,预测误差较大的模型权重较小。

其公式为:

(3)

(4)

其中w1和w2的取值范围为[0,1],w1+w2=1。

1.3.2 ARMA-BP残差优化组合模型

1.4 评价指标

为确保模型预测的准确性,设置两个关于预测精度的评价指标,包括均方误差(MSE)和平均绝对误差(MAE),计算公式如下:

(5)

(6)

2 实证分析

2.1 数据来源与描述性统计

本文所使用的数据区间是2017年1月9日至2020年8月17日,即福建省碳排放配额(FJEA)上市交易以来直到近期的收盘价,其中剔除了部分零交易量的数据,数据来源于中国碳排放交易网,共计487个样本。由图2可以看出福建省碳排放配额的市场价格自开盘以来并不稳定,一直处于波动状态,在前半段表现出在震荡中下降的趋势,而在后半段市场价格起伏较大,且出现过几次剧烈震荡,其中跌幅最大的一次是由2018年11月20日的30元/t一直跌至2019年4月10日的9元/t,持续跌幅达到70%。在表1有关FJEA收盘价的描述性统计中,最大值和最小值分别为42.28和7.19,标准差为8.295346,这同样说明价格波动较大,偏度为0.454738,且峰度为2.26174,呈现尖峰厚尾分布。

日期图2 FJEA收盘价

表1 FJEA收盘价的描述性统计

2.2 ARMA模型预测

2.2.1 单位根检验

建立模型之前要进行平稳性检验,否则可能出现伪回归现象,影响后面的预测结果。因此,对原序列进行ADF单位根检验,表2结果显示:原序列(PRICE)在10%的置信水平下并没有通过检验,而取自然对数序列(LNPRICE)则在5%的置信水平下通过了检验,这说明取对数后的序列更加平稳,不存在单位根,因此可以对LNPRICE序列直接进行建模。

表2 序列PRICE和LNPRICE的ADF单位根检验结果

2.2.2 白噪声检验和模型定阶

ARMA模型的p和q值确定需要观察序列的自相关和偏自相关尾部特征,同时还要确保序列不是白噪声序列,即存在有效信息。由表3的结果显示,自相关和偏自相关的Q统计量在1%的置信水平上拒绝原假设,说明序列LNPRICE为非白噪声序列。此外,自相关表现为拖尾,偏自相关表现为截尾,初步选择AR模型。表4是符合基本要求的6个模型检验结果对比表,结果显示ARMA(2,1)的可决系数均高于其他模型,且AIC值和SC值均为最低,这说明对序列LNPRICE建立ARMA(2,1)更为合适。

表3 序列LNPRICE的自相关和偏自相关分析序号自相关(AC)偏自相关(PAC)Q统计量P值10.9800.980470.420.000020.953-0.188915.90.000030.920-0.1261332.10.000040.885-0.0151718.50.000050.848-0.0812073.60.000060.8120.0442399.80.000070.7760.0012698.90.000080.741-0.0322972.20.000090.706-0.0373220.30.0000100.6730.0453446.10.0000110.6420.0403652.50.0000120.6150.0263842.10.0000表4 模型阶数确定模型(p,q)可决系数赤池准则(AIC)施瓦兹准则(SC)AR(1)0.965349-2.490959-2.473732AR(2)0.967000-2.538027-2.512146ARMA(2,1)0.967484-2.548699-2.514190ARMA(2,2)0.967257-2.537595-2.494459ARMA(3,1)0.967332-2.542625-2.499421ARMA(3,2)0.967513-2.544036-2.492192

2.2.3 模型建立和残差检验

ARMA模型的类型确定好之后,需要对模型参数、整个模型和残差进行检验。表5结果显示:常数项C和系数都通过了1%的显著性水平,F统计量为4770.633,其概率值为0,可决系数达到96.75%,说明模型的解释力很强;杜宾统计量为1.9944,接近2,所建模型的残差不存在一阶自相关;倒AR根和倒MA根均在单位圆内。以上检验结果均表示模型具有比较良好的统计意义。模型表达式如下:

LNPRICE=3.030365+1.641359LNPRICEt-1-0.65597LNPRICEt-2+εt-0.46718εt

(7)

表6为残差的自相关和偏自相关结果,可以看出,Q统计量的P值均大于5%,即接受原假设,残差为白噪声序列,这说明原序列中的有效信息已经被提取,模型拟合效果较好。

表5 ARMA(2,1)模型参数估计与检验结果变量系数标准差 t统计量P值C3.0303650.11269826.889210.0000AR(1)1.6413590.11856013.844150.0000AR(2)-0.655970.115863-5.661990.0000MA(1)-0.467180.139884-3.339760.0009可决系数0.967484赤池准则(AIC)-2.548699调整的可决系数0.967282施瓦兹准则(SC)-2.514190F统计量4770.633杜宾统计量1.994387倒AR根0.9500.67倒MA根0.450表6 残差LNPRICE的自相关和偏自相关分析序号自相关(AC)偏自相关(PAC)Q统计量P值1-0.001-0.0010.0003———20.0160.0160.1204———3-0.044-0.0441.0490———40.0580.0582.69480.1015-0.056-0.0554.21640.1216-0.001-0.0044.21670.23970.0420.0495.09260.27880.0560.0486.67330.2469-0.037-0.0337.35600.28910-0.043-0.0448.28600.30811-0.007-0.0068.30820.40412-0.047-0.0509.40120.401

2.2.4 模型预测

利用建立好的ARMA(2,1)对福建省碳排放配额(FJEA)的收盘价进行预测。预测结果比较如图3所示。可以看出,预测值点基本与实际值重合,说明模型预测精度较好,可以利用所得模型对FJEA未来一周的收盘价进行短期预测。

日期

2.3 BP神经网络预测

2.3.1 创建网络

在创建网络之前,首先将样本数据划分为训练集、测试集和验证集,其比例分别为0.7、0.15、0.15,并确定神经网络的结构。其中输入层和输出层的神经元分别为3和1,隐藏层神经元个数为10,输出层和隐藏层分别采用S型和线性型的变换函数。将输入项设置为第t期、第t+1期、第t+2期的数据,输出项设置为第t+3期的数据。

2.3.2 训练网络

分别将原序列和残差序列输入后,网络经过训练之后得到训练误差变化过程图(图4和图5),可以看出网络训练分别在第6期和第4期时收敛,并且在经历6次和4次网络训练之后,均方误差(MSE)逐渐趋近于1.8226和0.0041394, 两者的训练集、验证集与测试集三者之间的误差慢慢减少,变化趋势达成一致,3条曲线基本变成一条,误差基本得到稳定,此时两个模型的训练效果达到最优。

图4 原序列训练误差变化过程图

图5 残差序列训练误差变化过程图

2.3.3 模型预测

经过反复网络训练后,两者误差均达到最小值,最后分别对原序列和残差序列进行预测,预测结果如图6和图7所示,末尾星号处表示未来7期的预测值。可以看出无论是对原序列进行预测还是对残差序列进行预测,在接下来的7期内福建省碳排放交易价格均保持上升趋势。

图6 原序列预测图

图7 残差序列预测图

2.4 ARMA-BP模型预测

根据ARMA模型和BP神经网络的MAE值确定两者在组合模型中的权重分别为w1和w2,经计算得出ARMA模型的MAE值为0.053933,BP神经网络的MAE值为0.0513993,故w1=0.4880,w2=0.5120。计算得出ARMA-BP最优权重组合模型的预测值。其次,将ARMA模型的线性部分拟合值加上BP神经网络残差部分的拟合值得到ARMA-BP残差优化组合预测的预测值。最终将四个模型的预测值进行对比(表7),分别计算出它们的MSE和MAE,来判断模型优良与否。

由表7可知,ARMA模型预测值的MSE和MAE分别为0.0815和0.2576;BP神经网络预测值的MSE和MAE分别为0.0812和0.2631;ARMA-BP最优权重组合模型预测值的MSE和MAE分别为0.0803和0.2604;ARMA-BP残差优化组合模型预测值的MSE和MAE分别为0.0792和0.2521。

通过比较MSE和MAE,可知ARMA-BP残差优化组合的MSE和MAE均为最小值;同时ARMA-BP最优权重组合模型的预测精度虽比不上ARMA-BP残差优化组合模型,但较单一模型比较来说,其MSE要低于ARMA模型和BP神经网络,MAE则高于ARMA模型且低于BP神经网络。故综合来看,ARMA-BP的两个组合模型均分别优化了ARMA模型和BP神经网络单一预测精度,效果更好;其次,ARMA-BP残差优化模型的预测精度要比其他三者更高,也就是说该模型能够有效地拟合FJEA实际收盘价的短期变化规律。

表7 四种预测方式的精度对比

3 结论与展望

通过将ARMA模型和BP神经网络模型组合起来,分别建立ARMA-BP最优权重组合模型和ARMA-BP残差优化组合模型对福建省碳排放市场的收盘价进行短期预测,结果发现ARMA-BP组合模型提高了单一模型的预测精度,且ARMA-BP残差优化组合模型的预测效果最好,表明该模型能够有效地预测福建省碳排放市场的未来短期价格。

本文所建模型虽较之前模型的准确性有所提高,但尚有值得完善之处。首先,BP神经网络没有能够有效确定隐含层神经元素的方法,加之样本处理方法、网络的适应能力等方面还存在改善的空间[15];其次,长期预测不准确,随着预测区间的扩大,该模型的预测能力也会有所下降。因此,需在之后的研究中对上述问题加以改进。总而言之,本文构建的ARMA-BP组合模型进行短期预测是可行的,能够为碳排放市场的参与者提供一定的参考价值,并且该模型还能够应用于股票、股指、期货等其他金融衍生品等方面。

猜你喜欢

残差神经网络误差
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于双向GRU与残差拟合的车辆跟驰建模
基于递归模糊神经网络的风电平滑控制策略
基于残差学习的自适应无人机目标跟踪算法
神经网络抑制无线通信干扰探究
基于深度卷积的残差三生网络研究与应用
基于神经网络的中小学生情感分析
隧道横向贯通误差估算与应用
隧道横向贯通误差估算与应用
基于Q-Learning算法和神经网络的飞艇控制