基于灰色BP神经网络碳排放交易价格预测
2020-04-03马忠芸王红红
金 林,马忠芸,王红红
(中南财经政法大学 统计与数学学院,湖北 武汉430073)
近年来,全球极端天气频繁发生。2015—2019年,全球平均温度升温相比工业化前超出1.1℃,这与全球碳排放量与日俱增密切相关。若任由形势继续发展下去,必将严重威胁人类的生存与发展。中国作为全球最大的温室气体排放国,为应对全球气候变化,已经和175个国家签署了《巴黎气候协定》,并在多次政府工作会议中指出要加快推动碳排放市场的建设和碳金融的发展。碳排放交易市场的建设是控制温室气体排放的重大创新举措,是我国生态文明建设的重点目标之一。但我国碳排放交易(以下简称碳交易)市场的建立起步较晚,在经历了4 a地区试点探索后,2017年12月19日,我国碳排放交易系统正式启动。我国正处于全面建设碳排放交易市场的初级阶段,处于全球碳交易链条的底端,国际话语权不足,同时市场机制尚未完善,其发展仍然存在很多制约因素,而价格作为调节碳交易市场的经济手段,研究其影响因素的作用机理和预测价格变动规律,对于深入了解碳市场,推进碳交易市场全面、健康、持久的发展具有重要意义。
我国碳排放交易市场是参照欧盟碳排放交易体系(EU Emissions Trading System)建立起来的。由于欧盟碳交易体系市场机制成熟,欧盟碳交易体系市场价格的研究成果也相对较多。目前,学者们大致认为制度政策、能源价格、经济以及金融等因素对欧盟碳排放价格有显著影响。陈晓红和王陟昀[1]以欧盟排放交易体系为样本,开展研究后发现:受政策和制度影响的配额供给是交易价格最重要影响因素,煤炭价格是最大的能源影响因素,天气因素影响不明显。Aatola[2]研究欧盟碳排放市场发现,碳交易期货价格与电力价格、能源价格存在强相关性。Deeney[3]采用事件分析法探究了欧洲议会的决议对于欧盟碳市场价格波动的影响。Tan[4]基于分位数回归探究了碳排放价格与能源、经济因素的依赖关系和影响路径,结果表明,前期能源价格对碳排放市场冲击影响大,后期工业发展、股票市场因素的影响力逐渐提升。
在国际市场已经逐渐形成了以宏观经济、能源市场为主要影响因素,政策因素等其他因素为辅的影响系统时,我国学者利用当下碳试点地区积累的数据,也纷纷从市场环境、政策和气候环境以及经济等角度开展碳排放权价格的研究。如王倩[5]认为中国碳交易市场需求方占主导地位,能源、气候、经济对碳交易价格的波动有显著影响。赵立祥[6]的研究表明,碳交易价格的首要影响因素是市场环境,而政策和气候环境具备一定的影响,能源价格影响微弱。樊艳艳[7]选择煤炭价格指数、石油价格指数、工业指数、EUA期货价格等作为主要影响因素,对碳交易价格进行实证分析。但当下研究中碳交易价格影响因素的选择受主观影响较大,并且影响因素的全面性仍需要进一步研究。基于此,本研究使用Lasso统计变量选择方法更客观地确定我国碳排放交易市场价格影响因素。
随着碳排放市场成熟度不断提升,交易者对于碳交易价格波动的变化关注度越来越高,于是开始出现关于碳交易价格预测的研究。如姚奕等[8]通过EMD-SVM模型对湖北碳市场碳交易价格进行了预测,并取得较好效果。张晨和杨仙子[9]应用灰色马尔科夫模型预测碳交易价格波动。胡根华和朱福敏[10]基于无穷活动率Levy过程构建了碳交易价格波动率模型。除此以外,还可以使用机器学习的方法对碳交易价格进行更准确的预测,从而为相关市场参与者的经济决策提供参考。
基于以上分析,本研究首先从宏观经济、能源价格、气候环境和国际市场四方面构建指标体系,然后通过建立Lasso回归,客观筛选出影响碳交易价格的重要影响因子,并根据已经筛选的重要预测因子,建立灰色BP神经网络预测模型对碳交易价格进行预测。
1 碳排放交易市场价格影响因素和指标
综合已有文献中关于碳排放交易价格影响因素的研究,并结合经济学和环境学等理论知识。从供给、需求以及市场三个角度进行排放权交易价格影响因素的选取。由于不确定事件具有复杂多变性、不可预测性、不可量化性,下面主要从基本面上展开研究。根据宏观经济变动、能源价格、气候环境及国际市场的影响这四个基本影响因素,分别选取了初步认为对碳交易价格影响较大的指标,并考虑数据可获取性等因素,本研究总结了以下四个方面影响因素及其具体指标:
1.1 宏观经济
经济的发展水平直接影响着社会的需求和消费,碳交易活动的进行离不开市场经济,宏观经济的波动必然会给碳交易价格的涨跌带来影响。当经济衰退、市场低迷时,消费者便会减少消费,企业产量下降,大量资源被闲置,碳排放量需求减少,碳交易价格下跌;经济势头良好,消费意愿提升,企业扩大生产,资源得以充分利用时,碳排放量需求提高,价格上升,所以理论上宏观经济的变动与碳交易价格的变动呈正向变动关系。本研究选择对国内经济与绿色金融碳交易市场最为密切的上证180碳效率作为国内企业碳经营效益情况的反映,其指标含义是基于上市公司的碳足迹数据反映低碳排放公司的绩效表现。对于国内外宏观经济方面,分别选取了上证指数涨跌幅和道琼斯工业指数涨跌幅作为国内外宏观经济对于国内碳交易市场冲击的体现。
1.2 能源价格
CO2排放的重要源头之一是化石燃料的燃烧。一方面,碳排放交易市场通过成本控制的方式改变了企业对化石燃料的消耗量。当能源价格上涨时,出于对自身生产成本的考量,企业不得不减少对能源的购买和使用,从而减少对碳排放权的需求,最终导致碳排放价格的下降。另一方面,企业可以通过更新技术、改变能源利用方式,提高能源利用效率,转变传统消耗型经济发展方式,减少化石能源市场的交易,出售碳排放权获取利益,缓解化石燃料消耗大的企业的压力。这些举措都会造成CO2排放量下降,总体需求下降,从而影响碳排放权的数量和价格。在能源方面,本研究选取了国外原油价格、国内外煤炭价格、国内外天然气价格作为能源方面的重要因素。原油选择了全球原油的定价基准德克萨斯原油价格,国外天然气价格选择了与中国联系最为密切的天然气公司公布的埃克天然气价格,国内天然气选择任丘华港、内蒙时泰等天然气公司的每日报价的均值,作为国内天然气价格的体现。纽卡斯尔作为澳大利亚煤炭吞吐量最大的港口,选用其煤炭价格作为国际煤炭价格的重要表现,国内煤炭价格选择焦炭期货的每日收盘价作为国内煤炭价格的典型代表指标。
1.3 气候环境
气候环境中影响碳交易价格的主导因素之一是温度,当处于极度炎热或极度严寒的环境状态时,人们会提高使用制冷设备的频率或增加热力供应需求,能源需求上升,CO2排放量增加,因而碳交易价格也随之变动。空气中温室气体的含量直接决定着碳交易价格的制定。近年来,空气污染越来越严重,“三废”的大量排放导致空气质量越来越差,雾霾天气严重。环保部门制定了空气质量指数(AQI)来测量空气质量等级,AQI较为直观地反映了空气中温室气体的含量,从而影响碳交易价格的走向。因此,从气候环境的角度,主要考虑空气中碳含量和极端天气对于碳交易价格的影响。对于碳含量,本研究选取了各地区的空气质量价格指数(AQI)作为空气质量的衡量指标,其指标说明了空气中主要污染物的含量。对于极端天气,从天气网爬取了试点地区的日最高、最低温度数据。
1.4 国际市场
欧盟是全球碳排放主要需求者,欧盟各国设定一定的配额量,而这个配额量会直接影响各国对碳排放的需求。核准减排量(CER)的需求主体是发达国家中具有碳排放权缺口的企业,而供给端便是发展中国家清洁减排机制的企业。供需双方的缺口直接影响了国内碳交易价格,而核准减排量便是衡量此缺口的重要指标。另一方面,由于国内市场和国外市场的差异,汇率作为衡量不同币种的货币价值,直接影响了国内外碳交易的差价,市场中的交易者偏向价格更具优势的市场进行买卖碳排放权,从而影响了单个市场的碳交易价格走势。本研究选取核准减排量(CER)作为国际碳交易市场对我国碳交易市场价格变动的影响因子,选取欧元兑换人民币汇率作为国际市场环境对碳交易价格波动的重要影响因素之一。上述四个因素及其具体指标和数据如表1所示。
表1 指标体系明细
对当下研究文献中的影响因子进行归纳总结,初步选定了指标。首先对收集的数据进行初步处理,然后采用Lasso回归进行变量筛选,再建立灰色BP神经网络模型进行预测。
2 碳排放交易市场价格预测
2.1 数据处理和指标筛选
对于碳交易价格,国内8个试点地区属广州碳交易市场最为活跃,因此本研究选取全国第一大、世界第三大碳交易市场——广州碳排放权交易所作为国内碳交易价格交易的典型地区,进行后续碳交易价格预测的研究。由于国际市场和国内市场交易日期有所不同,本研究剔除了休息日及国内外15个假期的影响,获取广州碳交易市场有效交易日357 d的数据。为避免汇率的影响,统一货币计量单位,分别对国外原油、国外天然气价格、国外煤炭价格以及核准减排量分别用原始数据乘以汇率计算得到。最后,针对极端天气这一指标,采用通用认定当日最高温度在35℃以上称为高温天气,当日最低温度低于0℃称为低温天气。设定虚拟变量,当气温高于35℃或低于0℃时,设为1,其余设为0。
在进行Lasso回归变量筛选之前,由于上面变量数据均为时间序列数据,如果序列具有非平稳性,直接建立回归模型可能会出现伪回归的问题,因此需先对序列进行平稳性检验。平稳性检验结果如表2所示:核证减排量、德克萨斯原油价格、纽卡斯尔煤炭价格三个变量不平稳,其他变量均平稳。对核准减排量、德克萨斯原油价格、纽卡斯煤炭价格转化为增长率后,再次进行检验,变换后的序列平稳,此时命名核准减排量增长率、德克萨斯原油价格增长率、纽卡斯尔煤炭价格增长率分别为CER-R、WTI-R、NEWC-R。这时所有变量均为平稳序列,可以建立Lasso回归模型进行变量筛选。
表2 平稳性检验和变量选择结果
在进行平稳性检验后,下面使用Lasso回归进行变量选择。Lasso方法最先由Tibshirani[11]提出,是变量选择的常用方法之一。Lasso方法可以用来克服回归问题中所遇到的模型建立包含所有变量导致模型的复杂度上升,解释能力下降的问题。Lasso的系数β0、βj通过求解下列公式的最小值得到:
其中,yi——因变量;xij——待选择的自变量;λ——调节参数,Lasso主要原理是通过对惩罚项限定区域的设定,当调节参数不断增大时,λ将βj向0压缩,当调节参数达到某种程度时,βj压缩为0,从而完成变量选择,使得重要变量得以凸显。同时在控制大小的限制下,尽可能地寻找使得残差平方和最小的系数。调节参数λ的选择可以通过交叉验证的方法得到。其主要思想是通过将观测集随机分为k个大小基本一致的组,第一组为验证集,剩下k-1组拟合模型,整个过程会得到k个测试误差:MSE1,MSE2,…,MSEk,从而得到交叉验证误差从而通过选择一系列λ的值,计算其对应的交叉验证误差,然后选择CV最小的参数,从而得到最优的调节参数,完成对模型的拟合。
根据上述Lasso原理将初始选取的指标进行标准化处理,以避免量纲影响惩罚项的大小。根据R语言lars包中的Lasso函数完成变量的选择,并采用10段交叉法选择最为合适的调节参数,发现CV(10)=0.903,为最小交叉验证误差。
根据针对共线性问题的最小角度回归原理对变量进行压缩,得到的结果显示在表2中,其中上证指数涨跌幅、道琼斯指数涨跌幅、德克萨斯原油增长率及纽卡斯尔煤炭价格增长率的系数压缩至0,总计剔除4个变量,剩余8个重要指标。
2.2 碳交易价格预测
根据变量选择结果建立灰色BP神经网络模型进行预测。灰色BP神经网络模型是灰色预测模型和BP神经网络组合形成的预测方法,综合了灰色模型预测未来变化趋势定性分析的特点和BP神经网络适用于非线性的样本定量分析的优点。灰色预测是通过少量不完全的信息对未来一段时间的值进行预测,其适用于趋势较为明显的数据预测。BP神经网络模型通过构建由多个非线性的简单单元组成的并行互联的网络,可以有效地对非线性的数据样本进行分析,同时灰色预测模型解决了BP神经网络输入层随机的问题,两者的结合可以有效地完成一定时间范围内的预测问题。
设X(0)(k)为一单调非负的原始时间序列第k期的值。首先,需要采用依次累加的方式弱化原始序列的随机性得到序列X(1),对X(1)建立下列一阶线性微分方程:
得到灰色模型GM(1,1),求解预测值:
在模型预测的过程中进行累加处理,所以若需要得到真实的预测值,则需要进行累减处理,将GM(1,1)模型所得数据进行累减还原为,则:
由上述步骤可以得到序列的预测结果,但预测结果的准确性需要对比后验差模型精度表来进行衡量。通过计算原始序列X(0)和残差的方差之比C(后验差比),来判别模型的预测精度,C值越小表明预测值和实际的差异越小。根据后验差检验判别表得知,当C值≤0.350,表明模型拟合效果好;C值在(0.350~0.500]之间,模型拟合效果为“合格”;C值在(0.500~0.650]之间,模型拟合效果为“基本合格”;C值>0.650,说明拟合效果差,需要采用其他方法进行预测。
为尽可能避免由于随机因素对灰色预测模型带来的误差影响,本研究对不同的解释变量采用了不同的预测过程,对空气质量指数、国内煤炭价格及天然气价格采用直接建立灰色预测模型。对于碳效率变动率、国际碳交易价格变动率及汇率变动率采用首先预测原始序列,再利用变动率公式进行计算的方法得到;对于极端天气这一虚拟变量首先分别预测日最高温和日最低温,然后根据极端天气的规则进行判别是否处于极端天气中。因自变量较多,下面以空气质量指数(AQI)变量为例,说明灰色预测的过程。求解微分方程得到预测模型:
由于GM(1,1)模型得到的是一次累加量,将GM(1,1)模型所得数据经过累减还原为,即的灰色预测模型为:
计算模型预测的残差平方和、平均相对误差及相对精度的值分别为43 275.950,29.670%,70.330%,由此计算后验差比值C值为0.640,判断其预测精度为基本合格。
同理得到其他预测变量未来10期的预测值,结果如表3所示。未来10期空气质量指数、煤炭价格呈下降趋势,但中间有波动;日最高温、国际天然气价格、国内天然气价格呈上升趋势;而国际碳交易价格增长率、碳效率指数变动率及汇率变动率保持稳定,其水平分别维持在0.290,-0.650,0.340。各影响因素的预测结果表明,空气质量指数、日最高温和国际天然气价格受随机影响因素影响较大,预测精度较其他影响因素较小,误差较大。而国际碳交易价格变化率、碳效率指数变化率及汇率变动率预测效果较好。
表3 灰色预测模型碳交易价格影响因素精度
2.2.2 灰色BP神经网络预测模型
《秀才胡同》共使用10种修辞、11种典故,《东风破》共使用6种修辞、9处典故。在修辞的使用上,《秀才胡同》数量远超《东风破》。此二者对修辞的运用的方式也有所异同,以下进行讨论。
当灰色预测过程解决了传统BP神经网络输入层所存在的随机性的问题后,可以根据传统BP神经网络模型的模拟过程建立神经元的输入输出关系,模拟出碳排放权市场中重要影响因子与碳排放权价格之间的复杂关系。输入层输入重要影响因子,经过隐含层的处理后输出预测结果,即所需要的碳交易价格的预测结果。BP神经网络的基本思想如图1所示,其具体的实现过程如下:
图1 BP神经网络算法示意图
2.2.2.1 数据输入
在(0,1)范围内随机初始化网络中所有节点的连接权wij和节点的阈值θij,读入经过标准化处理的重要影响因素的样本xk和碳排放交易价格yk。
2.2.2.2 模型训练
2.2.2.3 输出预测值
计算误差,重复上述步骤,直到达到要求的误差范围输出。
由于神经网络具有较强的适用性和容错能力,利用历史数据建立训练模型,把灰色预测的数据结果带入训练好的模型中,就可以得到充分考虑历史信息的预测结果。在对数据进行标准化的基础上,利用已有样本357期数据进行神经网络模型的训练,其参数设置为误差参数为10-7,学习次数10 000次,神经元的个数为显著影响碳交易价格变动的变量的数据8个,经过480次迭代后收敛于82.550,得到预测模型。在使用模型进行预测之前,需对模型的预测能力进行评估。
为了评估模型的预测精度,需要量化误差,平均绝对相对误差(MAPE)不仅考虑预测值与真实值的误差,还考虑了误差与真实值之间的比例,所以本研究采用MAPE衡量预测方法的准确性。一般认为MAPE小于10%,则模型的拟合精度较高。以2017年1月1日—2018年6月30日为训练集,以2018年7月1日—2018年9月30日为测试集,预测了未来60期的碳交易价格,灰色BP神经网络预测模型对碳交易价格预测并计算MAPE值,具体结果如图2所示。
图2 预测模型平均绝对百分误差
从图2可以看出,灰色预测模型方法的误差随着预测期的增加呈现出逐渐增大的趋势。在10期内,MAPE小于4%,预测效果较好。对于较长时期,MAPE均在8%以下,中长期预测效果尚可。下面根据预测模型对未来10期进行预测,具体预测结果如表4所示。图3给出了原始数据和利用灰色BP神经网络模型得出的拟合值。
表4 灰色BP神经网络预测结果
图3 灰色BP神经网络预测结果
从图3可以看出,虽然灰色BP神经网络预测模型对于碳交易价格的拟合效果在少数区域表现不佳,准确性相对较低,但预测对于价格波动点捕捉的比较准确,且能够拟合出数据变动趋势和波动。
3 结论
综合考虑宏观经济、能源价格、气候环境和国际市场四方面因素,对市场中的碳交易价格建立指标体系。客观的统计方法Lasso回归对碳交易价格的影响因子进行筛选发现,我国碳交易市场价格主要受到煤炭价格、国外天然气价格、汇率、空气质量指数、国内天然气价格、碳效率指数、极端天气和核准减排量的影响,而国内外宏观经济、原油价格、国际煤炭价格对国内碳交易价格波动影响微弱。这不仅丰富了碳交易市场领域的研究,同时也有利于引导投资者进行合理投资,推动碳交易市场的健康、有序发展。
本研究还通过对碳交易价格重要预测变量进行灰色模型预测,建立了灰色BP神经网络模型。预测结果表明灰色BP神经网络模型在短期预测中表现良好,不仅能够准确描述碳交易价格的趋势特征,而且能及时捕捉碳交易价格的随机波动,为市场参与者进行相关决策提供了参考依据。同时,预测有效期最好控制在10期内,对于中长期预测结果,由于预测误差较大,精度较低,在使用时必须特别小心,以免带来更大的风险。