基于联合均值与方差模型的碳排放权影响因素分析
2022-09-03董洋王丹璐刘俊伯吴刘仓
董洋,王丹璐,刘俊伯,吴刘仓
(1.昆明理工大学 管理与经济学院,云南 昆明 650093;2.昆明理工大学 理学院,云南 昆明 650093;3.昆明理工大学 城市学院,云南 昆明 650093)
近年来,世界各国越来越重视全球气候变暖问题,减少温室气体的排放是每个地球成员的责任和义务。作为绿色金融工具之一的碳金融,可以通过鼓励和限制来提高企业能源使用率和降低碳排放量,将减排的目标在企业中内部化。2011年10月,北京、天津、上海、重庆、广东、湖北、深圳7省市启动了碳排放权交易地方试点工作。截至2020年12月31日,试点碳市场配额现货累计成交4.45亿吨,成交额104.31亿元人民币。全国碳排放权交易于2021年7月16日开市。目前,虽然几个试点市场已经运行数年,与发达国家相比,我国对碳市场的建设较晚,仍然面临着许多困难和问题,实现碳达峰、碳中和,是我国实现可持续发展、高质量发展的内在要求,也是推动构建人类命运共同体的必然选择。全面贯彻落实习近平生态文明思想,立足新发展阶段、贯彻新发展理念、构建新发展格局,扎实推进生态文明建设,对国内碳排放权影响因素进行分析是有深远意义的。
随着碳市场建设的不断发展,碳价格波动较大,对碳价波动的研究也相继出现。国外在这方面起步较早,主要从能源、经济、环境、政策等方面进行研究。Mansanet-Bataller等[1]利用多元回归模型,对多个因素与碳价之间的关系进行分析,发现影响碳价的主要因素是传统能源价格;Shahbaz等[2]用格兰杰因果检验研究了影响碳价的问题;Roshan等[3]发现温暖的气候条件会影响碳排放和碳价。我国的碳市场发展较晚,国内学者为促进碳市场的发展,也做了相关研究工作。马慧敏和赵静秋[4]发现传统能源价格对碳价存在正向关系;郭文军[5]使用回归分析方法研究了欧元汇率与我国碳价之间的关系;王倩和路京京[6]发现温度对碳价的影响存在着区域差异;同时,赵立祥和胡灿[7]通过结构方程模型,发现气候变化是碳价变化的主要影响因素;最后,狄琳娜[8]、史丹等[9]、莫建雷等[10]根据我国碳市场的实际情况,为我国碳市场交易提出了相关建议。
碳排放权是由经济学家提出的,排放交易概念导致了碳市场的建立,无论是理论还是分析方法都偏向金融方法。而本文中我们将机器学习与统计方法结合,分析湖北碳排放权影响因素,运用随机森林插补所收集到的数据缺失部分,再进行灰色关联度分析,寻找相关性强的变量,进一步建立联合均值方差模型。可分别同时对均值参数和方差参数建模,相比单一的均值回归模型适应性更广泛,模型可以用均值和方差来刻画收益和风险这两个关键因素。本文首先通过灰色关联度分析影响因素的主次程度,初步将影响较大的指标筛选出来;其次运用SCAD惩罚函数基于混合联合均值与方差模型进行变量选择,筛选出分别在均值和方差下各变量的影响关系,将影响湖北碳排放权较小的因素排除,根据影响较大的因素可制定有针对性的方案,使相关政策更符合各地区的发展,从而促进全国统一碳市场的建设。
1 碳排放权描述性统计分析
1.1 全国碳排放权情况
全国累计成交量中,重庆碳排放权配额(CQEA)成交量位居第一,湖北碳排放权配额(HBEA)成交量位居第二,深圳碳排放权配额(SZA)累计最少。每个交易市场都在平稳上涨,但是,相比之下深圳碳排放权配额(SZA)、上海碳排放权配额(SHEA)、北京碳排放权配额(BEA)的累计成交量趋势比较缓慢,而广东碳排放权配额(GDEA)和天津碳排放权配额(TJEA)的累计成交量近似。
全国统计累计成交额中,广东碳排放权配额(GDEA)累计成交额位居第一,其次是湖北碳排放权配额(HBEA)累计成交额位居第二,最少的是重庆碳排放权配额(CQEA)。而广东碳排放权配额(GDEA)从2019年5月份后开始大幅度上涨,其他交易市场的增长比较平稳。通过与累计成交量对比发现,碳排放权配额的累计成交量和累计成交额不成正比,比如,重庆碳排放权配额(CQEA)的累计成交量是最高的,但是其累计成交额却是最低的,说明每个市场的碳排放权配额均价存在很大不同。
全国碳排放权配额每日成交均价中,北京碳排放权配额(BJEA)的成交均价一直是高于其他交易市场的,而重庆碳排放权配额(CQEA)的成交均价一直低于其他交易市场,最高的成交均价122.97元/吨来自天津碳排放权配额(TJEA),但是也只在2013年出现过,之后天津碳排放权配额(TJEA)的均价持续走低,而近期最高的交易均价来自2020年8月的北京碳排放权配额(BJEA)市场,为102.96元/吨。本研究特别关注了湖北碳排放权配额(HBEA)的交易均价,最低为2016年7月的9.38元/吨,最高为2019年6月的54.64元/吨。
1.2 湖北碳排放权情况
根据上述全国的碳排放权情况,本文选择了碳排放权相对平稳的湖北做分析。经过查阅资料分析得,每年湖北碳排放权市场的成交量在年初很少,每年的6—7月和11—12月都是成交量的高峰期。
从图1可以看出,每年湖北碳排放权市场的成交额在年初很少,每年的6—9月和11—12月都是成交额的高峰期,即湖北碳排放权的成交额具有季节性,基本上每年的走势相似,所以常常有学者使用时间序列来研究碳排放权的成交额。
从图2可以看出,每个时期的均价都不同,每一年的交易趋势也不同。为研究湖北碳排放权均价的影响因素,了解交易趋势的平稳性和大小趋势,深究收益和风险,本文将引入联合均值与方差模型来进行分析。
2 模型构建
为研究碳价的影响因素,国内外学者做了大量工作。通过以上整理了解到,影响碳价的因素有很多,主要包括经济因素、传统能源价格、环境因素、行业市场环境、相关行业发展指数等。学者们从单一或几方面的因素综合分析,对不同碳市场的碳价影响因素分别进行了研究。本文通过整理相关文献,最终选取以下影响因素指标,见表1。
图1 湖北碳排放权市场当日成交额
图2 湖北碳排放权市场每年成交均价
2.1 数据预处理
2.1.1 随机森林插补缺失数据
选取的数据主要包括时间段为2014年4月28日至2021年5月20日共1 885日的湖北碳排放权的均价,每日包含24项记录,如BOCE动力煤现货结算价、全国汽油的市场均价、天然气的市场均价、中证100指数、沪深300指数、SHIBOR等,但部分变量存在缺失,需要进行插补。
目前缺失数据插补方法大都是基于均值插补、回归插补等统计方法,本文采用更为高效的机器学习处理方法,它能快速有效且精确地深入分析模型,具有一定的优势。它在选择特征的过程中,能删掉对模型构建并不起作用的特征,使算法更加合理,提高计算速度,同时采用随机抽取部分特征的方式使得模型可以尽量避免过拟合的问题[11]。参考钱超等[12]的研究,本文提出一种基于随机森林模型对缺失数据进行插补的方法,根据湖北每日碳排放权均价数据的缺失特征对缺失数据集进行分割,应用其完整数据子集构建随机森林回归模型并对缺失部分进行迭代插补,得到插补数据集。随机森林的基本思想如图3所示。
图3 随机森林示意图
表1 湖北碳排放权影响因素评价指标体系
选取1 885条记录,共有1 552条完整数据,完整度为82.33%,其余存在如下缺失:(1)只缺失1个记录的有28起,占缺失数据的8.4%。(2)只缺失2个记录的有62起,占缺失数据的18.6%。(3)由于时间关系,我们将缺失3个及3个记录以上的数据均删去,共删去243条数据。缺失数据插补工作流程图如图4所示。插补后,得到1 668条完整数据,为后面的模型做准备。
图4 随机森林插补流程图
2.1.2 正态性检验
对湖北碳排放权均价做正态性检验,得到如图5所示的QQ图。从图5可以看出,数据与正态分布拟合较好,图上的点大致分布于一条直线上,又通过Shapiro-Wilk正态检验,其P值为<2.2e-16,w值为0.958 98,所以数据通过正态性检验。
2.2 灰色关联分析
传统统计分析方法如主成分分析、回归分析等,在进行关联性分析时对样本量、概率分布、统计特征等有一定要求,各因素还要彼此无关[13]。而我国碳排放权交易市场建立时间短,其交易数据较少且存在交易数据不连续、波动大的特点。另外,碳排放权受经济、能源、空气、天气、技术等多种因素的综合影响,彼此间的关系是不确定的。因此,难以利用传统统计分析方法去科学地探究影响碳排放权的关键因素。灰色关联分析是基于灰色系统理论的一种分析方法,主要研究变量间的相关关系[14]。该方法可通过灰色关联度大小的排序结果判断影响因素的主次之分,且对数据的规律性以及数据的数量无硬性要求[15]。同时,其多次被应用于我国各领域关键影响因素的识别研究当中[16-18],具有广泛的适用性和科学性。因此,灰色关联分析用于碳排放权的关键影响因素识别较为合适。
图5 湖北碳排放权均价(单位:元/吨)QQ图
2.2.1 关联度分析
各因素与碳排放权的关联度表示各因素对碳排放权的影响程度。根据灰色关联分析方法的要求,本文将碳排放权各影响因素的关联度计算过程分为以下几步。
(1)确定参考序列和比较序列。设定湖北碳排放权配额(HBEA)当日成交量作为参考序列X0:
以湖北碳排放权各影响因素作为比较序列,22个比较序列为:
(2)指标数据的无量纲化。由于各影响因素单位不同,难以统一计算标准,因此在进行灰色关联分析时,需进行无量纲化。对比于极差正规化和标准化方法,均值化方法能够较好地体现数据间的差异程度[17]。因此,本文选择均值化方法进行指标的无量纲化:
(3)计算求差序列。以无量纲化的参考序列减去无量纲化的比较序列的绝对值:
(4)确定极值。
式中:ρ为分辨系数,ρ越小,其分辨能力越大。ρ取值范围为(0,1),一般取ρ=0.5。
(6)计算关联度并排序。由于关联度曲线上的节点是由许多个零散节点聚合而成的,故需将关联度曲线中各节点的关联值聚合为一个总体关联度γn。γn值越接近1,表明该因素与湖北碳排放权的关联度越高,越可能是湖北碳排放权的关键影响因素。关联度计算公式如下:
最终,求得各因素总体关联度γn,见表2。
2.2.2 关键影响因素选择
通过对γn值进行排序,可确定碳排放权的关键影响因素。根据表2,碳排放权影响因素体系中所有影响因素的γn按照由大到小依次排序为:X20沪深300指数(0.934 301 442)、X19中证100指数(0.933 245 227)、X17采购经理人指数(PMI)(0.932 898 198)、X22上海银行间的拆解利率(SHIBOR)(0.932 673 667)、X4全国汽油交易基准价(0.932 545 813)、X21美元兑人民币汇率(0.932 324 176)、X1动 力 煤BOCE现 货 结 算价(0.932 296 969)、X10湖北天然气工业用市场平均价(0.932 291 551)、X13湖北管道燃气工业用市场价(0.932 243 963)、X16武 汉AQI(0.932 024 525)、X14核证减排量(CER)现货结算价(0.931 949 621)、X15武汉平均气温(0.931 663 073)、X2焦 炭BOCE现货结算价(0.931 317 344)、X9湖北天然气民用市场平 均 价(0.931 040 076)、X3焦煤山西BOCE现 货结算价(0.930 558 206)、X11中 国LNG液化天然气到岸价(0.929 857 493)、X8湖北液化天然气车用零售 价(0.928 923 555)、X5中石化汽油92#经销价(0.928 920 764)、X18SOLARZOOM光 伏经理人指数(0.928 562 508)、X7中国胜利环太平洋原油现货价(0.927 779 628)、X6中国大庆环太平洋原油现货价(0.927 771 809)、X12湖北管道燃气民用市场价(0.714 279 579)。由各因素对碳排放权影响的灰色关联度可知,X20沪深300指数、X19中证100指数和X17采购经理人指数(PMI)的关联度较高,表明与实际情况相符,可见灰色关联可以用于碳排放权关键因素的确定。据此,本文将选取与碳排放权关联度高的前12个影响因素,即X20沪深300指数、X19中证100指数、X17采购经理人指数(PMI)、X22上海银行间的拆解利率(SHIBOR)、X4全国汽油交易基准价、X21美元兑人民币汇率、X1动力煤BOCE现货结算价、X10湖北天然气工业用市场平均价、X13湖北管道燃气工业用市场价、X16武汉AQI、X14核证减排量(CER)现货结算价、X15武汉平均气温作为联合均值方差模型的最优输入特征变量。
表2 灰色关联度及排序
2.3 正态数据下联合均值与方差模型的变量选择
联合均值与方差模型[19]是一类重要的统计模型,可对均值参数和方差参数同时建模,与单一的均值回归模型相比具有更大的适应性,可以概括和描述更多现实问题,特别在关注方差或波动的领域,比如经济和金融中风险管理领域,该模型的一个特点是对方差的重视能更好地解释数据变化的原因和规律。根据吴刘仓等[20]提出的模型可以同时分析影响响应变量的均值与方差,通俗来讲,就是影响响应变量的数值大小和数据平稳性,用均值和方差来刻画收益和风险这两个关键因素。均值,指的是投资组合的期望收益率,它是单只证券的期望收益率的加权平均,权重为相应的投资比例。而方差,则是指投资组合的收益率的方差,它衡量了实际收益率和均值的背离,刻画了投资组合的风险,这对碳排放权均价趋势的研究是有意义的。
2.3.1 联合均值与方差模型构建
假设(yi,xi,zi),i=1,2,…,n是来自联合均值与方差模型(8)的随机样本。
式中:N(·)表示正态分布,n为任意自然数,xi=(xi1,xi2,…,xip)T和zi=(zi1,zi2,…,ziq)T为解释变量,yi是其相应的响应变量,β=(β1,β2,…,βp)T是p×1维的联合均值与方差模型中均值模型的未知参数向量,此外γ=(γ1,γ2,…,γq)T是q×1维的联合均值与方差模型中方差模型的未知参数向量。zi包含一些或者所有xi和其他不在xi的变量,即均值模型和方差模型可能包含着不同的解释变量或者相同的一些解释变量,包含相同的解释变量但存在不同的影响方式。当时,该模型为正态线性回归模型。
2.3.2 惩罚极大似然估计
变量选择是统计推断中的重要内容。无关的协变量不仅会对变量间关系的理解产生负向影响,且在实际中获得自变量的观测数据代价较大;在回归模型的建模过程中,若把一些影响较小的协变量选入回归模型,会加大计算量,降低估计和预测的精度。因此,有必要对模型的变量进行选择。定义惩罚似然函数为:
式中:I(·)表示示性函数,(aλj-|βt|)+表示当(aλj-|βt|)>0时,取(aλj-|βt|),否则取0。在SCAD惩罚的函数中,Fan & Li[21]认为在实际应用中取a=3.7在贝叶斯风险下接近最优,因此本文也选择将a设置为 3.7。极大化公式(9)中的惩罚极大似然函数L(θ)得到θ的惩罚极大似然估计。
为方便叙述,惩罚似然函数式(9)写为:
其中,θ=(θ1,θ2,…,θs)T=(β1,β2,…,βp;γ1,γ2,…,γq)T,s=p+q,除了相差一个与参数无关的常数外,。
极大化式(12)中的函数L(θ)得到θ的惩罚极大似然估计,记为。在适当的惩罚函数下,关于θ极大化L(θ)会使部分参数消失,相应的变量删除,从而实现变量选择。因此,通过极大化L(θ)同时达到参数估计和变量选择的目的。
2.3.3 算法实现
注意到对数似然函数l(θ)的一阶导和二阶导都是连续的,此时l(θ)的近似为:
而且,给定初值θ0,可二次逼近为:
所以,除了相差一个与参数无关的常数项外,式(12)可二次逼近为:
那么对数似然函数l(θ)可写作:
利用Fisher信息阵近似替代观测信息阵,我们可以得到下式迭代的数值解。
最后,下面的算法总结了在联合均值与方差模型中参数的惩罚极大似然估计的迭代计算。
步骤1:取β和γ没有惩罚的极大似然估计β(0)、γ(0)作为初估计,即。
步骤3:重复步骤2直到收敛条件满足。
2.3.4 确定调谐参数
调谐参数的常用选择准则有赤池信息准则(AIC)和贝叶斯信息准则(BIC)。本文选取BIC为调谐参数,因为BIC准则能依概率1选择真实模型。定义如下:
对于一个给定的调谐参数λj,0<dfλ<s为模型的惩罚极大似然估计值的非零分量个数,为了保证零系数的调谐参数大于非零系数的调谐参数,则:
2.3.5 基于联合均值与方差模型的湖北碳排放权变量选择
湖北碳排放权均价的直方图如图6所示。
图6 湖北碳排放权均价直方图
根据前文灰色关联度,我们选取以下12项指标:湖北碳排放权均价Y、BOCE动力煤现货结算价A1、全国汽油现货基准市场价A2、湖北天然气工业市场价A3、湖北管道燃气工业市场价A4、核证减排量(CER)现货结算价A5、采购经理人指数(PMI)A6、中证100指数A7、沪深300指数A8、美元兑人民币汇率A9、上海银行间的拆解利率(SHIBOR)A10、武汉平均气温A11、武汉AQIA12,考虑以下模型:
通过利用上节算法,可以同时实现变量选择和参数估计,结果如表3所示。
表3 湖北碳排放权均价参数估计和变量选择结果
从均值模型来看,BOCE动力煤现货结算价A1、全国汽油现货基准市场价A2、核证减排量(CER)现货结算价A5、上海银行间的拆解利率(SHIBOR)A104个指标不是重要的变量,可以排除。湖北天然气工业市场价A3、湖北管道燃气工业市场价A4、采购经理人指数(PMI)A6、中证100指数A7、沪深300指数A8、美元兑人民币汇率A9、武汉平均气温A11、武汉AQIA128个指标影响湖北碳排放权均价趋势的高低,也就是投资组合期望收益率的主要因素,其中,沪深300指数A8是正向影响最显著的指标,美元兑人民币汇率A9是负向影响最显著的指标,所以希望收益率高的投资者应该重点关注这几个指标。
从方差模型来看,BOCE动力煤现货结算价A1、沪深300指数A8、武汉平均气温A113个指标不是重要的变量,可以排除。全国汽油现货基准市场价A2、湖北天然气工业市场价A3、湖北管道燃气工业市场价A4、核证减排量(CER)现货结算价A5、采购经理人指数(PMI)A6、中证100指数A7、美元兑人民币汇率A9、上海银行间的拆解利率(SHIBOR)A10、武汉AQIA129个指标影响湖北碳排放权均价趋势的平稳性,也就是投资组合风险的主要因素,其中,中证100指数A7是正向影响最显著的指标,所以希望投资风险小的投资者应该重点关注这几个指标。
综合两个模型来看,均值模型和方差模型的影响指标均不相同,也就是投资组合的风险和收益的影响指标不相同,所以将回归模型的均值模型和方差模型拆开分析是有意义的,便于更细地分析金融趋势。
3 结论与建议
本文研究的特点在于用统计模型和机器学习去分析碳排放权金融数据。相比较传统的方法,本文具有下列优点:
(1)本文在进行变量选择之前,提出一种基于随机森林模型对缺失数据进行插补的方法。插补后,得到1 668条完整数据,为后面的模型做准备。
(2)传统统计分析方法在进行关联性分析时,往往对样本量、概率分布、统计特征等有一定要求。相比传统统计分析方法,本文更适合用灰色关联分析方法进行关联性分析,也为之后的相似研究提供了方法借鉴。
(3)本文运用联合均值与方差模型对湖北碳排放权的影响因素做变量选择,能更好地关注投资组合的风险和收益。使用SCAD惩罚对系数进行压缩,把对响应变量影响不大甚至没有影响的协变量排除,提高了估计和预测的精度。从均值模型来看,BOCE动力煤现货结算价、全国汽油现货基准市场价、核证减排量(CER)现货结算价、上海银行间的拆解利率(SHIBOR)4个指标对收益率不是重要的变量,可以排除。从方差模型来看,BOCE动力煤现货结算价、沪深300指数、武汉平均气温3个指标对投资风险不是重要的变量,可以排除。
研究可为进一步探索碳市场建设提供以下几点启示:
(1)因为碳市场具有市场属性也有政治目标,因此在制定相关政策和减排制度时,既要考虑国内碳市场的实际发展情况,也要考虑地区差异,使相关政策更符合各地区的发展,从而促进全国统一碳市场的建设。
(2)鼓励碳市场投资者积极参与,完善碳市场的交易制度。我国是世界上碳排放量和减排潜力最大的国家之一,对于我国碳市场来说,有大量的潜在参与者,不仅要激励企业减排,而且更要多培养相关专业人才,提高群众减排意识。因为参与者的增加,可以促进碳资产的流动性,有助于碳市场的建设。
(3)国家要继续鼓励和扶持高排放企业在技术上进行升级改革,在提高企业生产效率的同时从源头上降低碳排放量,这样既能实现减排目标,又可以促进企业进行生产转型,更好地发展绿色经济。
(4)碳金融是欧盟发展绿色经济的新兴政策工具,为了尽快适应,我国还需鼓励在碳金融领域的创新,加大该领域的人才培养力度,加强国际上的交流与合作,促进全国统一碳市场的快速发展。