基于CEEMD小波去噪的一种预测碳排放的新方法
2022-07-11杨澈洲张国浩
杨澈洲,王 斯,张国浩
(重庆工商大学 数学与统计学院,重庆 400067)
随着碳排放与日俱增导致全球气候变暖从而对人们生活发展产生了直接而恒久的负面影响。因此,站在国家层面而言,科学地预测碳排放量走势并积极制定相关政策,进而实现绿色可持续性发展开始变得至关重要[1-2]。
能源消耗碳排放影响因素研究是预测未来能源消耗碳排放量的一个重要基础。能源消耗碳排放影响因素研究主要是为了探讨能源消耗碳排放与其影响因素之间的关系,主要包括人口规模、产业结构、经济产出、能源结构、运输结构、技术进步等因素。随着中国节能减排工作的积极开展以及低碳化的推广,许多学者对碳排放问题予以关注和研究,对碳排放影响因素的研究成果也逐渐增多。亓伟[3]运用可拓展的随机性环境影响评估(stochastic impacts by regression on population affluence and technology,STIRPAT)模型以及通过马尔可夫过程,从静态和动态两个方面研究收入与二氧化碳排放的关系,同时,在确定收入水平是影响二氧化碳排放量的主要因素后,重点研究收入水平与二氧化碳排放量之间的转移机制;ZHONG等[4]分析了“一带一路”沿线30个国家的国内生产总值(gross domestic product,GDP)与人口和碳排放之间的相关性,结果表明:GDP、人口和碳排放呈现总体上升趋势,三者间的变化显示出显著的相关性,GDP与人口和碳排放之间的相关性非常高;杨立国[5]针对GDP、碳排放、货物贸易出口额运用协整分析进行研究,结果表明:从长期直接效应来看,货物贸易出口和GDP与单位GDP碳排放存在相关关系。
机器学习模型由于其良好的性能被许多学者广泛用于数据预测与分析[6-8]。目前智能神经网络作为机器学习的一种经典方法被引入到碳排放预测领域。王珂珂等[9]使用灰狼-极限学习机(whale optimization algorithm-extreme learning machine,WOA-ELM)对神经网络模型进行优化,克服了算法容易陷入局部最优解这一问题并提升了预测模型的准确性,但忽视了对模型输入端数据的处理环节。D’URSO等[10]基于自回归模型,结合模糊聚类对空气污染监测网络信息进行检测,优化了检测模型,减少了检测空气污染所需的经济成本,但其仍然忽视了对模型输入数据的一些适当处理。适当对数据预处理将有效提升预测模型的准确性。纪广月将灰色关联分析与BP神经网络结合使用[11],使用灰色关联度分析找到影响碳排放的重要因素,并将重要因素按序排列搜集数据后加入神经网络模型进行预测,有效提升了神经网络的训练速度,并且达到了良好的预测效果。蒋能超[12]采用CEEMD联合小波去噪对数据进行预处理,从而提升了模型对中国宏观经济景气指数的预测精确度,但其在构建指标体系时未能详细说明影响中国宏观经济景气指数的重要因素。
受文献[9-12]的启发,本文做出了以下几点贡献:第一,根据已有文献,构建出适合本文预测的指标体系并采用灰色关联度方法进行分析;第二,通过CEEMD对数据进行分解并找到合适的阈值函数对分解数据进行处理,从而形成CEEMD联合小波去噪对数据进行预处理;第三,通过将预处理后的数据与未进行预处理的数据输入神经网络模型并对比验证基于CEEMD小波联合去噪的神经网络模型的优良性;第四,对碳排放进行合理地外推预测,并提取一些相关建议。上述研究对碳排放影响因素进行了探索,对数据预处理方法进行了改进,对助推碳排放预测工作、制定相关政策,进而实现绿色可持续性发展有着重要的意义。
1 指标体系构建及灰色关联分析
1.1 构建指标体系与数据来源
1.1.1构建指标体系
本文根据碳排放量驱动因素的种类,将影响碳排放的一系列指标作了如下几类区分:资产水平分为人均GDP、固定资本总额;人力资源水平分为城市人口、劳动力;实体经济水平分为工业增加值、货物进出口,指标及对应含义如表1所示。
表1 指标及对应含义表Tab.1 Indicators and corresponding meanings
1.1.2数据来源与描述
从世界银行、美国能源局、世界能源署获取历经25年13个国家8个变量的数据。由于数据的可得性,少量数据存在缺失值,本文采用随机森林填充法进行填补所有缺失数据。得到四大经济体25年的能源消耗碳排放总量,除2016年左右有小幅波动,其余年份均呈上升走势,能源消耗碳排放总量时序图如图1所示。
图1 能源消耗碳排放总量时序图Fig.1 Time series chart of total carbon emissions from energy consumption
1.2 灰色综合关联度分析
灰色关联分析法是一种多因素统计分析的方法。通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密,它反映了数据间的关联程度。因此,常用于量化评价不同影响因素之间的关联程度及指标体系合理性。由于各指标之间的单位不同,所以本文先对各指标数据进行归一化处理,再分别计算各影响因素的关联度。通过对归一化数据进行关联度分析可得四大经济体的城市人口、人均GDP以及劳动力关联度均在80%以上,说明这三个指标与碳排放量有较大的关联度。其余各指标之间关联度均在60%以上,这反映出本文选取影响因素与碳排放量有较大的关联度,说明本文体系构建良好。各指标关联程度表如表2所示。
表2 各指标关联程度表Tab.2 Correlation degree table of each indicator %
2 CEEMD小波联合去噪
CEEMD 在分解信息时会抑制高频有效信息、小波去噪在抑制大部分噪声时会消除部分小幅度有效信号。本文考虑联合使用CEEMD与小波去噪,首先,对原始信号采用 CEEMD分解获得多个信息分量;其次,选用硬阈值函数小波变换进行多尺度分解,对各尺度数据进行去噪处理,消除大部分CEEMD加入的随机噪声;最后,重构并输出处理后的信息。
2.1 CEEMD分解得到信息分量
对25年四大经济体能源消耗碳排放进行CEEMD分解处理,分为如下三步:
第一步,将正负白噪声加入1995年至2019年的原始数据Y(t),其中,Y(t)是原始信号;Wt是辅助白噪声,t=1,2,…,n;产生了2I个序列,DI1与DI2为加入白噪声后的数据。如式3所示。
(3)
(4)
(5)
第三步,进行均值计算,如式6所示。
(6)
对原始数据信号进行CEEMD分解,共获得6层信息分量,6层分解量有不同的特征波长以及频率,从第1层分量到第6层分量至上而下波长逐渐变长,说明数据信息已逐渐被分层,分解效果较为理想。分解后的信息分量与原始信号对比图如图2所示。
图2 CEEMD分解后的信息分量与原始信号对比图Fig.2 Comparison between the information score after CEEMD decomposition and the original signal
2.2 小波去噪对数据进行提纯
选择适当阈值函数对多尺度数据分量进行分解、去噪并重构输出。主要方法如式7所示,其中,α为尺度因子,它可以伸缩基本小波φ(t)函数波长;τ表示小波位移后的大小。
(7)
为了选取适应本文数据的小波函数对数据进行去噪处理,现对硬阈值函数、软阈值函数、固定阈值函数处理后的数据特征值进行对比。结果表明:硬阈值处理数据的信噪比SNR远大于另外两种函数,同时硬阈值处理数据的均方根误差RMSE远小于另外两种函数,说明硬阈值去噪后的数据层次区分更清晰,各层中数据与数据有较强关联性。因此,本文选择硬阈值函数对分解后加入噪声的数据进行去噪处理。三种阈值处理数据的SNR与RMSE如表3所示。
表3 三种阈值处理SNR与RMSETab.3 Three thresholding SNR and RMSE
为了说明CEEMD小波联合技术对数据进行预处理,在挖掘数据深层次性质的同时并不影响数据本身的一些基本性质。现将预处理前后数据的三个特征值进行比对,数据特征值对照如表4所示。
表4 数据特征值对照表Tab.4 Data characteristic value comparison table
根据表4可得,处理后数据无论是平均值还是标准偏差亦或是标准误差平均值都与原始数据无太大差异,这种差异在小数点百万分位后才体现出来。说明数据预处理对数据的基本性质没有太多改变。由此说明预处理后的数据对数据基本性质的影响较小,这保证了下文对数据分析的科学性与有效性。
3 改进神经网络模型预测分析
3.1 改进模型预测
通过灰色关联度分析建立合理的指标体系,以及对能源碳排放的时序数据作CEEMD小波预处理,得到良好的数据。由于BP、模糊神经网络模型常常被用来进行预测数据处理,因此,本文建立了基于CEEMD小波去噪的BP神经网络模型、模糊神经网络模型,设置测试集从2014至2019年对“一带一路”沿线国家或经济体的能源消耗碳排放进行预测,并以平均绝对误差MAE、均方误差MSE作为训练模型评估指标。以中国为例,BP神经网络模型与CEEMD小波-BP神经网络模型预测对比如图3、4所示。
图3 CEEMD小波-BP与BP预测对比 图4 CEEMD小波-BP与BP预测误差对比Fig.3 CEEMD wavelet-BP and BP prediction comparison Fig.4 CEEMD wavelet-BP and BP prediction error comparison
结合图3与图4可以得到,CEEMD小波-BP神经网络模型对数据进行预测结果从2014年呈现出小幅度下降直至2015年起持续上升趋势;预测误差到2015年起开始迅速上升直至2016年起开始缓慢下降。相比于BP神经网络模型,改进的BP神经网络模型拟合曲线更贴近原始数据,预测误差的极值也远小于BP神经网络。
以中国为例,模糊神经网络模型与CEEMD小波-模糊神经网络模型预测对比如图5、6所示:
结合图5与图6可以得到,CEEMD小波-模糊神经网络模型对数据进行预测时,拟合的预测曲线从2014年起开始缓慢下降直至2016年开始持续上升;预测误差曲线在2016年达到顶峰。相比于传统模糊神经网络模型,改进的模糊神经网络模型拟合曲线更贴近原始数据,从2014年至2019年的预测准确性均优于传统模糊神经网络模型。
为了进一步反应基于CEEMD小波去噪改进后神经网络模型的优良性,本文针对MAE与MSE对BP、CEEMD小波-BP、模糊神经网络、CEEMD小波-模糊神经网络进行对比,对比结果如表5所示。
表5 模型评价指标对比Tab.5 Model evaluation index comparison
通过表5可得,基于CEEMD小波去噪预处理后的BP神经网络模型与模糊神经网络模型无论是MAE还是MSE均优于其对应的传统模型。对于MAE,CEEMD小波-BP神经网络模型比传统模型下降了55%;CEEMD小波-模糊神经网络模型相比于传统模型下降了41%。对于MSE,CEEMD小波-BP神经网络模型比传统模型下降近78%;CEEMD小波-模糊神经网络模型相比于传统模型下降近65.5%。
3.2 能源消耗碳排放外推预测
基于CEEMD小波去噪后的数据对中国、俄罗斯、印度、东盟的能源消耗碳排放进行外推预测直至2026年,结果如图7至图10所示。
从图7可得,中国未来几年能源消耗碳排放量呈一条光滑曲线,直至2026年,中国碳排放量达到超过16 186百万吨。从图8可得,未来几年俄罗斯能源消耗碳排放量开始减少,直到2026年碳排放量减少到1 728百万吨,期间碳排放量变化曲线有两次明显斜率改变。从图9可得,印度在未来几年印度能源消耗碳排放量开始出现负增长然后负增长率逐渐减小,在2026年前碳排放量走势趋于相对平缓,直至2026年印度碳排放量减小至2 098百万吨,期间碳排放量曲线斜率有一次较为明显地改变。从图10可得,直至2026年,东盟能源消耗碳排放量将达到一个相对顶峰状态,此时碳排放变化逐渐平稳。
图7 中国碳排放量外对预测 图8 俄罗斯碳排放量外对预测Fig.7 External projections of carbon emissions in China Fig.8 External projections of carbon emissions in Russia
图9 印度碳排放量外对预测 图10 东盟碳排放量外对预测Fig.9 External projections of carbon emissions in India Fig.10 External projections of carbon emissions in ASEAN
从外推预测结果来看:未来几年,四大经济体、中国、俄罗斯、印度、东盟的能源消耗碳排放量平均增长率分别为:3.00%、4.23%、-0.18%、-1.32%、2.15%。中国、东盟能源消耗碳排放量表现出正向增长状态;对于俄罗斯与印度而言,由于长期工业化生产、产业结构失衡导致能源消耗碳排放量出现非正常现象的负增长率状态。2020—2026年期间中国的平均增长率最大,远超四大经济体与东盟,印度的平均负增长率远大于俄罗斯。2020—2026年各个经济体能源消耗碳排放量预测平均增长率如表6所示。
表6 2020—2026年各个经济体能源消耗碳排放量预测平均增长率Tab.6 2020—2026 Estimated average growth rate of carbon emissions from energy consumption in various economies
3.3 能源消耗碳排放弹性系数
本文引入能源消耗碳排放弹性系数以及能源消耗碳排放弹性系数变化百分比,以此说明外推预测的合理性。根据从世界银行获得的原始数据,设立基期,结合世界货币基金组织发布预测数据,获取2020年至2026年的GDP年平均增长率以及GDP数据,通过计算得到能源消耗碳排放弹性系数,计算得能源消耗碳排放弹性系数表如表7所示。
(8)
表7 能源消耗碳排放弹性系数表Tab.7 Energy consumption carbon emission elasticity coefficient table
根据表7可以得出,从2020年至2026年期间,中国能源消耗碳排放弹性系数开始逐渐降低,表明中国能源消耗碳排放总体增势得到有效控制;俄罗斯、印度的能源消耗碳排放弹性系数有正有负;东盟能源消耗碳排放弹性系数与中国类似,能源消耗碳排放弹性系数呈递减状态。
4 结论
本文以“一带一路”主要经济体能源消耗碳排放量为研究对象,针对预测模型的输入数据优化问题,提出了CEEMD小波联合去噪与BP、模糊神经网络结合的预测模型。采用CEEMD与硬阈值小波对碳排放量序列进行分解、重构处理,使得处理后时间序列平稳性相比原始信号有较大提高,这有利于提高神经网络预测模型的精确度。该方法相对于传统神经网络预测方法,MAE与MSE有显著下降。可以得出此模型比传统BP、模糊神经网络具有更好的容错与逼近性能,预测精密度较高。该模型在碳排放预测领域提供了一种新的方法,具有较好的理论应有价值与应用价值。
此外,值得注意的是:由于2019年末全球遭受新冠疫情影响,预测使用的碳排放量数据出现大幅波动,故本文仅外推预测到2026年。对于更长远的未来预测,希望留给以后的工作。