APP下载

基于CEEMD-SSA-ELM方法的建筑业碳排放预测研究

2023-10-10张新生任明月陈章政

生态经济 2023年10期
关键词:建筑业预测节点

张新生,任明月,陈章政,

(1.西安建筑科技大学 管理学院,陕西 西安 710055;2.陕西省新型城镇化和人居环境研究院,陕西 西安 710055)

过量排放二氧化碳造成的温室效应对当前人类社会发展造成了严峻挑战[1]。2020年,我国提出二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和。2021年,我国为尽早实现“双碳”目标,提出了碳达峰碳中和“1+N”政策体系,其中“N”为各行业碳达峰细化方案[2]。建筑业作为我国经济增长的主要贡献力量之一,其碳排放也占我国整体碳排放总量的三分之一[3]。随着我国城镇化进程的脚步逐渐加快,建筑业碳排放和能源消耗也呈现出稳定增长的趋势,由于其自身较大的减碳潜力和较低的减碳成本使其成为“双碳”目标的关键环节。因此,为了更好地实现“双碳”目标,必须对未来建筑业碳排放进行科学合理的预测。

由于气候变暖问题的严重性和迫切性,关于碳排放的研究已经有了长足进展,碳排放预测领域受到了重点关注[3-4]。

根据影响因素的不同,分别从单因素预测、多因素预测方面进行了研究。YANG等[5]以上海客运航班的碳排放为研究对象,通过自回归综合移动平均(ARIMA)线性模型预测了2017—2022年航空运输燃料消耗量和途中二氧化碳排放量。王阳等[6]以采矿过程中电机的碳排放研究对象,结合灰色理论并通过改进协方差函数的选择以提高预测准确度。虽然单因素预测取得了较好的效果,但该类方法主要是根据碳排放自身数据的变化结合预测方法的创新,不能将外界环境对其产生的作用考虑在内,导致预测结果过于片面。

在考虑人口、经济、能源、科技等不同因素对碳排放影响下,国内外学者对其进行了相关研究。HEYDARI等[7]提出了一种结合灰狼优化算法与广义回归神经网络(GRNN)的二氧化碳排放预测智能方法,研究了伊朗、加拿大和意大利的二氧化碳排放趋势,但是GRNN自身空间复杂度较高,计算较为繁琐复杂。QIAO等[8]以具有代表性的部分发达国家及发展中国家为研究对象,结合狮群算法(LSO)和遗传算法(GA)优化最小二乘支持向量机(SVM)计算未来二氧化碳的排放趋势,但SVM算法的参数存在强随机性,预测结果存在较大波动性。WEN等[9]利用随机森林算法(RF)对商务部门碳排放的影响因素进行分析,并利用离散粒子群算法(DPSO)优化BP神经网络的权重与偏置,但是BP算法的精度依赖于大量数据的训练,对于小样本问题适用度不高。LI等[10]使用广义迪氏分解法(GDIM)对建筑业碳排放进行因子分解,并使用STIRPAT模型结合情景分析法对我国建筑业碳排放趋势进行预测,由于碳排放的影响因素间关联程度较大,容易存在多重共线性问题,易产生“伪回归”现象。MA等[11]首先使用灰色关联法分析与我国碳排放相关的影响因素,然后构建萤火虫算法优化的GM(1, 1)预测模型。GAO等[12]首先验证美国碳排放数据的Gompertz规律,并利用混沌鲸鱼优化算法优化的GM(1, 1)对美国碳排放进行了预测,虽然灰色模型适用于小样本问题,但该算法难以保证长时期的预测性能。回顾国内研究,苏凯等[13]、张国兴等[14]和赵慈等[15]通过环境经济学中的STIRPAT模型分别对黄河流域的交通运输业、福建省和浙江省的碳排放总量进行了分解预测。胡振等[16]构建了基于BP神经网络的西部城市家庭消费碳排放预测模型,并以西安市为例验证了模型的可行性。徐勇戈等[17]提出了一种模糊布谷鸟算法优化支持向量机(FCS-SVM)的建筑业碳排放预测模型。

结合上述两点可知,现有研究主要集中于影响因素的更新和预测方法的改进,少有研究进行碳排放数据的预处理。2021年,张雯等[18]以12个不同国家为研究对象,结合LSSVM算法最先将EMD应用在碳排放预测领域并有效提高了预测精度,但该方法难以处理模态混叠现象。又由于碳排放数据自身的非线性和波动性[19-20],单纯依靠影响因素的改进或预测方法的改进很难完全解决这个问题。

为了解决上述问题,本文提出了一种集合互补经验模态分解(complementary ensemble empirical mode decomposition,CEEMD)、麻雀优化算法(sparrow search algorithm,SSA)和极限学习机(extreme learning machine,ELM)相结合的碳排放预测方法。本文首先运用灰色关联分析法(grey relation analysis,GRA)选取与建筑业碳排放关联程度较大的因素,在ELM预测的基础上,通过SSA优化ELM的参数后对我国建筑业碳排放数据进行初步预测,采用CEEMD将原始碳排放数据分解为多个不同振幅的频率项和一个残差项,将分解得到的平稳信号作为SSA-ELM的最终输入,最后验证模型的可行性,以期为我国建筑业碳排放提供一种切实可行的预测方法。

1 碳排放预测模型

1.1 碳排放测算

根据住房和城乡建设部发布的《建筑碳排放计算标准》,建筑碳排放包括但不限于建材的生产运输、建造、拆除等环节所产生的温室气体总和。建筑业碳排放可以分为直接碳排放和间接碳排放两部分[21]。直接碳排放由建筑业本身消耗的一次能源所产生;间接碳排放与建筑业上下游企业高度关联,主要是指建筑材料生产制造、运输过程中所产生碳排放。结合张智慧等[21]、冯博等[22]的研究思路,在充分考虑数据获取可能性的前提下,本文将直接消耗的煤炭、石油、原油等12种能源和其他行业生产的水泥、钢材等5种建筑材料所产生的碳排放确定为建筑业碳排放源,并根据其研究结果确定碳排放系数和建筑材料回收系数。建筑业碳排放的测算模型为:

式中:E为建筑业碳排放总量,ED为直接碳排放,EI为间接碳排放,Ci为第i种能源消耗量,ai为碳排放系数,Gi为第i种建筑材料的使用量,βi为第i种建筑材料的碳排放系数,εi为建筑材料的可回收系数。记1重量箱玻璃为50千克;钢材的回收系数为0.8,铝材的回收系数为0.85[22]。选取IPCC为标准,能源碳排放系数见表1。建筑材料碳排放系数见表2。

表1 能源碳排放系数表

表2 建筑材料碳排放系数表

1.2 灰色关联分析

GRA是根据序列曲线几何性质的相似程度来判断其联系的紧密情况,曲线越接近就证明序列间关联度越大,反之就越小。设建筑业碳排放量的时间序列为X0={y(k)|k=1, 2,…,m},与建筑业碳排放的相关的影响因素为Xi={xi(k)|i=1, 2,…,n;k=1, 2,…,m}。则各因素与碳排放的关联度为:

式中:ρ为分辨系数,按惯例取值为0.5;Pi(K)表示各因素与碳排放量的关联系数。

1.3 互补集合经验模态分解

经验模态分解(EMD)是HUANG等[23]于1998年首次提出的一种可以有效将非线性序列转化为平稳时序的方法,分解结果由多个本征模函数(IMF)和一个残差项(res)组成。WU等[24]提出的集合经验模态分解(EEMD)改善了EMD容易模态混叠的问题,但该方法是通过白噪声与原始时间序列多次混合,将每个噪声序列分解后的IMF的平均值作为最终的IMF,分解的最终结果易受所添加噪声的影响。为了解决该问题,YEH等[25]提出了互补集合经验模态分解,将白噪声以正负对的形式加入原始时间序列中,以减少分解过程中信息的损失。CEEMD的流程如下:

向原始信号添加N对正高斯白噪声和负高斯白噪声:

其中,S为原始信号,N为高斯白噪声,M1、M2分别为原始信号与正高斯白噪声和负高斯白噪声之和。然后对目标信号进行EMD分解,每个信号得到一组IMF分量,其中第j个IMF的第i个分量表示为imfj;最后对整体进行平均,获得每个IMF的结果,可以表示为:

因此,CEEMD的最终分解结果x(t)可表示为:

1.4 极限学习机原理

2005年,HUANG等[26]首次提出的ELM算法是一种新型前馈神经网络,对比传统前馈型神经网络模型具有参数少、速度快、泛化性能好的特点。ELM由输入层、输出层和隐藏层组成,通过输入层与隐藏层之间随机生成的连接权重及阈值建立模型间的联系。因此,在模型的训练过程中只需要设置隐藏层的激活函数和隐藏层的节点个数,便可得到唯一的最优解,已经被广泛应用在各类预测及分类问题。其网络结构如图1所示。

图1 极限学习机网络结构图

对于n个不同的训练数据(Xi,Yi),且Xi=[xi1,xi2,…,xin]T与Yi=[yi1,yi2,…,yin]T。l表示隐藏层中的节点数,h(x)是激活函数,ELM的输出可以描述为:

式中:wi是连接输入层节点和第i个隐藏层节点的权重,βi是连接第i个隐藏层节点和输出层节点的权重,bi是隐藏层中第i个节点的阈值层,Qi是ELM网络的输出。将ELM的隐层输出矩阵设置为H,则模型的训练结果在经过一定的训练时间后可以零误差接近实际训练数据:

也可以表示为:

通过最小化近似平方差的方法对连接隐藏层和输出层权重β进行求解:

ELM中,隐藏层的输出矩阵H与输入权重wi和隐层节点的偏置bi唯一对应,那么便可以通过公式(10)获得最优解β*:

式中:β*为输出权重,H+为矩阵H的Moore-Penrose广义逆。

1.5 麻雀搜索算法

麻雀搜索算法是XUE等[27]受麻雀种群觅食及反捕食启发所提出的一种新型智能优化算法。SSA可以理解为“发现者—加入者”模型,并加入了侦查预警机制以提高搜索效率,加快模型的收敛速度。相较于其他搜索算法,该算法具有更高效的收敛速度和精度,能够简单快速地求解数值计算问题。

发现者作为觅食行为的引领者,遍历范围更广,占整个种群的10%~20%。在每次进行迭代的过程中,发现者坐标的更新方式如式(11)所示。

除发现者外,剩余麻雀种类皆为加入者,根据公式(12)更新当前位置。

与发现者的比例相同,具有预警机制的麻雀也占整个种群的10%~20%,其位置更新公式如下所示:

α~N(μ,σ2)是控制步长的参数,K∈[-1, 1]表示麻雀移动的方向;为避免出现分母为0的无意义情况,添加一个极小常数μ;gi为当前麻雀个体的适应度;gb和gw表示全局最优适应度和全局最差适应度。当gi≠gw时,表明该麻雀正处于种群的边缘,极易受到捕食者攻击;当gi=gw时,表明种群中间的麻雀也意识到了危险,需要靠近其他麻雀减少被捕食的概率。

2 基于CEEMD-SSA-ELM建筑业碳排放预测模型构建

2.1 建筑业碳排放预测流程

碳排放数据的非线性和波动性特征使得其在传统模型的预测中存在一定的局限性。基于CEEMD技术、SSA-ELM优化模型,本文建立了CEEMD-SSA-ELM的建筑业碳排放组合预测模型。首先在对我国建筑业碳排放进行测算的基础上,通过GRA分析高关联度的影响因素,对建筑业碳排放量的时间序列进行CEEMD分解,生成一系列不同尺度的IMF分量,实现碳排放序列的平稳化。然后针对不同分量分别选取合适的模型参数,建立SSA-ELM预测模型,最终将各分量的预测结果叠加得到建筑业碳排放量预测值。基本流程如图2所示。

图2 基于CEEMD-SSA-ELM建筑业碳排放预测模型

(1)根据公式(1)计算我国建筑业碳排放总量E。

(2)利用灰色关联分析计算各影响因素与建筑业碳排放的关联度,并将其排序。

(3)利用CEEMD对原始碳排放数据进行分解,得到IMF各分量imfj和残差res。

(4)初始化SSA和ELM模型参数,并根据公式(11)~(13)更新麻雀种群位置。

(5)分别对各imfj和残差res建立SSA-ELM回归模型,选取最佳参数,获得各分解序列的预测值。

(6)将各分解序列的预测结果叠加获得建筑业碳排放预测值。

(7)与实际数据对比,计算误差指标并进行误差分析。

2.2 模型评价指标

为验证模型预测效果,本文选取均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、绝对相关系数(R2)作为评价指标。RMSE对于数据中的极大、极小值具有较高的敏感性,可有效衡量预测模型的精度,MAE由于自身绝对值化的离差不会产生正负抵消的效果,可有效衡量预测模型误差的实际情况,MAPE可以有效评估每个数据点的平均预测,R2表示预测值对于实际值的拟合优劣程度。RMSE、MAE、MAPE三者的值越小,表示模型预测性能越好,R2的取值范围为(-∞, 1],计算结果越接近于1表示模型拟合效果越好。

式中:yi为样本i的实际值,为样本i的预测值,为测试集的平均值,n为样本总个数。

3 建筑业碳排放预测分析

3.1 指标选择与数据来源

由表3可知,本文选取年末总人口数、GDP、城镇化率、建筑业总产值、房屋竣工面积、建筑业劳动生产率、建筑企业从业人数、建筑业一次能源消耗量8个指标作为我国建筑业碳排放评价指标。本文数据来自国家统计局网站及1995—2021年的《中国统计年鉴》《中国建筑业统计年鉴》《中国能源统计年鉴》。

表3 碳排放影响因素梳理

将上述影响因素视为比较数列,我国建筑业碳排放总量视为参考数列,通过GRA分析结果可知,各影响因素与我国建筑业碳排放关联度最小值为0.928,可视为上述因素与建筑业碳排放具有较强关联性,关联度计算结果见表4。各影响因素按关联程度大小依次排序:建筑业总产值、GDP、城镇化率、建筑业从业人数、建筑业劳动生产率、房屋竣工面积、一次能源消耗量、年末总人口数。

表4 灰色关联分析结果

3.2 数据描述

由图3可知,1995—2020年,建筑业碳排放量呈现出“缓慢上升—快速上升—快速下降—波动上升”的趋势,且绝大部分碳排放由间接碳排放产生。换言之,我国建筑业二氧化碳的主要来源是建筑材料的生产阶段。1995—2008年,呈现出上升趋势,但该阶段增速较缓;2008—2012年,我国建筑业进入大力发展阶段,由于城镇化进程的不断加快,碳排放量也呈现出爆发式增长,2012年达到了31万吨碳排放高峰;随后建筑业的高碳趋势开始回落,2015年碳排放量重新回到16万吨;2015—2020年,随着城镇化脚步的加快,每年的竣工面积随之增加,2019年的建筑业碳排放又重新回到了20万吨。

图3 1995—2020年建筑业碳排放量趋势

通过数据分解技术,我国建筑业碳排放被分解为从高到低的不同频率模块,图4为我国建筑业碳排放原始数据及分解后的具体数据情况。最上方的图为建筑业碳排放的原始数列,最下方的图为分解后的残差res,剩余各数列皆为本征模函数imfj。

图4 CEEMD分解结果

根据图4可知,我国建筑业原始碳排放数据仍然存在明显的波动性和非线性。imf1和imf2存在较强的波动性且波动幅度较大,而imf3和残差项res波动则较为平缓且波动周期较长。分解后的imfj表现出原始数据中的波动情况,是数据不稳定的主要原因,res是数据的主要组成部分,与原数据中碳排放的发展趋势更相符合,也更加平滑稳定。

3.3 模型参数设置

将1995—2020年碳排放数据以4∶1的比例分成两组,选取前20年数据作为SSA-ELM的训练集,剩余6组数据作为检验模型预测能力的测试集。根据年末总人口数、GDP、城镇化率、建筑业总产值、房屋竣工面积、建筑业劳动生产率、建筑企业从业人数、建筑业一次能源消耗量8个建筑业碳排放评价指标,分别对每个imfj和残差项res建立ELM、SSA-ELM预测模型,并对碳排放源数据建立ELM和SSA-ELM预测模型,将拟合预测结果对比分析,以验证CEEMD-SSA-ELM建筑业碳排放预测模型的性能。为消除实验中其他外在条件的影响,各模型的实验数据均采取最大最小归一化进行标准化,激活函数选择Sigmoid函数。选取麻雀种群数为40,预警值设为0.7,发现者和侦察者比例均设置为0.15。由上述分析可知,本文建立模型的设置输入层节点为8,输出层节点为1,隐藏层节点根据经验公式进行计算,公式如下:

式中:M为隐层节点个数,m为输入节点个数,n为输出节点个数,a为0~10之间的任意常数。通过计算可知,隐层节点个数在3~13为宜,对每个所建立模型重复训练15次,保留预测结果并计算平均相对误差,选取平均相对误差最小的模型为最终预测模型。

3.4 预测结果对比及分析

按照上述步骤设置模型参数,输入预处理数据并模型训练,将输出数据逆归一化并对各模型预测结果进行分析,各模型预测结果对比见图5,相对误差图见图6。

图5 预测结果对比图

由图5可知,在测试及样本数据中,利用CEEMDSSA-ELM模型的拟合曲线进行建筑业二氧化碳排放预测的效果优于其他模型。SSA-ELM与CEEMD-ELM拟合度稍差,而单一的ELM模型在此次模型对比过程中,拟合效果最差,与真实值存在较大偏差。结合图6和表5的分析结果可知,CEEMD-SSA-ELM的预测相对误差均小于其他预测模型。通过对比各模型相对误差的平均值可知,ELM、CEEMD-ELM、SSA-ELM、CEEMDSSA-ELM的平均相对误差分别为:2.41%、1.85%、1.57%、1.16%,CEEMD-SSA-ELM的平均相对误差明显低于其他预测模型且该模型的最大相对误差为2.7%,再次证明该模型的预测精度最高。

表5 2015—2020年各模型相对误差对比

为进一步对比模型预测性能,选用3.2节的四个统计学指标进行评价,分析结果见表6。CEEMD-SSAELM的均方根误差比CEEMD-ELM、SSA-ELM及单一的ELM模型分别低了1 490.06吨、1 395.43吨、2 253.63吨二氧化碳排放量,且其决定系数为0.948,高于三个对照模型,另外本文所选MAE、MAPE指标远低于其他模型。分别对比CEEMD-ELM和ELM、CEEMDSSA-ELM和SSA-ELM可知,经过互补集合经验模态分解建立的模型大幅提高了预测精度,预测趋势更优,预测值与真实值的偏离更小。因此,CEEMD-ELM相较于单一的ELM和经过单一优化过的SSA-ELM和CEEMD-ELM预测模型预测精度更高,结果更稳定,模型泛化能力更强。

表6 模型性能评价指标对比

4 结论

建筑业作为我国碳减排的重点行业之一,其预测结果的精准对我国“3060”目标实现及节能减排有着重要意义。本文首先采取灰色关联分析验证与建筑业碳排放高度关联的因素,使用CEEMD将建筑业原数据分解为多个时间序列,使用SSA-ELM对每个序列进行分别建模,最后将所有分解序列进行集成汇总获得最终建筑业碳排放预测数据。本文的主要结论如下:

(1)采用SSA对ELM的权重及偏置进行优化,解决了ELM算法自身参数选择的强随机性问题,有效提高了模型的预测精度。相较于单一的ELM算法,SSAELM的RMSE降低了1 440.23吨,MAE降低了858.2吨,MAPE降低了0.833%,R2提高了0.087,说明SSAELM具有更好的全局寻优能力和泛化能力。

(2)将CEEMD引入到建筑业碳排放量预测领域,有效缓解了碳排放数据的波动性与非线性,大幅度提高了模型的拟合效果。通过CEEMD将建筑业碳排放源数据分解为3个更平稳的IMF和一个残差项,其中imf1和imf2反映了数据的波动特点,imf3和res则表示建筑业碳排放的长期趋势,分别对其建立SSA-ELM预测模型,成功验证该模型可以有效应用在碳排放预测领域。

(3)由于建筑业碳排放的影响因素众多,且间接碳排放占建筑业碳排放的绝大部分,后续研究可以进一步考虑更多影响因素,如建筑业上下游的行业发展状况、绿色清洁能源的使用或其他建筑业发展指标等。

猜你喜欢

建筑业预测节点
无可预测
CM节点控制在船舶上的应用
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
Analysis of the characteristics of electronic equipment usage distance for common users
动物“跨界”建筑业
甘肃建筑业将采用清洁能源降低碳排放
基于AutoCAD的门窗节点图快速构建
毕赛端 “从事建筑业,我乐在其中”
不必预测未来,只需把握现在