APP下载

基于部分线性面板数据模型的碳排放分析和预测研究

2023-03-14杨宜平

统计理论与实践 2023年1期
关键词:数据模型排放量面板

何 萍 杨宜平

(1.重庆工商大学数学与统计学院,重庆 400067;2.重庆工商大学经济社会应用统计重庆市重点实验室,重庆 400067)

一、引言

气候变化是人类面临的全球性问题。经济的快速发展依赖于能源的消耗,从而产生大量的二氧化碳。目前,中国是世界上碳排放量最大的国家之一。为了应对环境问题,承担大国在全球环境保护中的责任,中国提出力争2030年前碳排放达到峰值,努力争取2060年前实现碳中和的目标,这也是2020年中央经济工作会议确定的八项重大任务之一,对于加速中国经济和能源转型、推动经济高质量发展具有重要意义。

目前,国内外学者对碳排放的研究主要集中于对碳排放的影响因素研究及预测上。如邱立新和徐海涛(2018)[1]研究了工业结构、城市化水平、外贸程度及能源强度4个变量对碳排放影响的时空差异。黄明强和连宇新(2018)[2]运用灰色关联分析法研究了福建省经济增长水平、能源结构、产业结构、能源强度、贸易密度和城市化率与碳排放量的关系,并且通过情景预测探讨了福建省碳排放趋势。宋丽美和徐峰(2021)[3]基于乡村振兴背景,对农村人居环境的碳排放进行测算并研究了碳排放的影响因素。郑颖和逯非等(2020)[4]通过经济发展情况和二氧化碳排放特征,将我国城市分为四类,运用对数平均迪氏指数法对比分析了四类城市二氧化碳排放量的影响因素。韩楠和罗新宇(2022)[5]对京津冀碳达峰进行了预测。胡茂峰和郑义彬等(2022)[6]对湖北省交通运输碳达峰进行了预测。

本文选取10个对碳排放有影响的因素作为解释变量。考虑到解释变量数量较多,模型构建比较复杂,以及多个变量之间可能存在共线性问题,我们采用主成分分析法对变量进行降维处理。分析发现,不是所有获得的主成分都与碳排放量存在线性关系,因此考虑构建部分线性模型来进行后续研究。部分线性模型自Engle提出以来就得到了广泛应用,田凤平和周先波等(2014)[7]利用部分线性面板数据模型,研究了基于产出缺口和通货膨胀关系的菲利普斯曲线在我国的表现情况。朱晋伟和梅静娴(2015)[8]利用部分线性面板数据模型研究了高技术企业创新绩效的影响因素。Lv和Zhu(2014)[9]采用固定效应部分线性面板数据模型研究42个非洲国家医疗保健支出与GDP的关系,结果表明医疗保健在非洲是必需品。

目前对碳排放进行研究的模型主要有Kaya恒等式[10-11]、IPAT模型[12-13]、STIRPAT模型[14-15]、LMDI分解[16-17]等,而利用部分线性面板数据模型进行分析及预测碳排放的文献较少。因此,本文拟对碳排放及影响因素构建部分线性固定效应面板数据模型,采用稳健的指数平方损失估计方法来估计参数和非参数部分。

二、部分线性固定效应面板数据模型构建及估计方法

考虑如下部分线性固定效应面板数据模型:

其中,Yit是响应变量,Xit=(xit,1,xit,2,…,xit,p)T是p维协变量,β=(β1,β2,…,βp)是未知的参数向量,g(·)是未知光滑函数,Uit为一维协变量,αi为不可观测的不随时间变化的均值为0的个体固定效应,eit为均值为0的模型误差。

借鉴Zhu和You等(2014)[18]的方法,通过引入辅助线性回归来消除固定效应,因为αi是不随时间变化的个体效应,因此可认为:

于是,模型可写成:

记Yi=(Yi1,Yi2,…,YiT)T,Zi=(Zi1T,Zi2T,…,ZiTT)T,εi=(εi1,εi2,…,εiT)T,g(Ui)=(g(Ui1),g(Ui2),…,g(UiT))T。

于是模型可写为:

接着,利用B样条函数来近似非参数g(u)。定义B(u)=(B1(u),B2(u),…,BL(u))T是阶数为M的B样条基函数,其中L=K+M,K为内部节点数。令γ=(γ1,γ2,…,γL)T为未知样条系数向量,则有g(u)≈B(u)γ。此时模型可写为:

其中,B(Ui)=(B(Ui1),B(Ui2),…,B(UiT))T。

为了获得参数分量估计,引入投影矩阵Qi=IT-B(Ui)[BT(Ui)B(Ui)]-BT(Ui),IT是T×T维单位矩阵。显然QiB(Ui)=0,QiQiT=Qi,因此将Qi左乘模型,可得:

本文采用指数平方损失估计方法对参数分量和非参数分量进行估计。指数平方损失估计方法最早由Wang和Jiang等(2013)[19]提出,是一种稳健的估计方法。即当数据出现尖峰、厚尾、异常点等情形时,指数平方损失估计不会受到离群值的影响,所获得的估计是稳健的。

因此,基于模型,利用指数平方损失函数可得到参数θ的稳健估计:

基于θ,用同样的方法可得到估计值γ:

三、变量选取与数据说明

(一)碳排放量测算

为研究碳排放情况,首先需要测算各省(区、市)每年二氧化碳排放量。本文借鉴苏永娴和陈修治等(2013)[20]的方法测算各省(区、市)每年的碳排放量。计算公式如下:

其中,i表示某类能源,本文选取8类主要能源,包括:原油、煤炭、煤油、柴油、焦炭、天然气、燃料油、汽油;Ki表示以万吨标准煤计算的某类能源的碳排放系数;Ei表示以万吨标准煤计算的能源i的消耗量;44/12是气化系数。见表1。

表1 各类能源的碳排放系数

(二)变量选取

本文以碳排放量为被解释变量,选取各省(区、市)人口规模、城镇化率、GDP、产业结构、居民人均可支配收入、财政情况、绿色专利授权数、城市生活垃圾无害化处理率、造林总面积、对外开放程度作为影响碳排放的因素,即解释变量。其中,以发明专利和实用新型专利授权量衡量绿色专利授权数,以第二产业增加值占GDP的比重衡量产业结构,以财政收入占GDP的比重衡量财政情况,以进出口总值占GDP的比重衡量对外开放程度。

表2 变量的描述性统计

(三)数据来源

本文选取除港澳台、西藏以外的30个省(区、市)作为研究对象,研究时间为2014—2019年。用于测算碳排放量的能源消费数据来自2014—2019年的《中国能源统计年鉴》《中国统计年鉴》;人口规模、城镇化率、GDP、第二产业增加值占GDP的比重、居民人均可支配收入、城市生活垃圾无害化处理率、造林总面积、发明专利和实用新型专利授权量、进出口总值占GDP的比重取自《中国统计年鉴》和各省(区、市)统计年鉴;财政收入占GDP的比重来源于财政部和国家税务总局,由EPSDATA整理而得。

四、主成分分析

对于选取的10个解释变量,利用R软件进行主成分分析,由分析结果可以算出,前三个主成分的累计贡献率达83.58%,已经包含了数据的大部分信息,因此可选择前三个主成分进行分析。由特征向量矩阵可知三个主成分的表达式为:

对上述三个主成分进行多元线性回归,模型如下:

从表3可以看出,在5%的置信水平上,第一主成分和第二主成分对碳排放量的影响显著,说明第一主成分和第二主成分与碳排放量存在显著线性关系,而第三主成分在10%的置信水平上不能通过检验,说明第三主成分与碳排放量之间不存在显著的线性关系。因此可猜测第一主成分和第二主成分对碳排放量为线性影响,第三主成分对碳排放量为非线性影响。

表3 多元线性回归结果

五、建模分析

基于上述分析,可以把第一主成分和第二主成分作为线性部分的协变量,将第三主成分作为非线性部分的协变量,构建部分线性固定效应面板数据模型对碳排放进行分析,具体模型如下:

其中,Yit表示某省(区、市)某年的碳排放量,β1、β2表示系数,P1it表示第一主成分,P2it表示第二主成分,P3it表示第三主成分,g(·)表示未知的非参数函数,αi为个体固定效应,eit为模型误差。

我们采用部分线性固定效应面板数据模型的指数平方损失估计方法来估计系数β1、β2和非参数函数g(·),可得到β1、β2的估计值分别为0.0823、-0.0815,以及非参数分量的估计,由此可得到拟合方程为:

将利用指数平方损失估计方法得到的拟合方程应用到2019年的数据中,可得到2019年碳排放量的预测值。通过部分线性固定效应面板数据模型得到的30个省(区、市)的平均预测误差为4.77%,其中5个地区的预测误差处于5%—10%之间,只有3个地区的预测误差在10%—15%之间。一般预测误差在10%以内均属于优秀预测,由此可认为本文所采用的模型和估计方法对碳排放的预测是较好的。同时我们利用线性回归模型对2019年的碳排放量进行预测,得到的30个省(区、市)的预测平均误差为37.22%,所有省(区、市)的预测误差均超过30%。因此,与线性回归模型相比,部分线性模型在碳排放量的分析与预测上是非常有效的。

六、结论

气候问题是全球关注的热点问题,而二氧化碳的排放是导致气候问题日趋严重的主要原因,因此对碳排放量的分析与预测是非常有必要的。本文对中国除港澳台、西藏外的30个省(区、市)的碳排放量进行分析预测,首先应用主成分分析方法降维,再构建部分线性固定效应面板数据模型,采用指数平方损失估计方法对模型进行估计,研究证明:部分线性固定效应面板数据模型的指数平方损失估计方法预测效果要优于线性回归模型。我们认为,主要原因在于部分线性模型既含参数分量,又含非参数分量,比参数模型更具有解释性和灵活性;同时指数平方损失估计方法能够很好地解决当数据存在异常值时估计不稳健的问题,从而获得稳健的估计。◆

猜你喜欢

数据模型排放量面板
面板灯设计开发与应用
天然气输配系统甲烷排放量化方法
黑龙江省碳排放量影响因素研究
MasterCAM在面板类零件造型及加工中的应用
面板数据模型截面相关检验方法综述
Photoshop CC图库面板的正确打开方法
全国机动车污染物排放量
——《2013年中国机动车污染防治年报》(第Ⅱ部分)
江苏省火力发电机组二氧化碳排放量估算
基于分位数回归的电力负荷特性预测面板数据模型
高世代TFT-LCD面板生产线的产能评估