APP下载

一种天然气需求量预测新模型及其应用
——以川渝地区为例

2021-05-11李洪兵张吉军

天然气工业 2021年4期
关键词:城镇化率需求量关联度

李洪兵 张吉军

西南石油大学经济管理学院

0 引言

由于经济发展、城镇化建设、环保政策等因素的需要,天然气作为优质高效的绿色清洁能源,将为后疫情时代中国经济“绿色复苏”、实现碳达峰、迈向碳中和作出重要贡献。《能源生产和消费革命战略(2016—2030)》提出实施天然气推广利用重大战略行动[1],加快天然气替代散煤步伐、大力发展天然气分布式能源。《加快推进天然气利用的意见(2017)》强调将天然气培育成为我国现代清洁能源体系的主体能源[2]。天然气消费量显著增长,2019年四川、重庆地区的天然气消费量占各自能源总量的比重分别为17.0%和15.3%,在全国处于领先水平,但仍低于世界平均水平(24%),未来川渝地区天然气市场仍具有较大增长空间。

深入分析并准确预测天然气需求量,不仅是相关部门制订清洁低碳、安全高效现代化能源体系发展政策的基础,也是建立天然气供需预测预警机制的内在需求。但天然气需求量受诸多因素的制约,由于因素的动态随机不确定性,因素之间相互影响的程度难以确定,准确预测存在较大难度。笔者采用灰色相对关联度挖掘影响天然气需求量的重要因素,基于逐步回归法构建了预测精度高的双对数需求函数模型,并对川渝地区天然气需求量进行了预测。

1 相关研究现状

天然气需求量预测结果受诸多因素的影响,这些因素大多数具有显著的动态随机不确定性特征,部分因素之间还存在某种线性或非线性关系,传统简单的预测模型不能满足其预测精度的要求[3]。不同的预测方法从不同角度揭示了预测对象的演变规律,选用合适的数学模型是提高天然气需求量预测精度的关键。近年来天然气需求量预测模型呈多元化发展态势,并得到了较好的实践和发展[4]。例如,从天然气需求量影响因素方面,王建良等[5]采用邓氏灰色关联度从GDP、人口、产业结构、城镇化率等因素中选择3个核心因素,建立灰色GM(1,3)模型,对我国东中西部区域的天然气消费需求量进行预测;卢全莹等[6]筛选出GDP、城镇化率、人口3个核心因素,构建了基于神经网络的预测模型;Szoplik[7]构建神经网络模型预测天然气需求量的演变趋势;柴建等[8]也认为可采用人口、GDP、城镇化率、产业结构等因素作为预测天然气需求量的解释变量,并建立了BMA模型、RBF分位数回归模型[9]预测未来天然气需求量;Zhang等[10]将国内生产总值、人口、消费水平等因素作为解释变量,采用贝叶斯模型平均法预测天然气消费量;Shahbaz等[11]构建了多元框架模型,研究经济增长对巴基斯坦天然气需求量的影响。另外,马小艳[12]、李洪兵等[13]利用线性回归模型分别对重庆市天然气和湖北省城市天然气需求量进行预测,Zhu等[14]也利用回归模型对全国天然气需求量进行了预测分析。通过对上述文献的研究结果发现,天然气需求量驱动因素出现频次较高的有国内生产总值、产业结构、人口发展、城镇化率、消费水平5个影响因素。预测模型中灰色预测方法适用于范围较广的短期预测,但预测精度有所下降[9];神经网络模型的预测精度虽然较高,但容易出现过度学习且易陷入局部最小,从而降低泛化性[3];线性回归模型建模迅速、简单方便,但难以刻画复杂的非线性数据演变趋势,且精度不够理想。

基于上述分析,在天然气需求量预测中,选择的诸因素不可能同时都能通过统计显著性检验,并且若将较多的自变量同时选入同一预测模型,将不可避免地导致不同程度的多重共线性问题。为此,笔者利用灰色相对关联度刻画两两变量之间的关联程度,剔除存在多重共线性关系的自变量,挖掘不同地区天然气需求量的重要影响因素。天然气需求量预测数学模型选择应用较广泛的双对数需求函数模型[15-17],该数学模型能避免预测过程中异方差与异常值的问题[16],降低复杂非线性数据的预测误差,预测精度较高且拟合参数具有明确的经济含义。采用逐步回归法逐一精细分析各影响因素对天然气需求量的统计显著性,剔除未通过显著性检验的因素,并采用最小二乘法估计待定参数,构建以“最少”解释变量解释最多天然气需求量变异量的“最佳”逐步回归分析双对数需求函数模型,并利用该模型对川渝地区天然气中长期需求量进行了预测。

2 相关方法和原理

2.1 灰色相对关联度

灰色相对关联度是灰色关联分析的一种重要方法,其基本思想是根据数据序列之间几何曲线发展变化趋势的紧密程度来判断数据序列的关联程度[18],克服了传统数理统计方法要求样本数据众多且必须具备某种概率分布特点的不足,也弥补了定性分析与量化分析结果相互矛盾的缺陷。两两数据序列几何曲线变化速率越接近,关联度就越大,反之越小。采用灰色相对关联度挖掘对天然气需求量影响较重要的有效驱动因素。计算步骤如下:

2)为使不同量纲影响因素的指标能进行有效的比较和计算,采用初值像处理数据序列Xi,将其转化为无量纲的数据序列,即

利用灰色相对关联度rij,将各影响因素对天然气需求量的影响程度进行量化,相对关联度较大,则表明对天然气需求量的影响程度较大,对预测天然气需求量就越重要。rij除了能够刻画影响因素对天然气需求量的影响程度大小以外,还可用于分析、处理天然气需求量预测中影响因素之间的多重共线性问题,主要通过比较影响因素之间rij的大小进行诊断。如果影响因素之间的rij大于预先设定的阈值,表明该组影响因素存在多重共线性问题,此时可将与天然气需求量关联程度较低的影响因素剔除。从而进一步精简影响因素,为多因素预测模型的准确预测提供基础保障。

2.2 多项式回归模型

多项式回归模型是解释变量之间相关关系的连续函数,且任意一个函数均可在一个较小范围内用多项式逼近,其拟合精度较高,因而在较复杂的实际问题中得到了广泛应用[19-21]。影响天然气需求量的解释变量具有时间序列特征,拟采用具有特殊性质回归式抛物线的一元三次多项式回归函数,对天然气需求量的各解释变量指标进行预估。模型的一般形式为:

2.3 逐步回归分析双对数需求函数模型

将逐步回归分析法引入具有需求弹性含义且常用于经济学分析的双对数需求函数模型,建立逐步回归分析双对数需求函数模型,运用该模型预测天然气需求量,其一般形式为:

式中Qk表示天然气在第k期的需求量;Xik表示第i个影响因素在第k期的数值,Xi表示GDP、人口发展、产业结构、城镇化率、消费水平等影响因素;β0表示函数截距,为常数项;βi表示第i个影响因素的偏回归系数,其具有需求弹性系数相同的内涵;u表示函数的随机误差项,一般情况下假定随机误差项平均值。

利用最小二乘法对式(6)中的各个参数进行确定。最小二乘估计量要满足最小方差性,故残差平方和应达到最小,则

逐步回归分析是将解释变量由相对关联度最高者逐次一一选入双对数需求函数模型,每选入一个解释变量都将进行统计显著性检验,若原来选入的解释变量因后选入的解释变量变得不显著时,则将后选入的解释变量剔除,以确保双对数需求函数模型中只包含相对关联度较高的显著性解释变量。最后得到一个以最少解释变量解释最多被解释变量变异量的最佳需求函数预测模型。

逐步回归分析建模的一般步骤为:①计算天然气需求量与各个影响因素之间的相对关联度,以及两两影响因素之间的相对关联度,根据相对关联度大小进行排序,同时剔除具有多重共线性问题的影响因素。②将相对关联度最大者选入双对数需求函数进行建模,计算偏回归系数,并进行统计显著性检验。如果统计显著性通过检验,则选入模型,否则剔除模型。③将剩余未选入的影响因素中相对关联度较高者选入上述模型,进行偏回归系数计算,同时进行统计显著性检验。如果通过检验,则选入模型,否则将该解释变量剔除。④重复步骤③,直到全部选入模型的影响因素均通过显著性检验且无可选入的影响因素为止,此时所建模型包含了与天然气需求量关联程度较高又具有统计显著性的所有影响因素,此时,称该模型为“最佳”双对数需求函数模型。

3 天然气需求量预测模型构建及预测分析

3.1 样本数据的选取及收集

经综合分析历史文献资料,笔者选取天然气需求量预测中出现频次较高的地区生产总值、产业结构、人口发展、城镇化率、消费水平等外生变量作为天然气需求量的影响因素。将地区生产总值设为解释变量X1,产业结构以使用能源较多的第二产业占比为解释变量X2,人口发展采用地区年末总常住人口为解释变量X3,城镇化率以城镇化率为解释变量X4,消费水平以社会消费品零售总额为解释变量X5。

2000—2019年川渝地区天然气需求量及其影响因素的各项指标数据来源于国家统计局、四川省统计年鉴、四川省统计公报、重庆市统计年鉴、重庆市统计公报的公布数据并经整理所得,将天然气需求量设为被解释变量Q。天然气影响因素指标及其需求量数据如表1所示。

3.2 构建逐步回归双对数需求函数模型

利用灰色相对关联度模型计算川渝地区天然气需求量与各影响因素以及两两因素之间的相对关联度,结果分别如表2、3所示。相对关联度越大,表明该影响因素对天然气需求量的影响程度越高,反之越小。影响因素之间的相对关联度较大表明因素之间存在线性关系,设定两两因素之间的灰色相对关联度大于0.9时,判定该两因素之间存在多重共线性,可剔除与天然气需求量关联度较小的影响因素。

由表2、3可知,四川地区与天然气需求量关联度由高到低的影响因素依次为城镇化率、GDP、消费水平、产业结构、人口发展;而重庆地区则依次为城镇化率、GDP、产业结构、消费水平、人口发展。若关联度大于0.9,则判定为存在多重共线性,由表2、3发现四川省与重庆市的地区生产总值(X1)与消费水平(X5)的相对关联度分比为0.964 7与0.957 7均大于0.9,而X1与天然气需求量(Q)的关联度大于X5与Q的关联度,故剔除关联度较小的影响因素X5,初步确定地区生产总值(X1)、产业结构(X2)、人口发展(X3)、城镇化率(X4)为影响天然气需求量的解释变量。

将表1中2000—2019年天然气需求量与各影响因素的数据进行对数处理后,根据表2、3中关联度,由大到小逐次将初步确定的影响因素选入双对数需求函数模型,并进行统计显著性检验。本文研究采用IBM SPSS Statistics 26软件执行逐步回归分析,以是否达到5%的显著性水平为标准,经反复迭代计算分析,逐次剔除不显著的影响因素,筛选出相对重要的影响因素,结果列于表4。

表1 天然气需求量及其影响因素指标数据表

由表2可知,城镇化率(X4)与四川地区天然气需求量的相对关联度最高,首先被选入模型中,构建成为模型A,统计显著性检验结果如表4所示。此时,模型A外尚有3个预测解释变量,各自变量与因变量的相对关联度以地区生产总值(X1)的0.689 5为最高,因此是第二个被选入的影响因素。在模型A的基础上选入变量X1,进行统计显著性检验,结果显示修正的R2=0.961,地区生产总值的t值为0.734、P值为0.473,均未通过显著性检验,故剔除影响因素X1。余下的两个因素中产业结构(X2)的关联度较高,被选入模型A,结果显示X2的t值为1.561、P值为0.137,未通过检验,不能纳入模型A。最后将人口发展(X3)纳入模型进行显著性检验,分析表明X3的t值为-1.876、P值为0.078,未达到P=0.05的显著性水平,不能选入预测模型,由于模型外无符合条件的影响因素,故选择变量程序终止,此时,利用该最佳预测模型A对四川地区的天然气需求量进行预测,预测的拟合值及误差结果如表5所示。

表2 四川地区各变量之间的灰色相对关联度表

表3 重庆地区各变量之间的灰色相对关联度表

表4 逐步回归分析所得到的模型中与排除系数估计值表

表5 川渝地区天然气需求量拟合值及误差结果表

2010年是四川地区“十一五”规划的收官之年,为实现“气化”全川的能源战略目标,导致天然气需求量呈“断崖式上涨”的异常情况,但模型A仍可解释被解释变量变异程度的96.4%,其MAPE=5.1%<10.0%,这表明模型A的预测精度为“优”,对后续预测具有较强说服力[5]。模型A的预测结果优于多元回归预测模型(MAPE=5.3%)、灰色预测模型(MAPE=7.6%)、非线性预测模型(MAPE=6.8%)等预测模型的结果,表明该模型的预测精度高于其他模型。

由表3可知,在重庆地区天然气预测模型中,首先被选入模型的仍是关联度最高的城镇化率,构建的模型为模型B。在未选入模型B的解释变量中,相对关联度较高的是地区生产总值(X1),选入模型B后,城镇化率(X4)与地区生产总值(X1)均通过了显著性检验(表4),此时构建具有X4和X1两个解释变量的模型C。根据关联度最大原则,继续依次将剩余解释变量产业结构(X2)、人口发展(X3)选入模型C,检验结果均未达到P=0.05的显著性水平(X2:t=0.209、P=0.837;X3:t=-0.195、P=0.848),故终止选择变量程序,此时,利用建立的最佳预测模型C对重庆地区的天然气需求量进行预测,其预测的拟合值及误差结果如表5所示。重庆地区受环保政策和产业结构优化调整的影响,天然气需求量在2000年出现“爆炸式增长”异常现象,但模型C仍将被解释变量变异量的解释能力由模型B的93.7%提高到98.6%,模型C的MAPE=4.2%<10.0%,表明该模型的预测精度为“优”,对后续预测具有很强的说服力[5]。模型C的预测结果优于多元回归预测模型(MAPE=5.2%)、灰色预测模型(MAPE=5.4%)、非线性预测模型(MAPE=6.1%)等模型的预测结果,模型C的预测精度高于其他模型。

分析川渝地区天然气消费结构可知,城市燃气处于天然气消费主力地位,占比达约45%,工业原料与工业燃料占比相当约为21%,其他消费占比约为13%,整体来说,消费结构比较合理。

对于四川地区,由表2可知,城镇化率是影响天然气需求量的最主要因素,近年来四川地区城镇化率逐年攀升,2019年达53.8%,但相较于发达地区,如北京市城镇化率86.6%的水平还有较大差距。该区天然气需求量较大一部分来源于城市燃气:①城市常住人口的增长直接导致居民生活、公共建筑、采暖空调、城市交通、城市基础设施建设等用气量大幅度提高;②城镇化建设带动了区域经济发展、推动产业转型升级,促使天然气相关工业发展,间接拉动了天然气需求量的增长,故城镇化率的变化是影响四川地区天然气需求量的重要因素。

对于重庆地区,影响天然气需求量的最主要因素与四川地区保持一致,皆为城镇化率。但与四川地区不同的是,四川城镇化率提升空间较大,对天然气需求量的影响后劲强劲,而城镇化率在影响重庆地区天然气需求量方面逐渐乏力,2019年重庆城镇化率超过全国60.6%的水平,达到66.8%,城镇化率仍将增长但后劲相对减弱。经济发展也是驱动能源消费的重要因素,重庆地区经济增速优势明显,由此带动的天然气需求量也非常庞大。

综上所述,城镇化率是影响川渝地区天然气需求量的最主要影响因素,构建的逐步回归双对数需求函数新模型对天然气需求量的预测效果好,预测精度和可信度高,可作为预测未来川渝及其他地区天然气需求量的预测模型。预测结果可作为相关部门及天然气企业制订储气计划、合理调度调峰调压、制订购气计划、科学施策和保障重要领域用气供应安全的参考数据,可作为政府相关部门科学制订天然气供需协调机制的理论依据。

3.3 未来川渝地区天然气需求量预测分析

采用逐步回归双对数需求函数模型预测2020—2030年川渝地区天然气需求量,需要在相关解释变量已知的情况下进行预测。2020年受新冠肺炎疫情影响,四川精准扩大有效投资、稳定外贸、提振消费,推动经济健康稳定发展;重庆市GDP同比增长将由2019年的6.3%预估降至5.0%左右[22]。采用预测性能较好的多项式回归模型分别对2020—2030年四川、重庆地区的生产总值与城镇化率指标进行预测,结果如表6所示。以构建的“最佳”预测模型A和C分别对四川、重庆地区天然气需求量进行预测,结果如图1所示。

图1 2020—2030年川渝地区天然气需求量预测图

表6 川渝地区天然气需求量影响指标预测结果表

随着我国能源清洁低碳高质量发展战略和环保政策的严格实施,在未来10年实现碳排放达到峰值,再经过30年力争实现碳中和的绿色低碳转型期,将有效拉动川渝地区天然气消费需求刚性稳健地持续增长。由图1可知,2020—2030年川渝地区的天然气需求量均呈上升趋势,但两个地区的天然气需求量增长率因其城镇化进程、经济发展等情况的不同而呈现一定差异,四川地区的平均增长率最高,重庆地区次之。2020年受疫情影响天然气市场需求疲软[23],四川地区天然气需求量增长率降至4.6%,重庆地区降至2.0%左右,2021年重庆地区天然气需求量增长率出现“报复性增长”,之后川渝地区增长率均呈下降趋势,表明川渝地区天然气需求量增速均有所减缓。到2030年四川和重庆的年天然气需求量将分别约为321×108m3和137×108m3,增长率将分别降至1.7%和1.1%,届时川渝地区天然气需求总量也将约为458×108m3。

4 结论

1)影响天然气需求量的因素繁多,某些因素不满足统计量检验或因素之间存在多重共线性。合理选择处理方法有利于挖掘重要影响因素,剔除不符合要求的因素,提高天然气需求量预测模型的可靠性和精度。

2)城镇化率是影响川渝地区天然气需求量的最重要因素,加快推进四川地区城镇化建设进程,是拓展四川天然气市场需求空间的有效手段;科学规划重庆地区城镇化发展,重点调整经济发展与能源消费之间的关系,是保障重庆天然气产业健康持续发展的有效措施。

3)选择预测天然气需求量的方法很多,本文构建的逐步回归双对数需求函数模型优于传统的算法且预测结果精度高,可作为其他地区构建类似的天然气中长期需求预测模型的参考。

4)未来10年川渝地区天然气需求量仍呈增长趋势,但受城镇化建设、经济发展等外部环境的影响,增长率逐年降低,到2030年川渝地区天然气需求总量增长率约为1.6%,需求量约458×108m3,天然气市场将由高速发展逐步转向高质量发展,应加快推进天然气生产和消费革命、建立健全协调稳定发展机制,以保障川渝地区天然气工业健康持续发展。

5)在经济由高速发展降速转为高质量发展新时期,调整优化能源结构,持续提高天然气消费占比是实现碳排放达峰与碳中和目标的最佳路径。新时期天然气消费将呈现“淡季不淡、旺季更旺”的新常态,需求量将持续攀升。

猜你喜欢

城镇化率需求量关联度
31 省份最新城镇化率:9 省份超70%,这10 个省份城镇人口最多
从数学角度看“弹性”
基于灰色关联度的水质评价分析
安徽省生态足迹与城镇化率关系实证研究
基于灰关联度的锂电池组SOH评价方法研究
2017年我国汽车软管需求量将达6.4亿m
基于BP神经网络人均猪肉需求量预测
基于灰色关联度的公交线网模糊评价
2013年日本国内纸与纸板市场需求量预计减少1.5%
广义区间灰数关联度模型