“新常态”下的中国天然气消费分析及预测

2019-07-10王亚茹KINKeunglai

运筹与管理 2019年6期

柴建，王亚茹* ， KIN Keung-lai

(1.西安电子科技大学经济与管理学院，陕西西安 710126; 2.陕西师范大学国际商学院，陕西西安 710062； 3.香港城市大学管理科学系，香港 999097)

0 引言

当前，化石能源的过度使用加速了温室效应等气候变化，《哥本哈根协议》之后，节能减排、走低碳经济之路成为各国应对气候变化的共识。中国承诺到2020年单位GDP二氧化碳排放比2005年下降40%～45%，实现减排目标的有效措施是增加可再生能源和天然气在一次能源消费者的占比。

相对于天然气而言，可再生能源由于其特有的资源和环境优势，逐步成为众多国家能源发展的战略选择[1]。近几年内，中国的可再生能源在能源结构中的比重不断上升，从“十一五”初的6.5%提高到了2015年的11.8%。可再生能源对天然气消费产生一定的替代效应从而抑制天然气需求量的增加。另一方面，中国天然气在一次能源中的比率经过几年的努力从2.7%提高到4%左右，在2015年天然气门站价下调以后，2016年中国天然气消费量显著增长，随着天然气行业市场化进程的推进，国内气价仍有下调空间，这将刺激未来天然气需求量增加。综上所述，未来中国天然气消费量变化情况难以确定。因此，对中国天然气未来的消费量进行准确的预测是十分必要的。与此同时，随着国家经济发展进入新常态，影响天然气消费的不确定性因素也在增加。但以前与天然气消费预测相关的文献考虑的影响因素较少，难以准确的分析与预测未来的天然气消费情况。因此，从全方位多角度考虑天然气消费影响因素，研究未来天然气消费情况具有十分重要的现实意义[2]。

1 文献综述

天然气需求量预测作为能源领域的重要研究内容，引起了学术界的广泛关注。就相关的问题，本文从多个角度与层次对天然气消费问题进行分析。主要的研究集中在以下两方面：

(1)天然气消费影响因素:影响能源消费的主要有经济增长，人口状况，经济结构，能源价格等因素。Shahbaz等[3]通过建立了一个包含有投资、就业人数、出口影响因素在内的多元框架模型，探讨了巴基斯坦天然气消费与经济增长的关系。结果表明经济的增长促进天然气消费量的增加。Özge Dilaver等[4]利用1978～2011年OECD欧洲年度数据建立了结构时间序列模型，分析得到天然气消费量的收入与价格弹性分别是1.19和-0.16。可以看出收入是天然气消费量的促进型因素而价格则是抑制型因素。Wang等[5]将协整检验和误差修正模型应用于分析居民、商业、工业三个不同行业的天然气消费量与价格之间的关系，结果发现在长期看来，居民的天然气消费量的价格弹性大于其他行业。综合分析相关文献，影响天然气消费的因素主要有经济发展水平、国家人口状况、产业结构、天然气价格水平、能源结构等。

(2)预测方法：Rodger等[6]和Szoplik[7]利用天然气消费量的数据建立了人工神经网络模型，从而分析与预测天然气消费量的季节性趋势。最终结果显示，人工神经网络模型的结果令人满意。Yu等[8]通过广泛的分析比较BP神经网络和遗传算法的几种组合，他们发现附加动量因子改进模型，为短期燃气负荷预测提供了较为理想的解决方案。Bianco等[9]利用意大利1990～2011年GDP、天然气价格、温度与非住宅天然气消费量的数据建立了回归方程，预测到2030年意大利的非住宅天然气消费量将达到320～430亿立方米。Bianco等[10]利用1990～2012年意大利的人口、国内生产总值(GDP)、供暖天数、住宅部门的天然气消费量和价格建立了多元线性模型对意大利住宅天然气消费量进行预测。预测到2030年天然气的消费量较1990年的消费量翻一番。卢全莹等[11]首先利用通径分析筛选出天然气消费的核心影响因素，发现人口和城镇化率是天然气消费的主要推动因素，GDP是天然气消费的主要限制因素。然后，运用智能算法RBF神经网络分位数回归模型对我国天然气消费进行分析和预测，结果表明“十二五”末，中国天然气消费量将近178 532.1百万立方米，2020年中国天然气消费量将近261 853.0百万立方米。Zeng等[12]利用2002～2014年的数据构建了自适应智能灰色预测模型(SIGM)，结果显示模型模拟效果良好，预测结果显示2015～2020年天然气消费量急速增加。Wang等[13]分别利用多循环Hubbert模型和GM(1，1)模型对中国天然气产量和消费量进行预测，实证结果表明，未来的供需缺口将越来越大。在影响因素选择方面，文献中的预测模型考虑的因素个数较少，预测结果难以准确；其次，由于单个模型自身的适用性和限制性，预测目标所处环境及趋势发展的不确定性，使得仅仅使用单一模型进行预测分析的风险加大。

关于组合预测模型，Bates等[14]在研究航空旅客数据时，最早提出了使用模型组合的方法进行预测分析，结果表明组合预测模型方法优于任何单一模型。该文引发了二十世纪七十年代大量关于模型组合理论的研究及应用。Xu等[15]利用2009～2015年中国天然气消费量的数据，将二阶多项式曲线模型与移动平均模型相结合建立了PCMACP模型，对中国天然气消费量进行预测分析，最终模型所得的平均误差为3.82%，明显低于二阶多项式曲线模型与移动平均模型的平均误差。柴建等[16]在模型选择的基础上，基于单变量( ETS、ARIMA 模型) 和多变量( 情景分析) 两个维度，在给予三个模型同等权重的基础之上建立了组合模型，进行电力需求量分析及预测。Xu等[15]所建立的组合模型，相对于单一模型而言，虽然在精度上有所提高，但是该组合模型只是考虑了两个单一模型，且其考虑的影响天然气消费的因素较少，因此其预测精度难以达到准确。BMA方法则使用模型后验概率加权平均备选模型，其理论依据较强。陈伟、牛霖琳[17]均在中国宏观经济预测中使用了贝叶斯模型平均法(BMA)，预测结果表明BMA预测精度高于其他单一模型。

在总结前人研究的基础上，本文通过分析经济发展水平、产业结构、人口状况、能源结构、天然气产业的投资、能源加工转换效率等情况，提取了12个变量作为影响天然气消费的解释变量，并抽选出相关文献中常用的6个变量用以构建基准BMA模型，基于此，逐次增加其他相关变量建立一个BMA模型集合，对比分析后从中选取预测精度最高的模型对未来中国天然气消费量进行预测，这也是本文的创新之处。以往文章或者只建立单一模型进行因素分析；或者考虑到的影响因素太少，并不能全面的整合影响天然气消费的因素；或者预测模型中选取的影响因素只是凭借经验之谈，缺乏必要的实证分析。

2 模型描述

现代各种预测模型多是对已知数据的分析，通过找到已知数据的内在规律与相互依赖关系，从而获得对未知数据预测能力。这通常是在样本数据足够多的情况下，在样本数据比较少的情况下，预测效果往往不甚理想。例如，在样本数少于变量数的情况下，采用常规回归方法分析各个解释变量对因变量的作用时，得到的系数通常不稳定，其预测结果不可靠，此时需采用分阶段分批逐步回归的筛选方法，调整样本数与变量数间的对比关系，弥补样本数不足的情况，从而获得较为理想结果。

在商业、工程、军事等各个领域中小样本数据是广泛存在的，由于可获得的样本量较少，所以通过仅有的小样本数据获得新信息的难度也比较大。因此利用小样本数据进行预测时，即在信息量有限情况下，需要适当的调整建模方法和利用高效的算法对潜在信息进行挖掘，从而找出信息间的规律性，再利用此规律对未知数据信息进行有效地预测。在已知的预测模型中，贝叶斯法通过把所求参数看成随机变量，求得的后验分布为参数的概率分布区间，再利用先验分布，用小样本数据得到概率估计值，该类模型的优势是通过充分利用各类先验信息，从而可以降低对样本容量的依赖程度，使得在相同评估精度要求条件下，需要利用的样本容量可以相对减少。

与此同时，比起仅使用单一模型，贝叶斯模型平均法作为一种基于贝叶斯理论的将模型本身的不确定性考虑在内的统计分析方法，其涵盖的信息更加丰富，能更好地模拟现实经济体，因而用于预测时能够提供更加贴近现实的预测值。自1978年 Leamer提出贝叶斯模型平均法的框架之后，除了在数学统计方面的应用[18～20]，BMA也经济学上得到广泛的应用，如产量增长预测，汇率预测，股票收益的预测和预测通货膨胀等[21～23]。

设y为综合预测值，D为可获得的已知数据，M1,M2,…,MR代表所有可能的模型，而哪一个模型是最佳模型事先并不知道，即模型本身存在着不确定性。

根据贝叶斯模型平均法的理论，综合预测值y的后验分布为：

(1)

其中，p(Mi/D)为在给定数据D的条件下模型Mi的后验分布，其形式为：

(2)

(3)

解释变量与天然气消费量之间的关系并不一定是线性模型，在这里本文将变量的值进行了对数化处理，所构建的线性模型已经体现了指数及幂函数的非线性关系。因此先假设单一模型为对原始数据进行对数化处理后的线性模型，其设定如下表示：

(4)

其中，y=(y1,y2,…,yt)是天然气消费量，xi为解释变量，β=(β1,β2,…,βp)是参数向量。

有上述公式可知，BMA模型进行建模分析数据的过程中，最重要的是计算出所有备选模型的后验概率，即各个备选模型的权重。本文是通过利用贝叶斯信息准则(BIC)来估计所有备选模型的后验概率[24]。L(D/Mi,θi)是样本数据D在模Mi的极大似然。如果是k模型中的参数个数，那么模型Mi上的BIC定义为：

(5)

式中，τ表示惩罚因子，L(D/Mi,θi)表示在给定模型Mi下样本数据D的似然函数，且L(D/Mi,θi)为：

(6)

(7)

最后进行预测精度的评价，本文使用RMSE(均方根误差)来评价模型的预测精度。

(8)

3 模型应用

3.1 数据描述

本文数据来自Wind数据库，在解释变量选择方面，遵循如下两个原则：其一，所选择的变量均是近年来中国天然气消费分析的实证研究领域中经常出现的；其二，所选择解释变量的观测数据具有较好的获得性。由以上原则，本文选取了12个影响因素作为影响天然气消费量的解释变量。因素主要包含经济发展水平、产业组成结构、替代品的市场占有率、天然气产业的投资等，因此本文搜集了以下因素的2003～2016年度数据：(1)由于大部分天然气在工业领域使用，且第二产业占国内生产总值的比重较大，因此GDP中工业占比(%)是影响天然气消费的重要因素；(2)经济的发展影响了中国的能源消费量，因此收集了GDP(亿元)的数据；(3)能源具有不可再生性，因此其未来消费量的预测应考虑该种天然气的中国年产量(十亿立方米)、天然气对外依存度(%)；(4)煤炭、石油、可再生能源作为天然气的替代品，其市场份额的占有率也是影响天然气消费的主要因素，其次在低碳政策要求下，可再生能源是最具有影响力的，因此将煤炭、石油、可再生能源(核电、风电、水电)占能源消费总量比重(%)纳入模型进行分析；(5)天然气管道基础设施建设能够促进居民生活天然气消费量的增加，用气人口增加，单位长度的管道服务的人口随之增加，能够促进居民生活天然气消费量的增加，天然气管道基础设施的建设大力促进了天然气的消费[24]。因此将分析天然气管道长度与反映城市结构变化的城镇化率(城镇人口占总人口比率表示)(%)，又由于天然气生活消费主要是以户为单位进行消费的，因此年底总户数(户)也是影响天然气消费量主要因素之一。(6)技术进步提高能源利用效率而从而节约能源[25]，能源加工转换率的增加能够提高天然气利用效率从而限制天然气需求。因此预测模型中应该考虑能源加工转换效率的影响。(7)天然气价格对天然气消费有负效应，因此预测模型中理应纳入价格因素，由于天然气出厂价格之后的加成成本由政府行政控制，所以，出厂价格大致能反映天然气的价格水平，该价格指数(燃气生产和供应业出厂价格指数)上升将抑制天然气的需求。具体情况如表1所示。

根据数据的可得性，选取2003年到2016年数据为基础数据，利用80/20法则，从这些数据中提取2003年到2013年数据子集建立BMA模型，2014年到2016年的数据验证模型，然后滚动预测2017年到2022年的天然气消费量。

表1 天然气消费量的影响因素

注释：0表示原始数据，1表示对数化处理，即ln(xi)。

3.2 模型设定

通过阅读大量文献发现，GDP、产业结构、能源结构、城镇化率是预测天然气消费量模型中出现频率较高的影响因素[26～32]，除此之外天然气价格、对外依存度、天然气产量、天然气管道长度、能源转换效率、普查人口(总户数)也是影响天然气消费量的因素[33～37]，但是这些因素在中国天然气消费量预测模型中出现的概率较低或者从未被当作解释变量纳入预测模型之中。因此本文首先构建了包含6个常用影响因素的基准模型，其次通过逐次添加利用频率较低的因素方式建立了其余61个模型。表2是对各个模型设定的描述。

表2 模型设定描述

3.3 实证结果分析

本文利用R软件基于贝叶斯信息准则对所有的备选模型做了贝叶斯模型平均[38]。以均方根误差作为评价模型预测精度指标，各个模型的预测精度及相对于基准模型而言预测精度变化如表3所示。

表3 模型预测精度

注释：预测精度变化项中负号表示模型预测精度降低。

由表3可知，相对于基准模型，除M2的预测精度下降12.5%以外，其余模型的预测精度均有所增加。若在基准模型的基础之上只增加一个解释变量，加入天然气管道变量反而降低了模型的预测精度，这可能是因为中国天然气管道建设仍处于发展阶段且由政府管控投资建设，该变量无法准确的反应天然气市场变化；添加天然气价格因素可以使得预测模型预测精度提升16.44%；添加对外依存度变量可以使得模型预测精度提升20.27%；添加能源加工转换率可以使模型的预测精度提升9.53%；添加户籍人口(总户数)解释变量可使得模型的预测精度提升12.26%；添加中国天然气年产量可使得模型预测精度提升18.32%。所有备选模型中M33的均方根误差值最小，相对于基准模型而言其预测精度提高了41.37%，因此本文利用M33对天然气消费量进行预测，该模型包含9个解释变量，分别是GDP、产业结构(工业占比)、占能源消费总量比重:原煤、占能源消费总量比重:原油、占能源消费总量比重:水电核电风电、城镇化率、天然气价格、对外依存度、中国天然气年产量。

在线性模型假设下，12个解释变量使得备选模型空间达到212个。

表4中展示了各个解释变量的BMA后验概率大小，BMA后验概率表示如果存在解释天然气消费量的“真正模型”，该解释变量包含于“真正模型”中的概率。解释变量的BMA后验概率越大，表示该变量对于天然气消费量的解释力越强。从表2中可以看到，后验概率最大的是x9(对外依存度)，这说明对外依存度可以弥补中国天然气产量不足情况，从而保障天然气市场的供应量，影响市场中的消费量。x12(中国天然气年产量)也是影响天然气消费量的一个重要因素，其后验概率是89.4%。排在第三、四位的是x6(城镇化率)、x3(占能源消费比重：原煤)，它们的后验概率分别是24.8%和20.5%，这说明城镇化发展使得天然气基础设施更健全，居民生活所需天然气更容易满足，从而扩大天然气消费量；中国煤炭在能源结构中的比例虽有所下降，但其仍是主力能源对天然气会产生较大的替代效应。其次x4(占能源消费比重：原油)、x5(占能源消费比重：水电、核电、风电)、x2(产业结构)的后验概率也相对较大，这表明天然气消费量也受产业结构与能源结构的影响。

表4 解释变量后验概率

表5是单一模型的BMA后验概率排名前五位模型列表。根据所获得的4096个模型，进行贝叶斯模型平均后所得到的累计总后验概率的1。且所有备选模型中后验概率最大的模型包含x12(天然气年产量)、x9(对外依存度)两个变量，该最大后验概率达到20.5%；其余四个模型的后验概率均为5.5%，除都包含x12(天然气年产量)、x9(对外依存度)外，还分别含有x1(GDP)、x2(产业结构)、x3(占能源消费总量比重：原煤)、x4(占能源消费总量比重：原油)。假设以后验概率最大的模型作为“真正模型”解释天然气消费量，其错误概率将达到79.5%，这说明没有哪个单一模型能够以很大的概率证明自己可以代表“真正模型”，表明了单一模型的不确定性，同时也证明了贝叶斯模型平均方法的重要性。因此所有解释变量对天然气消费量的的解释力度不能够通过单一模型计算出来的统计量判断，而应通过贝叶斯模型平均方法下计算出的回归系数进行判断。

利用各个单一模型的后验概率加权平均后所得到的回归模型为：

y=-1.5971+0.0024x1-0.0006x2

+0.1251x3-0.0562x4+0.0087x5+0.5411x6

-0.0013x7+0.0114x9+0.08643x12

回归模型中系数最大的是x12(天然气年产量)，其次是x6(城镇化率)，x12变动1个百分点，天然气消费量同方向变动0.8643个百分点；x6变动1个百分点，天然气消费量同方向变动0.5411个百分点。

表5 BMA模型中最优的5个模型

本文根据80/20法则将2003年至2013年的数据作为训练集数据建立BMA模型，2014年至2016年数据作为预测集数据验证模型的预测精度。建立模型后对2014至2016年天然气消费量进行滚动预测，预测值及真实值如表6所示：

表6 2014至2016年天然气消费量的预测值及真实值(亿立方米)

在单变量预测方面主要是时间序列预测，时间序列预测用的最多的是平滑预测模型和ARIMA预测模型；对于多元线性回归的变量预测，逐步回归是指在建立多元回归方程的过程中，逐次选择最优的变量纳入模型，逐步回归是变量最优组合；BVAR模型通常在短期预测时能够提供更高的预测精度；等权重加权平均法避免了使用单一预测模型的缺陷，是在组合预测中较为流行的方法。上述五种模型均是其各自领域的代表性模型，所以为了检测贝叶斯模型方法的预测效果，与ARIMA模型、单变量指数平滑模型、多变量逐步线性回归模型、多变量非线性的BVAR模型以及这四个模型等权重加权组合模型的结果进行对比分析。为了说明BMA模型的预测精度情况，接下来以RMSE为评判标准。

具体情况如表7所示：

表7 不同模型的RMSE

表7中，BMA模型的RMSE最小，以RMSE表示模型的预测精度，以ai=(RMSEBMA-bi)/bi表示相对于其他模型而言BMA的预测精度提高百分率，其中bi(i=1,2,3,4,5)分别表示逐步回归模型(b1)、ARIMA模型(b2)、ETS模型(b3)、BVAR模型(b4)、以及简单加权平均模型(b5)的RMSE值，BMA模型提高的预测精度百分比最低为19.24%，最高可达83.91%。这表明BMA的预测效果比ETS模型、BVAR模型、逐步回归模型、简单平均模型的效果好。

从世界经济信息网可以得到中国GDP的2017～2020年的预测值，预计2020年中国GDP将达到989110亿元，在世界排名第二。我国国内生产总值在2017 年达到785770亿元，年均增长7%，故本文以7%的增长率计算GDP 变化量。中商产业研究院发布的《2015～2020年中国天然气行业发展分析及投资研究报告》显示，中国天然气产量由2010年的958亿立方米增加至2015年的1350亿立方米，2010年至2015年的复合年均增长率为7.1%，2020年中国天然气产量将达1861亿立方米，2022年中国天然气年产量将达到2129.36亿立方米。兰海强[39]等人首先对我国城镇化率历史数据在统计口径上进行修正，然后又分别对四种传统的预测方法进行改进，最后基于修正的我国城镇化率历史数据运用改进的四种方法对中国城镇化率进行了预测。四种预测结果相互印证，由结果分析得出结论：中国2020年城镇化率将达到63.76%。万广华[40]等预测到2030年中国城镇化率降达到80%。按照这个预期，城镇化的年增长率将达到2.4%左右，本文以增长率2.4%的标准来设定2017～2022 年中国的城镇化率。由上述单变量预测模型比较可知，ARIMA模型的预测精度高于指数平滑模型，因此根据历史信息利用ARIMA模型对其余的解释变量进行滚动预测。

结合上述信息得到的解释变量的预测值，利用构建的BMA模型与情景分析方法，对2017年至2022年天然气消费量进行预测，预测情况如表8所示。

表8 天然气消费量的预测值(亿立方米)

十三五期间，国家层面的能源结构优化和环境污染治理成为天然气消费最主要的推动力，体现了中国对于天然气发展的重视。按照国务院《能源发展战略行动计划(2014～2020年)》，天然气消费市场需求强劲，到2020年天然气在一次能源消费中的比重将提高到10%以上，天然气消费量将达到4100亿立方米。

但是，随着国家经济发展进入新常态，影响天然气消费的不确定性因素也在增加，主要体现在两个方面。第一，宏观经济增长对天然气消费的驱动力减弱，很多用气行业面临着效益下降、产能过剩等问题，不仅投资更换燃气设备存在困难，而且对用气成本的波动更加敏感，导致用户煤改气、油改气的意愿大幅减弱。第二，天然气行情上行和国际油价的下探均会对天然气消费起到抑制作用。随着国际油价的一路下探，天然气相对成品油的优势正在逐渐减弱，同时由于与煤炭的差价不断扩大，天然气在电力、化肥等行业已完全丧失竞争力。2014年，中国天然气市场已经出现区间性、阶段性的供大于求的局面。

综合考虑各种因素，本文预计十三五末我国天然气消费增速将下滑，2020年的天然气消费量将达到2842.43亿立方米，低于国务院发展研究中心的预测期望值。到2022年天然气消费将为3254.15亿立方米，年均增长率为8%。(见表8)。

4 结论

本文通过对天然气消费影响因素的深入剖析，选取了12个解释变量进行研究，从中选取6个常用的解释变量构建基准BMA模型，在此基础上，以逐次添加变量的方式创建了预测模型集合，从中选取预测精度最优的模型对2017年至2022年的天然气消费量进行预测。

研究发现，在现有的数据条件下，最优的BMA模型包含GDP、产业结构(工业占比)、占能源消费总量比重:原煤、占能源消费总量比重:原油、占能源消费总量比重:水电核电风电、城镇化率、天然气价格、对外依存度、中国天然气年产量9个解释变量，相对于基准模型而言该模型的预测精度提高了41.37%，其中中国天然气年产量、对外依存度对天然气消费量的影响最大。本文通过逐次添加变量的方式定量分析具体添加变量后，模型预测精度的提升百分率，克服了现有预测模型在解释变量选择方面的不确定性。同时BMA方法通过计算后验概率并以此为权重对所有的备选模型进行加权平均，从而在利用所有得到的模型处理模型选择中的不确定性问题，克服了现有的单一模型方法与简单加权平均方法的不足。在预测精度方面，BMA比单变量的平滑指数模型、多变量的逐步回归模型、多变量非线性的BVAR模型、以及等权组合模型的预测效果更好，由此可见贝叶斯模型平均法在理论上与实证分析上均优于单一预测模型与简单组合模型。由BMA模型预测2020年中国天然气消费量将要达到2842.43亿立方米，低于国务院研究发展中心预测的4100亿立方米，到2022年中国天然气消费量将达到3254.15亿立方米，年均增长率将达到8%。