基于灰色关联分析及多元回归的上海市电力需求预测
2021-05-07张游国高岩
张游国 高岩
摘 要:通过从经济发展水平、产业结构、人口数量、对外贸易、气温因素五个维度,选取八个指标对上海市电力需求进行预测分析,首先从理论上分析了电力需求和各个影响因素之间的关系,接着对上海市2004~2018年各变量的相关数据分别通过单位根检验和Granger因果检验的定性分析以及灰色关联度的定量分析两个方面来筛选模型的影响因素,最后利用主成分分析对建立的多元回归模型进行修正,并根据修正后的回归模型对历史用电量进行模拟预测,得出该模型具有一定的预测精度。研究表明上海市电力需求受上海市国民生产总值、人口数量、第二三产业比值、对外出口、夏季平均气温五个因素影响显著,且模型精度较高,可为电力部门提供参考。
关键词:Granger因果检验;灰色关联分析;多元回归预测;主成分分析
中图分类号:F427 文献标识码:A
Abstract: Through eight indicators from five dimensions, including economic development level, industrial structure, population, foreign trade, and temperature factors, to predict and analyze Shanghai's electricity demand. First, it analyzes the electricity demand and the influencing factors theoretically. Then, the relevant data of each variable in Shanghai from 2004 to 2018 was cleaned and processed, and then the influencing factors of the model were screened through the qualitative analysis of unit root test and Granger causality test, and the quantitative analysis of gray correlation degree. Finally, the principal component analysis is used to revise the established multiple regression model, and the historical electricity consumption is simulated and predicted according to the revised regression model, and it is concluded that the model has certain prediction accuracy. Research shows that Shanghai's electricity demand is significantly affected by five factors, namely, Shanghai's GDP, population, ratio of tertiary and secondary industries, exports, and average summer temperature. The model in this paper is highly accurate, which can provide a reference for the power sector.
Key words: Granger causality test; grey relational analysis; multiple regression prediction; principal component analysis
1 上海市電力需求影响因素分析
影响电力需求的因素有很多,如人口因素、经济发展水平、产业结构等,同时为提升本文模型精度,也引入了对外贸易和气温两种影响因素[1]。
1.1 经济发展水平
经济发展水平一直作为影响电力需求的重要因素之一,本文用GDP作为经济发展水平的主要表征指标。但一般情况选用电力需求弹性系数来量化电力需求和GDP之间的关系[2],上海市近15年来其电力需求弹性系数也一直随着经济增长波动而变动,如图1所示。
当经济发展低迷时,电力需求增速也开始放缓,当经济发展繁荣时,其电力需求增速也加快。因此,经济发展水平和电力需求之间必然存在显著的相关性。
1.2 产业结构
自改革开放以来,上海市产业结构不断调整优化,对电力需求的结构及变化趋势产生了重大影响。2004~2018年近15年,上海市第一产业和第二产业发展比重下降显著,以第二产业最为突出,由2004年48.2%下降至2018年29.8%,下降了近20个百分点,这是由于上海市土地资源制约日益显著,劳动力成本上升明显,使得越来越多的上海市工业产业开始往长三角其他地方转移。同时,第三产业随政府规划调整逐渐成为上海市的支柱产业,其发展占比由2004年的50.4%上升至2018年的69.9%。
1.3 人口因素
电力产品是居民日常生活中必不可少的一部分,随着上海市人口规模的扩大,外来人口的增加,其用电量也大幅增加,2004年上海市人口为1 835万人,到2018年已增加至2 424万人。其人口的增长也必将刺激电力需求的增加。
1.4 对外贸易
根据过往研究表明,对外贸易也会对电力需求产生影响。首先出口贸易增长,导致就业和消费的增加,进而刺激消费的增长,进而使电力需求大幅增加。而进口增加则会导致失业增加,企业生产力从而下降,生产力的下降也必将影响到电力需求,最终使得电力需求量减少[3]。截至2018年,上海市当前进出口总额约占全国进出口总额的11.4%,其中上海市出口总额约占全国出口总额的8.4%,综上,对外贸易也是影响上海市电力需求的一个重要因素。
1.5 气温因素
由于全球气候变化因素的影响,气温变化对电力需求的影响越发重要,居民用电消费习惯与气温变化存在高度的相关性[4]。考虑到夏季高温对全社会用电需求的影响更为显著,通过选取2004~2018年上海市6~9月每日气温及用电负荷数进行分析,拟合关系图如图2所示。
如图2可得,气温和电力需求存在显著的正相关性,因此气温的升高,居民会习惯性的增加用电需求,可见气温也是影响电力需求的因素之一。
2 模型的构建
2.1 模型思路
基于上述的影响因素分析,本文选取了:经济发展水平、产业结构、人口因素、对外贸易、气温因素五个维度来选取解释变量,被解释变量为上海市全社会用电需求量。
初步建立需求模型如下:
2.2 变量选取及数据来源
上述分析可得,经济发展水平用上海市生产总值作为表征指标,单位为亿元。产业结构、人口因素、对外贸易、气温根据研究选取不同的指标。具体如表1所示:
同时,样本的来源主要来自上海历年统计年鉴[5],也有一些样本数据来自于Wind资讯,实证检验所使用的工具主要为Eviews软件。此外,单纯建立模型易产生异方差,为消除异方差,研究中对上述变量进行取对数处理。
3 模型实证检验及分析
3.1 单位根检验
本文选取的变量宏观因素较强,数据的非平稳性较大,若直接对模型进行回归,可能会造成“伪回归”,影响模型的准确性[6]。因此为防止此问题发生,需先对数据进行单位根检验,其检验方法较多,本文选取ADF检验对各个指标进行平稳性检验。其结果如表2所示:
由表2可得,在5%的显著性水平下,所有变量的时间序列均不存在单位根,因此上述变量均为平稳序列,符合格兰杰因果关系检验的条件,并可以进行进一步回归分析。
3.2 Granger因果关系检验
为进一步探究上海市电力需求和影响因素之间的相互关系,我们选取格兰杰检验来判定变量之间的因果关系,表明若某一时间序列变量的带动带来另一时间序列也发生了一致的变化,即用变量Y的过去值和对Y进行回归时,再加上变量X的过去值,使得回归的解释能力显著增强,则称X为Y的Granger原因,否则称非Granger原因。
根据AIC和SC信息准则,选取滞后2期为格兰杰因果关系检验的最佳滞后期,对各变量进行格兰杰关系检验的检验结果如表3所示:
如表3显示,在显著性水平为5%情况下,电力需求和上海市生产总值存在着双向的格兰杰因果关系,夏季平均最高气温和电力需求不存在格兰杰因果关系,而剩余其他变量则与电力需求仅存在单向的格兰杰因果关系。综上由于最高气温因素与电力需求在数值上不存在格兰杰因果关系,因此将该变量剔除。
3.3 影响因素的灰色关联度分析
接下来运用灰色关联度分析对各变量进行定量分析,灰色关联度分析是通过对各变量时间序列的发展趋势来判断各因素之间的关联程度,关联度大的表示主因子受該因子影响的较大,关联度小的表示主因子受该因子的影响程度小或几乎不受影响[7]。
综上所述,运用Matlab编程求解得各变量之间的灰色关联度如表4所示:
计算得出上海市全社会用电量与八个影响因素之间的灰色关联度,根据关联度大小排序结果来看。在上海市对外贸易方面,出口总额的灰色关联度大于进出口总额的关联度,因此选取出口总额作为上海市外贸情况的表征指标。接着,在产业结构方面,第三产业/第二产业>第三产业占比,故选取前者为产业结构的表征指标。综上所述,本文选择建模分析的最终变量如5所示:
4 多元回归模型修正
4.1 多重共线性检验
根据上述所筛选的经济指标,首先进行多重共线性的检验,通过Eviews软件对数据进行相关性检验,根据相关性系数可以得出各解释变量之间存在严重的多重共线性[8]。
4.2 修正模型
为提升模型结果的准确性,采用主成分回归的方法,在不剔除已考虑的解释变量前提下,克服模型的多重共线性。通过主成分分析将彼此共线性较大的解释变量转换成若干个主成分,这些主成分从不同方面反映对被解释变量的综合影响,且互不相关[9]。因此,本文先将被解释变量对这些主成分进行回归,再根据主成分与解释变量之间的对应关系,最后求得原回归模型的估计方程。
通过运用Eviews软件对解释变量进行主成分分析,结果如图3所示。
如图3可得,上半部分为主成分回归情况,得出五个主成分及其特征值、方差和累计贡献率,下半部分为特征向量图,第一列为五个解释变量,后面几列对应五个主成分的特征变量。本文选用方差累计贡献率准确认主成分个数,即选取n个主成分使累计贡献率达到85%以上,那么前n个主成分基本包含了全体解释变量的绝大部分信息,减少变量个数,从而克服模型共线性问题。由于图3中第一主成分F的累计贡献率已经达到85%,即反映了五个解释变量85%的信息,因此只需取第一主成分F即可,表达式为:
最后,本文在建立模型的過程中,提前对解释变量的数据进行了归一化的处理,因此用上式中解释变量的幂指数来判断某个因素对电力需求影响程度的大小仅具有一定的参考性。而本文建立的电力需求预测模型,其中包含了五个影响因素,故知道了这五个影响因素的具体值,代入模型,就可以预测出上海市对应年份的电力需求量。这对于制定电力生产计划有一定指导作用。
参考文献:
[1] 黄晨宏. 影响上海电力需求的主要因素及电力需求预测[J]. 电力需求侧管理,2011,13(3):72-76.
[2] 陈树民. 我国电力需求影响因素研究[D]. 济南:山东大学(硕士学位论文),2018.
[3] 周杰. 上海电力市场的分析预测[J]. 电子世界,2013(24):81-82.
[4] 王宝,马静,叶斌,等. 基于经济与气象维度影响因素的省级电网年度电力需求预测方法[J]. 电力需求侧管理,2020,22(2):51-56.
[5] 上海市政府. 上海统计年鉴[M]. 上海:上海市统计局,2004-2018.
[6] 叶珊,李士华. 江苏省电力消费与地区经济关系的实证分析[J]. 电工电气,2018(1):60-63.
[7] 孙金朋. 基于灰色模型对上海市电力需求预测分析研究[J]. 上海节能,2020(3):208-212.
[8] 赵颖. 基于回归分析的我国汽车销量预测模型研究[D]. 武汉:华中师范大学(硕士学位论文),2014.
[9] 崔巍,都秀文,杨海峰. 基于主成分分析法的电力需求影响因素分析[J]. 电力建设,2013(8):34-39.
[10] 张明,李存斌. 基于逐步回归—灰色预测的中长期电力需求预测[J]. 水利电力,2020(19):155,162.
[11] 李玉梅. 组合预测方法在中长期电力负荷预测中的应用[D]. 成都:四川大学(硕士学位论文),2008.
[12] 代业明,高红伟,高岩,等. 具有电力需求预测更新的智能电网实时定价机制[J]. 电力系统自动化,2018,42(12):58-63.
[13] 董承章,马燕林,吴靖,等. 计量经济学[M]. 北京:机械工业出版社,2011.
收稿日期:2021-05-29
作者简介:张游国(1995-),男,重庆人,上海理工大学管理学院数量经济学硕士研究生,研究方向:工业经济、电力市场;
高 岩(1962-),男,黑龙江五常人,上海理工大学管理学院,教授,博士生导师,研究方向:工业经济、系统工程、智能电网。