基于多源信息融合的能源需求预测模型研究综述
2016-12-20张金锁邹绍辉
冯 雪,张金锁,邹绍辉
(1.西安科技大学a.能源学院;b.能源经济与管理研究中心;c.管理学院,西安 710054)
基于多源信息融合的能源需求预测模型研究综述
冯 雪a,b,张金锁b,c,邹绍辉b,c
(1.西安科技大学a.能源学院;b.能源经济与管理研究中心;c.管理学院,西安 710054)
文章以能源需求预测模型技术提升和预测误差不断改善为线索,从信息源的角度出发,梳理了国内外能源需求预测的相关理论与模型特征。能源需求预测模型经历了单一模型、多源模型组合和智能信息融合三个发展阶段,文章对模型发展阶段的特点和存在问题进行评述,对未来非线性、变权重技术以及多源信息融合模型在能源需求预测方面的应用做出进一步展望。
多源信息融合;单一模型;多源模型组合;智能信息融合;能源需求预测
0 引言
准确地预测能源需求趋势,有利于规避能源供给风险,降低能源供需缺口,减缓经济周期波动,进而促进经济社会可持续发展。我国是一个能源消费大国,国内能源需求变化对全球能源格局的影响日益增强,科学预测能源需求是制定我国相关能源发展战略的重要依据。近十年来,虽然我国不断重视能源需求预测工作,相关研究也越来越多,但是已有能源需求预测方法普遍存在模型选择欠缺依据以及信息源不完备的问题,在此基础上较大的预测误差问题难以避免。鉴于此,本文对能源需求预测领域的文献进行系统分析与述评,对单一预测模型存在的问题进行剖析,在此基础上提出构建包含多源信息的能源需求预测模型分析框架,以期改善现有能源需求预测模型的预测精度,提高该类模型的应用价值。
1 基于信息单一化的能源需求预测模型
信息单一化是指仅采用单一模型预测能源需求。单一模型是一种纯数学模型的拟合估计方法,根据能源需求分析方法的基本假设不同,大致可将其分为两类:第一类是单一自相关时间序列模型,是一种基于能源系统自身对能源需求进行预测的研究方式。该类模型假设影响需求变化的一切因素都已反应在需求变量本身中,这些影响因素一般不会发生突变,因此可以通过历史需求的拟合来推测未来需求。趋势外推模型、ARMA模型和灰色模型就是典型代表。第二类是多因素相关关系预测模型,是基于整个社会经济系统对能源需求进行预测,基本假设是预测值不局限于自身各滞后期对它的影响,还包括其他相关因素的作用甚至是相互作用。该类模型主要包括多元回归模型、协整与误差修正模型、向量自回归模型、系统动力学模型、人工神经网络模型和情景分析法等[1]。
各单一模型根据各自的数学理论都有其不同的适用情况,有其不可替代的优势,但也有相应的不足,不能简单、绝对地评判哪个模型的优劣,对各单一模型的适用范围及优缺点归纳梳理如下页表1所示。
从单一模型的两种主要类型——自相关时间序列模型和多因素相关关系模型的比较来看,前者(自相关时间序列模型)是基于能源系统自身对能源需求进行预测的研究方式,基本假设是影响需求变化的一切因素都已反应在需求变量本身中,因此以历史需求可以推测未来需求。该方法能够较好地消除序列中的随机性波动,拟合能源需求确定性趋势能力较强,但是未反映出能源需求复杂系统中错综复杂的关系。后者(多因素相关关系模型)是基于整个社会经济系统对能源需求进行预测,基本假设是预测值不局限于自身各滞后期的影响,还包括其他相关因素的作用甚至是相互作用。相关关系法可以分析出能源需求复杂系统中多种因素与能源需求的因果关系或结构比例关系,但对影响因素的筛选有要求,复杂性也随之提高。总体来说,单一模型虽然总体上来说易于操作,但是缺乏能源需求基本规律的全面认识,模型的特点决定了信息来源的单一性,因此预测精度还有待改善。
2 基于信息多源化的能源需求预测模型
2.1 多源模型组合
Bates和Granger(1969)[2]最早提出多源模型的组合预测理论。该理论认为,有不同可供预测的单一模型,同时也有不同的组合方法,预测精度往往各不相同,没有一种方法可以达到100%的预测精度,但是组合模型有效地集结了各种数据样本的信息以及不同模型的有用信息,比单一预测模型考虑了更为全面的信息,因而可以有效减少或者抵消单个模型中的一些随机因素的影响[3],提高了预测模型的预测精度和可信度。组合模型较单一模型优势有显著提高,表现为以下三方面:第一,模型优势互补。组合预测方法不是各预测模型简单地堆砌而是合理组合,每种方法存在不同的适应情况,也都有其自身的优缺点,通过对具有互补性的方法进行组合,用其中一个模型分析方法的优势或特点弥补另一个模型的缺陷,从而达到优化模型的预测效果;第二,预测精度提升。目前可用的单一模型较多,但针对具体问题和数据特征时,正确地选择预测模型或方法较为困难,这时通常的做法是采用较多的模型来进行比较分析,但也很难找到单一“最佳”模型。组合方法则是把这些模型合理融合,经验表明,通过单一模型的组合运用,得到的预测精度通常比单一模型有所提高;第三,可信度提高。通过对各种预测方法的组合,可以有效地挖掘更多的信息,更加全面、系统地反映事物的本质。多个单一模型组合预测可以涵盖更多事物的特征,更能体现事物的实际情况,从而提高了预测模型可信度。
多源模型按赋权方式的不同,可以分为两类,其一是线性组合和非线性组合模型,其二是不变权组合和可变权组合模型,不同类型的组合模型存在不同的局限性。
表1 各单一预测模型适用性及优缺点梳理
2.1.1 按线性组合和非线性组合模型
鉴于能源系统的特征,大量文献证明,线性组合预测法较非线性组合预测而言,解决非线性问题的局限性较大、效果较差。它们预测效果产生差异的原因,主要有以下几点。
(1)从理论基础和模型特征来看,采用线性最优组合预测方法,对组合预测结果的影响既依赖于其单一模型预测值,又依赖于其相应的权重值,线性组合更多地注重权重分配问题,很难找出对权重系数的最佳确定方式。对于其权重确定方式而言,采用数学规划问题模型,其求解比较繁琐,并且根据不同假设条件采用不同建模机理,这对预测模型提出了更苛刻的要求,进一步限制了组合预测的应用范围。以ANN为代表的非线性加权方法,按单个样本误差和总体误差满足给定精度要求,在神经网络训练过程直接从数据中发现规则和特征,并由网络在动态学习中给出,无需建立模型结构和设定参数估计过程,从而改善了传统组合模型中权重系数不易确定的状况。相较线性组合模型更为凸显的优势在于,某一种预测方法对组合预测结果的影响虽然与自身的预测结果和权重有关,但其权重对组合预测结果的影响是非线性的,它既包括输入与隐单元之间的连接权,还包括输出与隐单元之间的连接权,在遇到某些难以处理的情况,比如指标间相关度较高、数据呈非线性变化、数据缺漏不全时仍可得到较满意的结果。因而更能适应能源预测系统的非线性特点。
(2)从个体样本失误对组合预测整体效果的影响来看,采用线性组合加权的最优线性组合预测方法,个别样本的较大误差会对整个组合预测产生较大的影响。以ANN为代表的非线性加权方法因具有无后效性的特点,即每一层神经元的状态只会影响下一层神经元的状态,不会产生累积不良影响,加上神经网络的神经元众多,且由多层组成,即使个别单元产生失误,其对整体的影响也能起到缓冲作用。这种对小失误的宽容性,有效减少了组合预测结果对真实值的偏离。
(3)从目标函数来看,最优组合预测方法追求的是在约束条件下总体误差平方和最小,目标最优解唯一,这种要求刚性很大;以ANN为代表的非线性加权方法不仅要求总体误差平方和最小,还对每个学习单元的拟合误差也有要求,因而能够有效保证总体误差平方和相对最小目标的实现,其目标最优解不唯一恰好成为一种优良特征,可视拟合精度的要求灵活调节,从而能更好地满足预测要求。
总体上来说,在能源需求预测领域,许多学者做了大量的线性和非线性组合预测研究[4-10],研究结果表明,非线性组合预测方法预测效果总体优于线性组合预测方法。以神经网络模型为代表的非线性组合预测方法具有更高的预测精度和实用性、简便性,是一种解决非线性组合问题的有效工具。
2.1.2 变权组合预测法和可变权组合预测法
不变权组合预测方法是通过最优化规划模型或其他方法计算出各个单一预测方法在组合预测中的权系数。权系数只与预测方法有关,而与时间无关,也就是说同一种单一预测方法在各个时点的权系数是一样的。需要强调的是,各种预测方法对于不同的预测时间段表现出不同的预测能力,比如有的方法对瞬态变化敏感,那么适用于中短期预测;有的方法善于考察长期趋势,那就表现出优越的中长期预测能力。这时,如果将不同时间组合的权系数设定为常值,就无法各取所长获得最佳预报结果。然而在预测实践中,不同的预测方法在不同时刻有不同的预测精度,也就是说同一种单一预测方法在不同时刻的表现并不是完全相同,有可能在某一点预测精度较高,但是另外一点预测精度则较低[11-14]。因此,变权重组合预测更符合实际,具有较高的预测精度和预测稳定性,能比较合理地描述系统的客观现实。
在能源需求预测领域,除了非负可变加权系数的组合预测模型之外,所有的线性组合模型和神经网络非线性组合模型均属于不变权组合预测。已有研究证明[15,16],变权重组合预测效果普遍优于不变权组合预测模型。
从整体上来看,多源模型组合方式在能源需求预测领域取得了较好的成果,但同时也面临挑战,该预测方式均假设未来的能源消费变化趋势仍延续着历史的规律,因此努力从历史数据中寻找能源需求的演变规律。但是,突发事件作为能源需求情景因素之一,势必引起能源消费的突变,从而出现“异常点”或转折性变化。目前多源模型组合方式对“异常点”或转折性变化的准确拟合和预测显得无能为力。
2.2 智能信息融合
随着计算机技术的日趋完善,以及人工智能模型的不断成熟,结合并利用专家系统在能源需求预测领域开拓出一条新的思路。Dennis L.Meadows(1973)等[17]于1970年代借助计算机技术来模拟和研究能源发展问题,虽然结论并不可靠,但是这是第一次能源方面相关问题的系统化分析。专家系统是一个用基于知识的程序设计方法建立起来的计算机系统,它拥有某个领域内顶级专家的知识和经验,并存放过去几年的数据和其他各种影响因素,如图1所示,利用专家的知识和信息是对不可量化的经验进行转化的一种较好的方法,将预测模型与专家系统的融合,就是一种智能信息融合。
图1 专家系统
已有智能信息融合模型在能源需求预测领域中的研究主要应用于电力负荷预测方面。在中长期电力负荷预测方面,倪军,杨明志等[18]对各个模型逐一进行评估决策,最终表明专家系统技术在城网中长期负荷预测的方法是可行的。王德金[19]研究了国内外常用的负荷预测算法和相应的适用情况,采用熵权法解决组合预测权重,为使负荷预测更加智能化,该研究开发了一套基于GIS地理信息系统的负荷预测模块,设计了专家推荐模型,融合专家推荐值来不断调整不满意的预测结果。在中短期电力负荷预测方面,大多数学者[20-23]利用神经网络的非线性逼近能力预测负荷曲线,然后通过专家系统根据天气因素或特殊事件对负荷曲线进行修正,以此提高负荷预测精度。电力负荷预测中智能信息融合的缺陷是只有神经网络模型的基础预测。
中科院余乐安博士首次将智能信息融合的理念应用于油价预测中,基本思想是:首先利用文本挖掘技术搜索影响油价波动的各种因素,然后通过粗集预处理和神经网络学习获得的相应规则形成专家系统的知识库,形成推理和解释机制,最后通过用户界面获取相应的预测信息,即提供各种数据频率(天数据、周数据、月度和年度数据)的油价预测结果。在此过程中,石油价格序列中非线性信息通过非线性模型预测,线性信息通过线性模型预测,不规则事件通过专家系统来处理,最后将不同的信息融合在一起形成最终预测结果[24]。
总之,两类基于信息多源化的预测模型,第一类是以模型信息为核心,通过多源模型组合的不断创新以最大限度捕捉能源需求系统的信息,已取得了较大的预测进展以及较好的预测精度,第二类是以专家信息源为核心,通过专家系统,融合不规则事件的影响,突破并克服了第一类模型的局限性,捕捉到多源模型无法拟合的“突变点”,使预测系统更加智能化。
3 研究展望
从文献归纳和梳理中可以看出,能源需求预测方法逐渐向规范性、可行性及智能化转变,尽管国内外学者对能源需求预测问题进行了有益的探索和研究,但在能源需求预测模型中可从以下两方面改进:
(1)构建基于非线性变权重的能源需求组合预测模型
目前在能源需求预测领域,非线性组合预测模型普遍优于线性组合预测模型。而已有非线性组合模型中,神经网络模型既有效地利用了神经网络的非线性映射能力,又克服了通常对不同预测方法适用性强调不足的缺陷。因此,关于非线性不变权的神经网络组合模型得到了广泛的应用,但是神经网络非线性可变权组合预测仍是空白。可变权组合预测方法尤其是非线性可变权方法比较复杂,因此研究成果并不多见,未来有进一步研究空间,这也是本文能源需求预测考虑的重要研究方法。
(2)构建基于多源信息融合的能源需求预测模型
在分析智能信息融合的基础上,进一步拓展信息源,构建基于多源信息融合的能源需求预测模型(MIF组合预测模型)。设想的思路是:首先将非线性变权重的组合模型预测结果视为第一个信息源,然后通过专家经验判断的方式,量化各种突发事件或政策调整的影响,诊断异常点对预测结果的影响,将影响结果视为第二个信息源,最后将多个预测机构的预测数据作为第三个信息源。在此多源信息基础上通过变权非线性融合技术赋予这三个信息源不同的权重,从而得到最终的预测结果。该思路实质上也是一种智能信息融合系统,当然,模型的实用性和可行性既要考虑到研究对象的数据特征,也要考虑到模型求解的具体技术方法。
[1]徐国强,胡清友.统计预测与决策[Z].上海:上海财经大学出版社,1998.
[2]Bates J M,Granger C W.The Combination of Forecasts[J].Journal of OperationalResearchSociety,1969,20(4).
[3]汪同三,张涛.组合预测:理论,方法及应用[M].北京:社会科学文献出版社,2008.
[4]卢奇,顾培亮,邱世明.组合预测模型在我国能源消费系统中的建构及应用[J].系统工程理论与实践,2003,(3).
[5]张玉春,郭宁,任剑翔.基于组合模型的甘肃省能源需求预测研究[J].生产力研究,2013,(11).
[6]秦晋栋.基于熵权灰色组合预测模型的区域能源需求预测研究[J].价值工程,2012,31(4).
[7]侯运炳,张文,张浩等.煤炭需求最优组合预测[J].煤炭工程,2008,(11).
[8]赵国浩,郭淑芬,申屠菁等.基于变权组合预测模型探讨中国煤炭需求[J].资源与生态学报:(英文版),2011,2(2).
[9]Donaldson R G,Kamstra M.Forecast Combining With Neural Networks [J].JournalofForecasting,1996,15(1).
[10]周扬,吴文祥,胡莹等.基于组合模型的能源需求预测[J].中国人口.资源与环境,2010,20(4).
[11]陈华友,刘春林.基于IOWA算子的组合预测方法[J].预测,2003,22 (6).
[12]陈华友,程蕾,张倩.基于相关系数的IOWA算子最优组合预测模型[C].第四届中国不确定系统年会论文集,2006.
[13]胡彦,李秀美,陈华友.基于IOWA算子的税收组合预测模型[J].统计与决策,2009,(10).
[14]周礼刚,陈华友,丁子千等.基于Theil不等系数的IOWGA算子组合预测模型[J].安徽大学学报(自然科学版),2010,(1).
[15]周扬,吴文祥,胡莹等.基于组合模型的能源需求预测[J].中国人口.资源与环境,2010,20(4).
[16]张丽峰.中国能源供求预测模型及发展对策研究[D].北京:首都经济贸易大学学报,2006.
[17]Meadows D L,Meadows D H,Zahn E et al.Die Grenzen des Wachs⁃tums:Bericht des Club of Rome zur Lage der Menschheit[M]. DeutscheVerlags-AnstaltStuttgart,1972.
[18]倪军,杨明志,杨期余.专家系统技术应用于城网负荷预测[J].供用电, 1994,(5).
[19]王德金.基于熵权法的电力中长期负荷组合预测[D].北京:华北电力大学,2007.
[20]于希宁,牛成林,李建强.基于决策树和专家系统的短期电力负荷预测系统[J].华北电力大学学报,2005,32(5).
[21]夏道止,王锡凡,周琳等.基于RBF神经网络和专家系统的短期负荷预测方法[J].西安交通大学学报,2001,35(4).
[22]招海丹,余得伟.电力负荷短期预测的模糊专家系统修正方法[J].广东电力,2001,14(1).
[23]Kim K,Park J,Hwang K et al.Implementation of Hybrid Short-term Load Forecasting System Using Artificial Neural Networks and Fuzzy ExpertSystems[J].PowerSystems,IEEETransactionson,1995,10(3).
[24]余乐安,汪寿阳,黎建强.外汇汇率与国际原油价格波动预测—TEI@ I方法论[M].长沙:湖南大学出版社,2006.
(责任编辑/亦 民)
F206
A
1002-6487(2016)23-0029-04
国家自然科学基金资助项目(71273206;71273207);陕西省软科学计划重点项目(2012KR2-01);陕西省教育厅科研计划项目(2010JK185)
冯 雪(1986—),女,陕西西安人,博士研究生,研究方向:能源经济与管理。
张金锁(1962—),男,陕西西安人,教授,博士生导师,研究方向:资源环境政策、管理系统工程。