基于多极限学习机融合的日前电价预测
2016-05-14贺宁
贺宁
摘 要:对日前市场电价的预测有多重方法,在众多智能算法中,多极限学习机融合算法研究的还不够深入。而在常规的预测模式下,往往因为可靠性和精度等级不够而影响预测结果。极限学习机日前电价预测模型的建立,从理论上仿真了实际电价,这种方法不仅仅考虑了日前电价的几个曲线特性,将各类信息整合在一起输入,简化了预测手段,输出结果可靠且高效。经过多次的实地测试,对比模型输出量与实际结果,发现这种预测方法非常可靠。
关键词:电力;预测;极限学习机
中图分类号: TP18 文献标识码: A 文章编号: 1673-1069(2016)22-109-3
1 概述
在日常生活中,电力能源与老百姓的生活息息相关,电力电价在各方利益关系中扮演着极其重要的角色。近些年来,各类企业和科研机构,都有大量的专业人员在对电价的预测做着各种科学研究。准确的电价预测关系到社会各阶层,包括普通的居民用电,大型重工业企业商业用电。可以说,当前社会,电力的应用无处不在,电价的准确预测对全社会能源结构变化都会产生深远的影响。另外,由于电力能源逐步走向多元化,除了传统的火电、水电、风电、核电,新兴的生物发电、太阳能发电等技术快速发展,在许多国家应用广泛,并且不同的电能产生方式造就的成本差异非常大,上网电价差异必然不同,这就给电价的预测带来了很多的困难。
传统的电价预测有很多种,常见的如:模拟电力市场实时运行来计算市场出清价格。在做建模之前,实施人员要去调研一些关键信息,诸如发电厂的分布、机组容量、发电负荷,输配电系统的运行状态,大型企业的发展规划方向等,同时要根据电网运行规律掌握电网潮流走向、输配电趋势以及电网升级改造等因素。该类方法在短时间内,能够很好预测电价走向,与电力市场实际需求吻合度也很高,但是仅仅适用于大中型企业,对于规模不大,又有这方面需求的用电单位和个人来讲,运用这种方式预测电价有很多不便。还有一种常用的预测方法,叫作统计学预测方法,就是通过搜集已发生电价和电费统计单位发布的与电价相关的信息建立预测模型。这种方法与模拟电力市场实时运行来计算市场价格相比,操作起来会简单一些,不需要太多的信息量,就可以搭建模型。统计学预测方法中比较常见的方法有时间序列法、计量经济学方法和智能算法等。
本文讨论的是一种新的预测方法,是基于多极限学习机的预测方法。同时,考虑对预测结果有较大影响的精度等级等问题,把多个极限学习机融合进来,从而形成多神经网络建模方法,这种方法的融入,可以提高日前电价预测模型的预测精度。
2 多源信息的融合
广义的多源信息融合技术有多种定义,本文简单介绍一下狭义的多源信息融合技术。这种技术是利用计算机的自动获取、分类、统计、分析所得数据,通过这种方式得到独立于个别信息源之外的其他信息,从而达到研究需要取得的成果和目标的一项技术。多源信息融合有很多优势,诸如可以在一定程度上加强系统的可靠性,也可以对系统影响量较大的鲁棒性有很大改观。另外,多源信息融合在数据测量的广度和立体空间上有很大的拓展。通过多源信息融合,还可以增强数据的可信任度和系统分辨能力。
信息融合技术最早应用于发达国家的国防科技领域,经过多年的发展,对应用这项技术的国家军事水平提升有很大的影响。后期的社会发展,对于高科技带来的衍生品需求量日益加大,因此这项技术在民用智能化信息综合处理技术研究上得到广泛重视。尤其是多源信息融合技术,逐步在众多信息整合技术中脱颖而出,成为各相关领域角力的有力工具。另外,虽然很多公司、企业在广泛使用信息融合技术,但是由于这项技术的需求背景是信息处理技术发展需要,因此,到目前为止,信息融合技术尚无自己的理论体系。现在人们研究的信息融合技术多数还仅限于理论方法的建立。
人工神经网络在多个领域有应用,本文所说的人工神经网络具有并行结构和其特有的学习方式,信息的融合是在把人工神经网络作为信息融合中心而完成的。由大量互联的处理单元连接而成的人工神经网络,是基于已接受样本的一致性去进行分类标准划分的,在这方面的学习能力具有很强的自适应性。可以从网络权值分布上看到这个特点,知识的获取是通过神经网络特定的学习算法来实现的。为了有效避开模式识别方法中建模和特征提取过程,必须对神经网络分布式信息存储和并行处理的方式进行充分地利用,这种做法对于模型不符和特征选择不当造成的负因子规避非常有效,可以大大提高识别系统的性能。
信息融合的过程如下:
第一步是建立拓扑结构。可结合将要建立模型系统的主要特点建立。
第二步是处理已知信息,划归一个单个的输入函数(映射函数),神经网络与环境进行交互作用后,得到输入函数的变化规律,再把规律结果反馈给神经网络。
第三步是输入函数后经过模型的信息整合得到预测结果的过程,是输入函数通过神经网络融合系统经过学习、确定权值的过程。
3 极限学习机算法
单隐含层前馈神经网络(SLFNs—single-hidden layer feedforward neural networks)算法——极限学习机(ELM-extreme learning machine)。极限学习机可以任意产生隐含层节点参数。经过单隐含层前馈神经网络的输出得到相应权值。经过任意选取的隐含层节点参数,一个线性系统形成了,就是单隐含层前馈神经网络。从而得到的输出权值,是通过逆操作隐含层的输出矩阵而来的。通过各类科研单位的研究,我们发现,极限学习机有两大优点,一个是具有广泛的全局搜索功能,另一个是操作起来非常简便。在极限学习机中,运用S型函数、正弦和复合函数等使用起来也很便利。一些不可微函数或者不连续函数一样可以成为极限学习机的激活函数。这个方法和常用的BP学习算法和SVM算法比较,效率更高。常用的BP学习算法局部非常小,学习率不宜选择。极限学习机算法则具有更好的泛化能力,参数确认过程也比较简单,从而省时且精度很高。ELM算法内容如下:
3.1 标准SLFN的数学定义
隐含层节点数量为L,那么,单隐含层前馈神经网络输出如下:
公式中的ai,bi为隐含层节点学习参数,βi=[βi1,βi2,…βim]T为隐含层第i个节点到输出层的连接权值,G(ai,bi,x)为第i个隐含层节点与输入x的关系,激活函数g(x):R→R(例如S型函数),则有
公式中的ai表示输入层到第i个隐含层节点的连接权值向量,bi表示第i个隐含层节点的阈值。ai·x为向量ai和x的内积。
3.2 极限学习机ELM(extreme learning machine)
随机抽取N个样本, 表位输入,
表示目标输出。如果一个有L个隐含节点的SLFN能以0误差来逼近这N个样本,则存在βi,ai,bi,有
H表示为网络的隐含层输出矩阵,第i列是与输入x1,x2,…,xN相关的第i个隐含层节点的输出向量,第j行表示与输入xi相关的隐含层输出向量。
研究发现,隐含层节点数L往往比训练样本数N小,从而使训练误差无限逼近一个非零的训练误差ε。SLFNs的隐含层节点参数ai,bi(输入权值和阈值)在训练过程中可以取随机值。这样式(4)输出权值β:
这里H+为隐含层输出矩阵H的Moore-Penrose广义逆。
ELM算法可以归纳为下面三个步骤:给出一个训练集
,激活函数以及隐含层节点数,则
①随机产生隐含层节点参数(ai,bi),i=1,…,L。
②计算隐含层输出矩阵H。
③计算输出权值:β:β=H+T。
4 多极限学习机(ELM)融合建模
多极限学习机(ELM)融合建模,为了提高精度等级,为信息融合做准备,把多个预测结果结合起来,一方面把有n个子数据集的训练数据进行数据配准,对分别建立ELM神经网络的数据进行训练,建立n个预测模型。另一方面,得到训练误差权重,据此融合得到终极模型,图1中,Y1,Y2,…Yn为n个子模型的输出;W1,W2…Wn为每个子模型的权重(W1+W2+…+Wn=1。)权重的初始值为W1W2=…=Wn=,随着训练的深入,观测误差,并调整子模型的权重,较大权重赋予好的模型。从而保证子模型性能最好的发挥各自的作用,Y为最终输出,且为最优。
5 仿真实验
下面用某电力公司辖下电网为研究对象。训练数据选择2~5月电价数据,建立日前电价预测模型;检验数据为6月份。模型中子模型的数目根据实验结果确定为n,即n为7个。
比较单一ELM和单一BP神经网络两种预测模型结果与多ELM日前电价预测模型预测结果如下表1。提取绝对百分比误差:
和均方根误差:
yi为实际值,i为预测值。经研究发现,上述三种研究结果有差到好的排列次序为:基于BP神经网络的预测模型〈基于ELM神经网络的预测模型〈多ELM融合预测模型,即多ELM融合预测模型最优。
6 结论
本文着力论证基于多极限学习机的方法优势,结合神经网络方法,对日前电价的特点进行了分析,建立了电价预测模型。并通过实例对传统的两种预测模型与本文研究的模型进行数据比对,提出比较因子。通过研究发现,本文提出的方法具有较好的性能,可以满足实际应用的需要。