APP下载

基于隐含数据信息挖掘的贝叶斯电采暖负荷预测∗

2019-01-09李香龙张宝群马龙飞徐振华

电测与仪表 2018年24期
关键词:电采暖贝叶斯负荷

李香龙,张宝群,马龙飞,徐振华

(1.国网北京市电力公司电力科学研究院,北京100075;2.北京航空航天大学自动化科学与电气工程学院,北京100191)

0 引 言

随着环境污染问题和能源危机问题日益凸显,清洁能源和节能环保产品的使用逐渐得到推广[1]。近年来新能源的快速发展,采用电采暖替代传统燃煤供暖,不仅能够有效缓解冬季供暖所带来的空气污染问题,同时充分利用新能源,节省大量传统燃料能源。北京农村供暖建筑保温性差,相比于城镇供暖耗能更高。北京农村地区住房供暖面积近年来增长迅速,从2006年农村住宅面积1亿平方米增加到2014年1.5亿平方米,平均年增长率为5.2%。针对日益增长的农村供暖需求问题,北京市提出“煤改电”计划,2017年完成20.5万户“煤改电”改造任务。“煤改电”计划的大范围推广,使得冬季用户用电负荷将大幅度增加,电力负荷峰谷差进一步增大,严重危害电网安全稳定运行。准确的冬季电采暖负荷预测能够有效缓解电力系统调峰和调频压力,对电力系统的安全经济稳定运行具有重要作用[2]。

负荷预测研究主要集中气象因素对电力负荷的影响,负荷预测方法包括有一元线性回归模型、时间序列模型、BP神经网络算法、小波分析和支撑向量机等算法[3-8]。其中一元回归模型和时间序列模型相对比较简单,考虑影响因素不全面,预测结果误差较大。BP神经网络学习训练则考虑了多种影响因素,但学习泛化能力弱,容易陷入局部优化的困境。支撑向量机算法则只考虑了温度对供暖负荷的影响,而没有考虑其他因素对供暖负荷的影响,导致最终预测结果误差较大。传统智能神经网络算法采用黑箱式数据训练和学习,没有考虑无法测量数据对实际预测效果的影响,导致预测结果的可靠度不高,预测误差较大。

贝叶斯网络用于负荷预测研究在近年来受到广泛关注,并取得了一定的成果,由于贝叶斯网络采用图形结构形式来表示知识,因此对复杂系统简单化处理的效果十分显著。Douglas首先采用贝叶斯网络来实现天气的预测,包括室外最高气温和平均气温,然后由得到的温度预测结果进行短期电力负荷预测[9]。Lauret等人使用贝叶斯网络首次进行短期电力负荷预测,并且利用Laplace算法实现贝叶斯网络结构中网络参数的学习和优化,得到较好的结果[10]。Saini等人结合贝叶斯网络和BP神经网络,通过贝叶斯网络来学习BP神经网络中的结构参数,从而实现对未来7天的电力最大负荷的预测[11]。Cottet等人引入了马尔可夫链蒙特卡洛方法,通过贝叶斯网络模型,实现对一阶稳态向量的自回归模型的学习,并利用该模型实现超短期负荷的预测[12]。

采用贝叶斯网络推理算法建立电采暖负荷预测模型。通过分析影响电采暖负荷的因素和各个影响因素之间的内在关系、条件依赖特性,对不同的影响变量采用不同的方式进行处理[13],搭建合理的贝叶斯网络结构,不仅改善了传统神经网络结构,同时通过概率统计以及对大量统计数据学习训练,使得网络结构更加清晰,推理预测更加合理,预测结果更加准确。结合北京电力科学研究院提供的2016年某市冬季电采暖负荷实测数据,通过网络训练和学习并进行预测,表明模型预测误差小,隐含数据分布信息得到有效学习和挖掘。

1 电采暖负荷

随着“煤改电”计划的实施和推广,电采暖负荷已经成为冬季电力负荷的重要组成部分。与一般电力负荷不同,电采暖负荷类似夏季的空调制冷负荷,不仅具有明显的季节气候特性,受气温变化影响显著,而且具有较强的时序特征,即电采暖负荷变化不仅受到气温变化的影响,且与其历史时刻的状态也密切相关。

电采暖方式包括直热式、蓄热式和空气源热泵设备供暖等。直热式供暖直接利用电热管将电能转化为热能,通过加热水媒介实现供暖;蓄热式供暖是在用电谷段开启蓄热模式,将电能转化为热能并存储在储热物质中,然后在用电峰段优先使用储热物质中的热量供暖,实现用户经济供暖;空气源热泵供暖则是利用空气源热泵设备,依据逆卡诺循环原理,从外界空气中提取热量为室内房间供暖,高效节能且环保。

影响电采暖负荷变化因素众多,主要包括环境气温变化、用户采暖用电习惯、区域电采暖设备规模和建筑热力学状态等[14-16]。用户采暖用电习惯主要指用户采暖方式和采暖设备设定温度大小。用户采暖方式即直热式、蓄热式、空气源热泵设备等其中一种或几种的组合。建筑热力学状态主要包括建筑房间的等效热容、等效热阻和散热功率等。可知影响电采暖负荷变化因素的信息是难以获取测量和采集的,采用贝叶斯网络能够有效解决这类包含有未知的隐含数据信息问题。

2 贝叶斯原理

2.1 概述

贝叶斯网络是一种采用图形结构来表示知识的,一种通过概率统计的计算和大量历史数据的学习,实现对复杂系统的不确定性推理和预测的智能方法。贝叶斯网络参数优化学习的过程是通过对历史数据进行训练来寻找得到最简约的网络结构和网络参数,从而来表示网络数据中各个变量之间的因果关系和条件概率特性的过程。

对模型的求解时,常常难以全面获取模型数据,总有部分数据无法观测和获取,此时称该模型中含有隐含变量,获得的数据称为不完全数据,其中无法测量获取的数据称为隐含数据,此时对模型的参数进行估计是十分困难的。在贝叶斯网络的学习中,采用EM算法实现对含有隐含变量的不完全数据进行参数学习,通过算法本身特性可以实现从不完全数据中建立包含隐含变量数据的模型,提高了模型的准确性。

2.2 EM 算法

EM算法由期望计算E步骤和最大化计算M步骤两部分组成,通过两步骤的反复迭代完成参数的估计计算。 给定观测样本数据[x1,x2,x3,…xm],对此观测数据得到关于参数θ的概率模型为p(x;θ),关于参数θ的对数似然函数为:

如果观测得到的样本数据是完全的,那么根据此似然函数很容易得到估计参数θ,但是实际观测得到的样本数据是不完全的,令其隐含变量为z,则此时得到的关于参数θ的对数似然函数为:

由于隐含变量z的存在,因此对参数θ的估计就十分困难,此时EM算法就给出了在这种情况下对参数的有效估计方法,其基本的过程就是猜测参数θ和隐含变量z的分布情况,然后进行重复迭代和更新,直到参数满足条件收敛。

2.2.1 E 步骤

首先令Qi(z)为隐含变量z的分布,那么有:

且有:

由于隐含变量z的存在,则能够使l(θ)界增大的参数θ均能够使l(θ)增大,则选择隐含变量z的分布满足最大化似然函数l(θ)的下界,式(4)取等号的条件为:

式中c为常数,因此可以得到隐含变量z的分布满足:

由此可以得到:

2.2.2 M 步骤

在此隐含变量z的分布条件下,调整优化参数θ使得似然函数最大化,即为对上述的似然函数求导,并令其为0,得到的即为最大化似然函数的参数θ。

然后重复上述的E步骤和M步骤,不断迭代优化直至收敛即可以得到最终模型的求解。

3 网络预测模型

3.1 贝叶斯网络搭建

在影响电采暖负荷的各个因素中,可获取的历史数据有室外温度变化和日、时刻类型,其余变量均是难以获取的,因此考虑采用贝叶斯网络进行负荷预测,搭建网络结构如图1所示。

图1 贝叶斯网络结构Fig.1 Bayesian network structure

图1 中可观测数据包括室外环境温度变化和日、时刻类型信息以及供暖负荷数据,隐含变量数据则是设备组合状态信息和室内设定温度信息。利用贝叶斯网络对其中各个变量进行处理。

3.2 变量处理

在贝叶斯网络进行数据学习中,网络原始训练输入数据,包括室外温度和日、时刻类型数据,采用归一化方式处理。

对于隐含节点变量,类型不同,其处理方式也是不相同的,分几种情况,其中称需要处理的变量节点为子节点,与其连接的上一层节点为父节点[17-20]。

3.2.1 离散变量

当子节点为离散节点,父节点为离散节点,对该节点处理过程如下:

式中i为该节点的可能取值;j为该节点上一层节点的可能取值。

若子节点为离散节点,父节点为连续节点,需要对连续变量父节点的条件概率进行处理,处理方式为将其转化为离散节点进行计算。

式中x为父节点变量取值;i为子节点取值;n为子节点可能取值的总数;wi和bi为子节点变量取值为i所对应的权重和阈值。

当离散子节点的父节点既有连续节点,又有离散节点情况时,这时,需要将离散节点处理为连续节点,因此对每一个不同的离散节点离散值的组合给定一个w、b参数集合,这样将离散节点看作是连续节点进行处理。

式中x为连续父节点变量取值;j为离散父节点变量取值;i为子节点取值;n为子节点可能取值的总数;wi,j和bi,j为离散父节点取值为j时,子节点变量取值为i时所对应的权重和阈值。

3.2.2 连续变量

若子节点为连续节点情况,不论父节点是离散节点,还是连续节点,对其处理方式均是将子节点离散化,即处理为一个离散节点形式,这类节点称为高斯节点,其满足高斯分布。

式中当子节点取值为y,父节点中离散父节点Q为i且连续父节点X为x时满足的高斯分布的各项参数情况。

根据高斯分布特征可以知道,当Y取值为高斯分布的均值时,其概率最大,因此可以得到该节点的最大预测取值为:

式中X为离散节点Q的父节点,m为离散父节点X的可能取值数。

4 算例分析

4.1 数据资料

采用国家电网北京市电力公司电力科学研究院提供的2016年某地区电采暖负荷数据共1 512组,采样间隔为60 min。获取的数据包含房间供暖负荷、气温变化和对应日期。将获取的数据最后10天共240组数据作为测试集,其余数据作为训练集。通过贝叶斯网络搭建的供暖负荷预测模型对训练数据进行学习并进行相应的负荷预测,得到预测结果如下。

4.2 结果分析

贝叶斯网络训练过程对数似然变化如图2所示。

图2中表现了随着贝叶斯网络数据训练迭代次数的增加,网络参数得到优化,概率似然值逐渐增大然后趋于稳定,网络效果性能不断提升。通过贝叶斯网络得到预测功率与实际功率相对百分误差分布如图3所示。

图2 对数似然Fig.2 Log likelihood

图3 预测误差Fig.3 Prediction error

图3 为预测相对百分误差分布情况,可知总体预测相对误差小于5%。总体网络预测效果好,预测误差符合精度要求。

由此可以得到在不同时刻点不同的日类型条件下,当室外温度和电采暖负荷信息确定的条件下,得到此时机组的设定温度和设备组合状态分布情况。分析贝叶斯网络中对隐含变量的分布学习情况,得到设备组合状态部分时刻分布情况见图4。

图4 设备组合状态分布Fig.4 State distribution of equipment

从图4可以得到房间大部分时段处于使用空气源热泵设备采暖为高概率状态,少部分时间段使用蓄热式设备概率大于空气源热泵设备状态。其中使用蓄热式设备概率较高状态所处的时间段处于用电低谷时段,此时用户选择采用蓄热式设备供暖,提高用电经济性。

对于隐含变量电采暖设备设定温度,在贝叶斯网络模型搭建的过程中取值为离散变量形式,分为高温、较高温、低温和较低温四个等级,由此得到局部设定温度状态概率分布情况如图5所示。

图5 供暖设定温度概率分布Fig.5 Heating set temperature probabilitydistribution

对图5中局部进行放大并与预测归一化负荷功率对比和分析如图6所示。

图6 供暖设定温度局部概率分布Fig.6 Heating set temperature local probability distribution

根据图6,可以看出电采暖负荷功率较大时,设备设定温度为高温和较高温的概率大于设备设定温度为低温和较低温的概率,同样当电采暖功率负荷较小时,设备设定温度为低温和较低温的概率较大。因此可以说明设备功率变化和设备设定温度的高低是密切相关的。同时采用该网络结构进行预测得到预测结果误差较小,满足要求。

5 结术语

通过贝叶斯网络搭建电采暖负荷预测模型,并通过历史数据的学习进行电采暖负荷的预测,解决了以下关键问题。

(1)通过合理搭建贝叶斯网络结构,通过历史负荷数据的学习实现了电采暖负荷较高精度的预测;

(2)基于贝叶斯网络算法的优点,不仅解决了传统智能算法对不完全数据学习的缺陷,采用概率分布的方式进行负荷预测,同时能够从学习结果以及贝叶斯网络结构内部了解到预测数据的推理过程,通过变量之间的影响和条件依赖关系可以得知导致事件发生形成的各个因素条件概率分布情况,使得网络数据学习不断“白化”。通过贝叶斯网络的数据学习能更有效的挖掘数据内部隐含信息,同时能够挖掘数据中隐含的包含明确物理意义的隐含信息,对提高电采暖负荷预测精度提供了一种新方法和新思路。

猜你喜欢

电采暖贝叶斯负荷
河北玉田:“光伏+电采暖”助力群众清洁温暖过冬
考虑用户舒适度的分散式电采暖调峰优化控制
互动模式下光伏与电采暖蓄热容量优化配置策略
贝叶斯公式及其应用
电采暖与热水采暖对比研究
基于贝叶斯估计的轨道占用识别方法
防止过负荷时距离保护误动新判据
主动降负荷才是正经事
一种基于贝叶斯压缩感知的说话人识别方法
负荷跟踪运行下反应堆一回路控制系统仿真与验证