APP下载

基于径向基函数广义回归网络混合模型的园区短时热负荷预测

2023-03-11王鹏飞卞金露

现代建筑电气 2023年1期
关键词:原始数据径向神经网络

王鹏飞, 卞金露

(海装驻上海地区第二军事代表室, 上海 200129)

0 引 言

在我国排放的温室气体中,50%以上出自发电取暖的能源消费,而根本原因是较低的能源利用效率。冷、热、电三联供机组(Combined Cooling Heating and Power Tri-Generation,CCHP)系统作为一种发展迅速的分布式能源,阶梯式利用燃气产生的热能进行热电联供、冷热电三联供发电,将单一的燃气发电效率从30%~40%提高到70%~80%,表现优越。同时,相比于以往集中供能的能源输配方式,CCHP大大减少了传输过程中的能量损耗。目前,我国对分布式能源系统的使用还处于试点和探索阶段,原则上以“以热定电”确定CCHP的装机容量,允许有条件的机组余电上网,这些政策为推广分布式能源系统提供了助力。

准确的短时热负荷预测为CCHP系统精细化运行控制策略提供了数据支持。目前,几乎所有的CCHP系统的需求分析均以“趋势预测”作为日常的运行控制方式。这种预测在不同预设环境条件下,以用能对象的标准能源需求为计算基础,预测标的多为长期、大区域、大需量的负荷,所以对数据的采集方式、采集频率、采集精度的要求较低,结果多用作定性分析,匹配预设的控制策略。然而实际影响负荷需求的因素复杂多样且相互关联,基于线性回归的数值预测模型的参考价值已日趋降低[1-3]。由于神经网络普遍具有非线性函数的逼近能力,因此成为了非线性时间序列预测的主要工具。本文采用在复杂系统预测中表现出色的神经网络模型,对CCHP系统短时热负荷需求进行预测。

目前,CCHP已成为国内新建能源中心项目的主要形式,在北京、上海、广州等地进行了推广示范,但多以楼宇供能项目示范为主。本文结合国内第一个大型商务区CCHP项目——虹桥商务区核心区域CCHP项目,提出了基于径向基函数广义回归网络(Radial Basis Function Generalized Regression Neural Network,RBFGRNN)模型的短时热负荷预测方法。相比其他的神经网络,如基于反传算法的多层感知器(Back Propagation Neural Network,BPNN)等,径向基函数网络(Radial Basis Function Network,RBFNET)[4-5]具有逼近特性最佳、训练快速、不会陷入局部极小等优点,更适合于短时预测应用。基于径向基函数广义回归网络在径向基函数网络的基础上,引入了Kohonen自组织映射(Kohonen Self-Organizing Mapping,KSOM)对样本进行聚类处理,优化了RBFNET在构建低维高维映射时所需隐含神经元的数目,降低了运算复杂性和单位时间内对运算能力的要求。本文针对短时热负荷,先采用傅里叶系数分解采集数据,建立负荷模型,过滤历史数据中的奇异值,平滑负荷曲线,再将平滑后的数据导入KSOM中进行聚类处理,以平均绝对百分误差(Mean Absolute Percentage Error,MAPE)作为学习评价函数对RBFGRNN的训练结果通过试误法得出最优的样本集合分类,进而获得隐含层与输出层之间的最佳线性权重。试验结果证明了所用方法合理、准确。

1 热负荷建模

观察历史数据的趋势及峰谷特征,采用先以傅里叶系数分解原始数据再重组的方法对热负荷建模[6]。负荷曲线可分解为基值、增量及周期性分量:

L=lbase+lgrowth+lperiodic

(1)

式中:L——热负荷;

lbase——热负荷基值;

lgrowth——热负荷线性增量;

lperiodic——热负荷周期性分量。

式(1)可改写为如下所示的矩阵形式:

L=W·X

(2)

其中:

(3)

(4)

式中:ω0——基波角频率;

b1——基荷;

b2——线性增长率;

b3、…、b2n+1——谐波分量的系数。

所以系数矩阵W为

W=inv(X)·L

(5)

(6)

2 混合模型的学习过程

模型的学习可分为样本数据预处理、网络权重计算及学习结果评价。样本数据预处理包括样本随机排列、数据归一化、样本聚类分析。网络权重计算通过RBFGRNN的训练法则,对训练样本进行维度变换,并寻找高维度模型输入矩阵与模型输出列之间的线性权重。学习结果评价是根据评价函数将测试样本输入模型进行的。若模型学习表现不佳,则重新对训练样本进行竞争聚类,并激活模型的再次学习。混合模型学习流程如图1所示,具体的过程算法将在本文中描述。

图1 混合模型学习流程

2.1 样本的随机排列

通常数据样本是按采集的时间顺序排列的,如果直接送入神经网络进行训练,神经网络将默认该顺序作为一个输入输出映射进行反复记忆训练。训练完成后,这个时间的先后顺序自然也将影响负荷的预测精度。通常在进行训练前,要求样本重新随机化排列[7]。

2.2 数据的归一化

样本中数据的量纲及单位往往是不一致的,这种情况会影响到神经网络模型预测的准确度,并且延长网络训练的时间。为了消除这一影响,需要对样本数据进行归一化处理,通过线性的数值变换,使得每个数据的值都在[0,1]的区间内,且保持与变换前相同的相对方差。常用的归一化方法有Max-Min归一化和Z-score归一化。

(1) Max-Min归一化:

(7)

(2) Z-score归一化:

(8)

其中,xi,norm是归一化后的样本,max(X)、min(X)、μ、σ分别是所有样本中各因素的最大值、最小值、均值及标准差的集合。当训练完成后的神经网络进行预测时,预测值要逆归一化,然后进行误差分析。

2.3 基于Kohonen自组织映射的样本聚类

RBFGRNN利用径向基函数作为核置换方程将输入样本从低维度空间向高维度空间映射,使得不同集合间的线性分割超平面更易被寻得。在进行置换前,需确定样本的最优集合数。本文使用竞争性聚类方法KSOM对训练样本进行聚类,用集合中心以及集合半径来确定置换前径向基函数的中心(Center)及扩散系数(Spread)。KSOM由输入层与竞争层组成。Kohonen自组织映射拓扑图如图2所示,比较输入向量与各初始中心向量的欧几里得距离,确定获胜中心,根据预设的学习率β将获胜中心向量C向输入向量移动。经过反复迭代,各中心向量不再移动或移动距离足够小,即可认为竞争结束,聚类完成[8]。

图2 Kohonen自组织映射拓扑图

2.4 径向基函数广义回归网络

径向基函数广义回归网络的结构拓扑有3层,分别为输入层、隐含层和求和层。径向基函数网络拓扑结构如图3所示。隐含层所包含的神经元由内核函数构成,本文选用高斯置换函数作为内核函数进行输入空间映射:

(9)

式中:xi——第i个样本;

cj——第j个样本集合的中心;

δj——第j个样本集合的扩散系数。

在对原始训练数据通过KSOM进行竞争聚类后,便可确定RBFGRNN隐含层内各隐含神经元的内核方程。

图3 径向基函数网络拓扑结构

从式(10)中可见,若原输入空间为一个m×n的矩阵,m为样本个数,n为每个样本所含的输入因素个数,则经过映射后,输入空间变为一个m×(k+1)的矩阵G,k≪n。

(10)

最后,线性求和层的权重通过Moore-Penrose广义逆矩阵求得[9]:

Y=G·W

(11)

W=(GTG)-1GTY

(12)

相比常见的MLP,RBFGRNN在完成低维向高维置换后,只剩下对线性分割超平面的求解过程,没有反复迭代的多层权重收敛过程,也不会发生由于初始权重选取不佳而导致的权重在收敛过程中陷入局域极小的情况,所以训练速度非常快。

2.5 评价函数

神经网络常用的评价函数为均方差(Mean Square Error,MSE),但是在归一化以后,误差绝对值均小于1,故选用MAPE来作为神经网络的评价函数:

(13)

在使用高斯方程进行高位映射时,需要先对样本进行分类,而样本集合最大半径与集合中心的选取对于预测精度而言是一个妥协的过程。本文采用KSOM进行聚类分析,寻找中心及扩散系数。通过调整最大集合半径的方法比较调整前后的网络训练表现从而迅速确定RBFGRNN最优的隐含层神经元个数。

3 试验及结果

试验流程图如图4所示,原始数据来自虹桥商务区D17地块负荷数据,样本采集时间为试验日0∶00 至次日0∶00,样本采集频率为每5 min一次。试验前,将数据转换为每小时一次。由于缺乏其他相关环境数据,如温度、日照强度、室外干球温度、湿度、风速、空气密度等,本次试验所选取的神经网络输入因素为预测目标热负荷前3 h的历史负荷数据。这3项输入因素隐含了热负荷连续变化的速度及加速度,与被预测目标的变化关联紧密。输入和输出表示为

Input=[Load-3Load-2Load-1]

(14)

Output=[Load]

(15)

图4 试验流程图

在采集的样本中,负荷的峰谷特征明显。某些时刻,计量设备故障、传输信号被干扰、计划外的负荷增减等因素会导致计量数据中出现异常值。D17地块热负荷记录数据如图5所示,图5中30~50 h区间中出现了2个波谷;80~120 h区间中出现负荷恒定的情况。这种非周期性出现的异常值对负荷预测建模的准确性产生了很大的影响。

图5 D17地块热负荷记录数据

由于工作日与节假日负荷曲线差异很大,因此通常将其分开建模。但负荷载体为一混合型商务地块,含有办公楼宇、酒店等,工作日与节假日、周六与周日之间差异也非常明显,且原始数据中奇异值多发生于73~120 h。基于以上原因,本文以1~72 h内的工作日负荷为基准,采用傅里叶系数分解法建立负荷模型,并对奇异的负荷记录进行剥离及插值估算。

D17地块热负荷原始数据及傅里叶模型平滑数据如图6所示。图6显示了经过傅里叶分解建模后的热负荷平滑数据与历史原始数据的对比。通过计算包含基波与前6次谐波的傅里叶负荷模型与原始数据之间的决定系数得到R2=0.794。平滑数据与历史数据的拟合度非常高。利用傅里叶模型的扩展功能,对73~120 h(周四、周五)的热负荷进行插值估算。D17地块热负荷原始数据与傅里叶模型插值估算数据的对比如图7所示。在88~102 h之间的奇异数据(原始数据中的恒定热功率输出而累计热量没有增加)得到了修正。

图6 D17地块热负荷原始数据及傅里叶模型平滑数据

图7 D17地块热负荷原始数据与

通过数据的平滑处理后,75%的样本用作训练样本,剩余25%样本作为测试样本,分别放入神经网络中训练和测试。不同集合最大半径的网络测试表现如图8所示,最后确定的最大集合半径为0.2,其相对应的集合数为99,因此隐含层由99个神经元组成,其逆归一化前的平均绝对误差值为0.040 3%。

图8 不同集合最大半径的网络测试表现

径向基函数广义回归网络测试结果与实际值的对比如图9所示。由图9中可见,测试输出值与实际值负荷曲线近似重合。径向基函数广义回归网络测试误差曲线如图10所示,最大误差为17.841 0 kW,最小误差为6.504×10-4kW。逆归一化后的平均绝对误差值为0.117 4%。

计算预测值与平滑数据之间的相关系数为R=0.989,证明了预测模型是非常可信的。通过对误差的统计分析,大多的概率累加点在正态分布函数变化后的直线上,故可认为误差服从标准随机正态分布。径向基函数广义回归网络预测误差的标准概率分布如图11所示。

图9 径向基函数广义回归网络测试结果与实际值的对比

图10 径向基函数广义回归网络测试误差曲线

图11 径向基函数广义回归网络预测误差的

4 结 语

本文提出的短期负荷预测算法,首先采用傅里叶系数分解方法对负荷重新建模,过滤奇异数据,并估计奇异数据的真实值。然后应用反传网络与径向基函数网络建立负荷预测模型。使用75%的样本数据对神经网络进行训练,剩余25%的数据进行测试。试验结果表明,本文所提出的短期负荷预测算法的预测精度平均绝对百分误差小于0.12%。

负荷需求曲线呈非线性,关联多个影响因素,如温度、日照强度、室外干球温度、湿度、节假日、风速、空气密度等,但同时将其作为输入因素影响了预测模型输入因素的独立性。因此在负荷预测前,通过对负荷影响因素做数值分析,如主成分分析(Principal Component Analysis,PCA)、卡-洛变换(Karhunen-Loeve Transform,KLT)等,消除因素之间的关联性,并对初始输入空间进行筛选及降维处理。虹桥商务区CCHP系统尚处于试运行阶段,所积累的历史负荷需求及环境数据不够多,无法应用成熟的系统化前期数据处理技术,且神经网络对于历史经验数据的学习在外部环境变化时有时效性的问题,过多的历史数据也会造成过学习的问题。如果预测出现较大误差,则说明与此事件类似度高的历史事件没有出现在RBFGRNN的训练样本中。KSOM会将此事件单独成类,并利用RBFGRNN训练快速的优势,迅速地完成学习过程。

本文提出的基于RBFGRNN混合模型的短时热负荷预测方法,克服了相关环境数据缺乏、原始采集数据多奇异值的困难,达到了理想的预测精度,为将来类似的预测项目提供了可靠的借鉴。

猜你喜欢

原始数据径向神经网络
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
浅探径向连接体的圆周运动
RN上一类Kirchhoff型方程径向对称正解的存在性
受特定变化趋势限制的传感器数据处理方法研究
基于PID+前馈的3MN径向锻造机控制系统的研究
神经网络抑制无线通信干扰探究
一类无穷下级整函数的Julia集的径向分布
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用