APP下载

基于PCA-BP神经网络的大型公共建筑能耗预测*

2016-05-27李明海赵明强

现代建筑电气 2016年4期
关键词:预测模型时间序列BP神经网络

李明海, 刘 敏, 赵明强

(西安建筑科技大学 信息与控制工程学院, 陕西 西安 710055)



基于PCA-BP神经网络的大型公共建筑能耗预测*

李明海,刘敏,赵明强

(西安建筑科技大学 信息与控制工程学院, 陕西 西安710055)

摘要:针对大型公共建筑高能耗问题,提出了主成分分析(PCA)与BP神经网络相结合的大型公共建筑能耗预测模型。基于时间序列对历史逐日耗电量进行相关性分析,提取预测点前三天的逐日耗电量,并与前一天日照、温度、相对湿度、风速的平均值进行主成分的浓缩,然后将其作为BP神经网络的输入,从而降低输入变量的维数,简化网络结构。结果表明,较传统的BP网络,大型公共建筑能耗预测模型具有较高的精度和更短的学习时间,但当预测样品数增加时预测误差逐渐增大。

关键词:大型公共建筑; 时间序列; 主成分分析; BP神经网络; 预测模型

0引言

当前,我国建筑能耗占社会总能耗的32%,公共建筑能耗占建筑总能耗的22%[1]。这就需科学分析公共建筑能耗,对于推动建筑节能具有重要的意义。目前,国内外研究者结合主成分分析(Principle Component Analysis,PCA)与BP神经网络对大型公共建筑能耗预测的研究较少[2-5]。

影响建筑能耗的因素多,它们之间存在相关性,并且与建筑能耗之间存在非线性的关系。BP神经网络具有很强的非线性拟合能力,其预测结果具有可靠性与可信性[6-8]。如果将这些影响因素都作为BP神经网络的输入,会造成网络结构复杂、训练速度慢等缺陷。本文建立PCA-BP网络的能耗预测模型,将浓缩的主要因子作为其输入变量,并进行了试验。

1PCA原理

PCA是一种多元统计分析方法[9],从原始变量中浓缩少数几个互不相关的主要成分,使其尽可能多地解释原始变量的信息,以达到降维的目的,其一般的数学模型[10]如下:

(1)

(1) 将原始数据标准化,以消除变量在数量级等方面存在的差异。假设有n个样品,每个样品有k项观测指标,则样本矩阵为

(2)

(3)

根据式(3)对样本矩阵X进行标准化,得到式(4)。

(4)

(2) 根据简单相关系数矩阵R,求出其特征值λ1≥λ2≥…≥λk和相应的单位特征向量b1,b2,…,bk。

(3) 确定主成分。一般特征值大于1,累计贡献率在75%~95%时对应的前p个指标作为主成分[11]。特征值小于1,说明原始变量的平均解释力度大于主成分的解释力度,累计贡献率达75%以上,表明这些主成分包含了原始变量所具有的主要信息[9],其计算公式为

(5)

则第i个主成分为

(6)

2能耗预测因子的选择及主成分提取

2.1预测因子的选择

以西安某高校综合楼建筑为研究对象,其建筑面积为28 665 m2。由于水、电、气、暖、动力结算最终均以电量为依据,故选取耗电量作为建筑能耗的评价指标。该建筑2013年部分检测数据如表1所示。首先采用SPSS数据分析软件的时间序列模块,对测试点之前的m个逐日耗电量进行相关性分析,根据自相关系数来确定m。历史能耗的自相关系数如表2所示。由表2可知,当自相关系数降至1-e-6时,其滞后为3,因此该能耗预测模型的样本输入维数为7。

表12013年部分检测数据

日期平均温度/℃平均相对湿度/%平均日照/(MJ/m2)平均风速/(m/s)逐日耗电量/kWh5月7日19.56920.122.214065月8日23.14923.461.614155月9日24.04225.282.814115月10日22.15121.011.514065月11日22.45324.181.414095月12日24.64924.401.814135月13日24.25718.281.814175月14日18.69502.114155月15日19.2908.473.214075月16日18.0892.413.214085月17日19.08811.831.214185月18日20.64427.784.114165月19日19.55921.781.114075月20日18.86910.861.013985月21日21.26823.111.61405

表2历史能耗的自相关系数

延迟/d自相关系数标准误差Box-Ljung统计数值自由度显著性10.8630.08896.1431020.7240.088164.3892030.6880.087209.6533040.4500.087236.3974050.3120.087249.4095060.1750.086253.5246070.1640.086257.1617080.1530.086260.36380

为降低输入变量的维数,减少信息重叠,提高网络的泛化性能,采用PCA对原始变量进行压缩,导出几个主要分量,作为BP 神经网络的输入,以便对能耗进一步预测。

2.2主成分提取

利用SPSS 22统计软件对输入变量的主成分分析。

输入变量相关系数如表3所示。由表3可见,变量之间存在相关关系,有信息上的重叠,故有必要进行PCA。

各成分的方差贡献率和累计贡献率如表4所示。由表4可见,前3个主成分的特征根大于1,且累积方差贡献率为82.627%,表明这些主成分包括了全部指标的主要信息,因此只考虑前3个因子。

表3输入变量相关系数

相关系数日均温度日均湿度日总辐射日均风速电量滞后1d电量滞后2d电量滞后3d日均温度1.000-0.0700.5910.3290.2950.2510.211日均湿度-0.0701.000-0.482-0.0910.1960.1650.125日总辐射0.591-0.4821.0000.0550.0470.0620.077日均风速0.329-0.0910.0551.0000.0980.052-0.006电量滞后1d0.2950.1960.0470.0981.0000.9090.808电量滞后2d0.2510.1650.0620.0520.9091.0000.893电量滞后3d0.2110.1250.077-0.0060.8080.8931.000

表4各成分的方差贡献率和累计贡献率

组件初始特征值总计方差贡献率/%累积贡献率/%提取载荷平方和总计方差贡献率/%累积贡献率/%12.91241.59741.5972.91241.59741.59721.83726.24567.8421.83726.24567.84231.03514.78482.6271.03514.78482.62740.74610.66293.289———50.2283.25296.541———60.1762.51899.059———70.0660.941100.000———

主成分系数如表5所示。由表5可计算各个主成分Yi(i=1,2,3)。

表5主成分系数

相关系数组件1组件2组件3电量滞后2d0.956-0.152-0.088电量滞后1d0.938-0.137-0.003电量滞后3d0.911-0.148-0.173日总辐射0.1920.854-0.298日均温度0.4490.6740.258日均湿度0.166-0.6730.394日均风速0.1460.3700.828

3公共建筑PCA-BP预测模型

利用MATLAB软件,将标准化处理后的原始输入样本和经PCA后得到的新样本作为BP 神经网络的输入,其中2013年1月1日~2013年5月6日的126组逐日数据作为训练数据,2013年5月7日~2013年6月30日的55组逐日数据作为检测数据,当前馈网络隐含层神经元个数为15,相对误差较小,故可确定其结构为7-15-1,同样可确定PCA-BP 网络结构为3-7-1。不同神经元时BP网格、PCA-BP网络预测相对误差分别如图1、图2所示。隐含层采用tansig函数,输出层采用logsig函数,目标误差为e-3,最大训练步数为1 000,学习率为0.01,训练算法采用L-M算法。

图1 不同神经元时BP网络预测相对误差

图2 不同神经元时PCA-BP网络预测相对误差

BP网络、PCA-BP网络分别经过1 000次、300次迭代后收敛,预测值与真实值的关系如图3所示。由图3可见,除个别点外,PCA-BP预测值与真实值很接近,BP网络预测效果处于波动状态,在耗电量突变的瞬间,BP网络预测能力稍好。前30个样品对应的耗电量稳定在1 400 kWh/d,后30个样品对应的时间因在6月,耗电量增加1倍,符合实际情况。

图3 预测值与真实值的关系

为进一步了解预测效果,本文采用平均相对误差对网络的泛化能力进行评价,计算式为

(7)

式中:ci、di——第i个样品的预测值与真实值;

n——样品个数。

BP网络、PCA-BP网络预测的平均相对误差如表6所示。由表6可见,PCA-BP网络的预测精度很高,平均相对误差在1%左右;5月29日前后由于季节性的影响,造成较大的相对误差,而BP网络预测的平均相对误差最大为42.98%。因此,随着预测样品数量的增加,BP网络、PCA-BP网络的预测误差逐渐增大。

表6预测的平均相对误差

日期BP网络PCA-BP网络5月7日~5月17日0.08150.00925月18日~5月28日0.09140.00985月29日~6月8日0.31680.08615月9日~5月19日0.42150.01015月20日~5月30日0.42980.0116

4结语

(1) PCA-BP能耗预测模型具有较高的精度,平均相对误差在1%左右,而BP网络的预测效果呈现波动性,最大平均相对误差达42.98%。改进后的PCA-BP网络具有更短的学习时间,在300次迭代后收敛,而传统的BP网络需要1 000次迭代后才收敛。

(2) 两个模型预测误差随着预测样品数的增加而增大,一方面,受气候季节性影响,模型样本范围太大时,导致误差增大,预测精度减小;另一方面,预测本身就是一个经验性判断过程,时间序列样本前后突变,精度必然会降低。

(3) 为进一步研究公共建筑能耗,要对能源进行科学合理的规划与布局,扩大测试样本数据的规模,尽量采集全年的能耗数据,以克服能耗值在季节更替有较大突变时PCA-BP网络拟合能力略微低于BP网络的缺陷。

参考文献

[1]李百战,张宇,丁勇.重庆市公共建筑能源管理现状分析[J].暖通空调,2010,40(9):112-117.

[2]DONG B,CHENG C,LEE S E.Applying support vector machines to predict building energy consumption in tropical region[J].Energy and Buildings,2005(37):543-553.

[3]YANG J,RIVARD H,ZMEUREANU R.On-line building energy prediction using adaptive artificial neural networks[J].Energy and Buildings,2005,37(12):1250-1259.

[4]李爱旗,白雪莲.居住建筑能耗预测分析方法的研究[J].建筑科学,2007(8):90-94.

[5]夏栋良,龚延风.基于多规则实时学习组合型BP神经网络的城市建筑能耗预测模型[J].建筑科学,2008,24(6):90-94.

[6]SIMON HAYKIN.神经网络原理[M].叶世伟,史忠植,译.北京:机械工业出版社,2004.

[7]MARTIN HAGAN T,HOWARD DEMUTH B,MARK BEALE H,et al.神经网络设计[M].戴葵,译.北京:机械工业出版社,2002.

[8]蒋宗礼.人工神经网络导论[M].北京:高等教育出版社,2001.

[9]张文彤,董伟.SPSS统计分析高级教程[M].北京:高等教育出版社,2013.

[10]薛薇.SPSS统计分析方法及应用[M].北京:电子工业出版社,2004.

[11]周松林,茆美琴,苏建徽.基于主成分分析与人工神经网络的风电功率预测[J].电网技术,2011,35(9):128-132.

Energy Consumption Prediction of Large-scale Public Building Based on PCA-BP Neural Network

LIMinghai,LIUMin,ZHAOMingqiang

(Information and Control Engineering Institute, Xi’an University of Architecture and Technology, Xi’an 710055, China)

Abstract:Aiming at the problem of high energy consumption in large-scale public building,this paper put forward an energy consumption prediction model according to the principal component analysis(PCA) and BP neural network.Based on historical daily power consumption’s correlation analysis of time series,the daily power consumption which came from three days before the prediction point was extracted and the previous day’s average values of sunshine,temperature,relative humidity,wind speed were condensed in the light of PCA.The results were used as the input of BP neural network,by this way the dimensions of input variables can be reduced and the network structure can be simplified.The experimental results show that this model has a high accuracy and shorter learning time compared with the traditional BP network.However,the prediction error of this prediction model will enlarge with the increasing of prediction samples.

Key words:large-scale public building; time series; principal component analysis; BP neural network; prediction model

收稿日期:2015-08-12

DOI:10.16618/j.cnki.1674-8417.2016.04.002

中图分类号:TU 201.5

文献标志码:A

文章编号:1674-8417(2016)04-0005-05

*基金项目:西安市城乡建设委员会建设科技项目(SJW2014011)

刘敏(1990—),男,硕士研究生,研究方向为建筑智能化与建筑节能。

赵明强(1990—),男,硕士研究生,研究方向为智能建筑与楼宇自动化。

猜你喜欢

预测模型时间序列BP神经网络
基于神经网络的北京市房价预测研究
中国石化J分公司油气开发投资分析与预测模型研究
基于时间序列的我国人均GDP分析与预测
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 
基于线性散列索引的时间序列查询方法研究
BP神经网络算法在数值预报产品释用中的应用
基于IOWHA法的物流需求组合改善与预测模型构建
基于组合模型的能源需求预测
基于预测模型加扰动控制的最大功率点跟踪研究