中央空调系统的数据分析
2018-04-11许珊珊
许珊珊 谭 兵 白 强 白 静
(西南石油大学理学院,四川 成都 610500)
1 引言
随着全球气候的变迁和空调技术的发展,越来越多的大型建筑物利用中央空调系统来实现室内温度和湿度的调节控制。如何围绕智慧城市建设实现中央空调系统的智能控制与节能,这是智慧城市建设中的重要研究课题之一。中央空调系统的优化控制策略研究也是实际中的一个很有普遍意义的重要课题,本文根据第五届泰迪杯数据挖掘挑战赛A题做相关分析。本次建模目标是利用热带地区某城市实际采集得到的一套中央空调系统数据,分析挖掘出系统中变量之间的相关关系,为设计一个中央空调的最优控制策略模型做准备。
2 符号说明
3 数据预处理
问题给出的数据是根据外部环境条件和经验由人工设定的控制策略采集得到的,由于某些时候受外部环境、其他电器设备、人员流动等因素的影响,可能会出现采集数据有些不稳定或个别的异常数据。通过对原始数据的观察分析,得知有部分数据是缺失的(通过挖掘数据的特征及规律,我们发现缺失日期有九天,缺少时间如下:10月29-31日,11月26-30日,12月4日),为了保证模型的有效性,本文对这部分数据进行分析,发现其对后续的处理分析不存在太大的影响,故忽略这部分缺失数据。对于异常数据,本文采用统计学中的3δ原则,将[μ-3δ,μ+3δ]之外的数据去掉。通过预处理,本文共去掉320条数据,约占原始数据的0.4%,剩余的88520条数据用于具体建模分析。
4 基于空调工作原理的变量关系建模
为了得到冷却负载、系统效率、耗电量与可控变量和不可控变量之间的关系模型,本文对可控变量与不可控变量数据进行深入挖掘分析,结合中央空调的工作原理,将因系统运行产生的不可控变量由可控变量表示,通过递推的思想可以计算得到冷却负载、系统总耗能以及系统效率。本文基于空调工作原理的变量关系建模总过程如图1所示。
图1 变量关系建模流程图
4.1 不可控变量与可控变量间的关系建模
4.1.1基于回归拟合的变量关系建模
回归分析是应用极其广泛的一种数据分析方法,有文献采用多元非线性函数表达式来描述中央空调系统的工作性能精确度比较高,因此本文利用多元回归对数据进行分析拟合。
冷水泵转速→冷水泵功率。
为了分析冷水泵的功率与转速的关系函数用MATLAB对数据进行了绘图分析,发现并没有明显的多项式关系,因多个冷水泵的开关情况不一致,同时在数据中冷水泵3和4基本没有开启,因此我们区分冷水泵的单双开对数据更深入地分析,发现其单开时明显呈现线性关系,拟合结果如图2,图3所示。
图2 冷水泵1单开时二次拟合
图3 冷水泵2单开时二次拟合
由图3可以看出,冷水泵功率与转速近似二次关系,其采用二次拟合具有很好的效果。冷水泵1单开时,其拟合误差均值为0,标准差为0.1105,相关系数为0.9919;冷水泵2单开时,其拟合误差均值为0,标准差为0.2623,相关系数为0.9406,通过相关系数可以发现冷水泵转速对冷水泵功率的二次拟合效果很好。
采用同样的方法对冷水泵1和冷水泵2同时打开时进行二次拟合分析,其拟合误差均值为0,标准差为0.6901,相关系数为0.9316,拟合结果如图4所示。
图4 冷水泵全开时二次拟合冷水泵功率
综上所述,利用冷水泵转速对冷水泵功率进行二次拟合的表达式如下:
采用与前文类似的分析方法,在区分单双开的情况下,用冷凝水泵转速对冷凝水泵功率进行二次拟合,拟合相关系数均在0.97以上,其拟合表达式如下:
冷却塔风扇转速→冷却塔功率。
用前文同样的方法,对冷却塔转速与冷却塔功率的关系进行分析,采用二次拟合,拟合相关系数均在0.99以上,其拟合表达式如下:
冷水泵转速+冷水泵功率→流入流出冷却装置的水流速度。
查阅文献可知,流入流出冷却装置的水流速度与冷水泵转速和冷水泵功率相关性较强。因此,本文利用冷水泵转速和冷水泵功率的数据,对流入流出冷却装置的水流速度采用三元二次拟合,在区分冷却装置开关情况时,其单开时的拟合图像如图5,图6所示。
图5 冷却装置1单开时
图6 冷却装置2单开时
拟合结果数据显示,当冷却装置1状态为1且冷却装置2状态为0时,其拟合误差的标准差约占原数据均值的4%;当冷却装置2状态为1且冷却装置1状态为0时,其拟合误差的标准差占原数据均值的6%,拟合效果均很好。
当冷却装置1单开时拟合表达式为:
chwsfhdr=-728.1527-2.3493chwp1kw+353.7411chwp2kw+98.5062chwp_pc+0.4273chwp1kw2-9.3178chwp2kw·chwp1kw-3.5260chwp_pc·chwp1kw+30.3244chwp2kw2+21.7568chwp_pc·chwp2kw+3.3964chwp_pc2
当冷却装置2单开时拟合表达式为:
chwsfhdr=-61.4846+0.5397chwp1kw+100.2626chwp2kw+209.1115chwp_pc+0.1123chwp1kw2-2.1156chwp2kw·chwp1kw-2.9787chwp_pc·chwp1kw+2.4933chwp2kw2+10.4597chwp_pc·chwp2kw+6.0509chwp_pc2
同理,采用三元二次拟合对冷却装置1和冷却装置2同时打开的情况进行拟合,得到如图7拟合结果。
图7 冷却装置1和2双开时
当冷却装置1状态为1且冷却装置2状态1时,其拟合误差的标准差占原数据均值的4%,说明拟合程度很好。其拟合表达式为:
chwsfhdr=-988.1381+17.7756chwp1kw-353.3532chwp2kw+315.3410chwp_pc-0.1450chwp1kw2-10.6578chwp2kw·chwp1kw+9.2127chwp_pc·chwp1kw-77.6286chwp2kw2+264.3390chwp_pc·chwp2kw-170.3371chwp_pc2
4.1.2基于改进的BP神经网络建模
在对空调变量之间关系的分析过程中,发现很多变量关系较复杂,并不能用简单的多项式拟合来进行处理,查阅相关文献可知,BP神经网络(BP Neural Networks)具有非线性映射能力,自学习、自适应的能力以及数据融合能力,适用于多变量系统。此外,对于独立的预测系统来讲,输入参数后可以满足神经网络预测的实施要求,但是并没有一个实际运行过程的误差反馈机制,因此本文把控制误差作为一个反馈参数作为神经网络的输入参数之一。
(1)冷水泵转速→冷却装置温差。
查阅相关文献可知,流入流出冷却装置的水温差受多种因素的影响,且有些变量是不能直接测得的,参数的确定比较困难。因此本文利用改进后的神经网络来拟合冷水泵转速和流入流出冷却装置的温差之间的关系。其中输入参数为冷水泵转速和误差反馈结果,输出参数为流入流出冷却装置的温差,训练后的结果如图8所示。
图8 反馈误差加入后的神经网络训练结果
从图8可以看出,冷却装置温差的神经网络模型的输出和系统的实际输出拟合程度很好,平均误差为1.1701×10-5,标准差为0.012622,完全符合空调系统预测的应用需求。
(2)冷水泵转速→冷却装置功率。
在进行冷水泵转速和冷却装置功率的分析挖掘中,并不能发现明显的变化规律,即使区分单双开,冷水泵转速同样没法直接拟合冷却装置功率,故本文采用BP神经网络对冷却装置功率进行拟合分析,其训练结果如图9所示。
图9 冷水泵转速训练冷却装置功率的结果
由训练结果可知,用冷水泵转速训练冷却装置功率时,它的平均误差为0.003 5,标准差为1.364,训练结果是相当不错。
4.2 冷却负载的综合模型
空调系统冷却负载的影响因素是多元的,主要的影响因素包括:流入流出冷却装置的水流速度、流入冷却装置的水温和流出冷却装置的水温,我们将这些变量作为拟合参数对冷却负载进行二次拟合,得到图10结果。
图10 冷却负载的拟合结果
拟合结果显示,所有数据拟合后的值与原观测值几乎完全重合,拟合的R-squared为0.999 8,说明拟合效果非常好(R-squared越接近于1表示拟合效果越好)。由此得出冷却负载的拟合公式为:
preloadsys=0.075·chwsfhdr
(chwrhdr-chwshdr)+0.0456
(1)
4.3 系统总耗电量的关系模型
中央空调系统主要的电能消耗包括:冷却装置的电能消耗、冷水泵的电能消耗、冷凝水泵的电能消耗和冷却塔的电能消耗,根据中央空调系统各部门的运转关系,总耗电量应为各装置功率消耗之和,其具体的计算公式如下:
(2)
其中:systotpower为总耗电量;chikw为冷却装置i的功率(i=1,2,3);chwpjkw为冷水泵j的功率(j=1,2,3,4);cwpmkw为冷凝水泵m的功率(m=1,2,3);ctnkw为冷却塔n的功率(n=1,2)。
根据题目附件1所给的数据结合公式(2)运用Matlab编程,得到总耗电量的拟合结果如图11所示。
图11 系统总耗电量的计算结果
由上图可以得到,拟合均值为-0.23126,标准差为3.5976,拟合程度很好,可以准确地反映出功率和总耗电量的关系。
4.4 系统效率的关系模型
根据常识可以得到系统效率的计算公式如下:
(3)
其中,effsys表示系统效率,systotpower为总耗电量,loadsys系统的冷却负载,根据此公式运用Matlab编程,得到系统效率的拟合结果如图12所示。
图12 系统效率的计算结果
根据图12拟合结果显示,从误差均值和标准差来看,拟合结果满足实际要求。
4.5 模型检验
4.5.1冷却负载的误差检验
已知环境变量,冷水泵的转速和状态、冷凝水泵的转速和状态以及冷却塔的转速和状态,其余不可控变量均为未知量,根据前文求得的可控变量与不可控变量之间的关系,拟合得到六个不可控变量值(四大功率,冷却装置温差,冷却装置流速),最后再用公式(1)计算冷却负载,冷却负载误差检验结果如图13所示。
图13 冷却负载拟合检验
图14 冷却负载误差
拟合误差的标准差是9.4258,误差图如图14所示,由误差图可以看出,冷却负载的误差范围是[-20,20],且绝大多数误差集中在[-5,5]之间,因此本文的模型拟合效果是理想的。
4.5.2总耗电量的误差检验
根据不可控变量与可控变量间的关系模型,由转速可以拟合得到对应的功率,再根据总耗电量的计算公式就可以计算得到总耗电量,图15展示了总耗电量拟合前后的对比和误差。
图15 总耗电量拟合检验
图16 总耗电量误差
总耗电量拟合误差的均值为0,标准差为3.83,误差图如图16所示,由误差图可以发现,总耗电量的误差范围是[-20,20],且绝大多数误差集中在[-5,5]之间。说明了我们的模型拟合效果是理想的。
4.5.3系统效率的误差检验
根据前文拟合模型,我们已经计算出了冷却负载和总耗电量,根据系统效率的计算公式,我们做出了拟合前后的系统效率对比图和系统效率误差图如图17所示。
图17 系统效率检验
图18 系统效率误差
系统效率误差的均值为0,标准差为0.0098,误差图如图18所示,由系统效率误差图可以发现,绝大多数误差在[-0.02,0.02]这个范围内波动,说明模型拟合效果很好。
5 结论与展望
本文基于空调的原理建立了相应的数学模型,结合多项式拟合及神经网络训练分析各变量之间的关系,得到的拟合效果很好。为后续对最优控制策略建模做了很好的准备,在后续工作中,我们将分别对中央空调系统的三种最优节能控制策略进行研究。以求达到真正的控制节能目的。
[1] BdRace数睿思_数据挖掘平台,第五届泰迪杯数据挖掘挑战赛赛题[EB/OL].http://www.tipdm.org/bdrace/jingsa/20161227/1030.html#sHref.
[2] 张昌,王福林,吉田治典.建筑设备系统最优化运行技术[J].暖通空调,2010,40(3):73-78.
[3] 钱丹浩,刘萍萍.PLC在中央空调变频节能系统中的应用[J].自动化博览,2006,(04):42-44.
[4] 李绵升.基于粒子群与控制误差回馈的BP神经网络冷负荷预测及动态目标控制[D].广州:华南理工大学,2012.
[5] 蒋红梅,任庆昌,冯增喜.中央空调冷冻水系统优化控制研究[J].吉林建筑工程学院学报,2012,(06):53-56.