APP下载

基于BAS数据挖掘的空调运行节能优化

2016-12-20包仁标马小军

现代建筑电气 2016年8期
关键词:档案馆数据挖掘聚类

包仁标, 马小军, 张 超

(南京工业大学 电气工程与控制科学学院, 江苏 南京 211816)



基于BAS数据挖掘的空调运行节能优化

包仁标, 马小军, 张 超

(南京工业大学 电气工程与控制科学学院, 江苏 南京 211816)

运用数据挖掘技术中的聚类分析方法对楼宇自控系统(BAS)存储的设备运行数据进行分析。结合南京某档案馆实例,采用数据分析软件SPSS对暖通空调(HVAC)的运行数据进行了聚类分析,得出年采样周期时间段内设备运行的聚类结果,并根据实际的能耗数据,提出了合理的优化策略,以指导物业人员调整设备运行时间,降低了建筑能耗。

楼宇自控系统; 数据挖掘; 聚类分析; 空调机组; 节能

0 引 言

近年来,由于计算机网络技术和传感器的发展,楼宇自控系统(Building Automation System,BAS)得到了飞速的发展,系统能测量的物理量越来越多,精度也越来越高,得到的数据也越来越多。在建筑全生命周期中,BAS数据存储和交换的最终目的是更高效、便捷地使用数据,分析存储和获得数据,为绿色建筑的分析、能耗降低提供数据支撑。

本文针对BAS存储的暖通空调(Heating Ventilation Air Conditioning,HVAC)系统的设备运行数据,运用大数据挖掘软件SPSS对其进行挖掘分析,通过基于距离的K-means聚类算法进行聚类分析,再结合实际的能耗运行数据与聚类分析结果,提出设备运行节能优化策略。

1 数据挖掘技术

BAS存储大量的建筑运行数据,但由于缺少更深层次的分析大量数据的工具,导致这些数据的利用率不是很高。数据挖掘技术提供了一种很好的手段,可发现这些大量数据中潜在的信息,为降低建筑能耗提供支持。

BAS存储的大量数据使用数据挖掘技术进行分析,可以分为数据发现、数据分区、知识发现、后期挖掘4个阶段[1]。BAS中应用数据挖掘技术的框架体系如图1所示。

(1) 数据发现。主要有两项任务,分别是数据预处理和数据可视化[2]。数据预处理在专业知识的发掘中是必要的步骤,占整个数据挖掘技术的80%,包括数据整理、数据传输、数据简化。数据可视化在早期的数据挖掘过程中具有重要作用,帮助用户直观地了解数据。

(2) 数据分区。大多数BAS是动态的和内部相关的,因此对采集整理后的数据进行划分就显得尤为重要。在不同的运行条件下,变量的值和变量之间的关系可能非常抽象,挖掘整个BAS系统中的数据就可能带来重要数据丢失的问题。依据BAS数据固有的特征将其划分成不同的子集,然后挖掘出每个独立的子集中有效的专业知识,数据的分区应主要依赖于系统中数据固有的特征,包含尽可能少的专业知识,才能充分利用数据挖掘技术在基础的数据发现中的优势[3]。把握数据固有的特征是非常棘手的问题,可以采用假设试验和聚类分析。

图1 BAS中应用数据挖掘技术的框架体系

(3) 知识发现。在完成数据挖掘的前两个阶段后,知识发现才是数据挖掘的真正过程。目前,已经存在许多数据挖掘技术,同时新的数据挖掘技术也在产生,如何选择合适的数据挖掘技术取决于考虑的问题及数据的专业领域。知识发现可以是类、决策树以及关联规则等,可以用来开发预测模型、检测和诊断异常以及开发优化策略。相对于监督数据挖掘技术,非监督数据挖掘技术更易从大量的BAS数据中发现未知的知识。在非监督数据挖掘技术中,关联规则挖掘(Association Rule Mining,ARM)已是普遍使用的一种,尤其在零售业、市场以及医疗等领域。在建筑业中,ARM正被逐步推广,相关性规则可以判断建筑中设备运行的非典型或非常规的条件。采用ARM处理BAS系统中的数据也存在两种主要的障碍:一是大多数的ARM算法只能处理分类好的数据;二是ARM常常会产生大量的规则,选择有用的规则有巨大的挑战及耗费时间。

(4) 后期挖掘。后期的数据挖掘包含选择、阐释和使用,需要分析人员依据前期的挖掘结果进行不断的分析改进,最终运用到工程项目中。

2 数据分析处理

2.1 项目概况

南京某档案馆用于存放当地的史籍资料和档案资料,属于甲级档案馆,总建筑面积为40 372 m2,地下2层,地上9层,建筑高度为37.6 m,属于一类高层建筑。-2F平时为汽车库、设备用房和档案馆职工餐厅,战时在汽车库内设置二等人员掩敝所;-1F为展厅、报告厅、设备用房及自行车库;1F为公众服务大厅、政府信息公开服务中心、方志馆阅览区及配套附属用房;2F为档案馆阅览区及培训中心;3F~6F为档案库区用房;7F为方志馆行政办公用房;8F为档案馆业务技术用房;9F为档案馆行政办公用房。空调冷热源采用螺杆式冷水机组和螺杆式地源热泵机组,设置在-2F,同时在-2F设置消防泵房、生活泵房、生活水箱和消防水池,在-1F设置成套式10/0.4 kV变配电房。

2.2 数据预处理

该档案馆项目中,BAS监控的设备主要为新风机组、空调机组、温/湿度传感器、液位传感器等,监测的数据主要为藏书库房内的温度/湿度,HVAC系统中的压差,供配电系统中的电压、电流、电能以及-1F会议室内的CO2浓度等。这些参数的测量方法并不复杂,精度要求也不是很高,但是由于测量环境的差异,对传感器等数据采集装置的要求存在很大的差异[4]。部分系统的监测数据则来源于设施自身所集成的监测装置,如冷冻机组、冷水机组、地源热泵、水源热泵等自带的专业监控系统,而HVAC系统中的水流量、送风量等数据也可通过系统自带的传感器测量得到。为了降低绿色智能建筑的建造与运维成本,需要不同设备制造商与智能化系统集成商之间紧密协作,实现信息的交互与共享。

依据建筑特点及人员活动情况,选择具有代表性的4组样本数据,分别来源于办公区域、公共大厅及库房。根据现场工作条件获得设备运行时间分布曲线,如图2所示。

图2 运行时间分布曲线

由图2可见,5月~10月期间是空调制冷系统功耗最大的阶段。

2.3 数据聚类计算

利用数据挖掘技术中的聚类分析方法对数据进行分析处理。聚类分析的方法主要有[5]划分方法、层次方法、基于模型的算法、基于网格的方法、基于密度的算法。

依据数据数量和直观的分布效果,采用划分方法中的K-means算法对数据进行分析。因为K-means算法具有如下优势[6]:对系统内存占用少,计算量较小,处理速度快;以较高的效率处理较大规模的数据,并且具有可伸缩性;时间的复杂度可以近似拟合为线性,而且适合挖掘大规模数据集。

K-means算法流程如图3所示。

图3 K-means算法流程

由图3可见,k个初始聚类中心点的选取对聚类结果具有较大的影响,因为在K-means算法中是随机地选取任意k个点作为初始聚类中心。在该算法中,一次迭代把每一个数据对象分到离其最近的聚类中心所在类,这个过程的时间复杂度为O(nkd),其中n为总的数据对象个数,d为数据对象的维数;新的分类产生后需要计算新的聚类中心,这个过程的时间复杂度为O(nd)。因此,该算法一次迭代需要的总时间复杂度为O(nkd)。

K-means算法最大的缺点是需要在分类前预估分类的数据。由于HVAC系统的制冷系统随着季节温度变化和办公场所人员流动情况,易于事先预估分类数目。

利用K-means算法对数据进行处理,计算得到每台机组的均值、标准差、方差。由每组设备运行时间的标准差可以看出,标准差数据均较大,说明设备运行的时间数据的离散性比较大,在归类时会影响类别的预估,因此采用Z分数法对数据进行标准化处理,使之符合标准正态分布。

在预估数据分类时,结合季节因素,可以分别假定分类数n=3和n=4,则分别得到两种分类结果。当n=3时,最终聚类中心结果如图4所示。聚类分类结果如图5所示。

图4 最终聚类中心结果

图5 聚类分析结果

2.4 聚类结果分析

当分类数n=4时,10月、11月的分类质量之间相差较大,但仍归为第一类,8月、9月的分类质量相同,但是两者分类结果属于不同的类别,产生了矛盾,故舍去。当分类数n=3时,在分类出的第一类中,10月的分类质量与第一类中的数值仍然有差异,但是差值为0.252 33,可以达到“类内距离尽可能小,类间距离尽可能大”的要求。因此,将HVAC系统中制冷相关设备的数据运行情况分类为三类,其中1月、2月、3月、4月、5月、6月、10月、11月、12月为第一类,7月、8月为第二类,9月为第三类,每一类对应于一种空调机组运行模式。

BAS系统对上述设备制冷区域的记录温度经过初步计算,得到每月的平均温度,如表1所示。

2.5 优化策略

先依据聚类的结果将空调机组运行模式粗略分为三类,然后再根据去年实际的运行数据再对每一类运行模式进行微调,最后对HVAC系统空间数据挖掘中数据预处理探讨在制冷条件下运行时提出如下建议:

表1 月平均温度 ℃

(1) 机组负荷的高峰在7月和8月,设备在运行时间上近似,因此对于温度阈值的设定可以作为后期设备运行控制的参考。

(2) 不同分布格局的库房设定不同的温度阈值,在建筑内部没有窗户的库房,可以提高温度设定阈值;档案馆北侧库房由于窗墙比较大,因外部的太阳辐射,库房内的温度影响比较明显,因此可结合库房使用情况设定温度阈值。

(3) 档案馆的办公时间具有明显的周期性,因此可以在周末减少设备运行数量。

(4) 在第一类中,依据南京历史气象数据,5月、6月份温度偏高,然而制冷设备的开行时间要求不高,因此在办公区域可以采取控制太阳直射光照射面积、增加开窗时间或者采用低功耗的风扇,来降低空调设备的运行。

(5) 在第三类中,只有9月数据归于该类,设备运行时间较长,由于此时处于档案馆搬迁阶段,且在为10月开馆做准备工作,室内的人员流动及库房、办公等区域的保温环境较差,因此在设定温度阈值不变的情况下增加设备的运行时间。

3 结 语

本文利用存储的电能数据和总的年能耗数据,分析出年采样周期中HVAC系统中冷水机组、冷冻水泵、冷却水泵设备的电能消耗趋势,总结出设备运行的时间趋势,并结合实测的温度,提出切实可行的设备运行改进方案,这对于降低建筑能耗有一定的意义。

[1] FAN C,XIAO F,YAN C C.A framework for knowledge discovery in massive building automation data and its application in building diagnostics[J].Automation in Construction,2015(50):81-90.

[2] 闫永惠.空间数据挖掘中数据预处理探讨[C]∥数字测绘与GIS技术应用研讨交流会论文集,2008:44-51.

[3] XIAO F,FAN C.Data mining in building automation system for improving building operational performance[J].Energy and Buildings,2014,75(11):109-118.

[4] MA Z J,WANG S W,XU X H,et al.A supercisory control strategy for building cooling water systems for practical and real time applications[J].Energy Construction & Management,2008,49(8):2324-2336.

[5] 陆云.聚类分析数据挖掘方法的研究与运用[D].合肥:安徽大学,2007.

[6] 吴文亮.聚类分析中K-均值与K-中心点算法的研究[D].广州:华南理工大学,2011.

[7] 梁文华,刘庆.智能建筑系统集成设计之综述[J].计算机应用与软件,2007,24(4):182-183.

[8] 符长青.绿色建筑与智能建筑的融合发展[J].智能建筑与城市信息,2012(7):24-27.

[9] ISIKDAG U,UNDERWOOD J,AOUAD G.An investigation into the applicability of building information models in geospatial environment in support of site selection and fire response management process[J].Advanced Engineering Informatics,2008,22(4):504-519.

[10] LEE J K,LEE J,JEONG Y S,et al.Development of space database for automated building design review systems[J].Automation in Construction,2012(24): 203-212.

[11] 石超刚.基于可持续发展的绿色建筑评价体系研究[D].长沙:湖南大学,2007.

[12] 葛松培,孙红三.建筑业信息技术应用新概念——BIM[C]∥第十二届全国工程建设计算机应用学术会议论文集,2004:332-336.

[13] 秦军.建筑设计阶段的BIM应用[J].建筑技艺,2011(S1):160-163.

[14] 贺灵童.BIM在全球的应用现状[J].工程质量,2013,31(3):12-19.

[15] KIM C M,SON H,KIM C W.Automated construction progress measurement using a 4D building information model and 3D data[J].Automation in Construction,2013,31:75-82.

[16] 陈宇军,刘玉龙.BIM协同设计的现状及未来[J].中国建设信息,2010(4):26-29.

[17] 王珺.BIM理念及BIM软件在建设项目中的应用研究[D].成都:西南交通大学,2011.

[18] 马智亮,曾统华,魏振华,等.从节能设计IFC数据生成的IDF数据的机制及关键算法[J].土木建筑工程信息技术,2012,4(1):1-5.

[19] 迟珊.BIM电气设计案例[J].建筑电气,2014(2):28-34.

[20] 郑国勤,邱奎宁.BIM国内外标准综述[J].土木建筑工程信息技术,2012,4(1):32-34.

【编辑部声明】

本刊已许可万方数据、重庆维普、中国学术期刊(光盘版)电子杂志社在其网站及其系列数据库产品中以数字化方式复制、汇编、发行、信息网络传播本刊全文。该社著作权使用费与本刊相关费用抵消。如作者不同意文章被收录,请在来稿时向本刊声明,本刊将做适当处理。

《现代建筑电气》编辑部

Energy-saving Optimization of Operation Strategy on HVAC Unit Based on BAS Data Mining Technology

BAO Renbiao, MA Xiaojun, ZHANG Chao

(College of Electrical Engineering and Control Science, Nanjing Tech University, Nanjing 211816, China)

This paper analyzed the storage equipment operation data of building automation system(BAS) by using the clustering method of data mining technology.Combining by Nanjing Archives,the operating data of heating ventilation air conditioning(HVAC) were analyzed by using data analysis software SPSS.The clustering results of devices were obtained in sampling period.According to the actural energy consumption data,the reasonable optimization strategy was proposed,which directs the property personnel to adjust the equipment running time and reduces the building energy consumption.

building automation system(BAS); data mining; cluster analysis; heating ventilation air conditioning(HVAC); energy-saving

包仁标(1990—),男,硕士研究生,研究方向为建筑电气与智能化。

马小军(1956—),男,教授,研究方向为建筑电气与智能化。

张 超(1990—),男,硕士研究生,研究方向为建筑电气及其智能化。

TU 201.5

B

1674-8417(2016)08-0048-05

10.16618/j.cnki.1674-8417.2016.08.012

2016-01-23

猜你喜欢

档案馆数据挖掘聚类
探讨人工智能与数据挖掘发展趋势
基于DBSACN聚类算法的XML文档聚类
关于县级档案馆馆藏档案开发利用的思考
基于并行计算的大数据挖掘在电网中的应用
全省部分档案馆新馆掠影
基于改进的遗传算法的模糊聚类算法
一种基于Hadoop的大数据挖掘云服务及应用
when与while档案馆
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例