基于欧氏距离最小化的非常规工况空调水系统运行关联准则研究
2023-07-17禹富偲王玉杰徐新华
禹富偲 王玉杰 徐新华
(1.重庆市轨道交通(集团)有限公司 重庆 400000;2.华中科技大学建筑环境与能源应用工程系 武汉 430074)
0 引言
2030 年前碳达峰和2060 年前碳中和是我国重大发展战略。全球建筑能源消耗占总能源消耗的三分之一以上,并且是二氧化碳排放的重要组成部分[1]。在建筑能耗中,空调系统运行能耗占比可达40%,减少空调系统的能耗是建筑节能中的重要工作[2-4]。在目前的空调系统运行中,制冷机和水泵等常处于部分负载状态下,运行效率低[5,6]。近年来,随着物联网等信息技术的快速发展和建筑自动化水平的提高,专业人员可以获得大量的空调系统运行数据,如何从大数据中获得有用的知识,用于指导空调系统的运行,引起了学者们的关注[7]。数据挖掘技术快速发展,为处理海量数据并从中发现有价值的信息提供了新的方法,比如通过构建建筑自动化数据知识挖掘框架实现非正常工况识别与故障识别[8]、基于人工智能的故障检测[9]、基于BP神经网络的故障诊断[10]和基于数据挖掘的空调系统控制方法[11]等。关联准则是数据挖掘技术中的一种,主要用于发现数据中频繁出现的模式[12]。数据挖掘在空调领域也有许多应用。王炳文[13]采用Apriori算法[12]对冷源系统各种运行模式下的典型工况的历史运行数据进行了强关联规则挖掘,结果表明关联准则可以提升冷源系统的整体能效,而且不需建模,实用性强。李冠男[14]提出一种基于聚类分析与关联准则挖掘相结合的方法,将能耗数据划分成了几个簇,识别出几种可以解释的系统能耗模式,并且在各个能耗模式下利用Apriori算法进行关联准则分析,可以识别出异常用能模式。王玉杰等[15]采用关联准则方法对空调水系统的运行参数进行了挖掘,获得在不同室外空气温湿度与建筑冷量需求条件下高效运行的空调系统运行参数,以指导实际空调系统的运行。
利用关联准则对空调水系统运行数据进行挖掘,可以得到在不同的工况条件下,能够保证系统高效运行的水系统参数,比如,冷冻水供水温度、供回水温差、冷却水回水温度和供回水温差等。但是,采用关联准则进行数据挖掘时,会对运行数据集进行清洗与筛选,在此过程中,一些工况会被剔除。另一方面,在实际运行中采集的工况不可能涵盖系统在全生命周期内的所有工况。因此,在采用关联准则进行准则集的挖掘时,如何获得关联准则集中的工况(常规工况)外的其他工况(非常规工况)的运行设定值,对于实际工程的运行应用非常重要。因此,本文提出一种基于欧几里得距离最小化的非常规工况的空调水系统运行关联准则的挖掘方法。
1 关联准则挖掘介绍
Apriori算法是常用的一种关联准则的数据挖掘算法[14],该算法使用频繁项集性质。Apriori算法采用支持度、置信度及提升度来描述获得的准则的质量。支持度是代表同时包含A,B的集合在所有事务中出现的频率,即支持度乘总数据量为该准则所使用的数据量,如式(1)。置信度是AB同时出现的事项占A事项的比例,如式(2)。提升度是用于评估关联准则有效性的指标,如式(3)。定义支持度为:
其中,P(A∪B)代表事务包含集合A和B的并(即包含A和B中的每个项)的概率。
定义置信度为:
定义提升度为:
提升度表示在含有A的条件下,同时含有B的概率,与B同时发生的概率之比。
满足最小支持度和最小置信度的规则叫做强关联准则,但是强关联准则也是有有效和无效之分的,如果提升度lift(A→B)>1,那么规则就是有效的规则,如果提升度lift(A→B)<1,那么规则就是无效的规则,特别的,当lift=1 的时候,代表A和B是相互独立的。
关联准则算法步骤流程如图1 所示。首先对给定边界条件下的数据项的支持度、置信度以及提升度进行计算,再按照算法得到频繁集,根据规则等级的原则对得到的规则标签进行排序,并剔除冗杂规则。采用类别规则标签CARs(CategoryAssociation Rules)按照等级进行排列,并且经过筛选,保留等级更高的规则。重复上述过程,遍历给定的所有边界条件下的数据项处理与筛选,最后获得所有的给定边界条件下的关联准则。
图1 关联准则算法步骤流程示意图Fig.1 Schematics of the procedure of the associated rule algorithmm
2 非常规工况关联准则挖掘方法
2.1 常规工况的关联准则
本文以一实际建筑的中央空调系统为研究对象,在TRNSYS 软件中对建筑的传热与空调系统进行了建模。通过模拟,获得在不同的冷冻水供水温度和不同的冷却水泵运行频率等众多工况下的空调系统运行数据[17]。其中,冷冻水供水温度设定值为7℃-18℃,1℃间隔;冷却水泵频率为24Hz至50Hz,2Hz 间隔;通过控制冷冻水供水流量控制室内温度在26 至28℃之间;模拟数据以分钟计,初步得到的数据量共计约8830 万条。对数据进行预处理,舍弃了室内温度不达标的数据,得到了五千余万条可用数据。
选取了与空调水系统运行有关的参数,对应第1 节中的A 事项包括冷冻水供水温度、冷冻水供回水温差、冷却水回水温度和冷却水供水温差,B 事项为COP,然后运用关联准则数据挖掘方法,获得了在不同的室外空气温湿度和系统冷量需求的范围内,系统的最佳运行参数,即获得了该空调系统在不同工况下的高效运行关联准则[16]。支持度代表的是一条关联准则的边界条件下,所使用的数据量占总数据的比例。在本文研究案例中,以分钟为单位,数据量为几千万条,支持度大于1%以上时,在进行关联准则挖掘时,有几十万条以上的数据量,数据量及代表性足够。在大数据挖掘领域中,一般的置信度设置为70%以上[13,14]。在本研究中,最小支持度取1%,最小置信度取70%,最小提升度取1%。表1 是部分工况下的关联准则。
表1 关联准则表(常规工况)Table 1 Table for associated rules(Conventional conditions)
在进行关联准则挖掘过程中,在某些工况下,未能找到满足支持度和置信度的关联准则,即在该冷量需求、室外温度和湿度条件下,未有对应的关联准则可用。在实际运行中采集的工况不可能涵盖系统在全生命周期内的所有工况,并且可能会出现极端工况,所以需要对关联准则进行补充。本研究采用最近距离原则进行关联准则补充,距离采用欧几里德距离。
2.2 欧氏距离介绍
欧氏距离是欧几里德距离的简称,指的是在m维空间中的两个点之间的距离,如式(4)。当考虑三维空间时,两点之间欧氏距离表示为式(5)。
其中,(x1,x2,x3)为点x的坐标值,(y1,y2,y3)为点y的坐标值,d(x,y)为两点之间的距离。
欧氏距离进一步推广到加权欧氏距离,用来处理各个维度分布不一样的情况,如式(6)。
其中,wi为第i维分量的权重。
2.3 非常规工况关联准则挖掘
将边界条件中的冷量需求以50kW 为单位分成12 个区间,分别是[0,50)、[50,100)、[100,150)、[150,200)、[200,250)、[250,300)、[300,350)、[350,400)、[400,450)、[450,500)、[500,550)和[550,+∞),从前往后依次定义区间为01 到12;将边界条件中的室外空气温度分成[0,15)、[15,20)、[20,25)、[25,30)、[30,35)、[35,40)和[40,+∞]七个区间,从前往后依次定义区间为1 到7;将边界条件中的室外空气湿度分为[0,40)、[40,60)、[60,80)和[80,100]四个区间,从前往后依次定义区间为从1 到4,所以经过排列组合一共可能有12×7×4=336 条关联准则。把这三个因素对应的区间的序号连接起来,定义为一个四位数的编号,冷量需求、室外空气温度和室外空气湿度分别是三维空间的三个坐标轴,编号代表其在三维空间中的位置点。比如,需求冷量区间[0,50),室外空气温度区间[0,15),室外空气湿度区间[0,40)对应的三维空间的位置点为0111,如图2 所示。判断三维空间中的位置点是否有关联准则对应,如果没有,与它距离最短的有关联准则的点所在的关联准则作为该位置点的关联准则。对于没有关联准则的空间位置点,可能有不同的有关联准则的空间位置点与其距离相等,比如0332 在三维空间中与之距离最短即为1 的点有0232、0331、0232 等。考虑到需求冷量因素、室外空气温度因素、及室外空气湿度因素的权重不同,点0332 与点0232、0331、0232 的距离是不一样的。
图2 三维空间位置点示意图Fig.2 Schematics of the point position in three-dimension space
本研究中定义三个因素,即需求冷量、室外空气温度、室外空气湿度的权重,以考虑这些影响因素对系统能效即能耗的影响作用。直接的影响是需求冷量,而室外空气温度是通过围护结构即新风影响需求冷量的,室外的空气湿度主要是通过冷却系统影响冷却水的回水温度进而影响系统的能耗。对这三个因素对空调系统能效与能耗的影响作用进行定性的分析,应该需求冷量影响最大,室外空气温度次之,湿度影响最小,具体的量化很难确定。在本算例中,需求冷量因素的权重取为50%,室外空气温度因素的权重取为30%,室外空气湿度因素的权重取为20%。
冷量需求在350kW-400kW 范围内、温度在25℃-30℃范围内以及相对湿度在80%-100%范围,与冷量需求在450kW-500kW 范围内、温度在20℃-25℃范围内以及相对湿度在40%-60%范围,使用模拟得到的数据未能找到在此边界条件下,满足支持度和置信度范围的关联准则。使用上述方法找到与之距离最近的关联准则,同时也取次近及第三近的关联准则,如表2 所示。取另外两个相近的准则,只是为了分析在采用不同准则时系统的能效情况,详细比较分析见下一节。
表2 关联准则表(非常规工况)Table 2 Table for associated rules(Non-conventional conditions)
3 应用结果分析
根据上述方法补充非常规工况的关联准则,可得到在所有边界条件下的关联准则,关联准则的应用流程如图3 所示。在模型中,关联准则的应用流程是:读取建筑物冷量需求、空气温度与湿度数据,模型平台中的关联准则应用策略模块经过判断可以寻找该边界条件下的最优参数值,即冷冻水供水温度设定值、冷却水供回水温差设定值、冷却水回水温度设定值、冷冻水供回水温差设定值。通过PID 控制器控制冷却水泵、冷冻水泵的运行频率从而控制冷却水供回水温差、冷冻水供回水温差,通过PID 控制器控制冷却塔风机转速从而控制冷却水回水温度,使得系统按照关联准则表中的最优参数来运行。在进行运行效果比较分析时,以采用既有模式运行的结果作为参考。既有模式是指空调水系统中制冷机冷冻水供水温度设定为7℃,水泵与冷却塔风机以工频运行。关联准则运行模式,就是采用关联准则表中的最优参数进行系统运行,即按照冷冻水出水温度设定值、冷却水回水温度设定值、冷冻水泵运行频率设定(即改变冷冻水供回水温差)、冷却水泵运行频率设定(即改变冷却水供回水温差)进行系统的运行。
图3 关联准则运用流程图Fig.3 Flowchart of the application of associated rule
如表2 所示,冷量需求在350kW-400kW 范围内、温度在25℃-30℃范围内以及相对湿度在80%-100%范围(即工况1)时没有对应的关联规则。此时采用与该工况点距离相近的工况点的关联准则进行系统的运行。分别用与该工况点相近的工况点的关联准则与既有运行模式对该系统在该边界条件下的运行进行模拟,得到结果如图4 所示。在此需要说明的,空调系统的需求冷量随时间不断变化,而且室外的空气温度与湿度也不断变化,对于一个采用冷却塔冷却的空调水系统而言,其COP是不断变化的。在这里给出的是在冷量需求在350kW-400kW 范围内、温度在25℃-30℃范围内以及相对湿度在80%-100%范围的不同的状态点。COP 平均值为不同状态点的COP 的平均值。
图4 采用不同距离工况点的关联准则运行COP 对比(工况1)Fig.4 Comparison of COP when using associated rule at different condition points(Condition 1)
图4 结果表明,第一近、第二近、第三近距离的工况点的关联准则和既有模式运行的平均COP分别为5.72、5.63、5.46 和4.26。既有运行模式指的是空调水系统中制冷机冷冻水供水温度恒定,水泵与冷却塔风机以工频运行。采用第一近距离的工况点的关联准则对该系统运行,系统COP 比既有模式运行时的COP 提高1.46。在图中部分状态点出现按照第三近距离准则运行的能效超过了按照第二近与第一近距离准则运行的能效,有可能是在设置需求冷量、室外空气温度、室外空气湿度的影响权重不是最优的。但是,在非常规工况下,采用欧式距离获得了该工况下的运行关联准则,而且采用该关联准则运行的能效要始终高于既有模式的运行能效。
冷量需求在450kW-500kW 范围内、温度在20℃-25℃范围内以及相对湿度在40%-60%范围(即工况2)时,也没有对应的关联准则。分别用与之最近的工况点的关联准则与既有运行模式模拟该边界条件下的运行,得到结果如图5 所示。第一近、第二近、第三近关联准则和既有模式运行的平均COP 分别为5.71、5.53、5.04 和4.00。采用第一近距离的工况点的关联准则对该系统运行,能效也有明显的提升。从上述实例可以看出,对未能挖掘得到的关联准则的工况,采用欧几里得距离方法补充的关联准则能够保证系统高效运行,而且在大部分状态点中,距离越近,COP 越高,运行效果越好。
图5 采用不同距离工况点的关联准则运行效果对比(工况2)Fig.5 Comparison of COP when using associated rule at different condition points(Condition 2)
在上述给出的两个案例中,都出现了按照第三近距离准则运行的能效超过了按照第二近与第一近距离准则运行的能效,但是都显著高于既有运行模式的能效。在这里需要指出的是,在采用关联准则进行挖掘时,由于数据的过滤与删除,以及用于关联准则挖掘的数据不可能涵盖所有的运行工况。因此在关联准则挖掘完后,可能出现一些新的运行工况(本文称为非常规工况)找不到关联准则,本文的目的就是提供一种方法,以获得非常规工况的运行关联准则。而且这一关联准则可能不是最优的,但是提供了一个关联准则,按照该准则运行,可以比既有运行模式的能效要高。
4 结论
本文利用关联准则的数据挖掘方法,对空调系统运行数据进行挖掘,获得了能够保证空调系统高效运行的参数(冷冻水供水温度设定值、冷冻水供回水温差设定值、冷却水供回水温差设定值和冷却水回水温度设定值)。挖掘得到的关联准则不一定涵盖所有运行工况,在部分工况(即非常规工况)下没有对应的关联准则。针对这种情况,本文提出了一种基于欧氏距离最小化的非常规工况关联准则补充方法,通过对关联准则中的边界条件进行编号,定义各个关联准则对应工况在空间中的位置,将最近距离的有关联准则的空间点的关联准则作为非常规工况位置的关联准则。本文以两个实例对采用这种方法补充的关联准则的可靠性进行了模拟分析。与既有模式相比,两实例采用从近到远的欧氏距离补充的关联准则运行的系统能效分别提升了1.4 与1.7。采用欧氏距离最小化的方法补充的关联准则能够很好地保证系统的高效运行。