APP下载

基于关联规则的复杂系统稳态运行参数优化

2021-04-17闫军威王炳文卢泽东

制冷学报 2021年2期
关键词:项集冷水机组关联

闫军威 李 昆 周 璇 王炳文 卢泽东

(华南理工大学机械与汽车工程学院 广州 510641)

化工、电力、制冷等行业设备的结构和功能日趋复杂,对复杂系统的运行稳定性及节能优化控制技术的要求也越来越高;因此,在满足复杂设备安全稳定运行的基础上,深入研究系统节能优化运行技术,对于提高系统能效、保证系统安全稳定运行意义重大。

系统节能运行优化是指在深入了解设备性能的基础上,建立特定的评价指标,评估系统的运行状态,以安全稳定运行为前提,以系统能耗最低或能效最高为目标,采用适当的方法优化系统运行参数的设定值。

传统的系统运行参数优化方法主要包括机理建模、黑箱建模及灰箱建模等。机理建模从系统内部机理特性出发,研究系统的运行性能。Lu Lu等[1]建立冷却水系统设备能耗半机理模型,并采用改进的遗传算法对冷却水系统运行参数进行寻优,仿真结果表明冷却水系统运行性能得到改善。方兴等[2]基于空调系统火用分析模型,以火用损最小为优化目标,采用多目标粒子群优化算法优化运行参数,结果表明空调系统运行效率显著提高。袁喜来等[3]基于水电机组状态空间方程和临界稳定条件,研究了孤网条件下水轮机调节系统控制参数稳定域,揭示了运行工况对机组稳定性的影响机制。复杂系统机理建模过程通常采用一定的简化手段,影响模型的准确性,所建模型与实际运行工况存在一定差别,工程应用较困难。黑箱建模侧重于根据系统输入与输出的关系进行建模,相对简单有效,较易于工程应用。周璇等[4]基于支持向量回归机建立冷水机组运行能效黑箱模型,采用粒子群优化算法对模型参数寻优,研究表明,该模型能够准确反映冷水机组的运行能效,预测精度较高。

随着物联网、自动控制及人工智能等技术的发展,各种设备的在线实时监控系统积累了大量的运行数据,为数据挖掘应用于工程实际奠定了基础。与传统建模方法相比,基于关联规则的数据挖掘方法无需考虑复杂的建模过程,工程实现简单,实用性较强,是国内外学者的研究热点。孙群丽等[5]采用关联规则方法,以锅炉效率为评价指标,挖掘得到不同工况下锅炉排烟温度与过量空气系数的优化设定值。Fu Xiao等[6]基于聚类分析建立建筑物的典型功耗模式,并采用关联规则算法挖掘中央空调设备运行与功耗的关系,用于改善建筑性能。周璇等[7]通过Apriori关联规则算法挖掘出各种运行工况下的单台冷水机组最佳运行能效与各运行参数间的关联规则,以指导冷水机组的节能优化运行。杨贤等[8]基于水电站最优维护系统,提出了基于工况关联规则的稳定性分析方法,实现对稳定性的综合关联分析,结果表明,该方法在稳定性分析及运行规律挖掘等方面取得较好效果。

基于关联规则的设备运行参数优化方法应用广泛,然而常规的关联规则挖掘在实际应用过程中,由于工况变化可能会导致工况切换时,不同工况对应的运行参数优化设定值有较大的阶跃变化,可能引起系统运行不稳定,影响系统安全稳定运行。此外,系统运行过程中各工况参数的变化对系统稳定性的影响不同,因此,本文研究多参数典型工况的划分与变工况条件下保证系统稳定运行的关联规则挖掘方法,并以广州市某商场冷水机组为研究对象,验证该方法的有效性,为运行参数的节能优化与系统安全稳定运行提供参考。

1 关联规则挖掘与Apriori算法

关联规则的一般形式为“X⟹Y”,其中X和Y为不相交的项集;关联规则的强度可以用支持度(support)和置信度(confidence)度量。支持度为事务数据库中包含X和Y项集的数量和所有项集数量之比,确定规则在给定数据集的频繁程度,衡量规则在统计意义上的重要性;置信度为包含X和Y项集的数量与包含X项集的数量之比,确定Y在包含X事务中出现的频繁程度,衡量规则的可靠性。这两种度量的形式定义如下:

sup(X⟹Y)=P(XY)

(1)

(2)

若规则“X⟹Y”满足支持度不小于最小支持度且置信度不小于最小置信度,则称关联规则“X⟹Y”为强关联规则,在挖掘关联规则时,产生的关联规则要经过支持度阈值和置信度阈值的衡量,筛选出来的强关联规则才具有指导决策的作用。

频繁项集的获取是关联规则挖掘的核心,也是算法计算量的主要部分。Apriori算法是挖掘关联规则频繁项集最常用的算法之一[9],该算法开创性的利用先验原理对非频繁项集进行剪枝,即若某个候选项集是非频繁项集,则其所有超集都是非频繁项集,有效控制了候选项集的指数增长,大幅提高算法的效率。

Apriori算法利用逐层搜索的迭代方法不断产生候选项集,通过剪枝以形成规则[10],其过程首先确定支持度阈值和置信度阈值,然后重复如下两个步骤:

1)连接:扫描数据库,通过前一次迭代发现的频繁项集产生新的更高层次的候选项集。

2)剪枝:由于候选项集不一定都是频繁项集,基于先验原理,与最小支持度比较,删除支持度小于支持度阈值的候选项集。

根据上述步骤,不断由频繁k项集生成候选的k+1项集,直到不能再生成候选项集为止,此过程将挖掘出所有的频繁项集,最后根据置信度阈值确定强关联规则。

2 基于关联规则的稳态优化方法

本文提出的基于关联规则的稳态运行参数优化方法流程图如图1所示,主要步骤如下:

图1 方法流程图

1)数据预处理,针对系统大量历史运行数据,采用数据预处理方法剔除异常数据;

2)典型工况划分,依据各外部工况参数对工况变化的影响程度进行分阶段工况划分;

3)参数稳态阈值的确定,采用四分位法有效地识别数据波动,进而确定参数稳态阈值;

4)准稳态工况检测,根据运行参数的准稳态阈值,利用滑动窗口法对历史运行数据进行准稳态工况检测;

5)关联规则挖掘,变工况条件下,挖掘保证系统稳定运行的关联规则。

6)参数优化,根据目标工况优化运行参数。

2.1 数据预处理

关联规则的合理性很大程度上决定于样本的选取。复杂系统设备运行具有动态性、多样性等特点,在数据采集、通讯和存储的过程中,由于噪声干扰、通信故障等问题,容易导致数据缺失、数据突变等数据异常现象[11],因此,需要对采集的原始数据进行预处理。数据预处理的任务包括数据清洗、数据集成、数据转换等。本文应用案例中的异常数据,如缺失值、离群值和逻辑异常数据等,采用直接剔除的方法进行处理;并在此基础上对数据进行离散化处理,为后续关联规则挖掘做准备。

2.2 典型工况划分

复杂系统工况大多受多个参数的影响,其工况划分方法也多种多样,工况划分的合理性直接影响不同工况下关联规则挖掘的实用性,然而由于各参数的量纲不同,分布特征也不同,其变化对运行过程的影响也不尽相同,但目前尚未有标准化的划分方法[12]。因此,本文提出基于变异系数的多步工况划分方法。变异系数用于各参数的波动对工况变化影响程度的量化计算,为工况划分提供理论依据。变异系数定义为参数的标准差与平均值之比,其优点在于能够比较不同量纲参数的离散程度;变异系数越大,参数波动越大,对工况变化影响程度也越大。第i个参数变异系数计算式如下:

(3)

式中:σi为标准差;μi为平均值。

该方法首先计算各工况参数的变异系数,然后各工况参数根据变异系数的大小依次进行单变量划分,每次划分的分类簇作为下一阶段划分的父样本集,最终结果按从小到大排序作为工况划分结果。根据参数对工况变化的影响程度进行分阶段工况划分和编号,可保证相邻编号的工况是典型的相邻工况,工况划分流程如图2所示。

图2 工况划分流程

2.3 准稳态检测

实际系统运行时,严格意义的稳态工况是不存在的,大多处于准稳态运行工况。当系统处于准稳态时,系统运行参数并非保持恒定不变,而是在基准值上下波动,这种波动可认为是大量相互独立的随机因素综合影响的结果[13]。因此,论文将工程应用上的准稳态运行过程定义为:在一段时间内,若表征系统状态的特征参数随时间的波动稳定在一定范围内,则可认为系统在该时段内处于准稳态,否则视为非稳态[14]。

本文提出基于滑动窗口法的特征变量一阶差分准稳态判别法,用于过滤非稳态数据,其基本思想是通过窗口步长d取样,根据特征变量在步长d内一阶差分绝对值的均值判断是否为准稳态过程,若采样周期内不满足准稳态过程,则顺时递推,重新判稳。计算方法如下:

(4)

式中:Δxi为相邻工况参数的差值;Δxmax为准稳态阈值;d为窗口步长[15]。

假设各工况下复杂系统各运行参数服从正态分布,采用四分位法求解准稳态阈值,定义系统准稳态运行的控制参数阈值Δxmax为第三四分位数(Q3)与上限值Q3+1.5IQR的均值,其中IQR为四分位距[16],IQR与Δxmax计算方式如下:

IQR=Q3-Q1

(5)

(6)

式中:Q1为第一四分位数。

一次性是风景园林景观工程施工的显著特点,施工成本控制应立足于各施工阶段的不同展开动态控制。其原因是准备阶段根据施工内容对成本目标进行确定,对成本计划和方案予以制定;而在竣工阶段,成本盈亏已成定局,已经不能纠正发生的偏差。

在步长为d的窗口内,特征变量一阶差分绝对值的均值差若小于准稳态阈值,则可判定此段运行状态为准稳态。基于滑动窗口法的准稳态判别过程示意图如图3所示。

图3 滑动窗口法示意图

2.4 改进的关联规则挖掘

实际运行过程中,运行参数的时变曲线蕴含着系统整体内在的运行特性信息,其运行状态不仅与当前时刻的工况有关,也受到历史工况影响。常规的关联规则挖掘只针对当前工况下的运行参数进行挖掘,未考虑工况切换过程可能导致的运行参数目标值的跃变,引起运行不稳定,从而影响设备安全稳定运行的问题。因此,本文将历史工况作为关联规则的输入参数之一,通过工况约束,强化挖掘过程中的工况与目标的联系,兼顾稳定性与运行效率。挖掘出来的强关联规则保留了运行数据的历史工况信息。

由于运行参数受历史工况运行状态的影响,且不同工况间的切换具有多样性,可能导致当前工况下能效水平最高的运行参数设定值并不唯一,因此,保留挖掘出的所有强关联规则,在实际优化过程中以保证系统稳定性为前提,以能效最高的原则选择强关联规则。当待优化工况为非典型工况时,则根据最近邻法选择最相似的典型工况点代替该工况。最近邻法是将与测试样本最近邻的训练样本类别作为决策的方法:假设外部工况集为SN。

SN={(X1,θ1),(X2,θ2),…,(XN,θM)}

(7)

式中:XN为工况样本向量;QM为工况类别;对于未知工况X,SN中与之距离最近的工况XN对应的类别θ被作为工况X的类别。

由于工况各参数的量纲不同,距离计算方式采用马氏距离,马氏距离考虑了变量之间的相关性且不受量纲影响,距离计算式如下:

(8)

式中:∑为工况集SN的协方差矩阵。

为了提高关联规则的适用性,将所有运行参数的离散化区间用其中心值替代,以量化关联规则,获取运行参数的具体优化值[17]。例如,某规则中某个控制参数属于分区[8.2, 8.4],该区间的中心值为8.3,得该控制参数的优化目标值为8.3。

3 案例分析

以广州某大型商场中央空调的1#冷水机组为研究对象,该机组的额定制冷量为1 758.5 kW。选取2013年9月至2020年3月的历史运行数据进行分析,数据采集系统的采集频率为150 s。根据参考文献[7],选取冷冻出水温度、冷冻回水温度、冷却回水温度、冷却水流量4个参数作为影响机组运行效率的主要参数。

3.1 数据离散化

关联规则挖掘的数据类型为离散型数据,由于冷水机组的运行数据是连续型变量数据(如冷水供回水温度、温湿度等),无法直接运用算法进行挖掘,因此需要对数据进行离散化。目前尚无通用的数据离散化方法,本文采用最常用的等宽离散化方法对所有参数进行离散化,根据各控制器的参数调节基准、数据范围及多次实验,各参数的组距及数值范围如表1所示。

表1 等宽离散化参数

3.2 典型工况划分

影响空调冷负荷的外部参数主要包括外界环境温度、相对湿度和冷负荷[18]。利用上述3个参数对工况进行划分。参数的变异系数计算结果如表2所示。

由表2可知,冷负荷变化为外部工况变化的主导因素,外界环境温湿度对外部工况变化的影响很小。因此,依次按湿度、温度、冷负荷分布进行工况划分,共得到183组运行工况。

表2 工况参数变异系数

工况划分周期直接影响了工况划分结果的合理性,工况划分周期过短,可能导致机组频繁切换,容易造成系统的不稳定运行,划分周期过长,可能导致系统运行状态切换过于缓慢,节能优化效果不明显。研究对象的数据采集时间为150 s,为了更清楚地描述周期对工况划分的影响,不同时间间隔下,取偏差值数量大于50组的相邻工况变化的统计分布如图4所示。

图4 不同时间间隔相邻工况编号差值统计

由图4可知,当工况划分周期较短,工况变化分布越集中,这是由于工况划分周期较短时,外部参数变化较小,机组运行状态变化也较小;当工况划分周期过长时,可能导致工况总量过少,难以充分挖掘合适的关联规则。此外,部分工况的数据量很少,为非典型工况,不具有代表性,难以挖掘出相应关联规则。因此,将工况划分周期为20 min,数据量大于150组的工况为典型工况,最终确定148种典型工况。

各工况下准稳态阈值的确定方法采用四分位法确定,例如历史运行数据中,冷冻出水温度的变化分布如图5所示。第一四分位数Q1=-0.3,第三四分位数Q3=0.25,得到四分位距IQR=0.55,上限值为Q3+1.5IQR=1.075,从而得到冷冻出水温度的稳态变化阈值Δxmax=0.66;由于系统存储数据精确到小数点后一位,取冷冻出水温度的稳态变化阈值为Δxmax=0.7;按照相同的方法,其他运行数据波动值的四分位数及稳态变化阈值如表3所示。

图5 冷冻出水温度的变化分布

表3 运行参数的稳定变化范围

3.3 准稳态检测

冷源系统运行过程涉及多个运行参数,运行状态是否处于准稳态,由所有运行参数共同决定。为保证数据为冷水机组的长期稳定运行数据,设置滑动窗口的窗口宽度d为1 h所对应的数据量,即1 h内数据能保持准稳态则存入准稳态数据库,作为后续关联规则挖掘的数据集。

对机组运行参数分别进行准稳态检测,当4个运行参数均处于准稳态时,则认为机组运行状态为准稳态,准稳态标识为1,非稳态标识为0。机组的部分采样数据以及准稳态检测结果如图6所示。

图6 准稳态筛选结果

由图6可知,机组运行过程大部分时间处于准稳态,在第1~38、64~77、161~180、281~300四个采样数据段内出现了数据波动,运行过程为非稳态,该方法能准确识别出非稳态边界,有效剔除波动较大的过渡过程数据,为准确挖掘各工况下的关联规则提供了有效数据。

3.4 关联规则挖掘与优化策略提取

考虑历史工况对当前时刻参数设定的影响,同时为降低关联规则挖掘的复杂性,将上一优化时段的历史工况做为规则挖掘的参数之一,结合关联规则挖掘算法确定机组在制冷效率最优时的运行参数目标值。

通过对历史运行数据的挖掘,分别得出冷水机组在各典型工况下,改进前后的关联规则算法所挖掘的强关联规则,取区间中心值为该参数的优化目标值,部分运行工况在改进前后的强关联规则分别如表4、表5所示。

表4 部分典型工况下未改进的强关联规则

由表5可知,由于上一历史工况的不同,在当前工况下可能存在不同的强关联规则,若在当前工况下所有运行数据中挖掘提取一组强关联规则,则易掩盖掉部分更优的关联规则,因此考虑历史工况约束的关联规则挖掘优化方法更加符合实际运行情况。

表5 部分典型工况下改进的强关联规则

4 仿真结果与分析

以2019年7月31日(夏季)12:00—18:00与2020年2月21日(过渡季)10:00—18:00的单台冷水机组运行数据为例,说明本文算法的有效性,其部分时刻室外干球温度与相对湿度分布及冷负荷需求分布分别如图7、图8所示。

图7 2019年7月31日室外温湿度和冷负荷需求

图8 2020年2月21日室外温湿度和冷负荷需求

在当日不同工况下,分别按表4、表5中的优化目标值对各运行参数进行优化,使COP达到最优值,进而使冷水机组在最佳状态下运行。冷水机组实际运行COP与两种优化方式优化后的COP对比如图9所示。

图9 实际运行COP与优化COP对比

由图9可知,改进优化后的COP整体高于未改进优化的COP,整体优化效果显著;由于改进后的变工况关联规则挖掘需要保证系统运行稳定性,将上一历史工况作为输入条件之一,与仅考虑当前工况的关联规则挖掘方法的样本数据集存在差异;当工况变化较大时,改进的优化方法在保证稳定性的前提下,部分情况不能达到最优COP,因此部分改进优化后的COP低于未改进优化的COP。

图10所示为2019年7月31日12:00—18:00运行周期内,两种优化方式得出的4个运行参数最优设定值分布,运行参数标准差如表6所示。由图10可知,按照改进的关联规则优化运行参数后,变工况下冷水机组运行参数稳定性明显提高;对比两种优化方法4个运行参数的标准差,改进后的优化方法运行参数标准差分别下降了61.16%、40.84%、43.94%、55.6%,综合稳定性提高了50.4%,说明该方法使机组运行过程稳定性较好。对比当天该台冷水机组实际运行能耗与两种优化方法优化后的能耗,实际运行能耗为2 530.82 kW·h,未改进的优化方法优化后能耗为2 313.74 kW·h,节能率达到8.58%;改进的优化方法优化后能耗为2 164.34 kW·h,节能率达到14.48%。与未改进的优化方法相比,由于系统运行稳定性更高,运行参数调整时间更短,较小的超调量与调整时间能够有效降低冷源系统设备能耗,并能快速满足供冷需求,因此,本文提出的方法节能优化效果更显著,节能率更高。

图10 2019年7月31日优化前后运行参数设定值分布

表6 2019年7月31日运行参数标准差

同理,选取2020年2月21日10:00—18:00的单台冷水机组运行数据验证表4、表5中的强关联规则优化效果。两种优化方式得出的4个运行参数最优设定值分布如图11所示,运行参数标准差如表7所示。由图11可知,改进的优化方法同样具有较好的效果;对比两种优化方法4个运行参数的标准差,改进后的优化方法运行参数标准差分别下降了77.4%、80.0%、52.5%、41.0%,综合稳定性提高了62.7%;实际运行能耗为1 979.16 kW·h,未改进的优化方法优化后能耗为1 759.38 kW·h,节能率达到12.5%;改进的优化方法优化后能耗为1 699.03 kW·h,节能率达到16.5%。

图11 2020年2月21日优化前后运行参数设定值分布

表7 2020年2月21日运行参数标准差

5 结论

本文提出的变工况关联规则挖掘方法克服了常规关联规则挖掘方法在复杂系统工况切换运行参数目标值波动过大容易造成系统不稳定运行的问题,采用变异系数量化了运行参数对工况的影响,并通过工况划分与准稳态工况阈值检测提升了关联规则挖掘的有效性。以某商场单台冷水机组为例验证了该方法的有效性,仿真结果表明,优化后冷水机组运行稳定性与原运行方式相比,冷水机组运行能耗在夏季和过渡季运行稳定性分别提高了50.4%和62.7%,同时冷水机组运行能耗分别降低了14.48%和16.5%,具有较好的节能效果和运行稳定性,为机组经济高效运行提供有力支持。

关联规则挖掘在实际工程中的应用是一种“历史寻优”过程,当既有控制策略不符合实际要求时,基于关联规则挖掘的优化效果不一定理想,因此对于优化过程需反复进行,随着进一步的研究和持续优化,为解决冷水机组运行参数优化控制提供更完善的方案。

本文受广东省自然科学基金项目(2017A030310162,2018A030313352)资助。(The project was supported by the Natural Science Foundation of Guangdong Province(No.2017A030310162 & No.2018A030313352).)

猜你喜欢

项集冷水机组关联
水冷磁悬浮变频离心式冷水机组
“一带一路”递进,关联民生更紧
奇趣搭配
智趣
克莱门特冷水机组系统节能应用会议顺利召开
关联规则中经典的Apriori算法研究
一种频繁核心项集的快速挖掘算法
河南精蜡厂新增冷水机组降耗效果好
基于性能曲线的冷水机组配置和运行优化
语言学与修辞学:关联与互动