APP下载

基于神经网络的建筑能耗及设备故障预测方法研究

2022-04-25董道国朱建龙方瑾

智能建筑与智慧城市 2022年4期
关键词:项集能耗数量

董道国,朱建龙,方瑾

(华建数创(上海)科技有限公司)

1 引言

目前,智慧建筑在建筑行业内的应用越来越广泛。智慧建筑是为了适应现代信息社会对建筑物功能、环境和高效管理要求,在传统建筑的基础上发展而来[1]的,因此,基于BIM技术和物联网技术的建筑运维管理系统得到了业内的广泛关注。但是人工智能技术在建筑领域内的应用仍然较少,主要应用方向是以节能为主的能耗系统及故障诊断系统。能耗系统是建筑运维过程中节能减排、节约费用的关键系统,一般基于统计机器学习方法的线性回归(LR)[2]、支持向量机(SVM)[3]、时序模型(ARIMA)[4],以及基于神经网络的BP 神经网络[5]、长短期记忆网络(LSTM)[6]等进行能耗分析预测。在建筑运维过程中,设备的维护维修同样是一个频繁且重要的工作,对于设备运维期故障的分析预测一般采用关联规则挖掘(apriori)[7]及BP 神经网络算法[8]。常规的预测方法将能耗预测和故障预测割裂开来,没有考虑两者的潜在共同影响因素,本文提出一种采用人工神经网络的多任务学习方法,在融合BIM 模型数据和物联网数据的基础上,可同时进行建筑能耗和设备故障预测。

2 训练数据

采用基于物联网和BIM 模型的智慧建筑,可采集以房间为单位的、大量的设备和传感器数据,因此建筑能耗和设备故障预测的颗粒度可以细化至单个房间,由此产生的大量数据同时解决了机器学习模型基于大数据的问题。通过物联网设备及传感器可以获取每个房间的环境参数和设备信息,环境参数包括某一天的最高温度、最低温度、湿度、天气、人流量等,设备信息包括设备类型、设备数量、设备使用年限,历史上维修次数等。通过BIM 模型可获取房间和设备的空间数据,房间的空间数据包括体积、朝向、门窗面积、内外墙面积、楼板面积等,设备的空间信息包括房间内拥有的设备类型、设备数量等。训练数据的标签分为各种能耗数值及设备故障的有无,每一类设备对应一种设备故障类型。数据集的特征和标签均可根据不同的能耗预测对象及设备故障类型进行增删。

3 Apriori算法

Apriori 算法是第一个关联规则挖掘算法,也是最经典的算法。它利用逐层搜索的迭代方法找出数据库中项集的关系,以形成规则。项集出现的频率即为项集的支持度,如果某项集满足最小支持度,则称它为频繁项集。根据最小支持度,用K项集去探索(K+1)项集,首先找出频繁1 项集的集合记为L1,基于L1找出频繁2项集L2,依此类推,直到不能找到频繁K 项集。为了提高频繁项集逐层查找的效率,该算法利用连接(将Lk-1与自己连接产生Lk的候选项集)和剪枝(任何非频繁的K-1项集都不可能是频繁K项集的子集)减少计算量[9]。

将数据进行选取并规范化处理后,即可采用多元线性回归或神经网络算法,直接对能耗进行回归或者对故障进行分类。但是对于关联规则挖掘,由于Apriori 算法无法处理连续值的情况,所以必须将连续值进行分箱处理,每一种连续值的分箱方式均需人为指定。同时,Apriori 算法需要设定最小支持度及最小置信度的阈值,将其作为频繁项集的依据。当阈值设定过小时,频繁项集数量会过多,当阈值设定过大时,频繁项集数量会过少甚至没有,因此最小支持度及最小置信度的设置需要一定的经验。此外,在某些情况下频繁项集的挖掘仅仅基于故障和故障之间,不考虑其他的各种因素,因此还需要根据一定的日期间隔及空间间隔对设备故障进行筛选后合并为一条关联数据,间隔的选取同样需要较多的人工经验。对于训练样本较少的设备故障数据而言,机器学习结果本身就存在较大的偶然性,外加采用Apriori 算法需要较多的人为经验进行调参,因此该算法用于运维系统中的故障预测时使用起来较为麻烦。

4 神经网络

普通的神经网络即BP神经网络采用输入层、隐藏层及输出层作为网络结构,如图1所示,其中隐藏层的数量可以多于一层。输入的节点数为特征的数量,输出的节点数根据任务需要进行设置,隐藏层的节点数可以任意设置,一般不少于输入节点的数量。基本BP 神经网络包括信号的前向传播和误差的反向传播两个过程。以三层神经网络为例,正向传播时,输入值乘上权重矩阵并经过非线性变换后输出至隐藏层,再经过一次权重变换后产生输出信号,若实际输出与期望输出不相符,则转入误差的反向传播过程。误差反向传播是将输出误差通过隐藏层向输入层逐层反传,并将误差分摊给各层所有单元,以此调整权重矩阵。通过调整输入节点与隐层节点的权重值使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数即权重值,训练结束。神经网络推理时,将与训练数据集格式相同的数据作为输入,网络的输出值可直接使用,神经网络屏蔽了计算细节。

图1 BP神经网络结构图

为了将建筑能耗与设备故障预测在同一个网络中实现输出,需要将图1的网络结构进行微调,如图2 所示。a1至an为能耗预测的输出项,n由能耗预测对象的数量决定。bn+1至bm为设备故障预测的输出值,m由设备故障的类型数量决定。

图2 能耗及故障预测BP神经网络结构图

由于设备故障预测类型为二分类,因此还需要经过一层Sigmoid函数进行变换,将输出数值转换至0~1 之间,即故障出现的概率大小。在神经网络的前向推理过程中,当故障预测部分的某个输出概率大于0.5时,可以认为该输出所对应的故障类型出现的可能性较大,管理系统即向物业管理人员进行提醒。由于每次输入的数据为一个房间的数据,并不能考虑房间与房间之间的关联性,也未能考虑单个房间与整个建筑之间的相互影响,因此对于设备故障的预测存在一定的不准确性,但是作为运维管理系统中的提醒事项已经足够。

5 损失函数

对于回归类学习任务,通常采用均方误差(MSE)作为损失函数,

式(1)中:y为实际值;ŷ为预测值;n为能耗预测项目的数量;

对于分类任务,通常采用交叉熵(Cross En‐tropy)作为损失函数,

式(2)中:y和ŷ的含义同上,m 为设备故障类型的数量。

由于训练样本中,正负样本极不平衡,假如以设备出现故障为正样本,那么负样本的数量将远大于正样本的数量,因此需要增加正样本的损失权重,

式(3)中:α是小于1的正小数,以此降低负样本的权重。最终的损失应包含能耗预测和故障预测两部分,但由于能耗预测的损失值会大于故障预测,因此需要减少能耗预测的损失,避免优化方向只朝着降低能耗预测部分损失的方向进行。

最终的损失函数为:

式(4)中:β是小于1 的正小数。损失函数拥有之后,即可建立神经网络进行训练。

6 结语

①采用Apriori算法可以挖掘设备故障间的关联规则,但是需要人为经验进行调参,该算法应用于运维系统中的故障预测时较为麻烦。

②采用神经网络进行的多任务学习可以同时解决建筑能耗和设备故障预测两个问题,即可解决Apriori 算法的缺点,又可以挖掘能耗相关参数和设备故障间潜在的关联关系。

③利用BIM 模型可以有效利用建筑的空间数据,增加特征数量。缺点是每次输入的是一个房间的数据,未能考虑房间与房间之间的关系、单个房间与整个建筑的影响,因此对于设备故障的预测存在一定的不准确性。

④对于故障预测损失函数需要考虑能耗预测和故障预测两个部分,对于故障预测,需要权衡正样本和负样本数量的不平衡,因此引入两个超参数ɑ和β对损失进行调节,让能耗预测和故障预测两个部分的优化更加合理。

⑤采用本方法的建筑能耗和设备故障预测可根据目标任务灵活调整网络结构,不足之处在于没有充分利用BIM模型中的空间拓扑关系。

猜你喜欢

项集能耗数量
120t转炉降低工序能耗生产实践
基于共现结构的频繁高效用项集挖掘算法
能耗双控下,涨价潮再度来袭!
芳芳猜童话书的数量
探讨如何设计零能耗住宅
统一数量再比较
日本先进的“零能耗住宅”
基于矩阵相乘的Apriori改进算法
不确定数据中的代表频繁项集近似挖掘
头发的数量