基于马尔科夫算法对预测窗户状态模型的研究
2019-04-07于浩玮张伟捷张畅畅
于浩玮 张伟捷 张畅畅
摘 要:针对目前国内室内人员开窗行为使用算法的局限性,本文提出使用马尔科夫算法对办公建筑室内人员开窗行为建模,并以预测准确率来评价该模型。结果表明,马尔科夫模型在本文数据下最高预测准确率达到60%,平均预测准确率在58%左右,相比于同等数据条件下的逻辑回归模型,预测准确率提高4%左右。但是,该模型的稳定性较差,需要多次模拟结果取平均值作为最终预测结果进一步分析。
关键词:室内人员 开窗行为 马尔可夫 办公建筑
中图分类号:TU834.1 文献标识码:A 文章编号:1674-098X(2019)11(a)-0049-03
1 研究背景
近年来越来越多的相关研究表明:室内人员开窗行为对建筑能耗、室内热舒适和室内空气品质有着直接影响,因此,对于室内人员行为的研究逐渐成为了研究热点。目前国内相关建模研究多使用逻辑回归算法分析住宅建筑、办公建筑及医院建筑的开窗行为,也有研究使用高斯算法对办公建筑开窗行为建模,并与逻辑回归模型进行对比。但是,在国内却几乎没有研究使用传统经典算法之一——马尔科夫算法对开窗行为建模。以上相关研究所使用的算法虽然能分析出对窗户状态有影响的因素并预测窗户状态,但它们不能预测窗户状态的变化(0→1和1→0)。忽视窗户状态的变化,有可能造成模型预测准确率的下降。基于此现状,本文测试了北京某办公建筑在过渡季的相关数据来进行建模,选择离散型马尔科夫链算法来模拟窗户状态的变化,而不仅仅是预测窗户状态,研究该算法所建立模型的预测准确率。
2 算法介绍
根据对已有马尔科夫模型的研究,本文结合数据实际情况,建立了离散型马尔可夫模型。该模型的一般流程如图1所示。第一步是根据相关因素估算初始窗口状态(任何选定时间段)的概率。其中,估算方法是根据该时刻的环境参数使用逻辑回归算法预测得到的(以此可以将连续时间点随机分布;逻辑回归算法不在此处赘述,详细算法可参考[7])。第二步是构建马尔可夫转移矩阵,该矩阵可以描述窗户状态变化及相关变化的概率。第三步是使用马尔可夫过程的定义来基于当前时刻的状态预测下一时刻的窗户状态。离散型马尔可夫链过程的定义如公式(1)所述:
3 测试建筑及参数基本信息
本文所使用数据是实测了北京某高校办公建筑中5个房间在过渡季节的室内外温度、室外相对湿度、风速、风向、日照时长、PM2.5浓度、室内人员在室情况以及窗户状态共9个物理量。如图2(a)所示,该建筑共有两层,首层是实验室,二层全部是办公室。首层的外维护结构为砖块,二层的外维护结构是由370mm普通砖(导热系数:0.6W/(m·K))和200mm聚苯乙烯泡沫(导热系数:0.033W/(m·K))组成。二层共有9间办公室,每一间办公室的面积和布局都大致相同,标准间室内布局如图2(b)所示。每间办公室的建筑面积约为10㎡,而且房间内都有一个南向可以自由滑动的平开窗(150cm×160cm),最大可开启一半;房间内设有可以用来遮挡阳光的窗帘;室内所有窗户和窗帘均可由室内人员自由操作。本次测试办公室均为单人办公室,且室内教师均无吸烟史。建筑周围没有影响办公室内太阳辐射度的高大遮挡物或者树木。此外,根据现场调研问卷显示,建筑周围通常很安静,不会对室内人员的开窗行为造成任何影响。因此,噪音在本研究中不被视为开窗行为的驱动因素。本次数据收集于过渡季节(2015年3月15日—2015年5月16日),在此期间自然通风是调整室内热环境和空气质量的主要室内人行为。
4 建模及结果
如前文所述,逻辑回归模型在预测过程中忽略了室内人员开窗动作的真实动态过程。该模型主要用于根据相关环境因素来预测窗户状态概率,而非实际开关窗动作的概率。为了得到更好的预测效果,本文使用了马尔可夫模型,希望在考虑人员实际开关窗动作后再进一步预测,以此提高模型预测准确率。此外,马尔科夫模型中当前时刻窗户状态概率及转移矩阵内所需概率均有逻辑回归算法得出。因此,马尔科夫模型总体分为两部分:(1)当前时刻窗户状态及转移矩阵内元素的预测。(2)根据公式计算得出下一时刻窗户状态概率。可以认为,马尔科夫模型是逻辑回归模型的进一步修正。
总的来说,马尔科夫模型的关键在于找到可用的转移矩阵。表1提供了马尔科夫转移矩阵中各个行为预测概率所对应的相关系数和截距。转移矩阵中的窗户由开到关的概率(P10)和由关到开的概率(P01)是具体直观表现窗户状态变化的因素。由于这两个概率的预测是由逻辑回归算法得出,并得到相关影响因素排名。窗户被打开的概率与太阳辐射度,室内温度和PM2.5浓度相关,而窗户被关闭的概率则与室外温度,室内温度和风速相关。根据建模结果总结,可以将预测P01的相关因素可以被分为三组:日照时长(θsh),室内温度(θit),室內温度和PM2.5浓度(θit+θPM)以及日照时长和室内温度(θsh+θit)。同样的,P10的预测也分为三组:室内温度θit,室内温度和风速(θit+θws)以及室内外温度和风速(θot+θit+θws)。开窗行为P01随着日照时长和室内温度的增加而增加,随着PM2.5浓度的增加而减少,这意味着室内人员倾向于打开办公室窗户以降低室内温度;对应的,风速的增高和室内外温度的下降则与关窗行为概率(P10)的增长在某种程度上相对应。
表2是對开关窗动作有显著影响因素的排序。对开窗动作概率(P01)预测影响最大的因素是室内温度,日照时长和PM2.5浓度其次;对于关窗动作概率(P10)来说,风速的影响最显著,其次是室内外温度。
除了转移矩阵内概率根据不同因素组合而分为多组,当前时刻窗户状态也同样的分为三组。由此,马尔科夫模型共有八个子模型产生,并与逻辑回归模型相对应,如表3所示。为了进一步说明马尔科夫模型的预测准确性,本文将中间步骤是用的逻辑回归模型结果引用进行对比。马尔科夫模型的预测准确率比对应的逻辑回归模型的预测准确率平均高4.4%,这说明马尔可夫算法对逻辑回归模型有一定的修正作用。对比模型1和模型3,将室内温度加入开窗行为预测模型中使新模型的预测准确率提高2%;而对比模型2和模型3,在其他步骤使用影响因素一样的前提下,新增的日照时长于开窗动作中不仅没有提高新模型的准确率,反而下降了0.45%。同样的,对比模型5和模型6,增加的因素也是是新模型的预测准确率有所下降。而模型8在模型7的基础上增加了室外温度来预测关窗动作,新模型的预测准确率则升高4.82%。此外,将PM2.5浓度考虑进开窗行为的模型准确率都较高。这两个模型虽然在窗户状态预测过程中放入的因素数量不是最多,但是主要的影响因素都在模型中。综上,马尔科夫模型准确率不是由相关因素数量决定的,而是将最有影响的因素放在合适的位置才能使模型预测准确率最高。
除了模型的最高准确率,模型的稳定性也应该引起重视。在不同影响因子数量下,关于逻辑回归和马尔科夫模型预测准确率的进一步对比如图3所示。从图3中可以清晰的看到,预测开窗行为的马尔可夫模型具有更高的预测精度。但是,该模型的稳定性比逻辑回归模型的稳定性更差。导致这种不稳定性的原因之一可能是训练数据量较小,训练模型中的数据不能完整地覆盖所有情况,这会放大模型中的误差。此外,由于在训练数据处理过程中要保证数据是严格按照时间顺序排列,且时间间隔为10min,所以训练数据中一些明显错误的数据不能剔除,这也可能导致了马尔科夫模型的不稳定性。而且,马尔科夫模型在计算过程中使用了多个预测概率进行叠加计算,这也可能会导致错误的偏移或放大。因此,与逻辑回归相比,即便马尔可夫模型的准确率较高,但是预测的窗户状态时模型稳定性较差。
5 结语
通过建立马尔科夫模型对办公建筑室内人员开窗行为的模型,模拟结果显示:该模型预测准确率较好,平均准确率在60%左右,高于同等条件下的逻辑回归模型准确率。但是此模型的稳定性较差,同组数据预测结果跳动较为明显,需要在多次运行后取平均值作为最终结果来分析。
参考文献
[1] Wang, Chuang, et al. A generalized probabilistic formula relating occupant behavior to environmental conditions[J]. Building and Environment,2016(95):53-62.
[2] Feng, Xiaohang, et al. A preliminary research on the derivation of typical occupant behavior based on large-scale questionnaire surveys[J]. Energy and Buildings,2016(117):332-340.
[3] SongPan,Yingzi Xiong, Yiye Han, Xingxing Zhang, Liang Xia, Shen Wei, Jinshun Wu, Mengjie Han, A study on influential factors of occupant window-opening behavior in an office building in China[J]. Building and Environment,2018(133):41-50.