房间辐射时间序列决策树分类方法研究
2023-06-03陈友明刘佳明宁柏松方政诚
陈友明,刘佳明,宁柏松,方政诚
(1.湖南大学 土木工程学院,湖南 长沙 410082;2.郑州大学 土木工程学院,河南 郑州 450001;3.建筑安全与节能教育部重点实验室(湖南大学),湖南 长沙 410082)
空调设计负荷计算是空调系统设计的基础,负荷计算的准确性对整个系统运行能效有显著影响.辐射时间序列方法(RTSM)[1]是由热平衡方法(HBM)[2]推导而来的一种适合于工程应用的设计冷负荷计算方法,它有效地替代了其他所有简化(非热平衡)方法,如传递函数方法(TFM)、冷负荷温差/冷负荷因子方法(CLTD/CLF)和总等效温差/时间平均方法(TETD/TA)[3-4].然而,该方法对冷负荷的估计总是较为保守,随着房间玻璃面积比例的增加,RTSM 对冷负荷的高估倾向增加.在玻璃使用率高、辐射得热极高的情况下,峰值冷负荷高估高达37%[5].为提高辐射时间序列方法的准确性,许多学者对辐射时间序列方法的改进进行大量研究.文献[6]根据RTSM 使用的窗户模型和数据,建立了一套新的辐射/对流分裂比率.文献[7]用数值方法研究了窗户结构对对流换热速率和向下气流速度的影响.文献[8]认为由于内部辐射得热、太阳散射辐射和太阳直射辐射再次反射并通过窗户传输到室外,使用辐射时间序列前需减去这部分损失的热量,修改后的RTSM 与HBM 的偏差小于17%.文献[9]认为冷负荷对内表面对流换热系数和辐射相关参数十分敏感,影响辐射得热转化为负荷的快慢,ASHRAE 基础模型低估了测试建筑中存在的高换气次数下的内表面对流换热系数.文献[10]认为自然对流系数显著低估了内表面对流换热的速率,房间即使在换气次数低至3 ACH时,空气流动也相对良好.文献[11]比较并研究了各类房间内表面对流换热模型.
辐射时间序列方法的准确性与辐射时间序列密切相关.辐射时间序列不仅受内表面对流/辐射换热系数的影响,还受包括内围护结构及家具等在内的所有热质材料的综合影响.影响辐射时间序列的房间结构类型和特征参数众多,房间组合类型多.不同房间类型有不同的辐射时间序列,不便于工程设计使用.不同房间结构和特征参数组合使用同一组辐射时间序列就会带来较大的计算偏差.目前ASHRAE[3]仅给出轻型、中型、重型三类房间的典型结构,并对有无地毯及窗墙比进行划分,且轻型、中型、重型的划分并无明确的量化指标衡量.设计人员只能根据外墙、内隔墙、天花板和地板的结构综合考虑,就近选择一组辐射时间序列进行负荷计算,造成空调设计负荷偏差较大.此外,各国对于房间轻重标准也不相同,如英国的中型结构比美国的中型结构稍重,而我国缺乏一套符合国内典型建筑的辐射时间序列.针对上述问题,本文提出决策树方法提取影响辐射时间序列的关键特征参数,对结构类型及特征参数组合的房间进行分类,既降低辐射时间序列的组数,便于工程设计应用,又能准确计算出所有结构类型和特征参数组合房间的设计负荷.
1 辐射时间序列的生成方法
1.1 辐射时间序列
通过外围护结构进入房间的得热分裂为对流和辐射两种形式,对流部分立刻成为空调的冷负荷;辐射部分先被室内热质表面吸收,随后通过对流从这些表面转移到空气中才成为空调的冷负荷.这个过程存在时间延迟和能量递减.辐射时间序列方法用24项辐射时间因子描述辐射得热转换为冷负荷的过程.以24 h为周期,仅在第一个时刻输入单位三角波辐射能量,通过热平衡方法不断迭代,稳定后各小时内向空气传递的热量即为辐射时间因子.
不同的辐射分布特性会产生不同的辐射时间序列.根据辐射的分布不同,将辐射时间序列分为两类:太阳辐射时间序列和非太阳辐射时间序列[3].太阳辐射时间序列假定辐射均匀分布在地板和家具上,用于计算无内遮阳时透过窗户入射到地面的太阳直射辐射得热到冷负荷的转化;非太阳辐射时间序列假定辐射均匀分布在房间的所有内部表面,用于计算来自人员、灯光、设备、墙壁、屋顶和地板的辐射得热以及太阳散射得热到冷负荷的转化.此外,对于带有内遮阳(百叶窗、窗帘等)阻挡的直射辐射,由于进入房间前已被内遮阳吸收,并分裂为辐射部分和对流部分,辐射部分的冷负荷转化计算应使用非太阳辐射时间序列.
在计算房间冷负荷时,用辐射时间序列计算辐射得热形成的逐时冷负荷,计算式为:
式中:Qτ为τ时刻辐射得热形成的冷负荷,W;qτ-i(i=0,1,2,…,23)为房间τ-i时刻房间的辐射得热,W;ri(i=0,1,2,…,23)为辐射时间因子.
1.2 热平衡方法
热平衡方程组主要包括房间围护结构各节点热平衡方程及空气节点的热平衡方程.围护结构非稳态传热采用状态空间法,在一维空间上进行离散并建立各节点的热平衡方程.空气节点热平衡基于两个假设:一是室内空气温度均匀;二是室内空气对辐射完全透明,不吸收长波辐射.空气节点的热量交换包括室内空气与房间所有内表面的对流换热、内扰的对流部分、渗透和通风引起的热量交换以及空调系统带走的热量.联立所有节点热平衡方程得到房间的热传递过程的状态空间模型[12]:
式中:T为所有节点温度组成的列向量;U为影响房间热环境的热扰动组成的列向量;A和B为与房间热特性和扰动相关的系数矩阵;Q为输出的空调负荷,W;C和D为系数行向量.
本文运用热平衡方法计算大量结构与特征参数组合房间样本的辐射时间序列作为样本数据集,对该数据集使用大数据方法——CATR 决策树分类方法提取影响辐射时间序列的关键特征参数并进行分类.
2 房间特征参数提取与分类方法
2.1 CATR决策树分类方法
不同的房间结构和特征参数会产生不同的辐射时间序列.影响房间辐射得热向冷负荷转化过程的参数众多,取值范围大,特征参数组合数量巨大.本文采用CART 算法提取影响辐射时间序列的主要特征参数,并对房间特征参数进行分类,流程如图1所示.
图1 房间主要特征参数提取与辐射时间序列分类流程Fig.1 Extraction of main characteristic parameters of room and classification process of radiation time series
对所有数值型特征参数在一定范围内取值,对所有非数值型特征参数根据一定规律编号,转化为数值型特征参数.辐射时间序列的第一个因子作为不同类别的目标值,基尼指数为分类依据.
对于抽取的房间样本集合S,假设有K个类别,第k个类别的数量为Nk,则样本集合S的基尼指数G表达式为:
式中:|S|为样本集合S的样本数量.
给定子集样本数量阈值N0和基尼指数阈值G0.根据房间特征参数A的第i个值将样本集合S分裂成S1和S2(称为二分方案)两个子集,即两个子节点.二分方案下集合S的基尼指数为:
对于样本集合S中的所有房间特征参数,在最优二分方案下选取最优分裂特征参数作为样本集合S的分裂方案:
满足以下条件之一,停止分裂:
1)子节点数据集的样本个数小于阈值N0;
2)子节点数据集的基尼指数小于阈值G0.
对于生成好房间特征参数的分类决策树,为了防止过拟合,降低噪声对样本集的影响,提高模型分类的准确性或者满足树模型复杂度的要求,往往需要对决策树进行剪枝.剪枝策略为代价-复杂度剪枝,损失函数[13]为:
式中:Tt为以t为根节点的子树;C(Tt)为以t为根节点的叶子节点的预测误差;|Tt|为子树Tt的叶子节点的数量;α为代价与复杂度之间的平衡系数.若剪枝后的损失函数比剪枝前的损失函数更小,则进行剪枝.
在剪枝前预先计算子树所有节点的临界α值,临界α值为对该节点剪枝前后损失函数相等对应的α值.若给定的α值大于或等于该节点临界α值,则将该节点以下枝叶剪去,否则保留该节点.α值取值越大,剪枝的数量越多,分类的类别越少,但预测误差越大;α值越小,剪枝的数量越少,分类的类别越多,预测误差则越小.本文以满足工程应用为需求,兼顾准确性,以复杂度为主要目标,预先设定最多的分类数量阈值n,剪枝前先给出初始α值,一般为各节点中最小的临界α值,不断增大α值,使剪枝后分类数量达到设定的分类数量阈值n,再计算分类后各类别均方根误差的大小,给定误差限ε,若各类别的均方根误差小于误差限ε,则继续增大α值,直到选择出满足误差限的最佳分类数量.
2.2 各类别辐射时间序列代表值选取方法
通过CATR 决策树提取影响辐射时间序列的主要特征参数,并将房间结构和特征参数组合划分为若干类.每一类实际上是辐射时间序列相近的样本集合,是由若干个房间结构和特征参数组合样本组成的子集,因此需要找出一个最具代表性的辐射时间序列来代表该类样本子集.本文应用K-中心点(K-Medoids)算法确定最具代表性的辐射时间序列.中心点算法与均值算法相比有两个优点:1)降低了均值算法对离群点的敏感性;2)24 项辐射时间因子之和等于1,结果更合理.中心点算法步骤如下:
1)将类内各样本生成的辐射时间序列看成1×24的向量,即构成24 维的样本空间.计算类内所有样本的欧式距离D.
式中:Di,j为样本i与j间的欧氏距离;ri,k为样本i的第k个辐射时间因子;rj,k同理.
2)挑选与类内所有样本的欧氏距离之和最小的样本,该样本的辐射时间序列作为最具代表性的辐射时间序列:
3 房间结构和特征参数取值及其分类过程
3.1 房间特征参数选取及数据预处理
影响房间辐射得热向负荷转化过程的参数众多,主要包括外墙类型、窗户类型、内墙类型、地板类型、天花板类型、窗墙比、房间宽度、房间进深等.参考国家相关标准[14-18],选取典型结构构造不同的房间组合.对于外墙类型、天花板类型等非数值型参数,需要对这些围护结构按轻重程度排序,转化为数值型参数.以外墙特征参数为例,计算多组其他特征参数不变情况下不同外墙结构的辐射时间序列,该外墙结构下首项辐射时间因子越小,说明外墙结构越重,从而将外墙结构排序.根据《民用建筑供暖通风与空气调节设计规范》(GB 50736—2012)[14]给出13 种墙体类型,取值为1~13 的整数,分别代表13 种墙体.根据国家建筑标准设计图集:《蒸压加气混凝土砌块建筑构造》(13J104)[15],《砖墙建筑、结构构造》(15J101、15G612)[16],《轻集料空心砌块内隔墙》(03J114)[17],《轻钢龙骨内隔墙》(03J111)[18],选取12种内墙类型,结构由重型到轻型编号为1~12的整数,依次代表普通砖墙、黏土空心砖墙、轻集料内隔墙、密度为700 kg/m3的加气混凝土墙、密度为500 kg/m3加气混凝土墙、轻钢龙骨内隔墙,每种墙体主体材料厚度分120 mm 及180 mm 两种.由于其他轻质材料不能用于地板结构,只考虑钢筋混凝土地板,并按有无地毯将地板分为两类,地毯物性参数参考ASHRAE[3]给出的棉质地毯参数.天花板分为无吊顶、金属板吊顶、非金属板吊顶三类,吊顶空间空气层取40 mm,参数参考ASHRAE[3]给出的空气层热阻.房间结构和特征参数取值如表1所示.
表1 房间结构和特征参数取值表Tab.1 Room structure and characteristic parameter value
3.2 随机抽样
房间结构与特征参数组合众多,无法计算所有组合的辐射时间序列.本文将采用简单随机抽样方法抽取10万种组合作为样本集.
3.3 模拟计算
用热平衡方法计算抽取的样本集每个特征参数组合的非太阳辐射时间序列及太阳辐射时间序列.
3.4 CART分类
用首项辐射时间因子作为目标值,用CART 算法对样本集的房间结构和特征参数组合进行分类和提取主要特征参数,并对生成的决策树进行适当剪枝.在剪枝时预先计算每个节点的临界α值,即剪枝前后损失函数相等对应的α值.若给定的α值超过该节点剪枝的临界α值,则对该节点以下枝叶进行剪枝.将房间分类数量阈值设为12 类,各类别的均方根误差限设为0.005,调整α值的大小,将房间结构和特征参数分成若干类别,以满足工程应用需求.
3.5 各类别辐射时间序列代表值选取
分类后的各类子样本集为辐射时间序列特性相近的房间结构与特征参数组合的房间样本集.用2.2节的K-中心点算法确定分类后的子样本集的辐射时间序列代表值.
4 结果与讨论
4.1 CART算法分类结果
首项辐射时间因子代表了辐射得热第一个时刻内转化为冷负荷的比率,反映了辐射得热转化为冷负荷的快慢,因此作为分类的目标值.经过剪枝后的结果如图2所示,图2中最后一行数字为该类别中最多的样本的首项辐射时间因子.非太阳辐射时间序列分为12类,太阳辐射时间序列分为8类.
图2 房间辐射时间序列的分类树Fig.2 Classification tree of room radiation time series
通过决策树寻优过程提取了影响辐射时间序列的主要特征参数.对于非太阳辐射时间序列,第一个节点分裂特征为内墙类型,即对辐射时间序列影响最大的特征,前10 种内墙类型为实心墙,划分为一类,后两种为轻钢龙骨内隔墙;第二层节点分裂特征均为地板类型,根据是否铺地毯划分为两类;第三层节点均为天花板类型,无吊顶和金属板吊顶为一类,非金属板吊顶为另一类;第四层节点主要为窗墙比,窗墙比越大,首项辐射时间序列因子越大,房间类型越轻;第四层还有一个节点分裂特征为房间宽度.因此,对非太阳辐射时间序列影响最大的特征主要为内墙类型、地板类型、天花板类型、窗墙比.外墙类型、窗户传热系数、房间进深等特征参数没有出现在决策树中,对非太阳辐射时间序列的影响较小.
对于太阳辐射时间序列,第一个节点分裂特征为地板类型,即是否铺地毯对太阳辐射时间序列影响最大;第二层节点分裂特征为内墙类型,实心墙体为一类,轻钢龙骨内隔墙为一类;第三层节点分裂特征为天花板类型,无吊顶和金属板吊顶为一类,非金属板吊顶为一类.因此,对太阳辐射时间序列影响最大的特征主要为地板类型、内墙类型、天花板类型,而窗墙比、外墙类型、窗户传热系数、房间宽度、房间进深等特征参数没有出现在决策树中,对太阳辐射时间序列影响较小.
外墙类型对两类辐射时间序列影响均比较小,因为墙体内表面薄层吸收的辐射能量转化为四个部分:自身储存的部分、向墙体内层传递的部分、以辐射形式与房间其他表面换热部分,以及以对流形式与空气换热的部分.其中只有以对流形式与空气换热的部分转化为冷负荷.因此,辐射能量转化为冷负荷的快慢主要由这四个部分对应的热物性参数决定,对流换热系数影响与空气的换热,辐射换热系数影响与其他表面的换热,薄层的密度和热容参数影响自身热量储存,薄层的导热系数影响薄层向墙体内层传递热量.由于满足规范要求的外墙厚度均较大,密度和热容较大,大部分能量用于自身储存和向墙体内层传递,以对流形式传递到空气中的能量较少,因此,辐射得热转化为冷负荷过程较慢,首项辐射时间因子均偏小.对于内墙类型,轻钢龙骨内隔墙中间为空气层,蓄热能力较弱,同时难以向内墙内部传递热量,使房间辐射得热转化为冷负荷过程较快,首项辐射时间因子偏大.其他实心内墙均有较大热容,与轻钢龙骨内隔墙存在明显差异,故划分为两类.而前10 种内墙不再继续划分类别,说明不同实心墙体对首项辐射时间因子影响的差异较小.对于天花板类型,增加吊顶后,多一层空气层,增大了热阻,减少了向天花板内部传递的热量,与没有吊顶相比,辐射得热转化为冷负荷过程更快,首项辐射时间因子偏大.由图2 发现,无吊顶与金属板吊顶为一类,非金属板吊顶为另一类,说明金属板隔热效果并不明显,主要由于金属板传热系数较大,阻断热量向天花板内部传递的能力较弱,而空气层的传热系数较小,对热量向内部传递有一定阻隔作用,使得辐射得热向冷负荷转换过程稍微比无吊顶偏快,而远慢于非金属板吊顶.对于地板类型,有无地毯作为辐射时间序列不同类别划分的主要特征,说明有无地毯对辐射时间序列的影响较大.增加地毯后,辐射首先被地毯表面吸收,由于地毯热阻较大,阻止热量向地板内部传递,同时地毯自身蓄热能力较弱,温度升高较快,大部分热量只能通过对流和辐射传递到空气和房间其他表面上,使得辐射得热向冷负荷转化过程加快,首项辐射时间因子偏大.对于窗墙比,由于窗户玻璃蓄热能力很弱,玻璃获得的辐射热量很快以辐射和对流的形式释放,因此,窗户面积比例越大,辐射得热向冷负荷转化过程越快,首项辐射时间因子越大.由于太阳辐射初始不会分配到外墙和外窗的内表面上,而是经过其他表面再辐射使窗户获得热量,这部分热量比重较小,因此,窗墙比对太阳辐射时间序列的影响较小,而对非太阳辐射时间序列影响较大.对于房间宽度,房间宽度越大,外墙、地板、天花板面积比重越大.若节点数据集中的外墙、地板、天花板均偏重型,则使首项辐射时间因子偏小;若节点数据集中的外墙、地板、天花板均偏轻型,则使首项辐射时间因子偏大.
4.2 各类辐射时间序列代表值
用K-Medoids 中心点算法确定分类后子样本集的辐射时间序列代表值.各类辐射时间序列代表值如图3 所示,非太阳辐射时间序列的首项辐射时间因子分布比较均匀,分布范围较广,明显看出各类之间的区别,分类效果较好.太阳辐射时间序列分布在两个不同的范围内,类别1~4 均为无地毯房间,首项辐射时间因子较小;类别5~8 为铺地毯房间,首项辐射时间因子较大,说明房间有无地毯对太阳辐射时间序列影响极大.
图3 各类别辐射时间序列代表值Fig.3 Representative values of radiation time series of each category
美国ASHRAE[3]标准给出的非太阳和太阳辐射时间序列第一个因子范围分别在0.22~0.53 范围内和0.26~0.56 范围内.本文计算的国内典型房间类型非太阳和太阳辐射时间序列第一个因子范围分别在0.19~0.40 范围内和0.18~0.44 范围内,整体上比ASHRAE 标准偏小.主要由于ASHRAE 中所有房间均带有隔声板吊顶,其热阻较大,隔热效果很好,且未考虑无吊顶的情况,同时,本文没有加入不符合国内规范要求的轻型外墙结构,导致ASHRAE 中首项辐射时间因子偏大,因此,ASHRAE 标准不适合我国部分建筑类型.在ASHRAE中,仅给出轻型、中型、重型房间对应的外墙、内墙、天花板、地板结构,涉及的围护结构组合房间类别数量较少,即当外墙属于重型房间结构,而内墙属于中型房间结构等类似情况时,无法准确判断房间整体结构类型.在特征参数选择上,ASHRAE 先通过围护结构判断房间类型,在此基础上根据窗墙比和是否铺地毯决定辐射时间序列的选择,而本文考虑所有特征参数对辐射时间序列的影响,从影响最大的特征参数开始,通过决策树判断房间所属类别,直接使用相应的辐射时间序列,无需判断房间轻重类型,结果更加合理.
4.3 适用性检验
采用均方根误差(RMSE)[6]的平均值评估每一类的代表性辐射时间序列与类内样本的误差,RMSE计算式为:
式中:rs,k为代表性辐射时间序列的第k个辐射时间因子;ri,k为样本i的第k个辐射时间因子;N为各类的样本数.
各类代表性辐射时间序列的RMSE 值见表2 和表3.结果表明,非太阳辐射时间序列各类别的RMSE 值在0.003 4~0.005 8 范围内,太阳辐射时间序列各类别的RMSE 值在0.001 4~0.003 0范围内,误差数值很小,说明各类别的样本数据分布较集中,各类别代表性的辐射时间序列能够代表整个类别.
表2 非太阳辐射时间序列的RMSE值Tab.2 RMSE value of nonsolar radiation time series
表3 太阳辐射时间序列的RMSE值Tab.3 RMSE value of solar radiation time series
5 结论
1)影响辐射时间序列的房间结构类型和特征参数众多,房间组合类型多.现有可用的辐射时间序列涉及的房间结构类型和特征参数数量太少,导致空调设计负荷偏差较大.本文提出用CART 决策树算法提取影响房间辐射时间序列的主要特征参数,对房间结构和特征参数组合进行分类.
2)用CART 决策树算法对随机抽取的针对国内常用围护结构类型及其特性参数组合房间样本进行分类,讨论了影响辐射时间序列的主要因素.将国内房间特征参数组合的非太阳辐射时间序列分为12类,太阳辐射时间序列分为8 类.通过决策树判断房间所属类别,直接使用相应的辐射时间序列,无需判断房间轻重类型,使辐射时间序列方法计算设计负荷更加准确.
3)用K-Medoids 中心点算法确定了分类后的类内代表性辐射时间序列.各类别的RMSE 值很小,各类的代表性辐射时间序列能够代表整个类别.