室温空间特性差异性分析及抽样推断方法研究
2022-09-28张旭张浩浩顾吉浩
张旭,张浩浩,顾吉浩
(1.国家能源集团宁夏电力有限公司,银川 750001;2.工大科雅(天津)能源科技有限公司,天津 300401;3.河北工业大学,天津 300401)
0 引言
十九届五中全会将碳达峰、碳中和作为“十四五”乃至2035 国家战略目标[1]。低碳转型已成为各行各业不可逆的大趋势,供热领域也在积极探寻新的技术发展路线,以实现碳中和目标。随着云计算、大数据、物联网、人工智能技术的发展,窄带蜂窝物联网(NB-IoT)技术逐渐兴起[2],基于NB-IoT 技术的室温采集装置在供热行业得到推广和应用。在智慧供热系统的信息化建设中,无论是供给侧还是需求侧,热用户室温监测是实现智慧供热的重要手段之一[3]。
近年来,国内外学者对热用户室温数据的影响因素进行了大量研究。刘巧玲等[4]采用数值模拟软件Fluent,研究并发现空调系统中室内温度传感器位置的设置对人员热舒适性和空调系统能耗的影响较大。程雪[5]采用正交试验设计,选取了5 个对室内热环境有影响的因素,通过Flo Vent 仿真软件对16 种工况进行模拟,分析这些影响因素的相关性,并提出了智慧供暖建筑室内平均温度监测研究法。梁媛等[6]采用DeST-h 软件对不同入住率和不同房间位置的住户耗热量和室温进行仿真模拟,得到建筑模型各种工况下的代表温度标准值。王淞等[7]研究了采暖房间室温的波动幅度和变化规律,应用简化数学模型对非稳态传热过程进行模拟,分析供热附加率、外围护结构条件及房间在建筑中所处位置等因素对室温的影响。陈军伟[8]通过多属性感知数据间的特征分析,提出基于时间稳定性和属性相关性的感知数据恢复算法,用于无线传感器网络中的数据清洗和缺失数据恢复。张婷婷[9]基于属性之间的特征以及时-空相关性,建立了传感器感知数据缺失重建模型。翟勇等[10]针对供热机组大数据状态评估过程中存在的异常数据,提出了一种基于均值漂移聚类算法的数据清洗策略,能够有效区分数据中的异常点并进行清洗处理。郭佳昌等[11]基于孤立森林算法和反向传播(BP)神经网络分别建立了异常检测模型和异常分类模型,提出了异常供热管网运行数据的校正方法。
然而,热用户室温数据通常呈现出来源多、信息异构、数量庞大等特点,原始室温采集数据往往不能满足后期供热状态评价的要求。关于室温数据差异性的研究多采用建模仿真方法,但建立的理想模型缺少实际工程应用大数据的支撑。本文对实际工程案例中的室温差异性规律进行分析,并利用统计学方法对室温的多种抽样方法、最佳抽样比例进行研究,指导室温测点安装比例以及安装位置布局,实现建筑整体真实供热效果反馈,以构建精准的供暖质量评价体系。
1 研究对象
1.1 项目概况
国能宁夏供热有限公司的智慧供热庭院网荷一体化优化技术研究项目采用典型室温采集系统,覆盖了华府万和城、云和一期、云和二期、丽景雅居共4 个小区,共安装典型室温采集装置约4 500 块,覆盖8个热力站机组,总供热面积50 万m2。
1.2 数据来源
本项目安装的设备为开关型市政供电式室温采集装置,室温传感器测量精度为±0.5 ℃,数据采集和传输时间间隔为20 min。安装用户覆盖二级管网的近端、中间、末端;对于同一幢建筑,覆盖底层、中间层、顶层以及边角位置。表1 为本研究使用的数据样本来源说明,分析数据仅取正常供暖住户。图1 为从研究项目的智慧供热软件平台中获取的2021年典型室温采集原始数据时间序列散点图。
图1 室温采集原始数据时间序列散点图Fig.1 Time series scatter plot of the collected indoor temperatures
表1 室温数据样本来源说明Table 1 Room temperature data sample source description
2 理论方法
室温采集数据除了受测量精度、设备故障、通信故障等因素影响,还易受到人为因素干扰,例如开窗、开空调、设备移位等。这些情况常常会导致数据水平迁移和趋势变化异常,无法合理表征用户的供热质量[12]。因此,海量室温数据必须经过严格筛选和分析后才能用于统计分析。
2.1 数据清洗
目前,数据清洗常采用拉依达准则、四分位数法和K-means 聚类等,保证室温采集数据的合理有效[13-14]。本文通过箱线图和频率分布图描述数据分布特征。频率分布图排除了由于取样不同和测量不准所带来的误差,能够精确地反映总体分布规律,直观表征数据的趋势特征、波动幅度及离散情况。箱线图主要通过数据中的最大值、最小值、中位数和2 个四分位数据描述数据的整体形态,并可以表征偏离较大的离群数值。箱型图原理如图2所示,通过其上、下限可以很好地剔除异常数据。
图2 箱型图含义解释Fig.2 Box plot meaning explanation
2.2 抽样推断
2.2.1 抽样方法
抽样方法主要包括随机抽样、分层抽样、整群抽样、系统抽样。在实际调查研究中,很少单独采用随机抽样方法,常常将2 种或多种抽样方法结合使用,进行多阶段抽样[15]。本文针对室温采集较全的华府万和城小区(约2 000 户),按照20%抽样比例,使用整群抽样、分层随机抽样、分层系统抽样3种抽样方法,对比分析选择合适抽样方法。
整群抽样是先将总体划分为K个群,再随机抽取k个群(k<K),由抽中各群的全部观察单位组成样本。本次以第9个群(即#1,#10,#19,#28,#37栋)的全部室温数据作为抽样样本。
分层抽样是先将总体中全部个体按对主要研究指标影响较大的某种特征分成若干“层”。样本按照住户处于供热循环的始端、中端、末端及不同楼层顶部、中部、底部、边端组合分为12层。分层随机抽样是在12 层中每层按照完全随机的方法进行抽样最后组合为分层随机抽样样本;分层系统抽样是在12 层中每层按照系统抽样的方法进行抽取样本最后组合为分层系统抽样样本。
2.2.2 成数推断
实际供热中室温分布情况一般呈现正态分布规律,各室温区间均会有一定的比重,应采用成数抽样统计。
在估计室温分布成数P时,由于P未知,用样本比例p代替P,计算估计量的标准误差,在1-α的置信水平下,总体比例P的置信区间为
式中:N为样本总量。
不重复抽样下的成数抽样极限误差
3 结果与讨论
3.1 室温数据空间特性差异性分析
通过对典型室温多维度统计分析,判断其安装位置是否合理、是否由于开窗通风等因素导致数据异常;通过对各楼层、各楼栋的室温分析,判断小区水平失调及垂直失调情况;通过对各位置用户室温分析,判断小区不同位置房间建筑热惰性及供热系统调控现状。
3.1.1 楼栋落位空间特性分析
为分析不同楼宇供热是否存在差异,以楼为单位进行室温分布统计,分析供暖稳定期(2021-12-23—25)部分楼栋室温分布规律(如图3 所示)。从图3 中可以看出,不同楼栋室温中位数不同,#1,#41楼最大,#4,#31 楼最小。中位数可以代表该楼栋整体的平均室温,由于二级网水平方向存在水力失调,导致不同楼栋之间的整体供温质量不同;通过连续3 天的中位数变化趋势可以看出,随着室外温度的变化,各楼栋室温差异性趋势基本保持一致,在二级网水力工况保持稳定的情况,不同楼栋之间的室温差异性基本保持一致。
图3 不同楼栋的室内温度箱型图Fig.3 Box diagram of indoor temperature in different buildings
各楼栋室温基本呈现正态分布(如图4 所示)。不同楼栋的室温离散度不同,#2,#3,#4 楼离散度较大,#1,#8 楼离散程度较小。最高频率对应室温可以代表楼栋平均室温整体供暖质量,通过曲线对比可知,#1,#8,#9,#41 楼最大频率室温相对较高,在24 ℃以上;#4,#31楼最大频率室温相对较低,在23 ℃以下。
图4 不同楼栋的室内温度频率分布Fig.4 Frequency distribution of indoor temperatures in different buildings
3.1.2 楼层空间特性分析
一般,高层住户室温较高,底层住户室内温度稍低[16]。本文研究的小区楼层为33层,以楼层为单位对每层住户室温分布进行统计,其中低区机组为1—17 层为供热,高区机组为18—33 层供热(如图5所示)。
从图5 可以看出,不同楼层的室温箱型图存在明显的差异性,其中低区机组不同楼层的供热效果呈现出明显的“底层低,高层高”,1—7层室内温度中位数均在25 ℃以下,8—17层中位数均在25 ℃以上。高区机组的低层和高层室温变化趋势不明显,但是高区机组整体室温高于低区机组室温。最顶层室温相比于其他楼层出现明显的降低。
图5 不同楼层室内温度箱型图Fig.5 Box plots of indoor temperatures on different floors
从传热学角度分析,由于热空气有自下向上流动的物理特性[17],会造成高层室温与低层室温低的差别,但由于不同楼层间的热传导,温度差别不大,差值在2 ℃内。以#9,#26楼为例,不同楼层室内温度频率分布如图6 所示。由图6 可以看出,各楼层室温正态分布不明显,多数频率曲线在“主峰”之外还存在一个“副峰”,由于同一楼层住户是由不同水平方向引伸出的单元垂直立管供热,推测是不同立管间水平水力失调造成的。通过最高频率室温分析,15,17,26,29层最高频率室温相对高,5,6层最高频率室温最低。
图6 不同楼层室内温度频率分布Fig.6 Frequency distribution of indoor temperatures on different floors
3.1.3 房间位置空间特性分析
对住户进行位置分类,分析不同位置住户室温在供暖稳定期的历史数据,可进一步指导典型室温下供热机组的安装。将住户位置划分为边角住户、底层住户、顶层住户、中间住户。本次共选取875个典型住户的历史室温数据进行分析,其中边角住户占比14%,底层住户占比7%,顶层住户占比6%,中间住户占比73%。不同位置典型住户室温情况如图7所示。
图7 不同房间位置室内温度箱型图Fig.7 Box plots of indoor temperatures in different parts
在室外温度相对稳定工况下,底层住户室温中位数最低,顶层住户和边角住户的室温中位数接近,中间住户室温最高。由于中间住户采样数量较其他3类的住户多,箱体较大。
室温频率分布如图8所示。不同房间位置室内温度也存在差异性,顶层住户最高频率室温相对较高在26 ℃左右,在22 ℃处在一个“副峰”;中间住户和边角住户最高频率室温接近,约为24 ℃;底层住户最高频室温分布有2个峰值,21 ℃和23 ℃。
图8 不同房间位置室内温度频率分布Fig.8 Frequency distribution of indoor temperatures in different room locations
3.2 室温数据统计抽样推断
室温抽样推断是从所有热用户室温数据中,抽取一部分样本数据进行统计分析,并对总体数据进行推断和评估。
3.2.1 不同室温抽样比例对比分析
以采用分层随机抽样方法,以华府万和城小区为总样本,对总体样本分别进行抽样率为3%,5%,7%,9%,10%,15%,20%的统计分析,分5 个室温区间进行比重值和成数分析统计,结果见表2。
由表2可知:当抽样比例<9%时,在不同的室温区间均存在样本比重与总体比重有差异的情况,无法满足抽样比重要求;当抽样比例≥9%时,各区间的样本与总体室温分布比重均无明显差异,说明该比例可满足抽样推断的要求。
3.2.2 不同室温抽样方法对比分析
华府万和城小区共计43栋楼,采用所有楼栋号从小到大排列,每隔4 栋选取1 栋(即选取比例为20%)。根据2.2 节提出的抽样方法和成数推断,进行整群抽样、分层随机抽样和分层系统抽样,结果见表3。
在置信度为95%,显著性水平α=0.05时查询获得|Zα/2|=1.96[18]。这3 种方法的区间比重Z值都小于临界值1.96,与总体区间比重没有显著差异。但通过对比抽样结果与总体比重的差异可知,分层随机抽样各室温区间的样本比重与总体各区间比重Z值相差更小,更能代表或推断出总体的室温区间分布。
对于容量较大、个体差异不明显的总体,通常采用分层系统抽样方法或整群抽样。分层系统抽样虽然保证了抽样的公平性和客观性,但对于许多容量较大、某方面特征有较大差异的样本,该方法还是不具有良好的代表性。这时就考虑用分层随机抽样的方法来抽取样本,根据某一特性(如不同的房间位置、与热力站的距离、不同楼层位置等)将样本进行分层处理后,可以保证各特征在随机抽样过程均能被覆盖,进而获取准确度更高的推断结果。
根据分层随机抽样方式,得出抽样均值xˉ=21.346 ℃,σ=1.91 ℃,n=378。假设不知道小区总体室温情况,即总体标准差未知,可用样本标准差代 替,则 总 体 均 值 的 区 间 估 计 值 为(xˉ-Zα/2×
4 结论
本文通过室温历史数据统计分析,从空间维度上对比了热用户的室温差异性,并基于差异性分析结果,分析不同抽样方法对室温统计结果的影响,主要结论如下。
(1)利用四分位法箱型图和数据分布密度正太分布规律,识别供热异常室温数据;室温中位值和最高频室温统计数据可作为供热质量定量评价依据,指导后续热力站的优化调控。
(2)受垂直水力失调的影响,不同楼层室温存在差异性。自下而上的热对流和热传导会导致室温在垂直方向呈现出“底层低,高层高”的趋势。
(3)不同位置的热用户,受到垂直失调和水平失调的共同影响,加之房间与外界散热量、用户间传热相互作用不同,室温规律为:中间住户>顶层住户≈边角住户>底层住户。
(4)基于分层随机抽样的方法,当抽样比例≥9%且置信度为95%的情况下,样本数据可满足推断出室温总体分布规律的要求。