基于机器学习的燃气灶效率测量的因素分析研究
2020-09-23国家燃气用具产品质量监督检验中心佛山张明伟
国家燃气用具产品质量监督检验中心(佛山) 张明伟
1 引言
热效率是燃气灶非常重要的热工性能指标,因而国家强制要求检测燃气灶的热效率。热效率的检测会受到燃气热值、燃气温度以及测量环境的温度等因素的影响。理想的外在条件是采用燃气的标准热值,测试环境和燃气温度均在标准状态下。但是在实际的测试过程中,满足这样的条件是存在一定困难的,因此国家标准GB16410-2007中,允许这些外在影响因素可以在一定范围内变化。从检测的角度,需要了解这些外在因素对燃气灶热效率的影响程度,提出高精度测量燃气灶的新方法。
另一方面,在不同的季节测量的同一款燃气灶的热效率会有较大的波动,这种波动对于燃气灶研发具有较大的干扰性,无法确认燃气灶热效率的变化是来自外在因素还是燃气灶的自身结构。因而,也需要了解外在因素对燃气灶热效率测量的影响规律。
建立物理模型来分析这些外在因素的变化是困难的,因为目前尚无法建立一个较为准确的物理模型来计算燃气灶的热效率。基于大量的燃气灶热效率的测试数据,可以采用机器学习的方法,通过数据挖掘的方式对外在环境因素的影响进行分析。随机森林算法(Rondom forest algorithm)是一种集成机器学习算法,随机森林由很多的树组成,每一棵树之间没有关联。采用自助采样法带来的样本扰动和对属性随机抽取带来的属性扰动,使得作为随机森林基学习器的树具有“多样性”。随机森林可以用于分类和回归,具有计算开销小、泛化性能强、可以拟合复杂的非线性函数等诸多优点。
本文利用实验数据通过随机森林算法的学习和验证,建立外部因素的热负荷和热效率的关系模型,并通过模型进行影响因素重要性分析。
2 环境、气源条件对燃气灶性能的影响
2.1 热效率预测模型
2.1.1 构建模型
实验获得的485组数据中,数据集的75%的划分为训练集,其余25%划分为测试集。特征为室温波动、燃气温度波动和低热值波动,标记为热效率。采用随机森林机器学习算法,使用交叉验证法得到最优参数。训练得到热效率预测模型,探究三个外部因素(室温、燃气温度和低热值)对热效率的影响。
2.1.2 模型分析
测试集和训练集热效率预测值与实际值的关系、模型预报热效率的绝对误差和相对误差分别如图2-1、2-2和2-3所示。
图2-1 模型测试集和训练集热效率预测值与实际值关系
图2-2 模型热效率预报的绝对误差
图2-3 模型热效率预报的相对误差
输出显示,测试数据热效率平均绝对误差为1.147%,训练数据热效率平均绝对误差为0.549%。统计结果表明,对于热效率绝对误差[-2,2]%内,占所有数据集的97.13%;对于热效率相对误差[-0.03,0.03]内,占所有数据集的97.13%,这些表明模型性能良好。
此外,对于三个输入特征:室温波动、燃气温度波动和低热值波动,特征重要度分别为0.26725、0.28533和0.44742。
2.2影响因素的特征重要度分析
根据建立的模型,进行了影响因素的特征重要程度分析,分析结果如图2-4所示。从图2-4可以看到,对热效率影响的重要程度最大的是燃气低热值的波动,其次是燃气温度波动,最后才是室温波动。
图2-4 三个热效率预测模型中的特征重要程度
2.3 单因素对燃气灶热负荷和热效率的影响
利用所建立的数据模型,对室温、燃气温度和低热值对热效率的影响进行了单变量分析。
燃气热值、燃气温度以及室温对热效率的单变量影响分别如图2-5、2-6、2-7所示。
燃气热值对燃气灶热效率的影响非常显著,一般地,采用高热值燃气测量的热效率要低于采用低热值燃气的测量结果。因此在进行燃气灶热效率测量,如果有条件,尽量保证燃气热值的稳定。
燃气温度在18-22℃范围内,对燃气灶热效率的检测影响非常剧烈,这个区域是检测燃气灶的主要燃气温度区域。因而燃气温度的精确测定对燃气灶热效率检测精度意义重大。
观察到,随室温增加,热效率波动下降,22℃之后又波动上升;随燃气温度增加,热效率波动较大,整体呈增加趋势,最后趋于平缓;随低热值增加,热效率波动下降。
图2-5 低热值与热效率关系
图2-6 燃气温度与热效率关系
图2-7 室温与热效率关系
3 结论
(1)随机森林算法适用于研究环境、气源条件对燃气灶热负荷和热效率的影响。利用随机森林算法可以成功地建立室温、燃气温度、低热值与燃气灶热效率的关系模型,模型能够较好地预报热效率。
(2)在室温、燃气温度、低热值三个因素中,对热负荷影响重要程度为低热值>室温>燃气温度;对热效率影响重要程度为低热值>燃气温度>室温。
(3)在燃气灶的热效率检测中尽量保持燃气热值的稳定,提高燃气温度的测量精度可以提高燃气灶热效率的测量精度。