APP下载

空气热机平衡点的快速判定方法

2022-11-02全泓达

物理实验 2022年10期
关键词:热机平衡点聚类

全泓达,盖 磊

(中国海洋大学 物理与光电工程学院,山东 青岛 266100)

热机是将热能转换为机械能的仪器.法国青年工程师卡诺从理论上对理想热机的工作原理进行研究,提出了一种理想的由2个等温及2个绝热过程的循环,称为卡诺循环,并在1824年提出了卡诺定理,为后来热力学第二定律的建立奠定了基础,为提高热机的效率指明了方向,为热力学的发展做出了杰出的贡献[1-3].

由于热机的整个装置处于动态平衡,获取精准的静态状态数据需要较长的判断时间,因此本文主要基于空气热机实验中验证卡诺定理的静态测量法,探索了快速判断平衡点的方法.

1 实验设备及原理

1.1 空气热机实验仪

实验采用世纪中科的ZKY-RJ空气热机实验仪,实验由空气热机电加热器进行加热,并由空气热机测试仪得到冷端温度、热端温度、转速、气缸压力以及气缸体积等实验数据,并经过实验通信器面板传回电脑进行数据显示.

1.2 静态测量法验证卡诺定理

热机每次循环从热源吸收的热量

(1)

其中,n为热机转速,ΔT为冷热端温差.因此热机效率η可表示为

(2)

其中,A为气体对外所做的净功,即P-V图中曲线所围面积.由于式中的变量均可以在实验中测量得到,因此通过观测不同冷热端温度时的nA/ΔT与ΔT/n的关系即可验证卡诺定理.

测量式子(2)中的参量有2种方法:静态测量法和动态测量法.静态测量法是在电压档位一定时,在系统稳定后测量得到的平均值,可以表示在一定的冷热端温度时的关系.热机稳定工作是指冷热端在一定的温度下,保持一定的效率,即在每次循环中热机对外做功近乎不变.在一定输入功率下,系统是否达到平衡取决于冷热端的温差和转速,即通过电加热器可以使冷热端温差变大(视冷端温度不变或者变化很小),而热机每次循环都将从热源吸收热量,使冷热端温差下降.所以二者的平衡即是静态测量法所需要的稳定状态.

实验中判断热机是否平衡需要长时间的数据记录,当转速、冷热端温差在一定范围内上下浮动时(例如n<1 r·s-1,ΔT<5 K),可判断空气热机达到平衡状态,但判定平衡点的观测时间通常需要10 min甚至更长,从而不利于实验教学.

2 实验设计及步骤

1)打开计算机、测试仪和通信器,加热电源;

2)将电压调至5档,预热仪器使飞轮顺利转动(一般ΔT>80 K);

3)将电压调回1档,开始计时计数,每隔1 min记录1次T1,ΔT,n和A,直至各项数值在平衡点附近变化(记录时间约1 h);

4)将电压调至2档重复上述步骤3).

3 数据处理

3.1 数据处理方法的原理

3.1.1 K型均值聚类

K型均值聚类(K-means clustering)是经典的无监督机器学习算法,用于无目标值的数据集[4].K型算法主要是通过迭代来对数据集进行分类.首先在样本中选取任意K个样本作为聚类中心,利用所选取的聚类中心计算各样本与中心间的距离;然后根据获得的最小计算距离重新划分对象.距离一般通过欧式距离Dδ进行度量,表达式如下:

Dδ(xi,xj)=

(3)

其中,xi=(xi1,xi2,…,xip)和xj=(xj1,xj2,…,xjp)表示p维欧几里德空间中的2点.重新计算获得每个样本的均值后,迭代至目标函数值不变或者小于指定阈值.目标函数为平方误差准则函数,表示为

(4)

其中,Ci为数据对象数量,ci表示第i个簇中心.

3.1.2 KNN分类

最近邻节点分类(K-nearest neighbor,KNN)方法是有监督的弱机器学习算法[5],其通过计算预测值与现有样本的闵可夫斯基距离(Minkowski distance)来确定预测所属类别.

闵式距离的表达式为:

(5)

当p→∞时,闵式距离转化为切比雪夫距离(Chebyshev distance);当p=2时,闵式距离转化为欧几里得距离;当p=1时,闵式距离转化为曼哈顿距离(Manhattan distance).通过闵式距离,可较好表示n维欧几里德空间中2点相对距离.

KNN算法中最为重要的参量为判断类别时采用的样本个数,若选取的样本数量过小,容易受到异常点的影响;若选取的样本数量过大,就会受到样本均衡的影响,所以选取合适的样本数对KNN模型具有重要作用.

本文对实验数据进行KNN分类处理,以获得能较好判断热机是否到达平衡的模型,通过该模型能准确快速地判断空气热机是否达到平衡,从而减少实验时间.

3.2 实验数据处理

为使实验结果具有普适性,消除仪器和档位(加热电压)的偶然性,本文对2台仪器3个档位进行实验,部分原始数据如表1所示.

表1 实验原始数据(部分)

由于各项指标的数据单位以及数值大小不同,所以需要对各类数据进行标准化.假设进行分析的指标变量有m个,分别为z1,z2,…,zm,共有n个评价对象,第i个评价对象的第j个指标的取值为aij[6].将各指标值转化为标准化值有

(6)

由式(6)可获得各项指标标准化后随时间的变化图线,如图1所示.根据卡诺定理,热机在稳定运行时,其在1个循环内的效率仅跟冷热端温度有关,而在多次循环中,转速与循环次数有关,那么是否平衡也与转速有关.以下将不考虑对外做功对平衡判断的影响.需要补充说明的是,为了获取仅与上述因素有关的热机平衡判定方法,而非对比仪器间差异,所以无需控制仪器A和B都在电压档1和2进行实验测量.

(a)仪器A电压档1

利用得到的标准化数据,进行K型聚类[7],将欧几里德距离作为K型聚类的判断标准,将数据分为平衡状态与非平衡状态,由此可以获得较为客观公正的平衡点,图2为聚类后的轮廓图.

(a)仪器A电压档1

图2中簇1为聚类后认定的平衡状态,簇2为聚类后认定的非平衡状态.通过对轮廓图的分析,可以发现聚类效果较为显著.为了让实验数据更具有信服力,本次实验记录了长时间(远超热机平衡所需时间)的实验数据,所以有大量的平衡状态数据点,而该类型的点能很好地被聚集在一起,形成较为明显的数据边际,说明平衡与非平衡之间存在一定的衡量指标.

然后利用KNN进行分类,将所有数据进行整合,并将加热电压值作为模型建立的特征值.图3和图4为模型的训练结果.

图3 模型ROC曲线与AUC

图4 模型混淆矩阵

整体利用5折交叉验证获得的模型准确率达到93.3%,且为了防止过拟合,预留部分数据进行验证,最后效果较好,基本满足预期需求.

图3为模型的ROC曲线(Receiver operating characteristic),其中AUC[8](Area under curve)接近1,远在超假正率(False positive rate,FPR)等于真正率(True Positive Rate,TPR)的直线上方,接近1个完美的分类器.

图4为模型的混淆矩阵[9],从矩阵可以看出误判断数量较少,整体能比较好地对平衡与非平衡状态进行分类.

基于以上模型,再次进行5组实验,在不同仪器不同电压档位下各测量60个数据,并将得到的数据放入模型预测系统是否处于平衡状态.为了避免仪器因转速过高而触发保护机制,将最高电压档位设定为4档.

图5是模型对于系统是否达到平衡状态判断,横坐标表示仪器和电压档位,上下阈值为K-means聚类算法得出的平衡点的最大值和最小值,模型所判断出的平衡点落在该范围越多说明模型判定准确性越好.可以看出,模型判断的平衡点基本都集中在平衡范围内.

图5 不同仪器、不同电压档位下系统平衡状态的判断结果

图6为C仪器在电压档为4时的转速随时间的判断结果,可看出系统在平衡状态与非平衡状态间的转换位置处于曲线拐点,与真实进入平衡点时间不超过2 min,说明该模型判断效果较好.

图6 C仪器在电压档为4时转速随时间的判断结果

4 结束语

本文通过对空气热机实验测得的数据进行分析,获得了基于KNN的模型分类器,通过多种指标对模型进行衡量分类都有较好的预测结果.其中,误分类点处于平衡状态与非平衡状态的模糊界线处,从错误预测进入正确预测所需时间不大于2 min,因此误分类相较于接近10 min的主观判断有了大幅度的提升,并具备一定的实用性.将每一时刻获得的数据输入该模型,能得到较好的预测结果.另外,通过K-means聚类算法可以对因测量精度、环境影响、仪器误差、动态平衡等因素带来的数据波动提供较好的参考中心值,从而使得真实值的选取更加准确.

猜你喜欢

热机平衡点聚类
把握重点 学习热机
“热机”易错大盘点
探寻中国苹果产业的产销平衡点
热机的起源与发展
电视庭审报道,如何找到媒体监督与司法公正的平衡点
基于DBSACN聚类算法的XML文档聚类
基于改进的遗传算法的模糊聚类算法
在给专车服务正名之前最好找到Uber和出租车的平衡点
长城凌傲车发动机热机怠速抖动
一种层次初始的聚类个数自适应的聚类方法研究