空气热机平衡点的快速判定方法

2022-11-02全泓达

物理实验 2022年10期

全泓达,盖磊

(中国海洋大学物理与光电工程学院，山东青岛 266100)

热机是将热能转换为机械能的仪器.法国青年工程师卡诺从理论上对理想热机的工作原理进行研究，提出了一种理想的由2个等温及2个绝热过程的循环，称为卡诺循环，并在1824年提出了卡诺定理，为后来热力学第二定律的建立奠定了基础，为提高热机的效率指明了方向，为热力学的发展做出了杰出的贡献[1-3].

由于热机的整个装置处于动态平衡，获取精准的静态状态数据需要较长的判断时间，因此本文主要基于空气热机实验中验证卡诺定理的静态测量法，探索了快速判断平衡点的方法.

1 实验设备及原理

1.1 空气热机实验仪

实验采用世纪中科的ZKY-RJ空气热机实验仪，实验由空气热机电加热器进行加热，并由空气热机测试仪得到冷端温度、热端温度、转速、气缸压力以及气缸体积等实验数据，并经过实验通信器面板传回电脑进行数据显示.

1.2 静态测量法验证卡诺定理

热机每次循环从热源吸收的热量

(1)

其中，n为热机转速，ΔT为冷热端温差.因此热机效率η可表示为

(2)

其中，A为气体对外所做的净功，即P-V图中曲线所围面积.由于式中的变量均可以在实验中测量得到，因此通过观测不同冷热端温度时的nA/ΔT与ΔT/n的关系即可验证卡诺定理.

测量式子(2)中的参量有2种方法：静态测量法和动态测量法.静态测量法是在电压档位一定时，在系统稳定后测量得到的平均值，可以表示在一定的冷热端温度时的关系.热机稳定工作是指冷热端在一定的温度下，保持一定的效率，即在每次循环中热机对外做功近乎不变.在一定输入功率下，系统是否达到平衡取决于冷热端的温差和转速，即通过电加热器可以使冷热端温差变大(视冷端温度不变或者变化很小)，而热机每次循环都将从热源吸收热量，使冷热端温差下降.所以二者的平衡即是静态测量法所需要的稳定状态.

实验中判断热机是否平衡需要长时间的数据记录，当转速、冷热端温差在一定范围内上下浮动时(例如n<1 r·s-1，ΔT<5 K)，可判断空气热机达到平衡状态，但判定平衡点的观测时间通常需要10 min甚至更长，从而不利于实验教学.

2 实验设计及步骤

1)打开计算机、测试仪和通信器，加热电源；

2)将电压调至5档，预热仪器使飞轮顺利转动(一般ΔT>80 K)；

3)将电压调回1档，开始计时计数，每隔1 min记录1次T1,ΔT,n和A，直至各项数值在平衡点附近变化(记录时间约1 h)；

4)将电压调至2档重复上述步骤3).

3 数据处理

3.1 数据处理方法的原理

3.1.1 K型均值聚类

K型均值聚类(K-means clustering)是经典的无监督机器学习算法，用于无目标值的数据集[4].K型算法主要是通过迭代来对数据集进行分类.首先在样本中选取任意K个样本作为聚类中心,利用所选取的聚类中心计算各样本与中心间的距离；然后根据获得的最小计算距离重新划分对象.距离一般通过欧式距离Dδ进行度量，表达式如下：

Dδ(xi,xj)=

(3)

其中，xi=(xi1,xi2，…，xip)和xj=(xj1,xj2,…,xjp)表示p维欧几里德空间中的2点.重新计算获得每个样本的均值后，迭代至目标函数值不变或者小于指定阈值.目标函数为平方误差准则函数，表示为

(4)

其中,Ci为数据对象数量，ci表示第i个簇中心.

3.1.2 KNN分类

最近邻节点分类(K-nearest neighbor，KNN)方法是有监督的弱机器学习算法[5],其通过计算预测值与现有样本的闵可夫斯基距离(Minkowski distance)来确定预测所属类别.

闵式距离的表达式为：

(5)

当p→∞时，闵式距离转化为切比雪夫距离(Chebyshev distance)；当p=2时，闵式距离转化为欧几里得距离；当p=1时，闵式距离转化为曼哈顿距离(Manhattan distance).通过闵式距离，可较好表示n维欧几里德空间中2点相对距离.

KNN算法中最为重要的参量为判断类别时采用的样本个数，若选取的样本数量过小，容易受到异常点的影响；若选取的样本数量过大，就会受到样本均衡的影响，所以选取合适的样本数对KNN模型具有重要作用.

本文对实验数据进行KNN分类处理，以获得能较好判断热机是否到达平衡的模型，通过该模型能准确快速地判断空气热机是否达到平衡，从而减少实验时间.

3.2 实验数据处理

为使实验结果具有普适性，消除仪器和档位(加热电压)的偶然性，本文对2台仪器3个档位进行实验，部分原始数据如表1所示.

表1 实验原始数据(部分)

由于各项指标的数据单位以及数值大小不同，所以需要对各类数据进行标准化.假设进行分析的指标变量有m个，分别为z1,z2,…,zm，共有n个评价对象，第i个评价对象的第j个指标的取值为aij[6].将各指标值转化为标准化值有

(6)

由式(6)可获得各项指标标准化后随时间的变化图线，如图1所示.根据卡诺定理，热机在稳定运行时，其在1个循环内的效率仅跟冷热端温度有关，而在多次循环中，转速与循环次数有关，那么是否平衡也与转速有关.以下将不考虑对外做功对平衡判断的影响.需要补充说明的是，为了获取仅与上述因素有关的热机平衡判定方法，而非对比仪器间差异，所以无需控制仪器A和B都在电压档1和2进行实验测量.

(a)仪器A电压档1

利用得到的标准化数据，进行K型聚类[7]，将欧几里德距离作为K型聚类的判断标准，将数据分为平衡状态与非平衡状态，由此可以获得较为客观公正的平衡点，图2为聚类后的轮廓图.

(a)仪器A电压档1

图2中簇1为聚类后认定的平衡状态，簇2为聚类后认定的非平衡状态.通过对轮廓图的分析，可以发现聚类效果较为显著.为了让实验数据更具有信服力，本次实验记录了长时间(远超热机平衡所需时间)的实验数据，所以有大量的平衡状态数据点，而该类型的点能很好地被聚集在一起，形成较为明显的数据边际，说明平衡与非平衡之间存在一定的衡量指标.

然后利用KNN进行分类，将所有数据进行整合，并将加热电压值作为模型建立的特征值.图3和图4为模型的训练结果.

图3 模型ROC曲线与AUC

图4 模型混淆矩阵

整体利用5折交叉验证获得的模型准确率达到93.3%，且为了防止过拟合，预留部分数据进行验证，最后效果较好，基本满足预期需求.

图3为模型的ROC曲线(Receiver operating characteristic)，其中AUC[8](Area under curve)接近1，远在超假正率(False positive rate，FPR)等于真正率(True Positive Rate，TPR)的直线上方，接近1个完美的分类器.

图4为模型的混淆矩阵[9]，从矩阵可以看出误判断数量较少，整体能比较好地对平衡与非平衡状态进行分类.

基于以上模型，再次进行5组实验，在不同仪器不同电压档位下各测量60个数据，并将得到的数据放入模型预测系统是否处于平衡状态.为了避免仪器因转速过高而触发保护机制，将最高电压档位设定为4档.

图5是模型对于系统是否达到平衡状态判断，横坐标表示仪器和电压档位，上下阈值为K-means聚类算法得出的平衡点的最大值和最小值，模型所判断出的平衡点落在该范围越多说明模型判定准确性越好.可以看出，模型判断的平衡点基本都集中在平衡范围内.

图5 不同仪器、不同电压档位下系统平衡状态的判断结果

图6为C仪器在电压档为4时的转速随时间的判断结果，可看出系统在平衡状态与非平衡状态间的转换位置处于曲线拐点，与真实进入平衡点时间不超过2 min，说明该模型判断效果较好.

图6 C仪器在电压档为4时转速随时间的判断结果

4 结束语

本文通过对空气热机实验测得的数据进行分析，获得了基于KNN的模型分类器，通过多种指标对模型进行衡量分类都有较好的预测结果.其中，误分类点处于平衡状态与非平衡状态的模糊界线处，从错误预测进入正确预测所需时间不大于2 min，因此误分类相较于接近10 min的主观判断有了大幅度的提升，并具备一定的实用性.将每一时刻获得的数据输入该模型，能得到较好的预测结果.另外，通过K-means聚类算法可以对因测量精度、环境影响、仪器误差、动态平衡等因素带来的数据波动提供较好的参考中心值，从而使得真实值的选取更加准确.