润滑油冷却液污染的拉曼光谱检测方法研究

2021-03-09明廷锋孙云岭田洪祥盛晨兴

光谱学与光谱分析 2021年3期

李婧，明廷锋*，孙云岭，田洪祥，盛晨兴

1. 海军工程大学动力工程学院，湖北武汉 430033 2. 武汉理工大学船舶动力工程技术交通行业重点实验室，湖北武汉 430063 3. 国家水运安全工程技术研究中心可靠性工程研究所，湖北武汉 430063

引言

船舶柴油机润滑油易受到冷却液的污染，从而引起润滑油老化、变质及功能失效[1]。因此，在润滑油使用过程中，针对润滑油中冷却液的污染问题，必须加以监测，防止二次故障损失。冷却液主要包含水、乙二醇及有机羧酸。目前可以用蒸馏法[2]和卡尔菲休滴定法[3]测量水分，间接反映冷却液的污染。该方法一方面受到水分来源的影响，一般来说，常见的船舶柴油机润滑油进水来源是冷却液，也存在进海水或淡水的可能性。另一方面，柴油机工作时，由于润滑油温度高，会挥发掉一部分水分。仅通过测量水分来表征冷却液的污染是很不全面的。通过利用气相色谱法[4]测量发动机机油中的乙二醇。但由于测量时间长，体积大，操作比较复杂，不适合现场测量使用。傅里叶红外(FT-IR)光谱法[5]可测量水和乙二醇浓度，但由于冷却液中含一定量的水，如果测试污染油样中水的含量过高，会使傅里叶红外光谱仪中的分束器受潮而损伤。拉曼光谱在测试过程中，具有无需触及试样、仪器维护费用低等特点[6]，一条光谱数据隐藏了大量可分析的试样信息，在定量分析和定性分析试样浓度的领域获得了广泛应用。

目前，人工神经网络和偏最小二乘法可以用于拉曼光谱分析[7]。阮华等[8]利用拉曼光谱，结合支持向量机的方法，建立汽油辛烷值的多元校正模型。徐荟迪等[9]利用马氏距离判别方法和随机森林判别的模式识别方法可以对具有相同拉曼峰的不同产地的软玉进行鉴别。本文使用长短期记忆神经网络(long short-term memory，LSTM)，分析柴油机冷却液污染润滑油的拉曼光谱数据，并进行冷却液污染比例的定量检测研究。

1 理论部分

LSTM是一种特殊的递归神经网络(recurrent neural network，RNN)，其中一个关键性扩展是使自循环的权重视上下文而定，而不是固定的[10]。本文给出一种基于LSTM神经网络的润滑油冷却液污染定量估计方法。算法分为3个部分，数据预处理、神经网络训练、冷却液浓度定量估计，如图1所示。光谱数据预处理包括数据采样、拟合、离散点平均梯度估计；神经网络训练，包括模型结构的选定、构建训练样本集、对神经网络模型训练和测试；冷却液污染浓度定量估计包括原始光谱数据预处理及神经网络估计污染物浓度的检测。

图1 整体算法流程图Fig.1 Overall algorithm flow chart

2 实验部分

2.1 仪器

实验使用的拉曼光谱仪，型号为RamTracer，最大功率为330 mW。所检测的光谱范围为2 000～250 cm-1。光学分辨率小于6 cm-1。

2.2 材料

实验柴油机润滑油为壳牌喜力HX2，15W-40润滑油，防冻冷却液为Prestone 50/50。

2.3 样本

油样的配置方案为通过空白油样，配制混入冷却液质量百分比浓度为2%，1.5%，1%，0.5%和0.25%的油样，作为A组，编号分别为A1，A2，A3，A4和A5。空白油样编号为A6。

选择某型柴油机润滑油的在用润滑油，不含冷却液的油样，加入已知冷却液，分别得到含0.2%和0.4%冷却液污染的在用润滑油，作为B组，编号分别为B1和B2。

拉曼光谱仪开机预热30分钟以后，进行预先测试。将功率调节器调到合适位置以确保每次测量时，在功率调节器固定不变的情况下能得到有效谱图。功率调节器固定以后，进行A组样本的拉曼光谱测试，每组油样测得拉曼光谱数据50个，6组共300个数据。数据范围为300～2 000 cm-1的拉曼光谱图叠加如图2所示。从拉曼光谱图中难以看出冷却液污染浓度与图形之间的关系，因此必须建立污染度浓度与图形之间的定量分析方法。

图2 300个样本的拉曼光谱数据Fig.2 Raman spectral data of 300 samples

3 结果与讨论

3.1 光谱数据预处理

以污染物为乙二醇作为研究对象，选取300～2 000 cm-1的数据作为原始的数据，数据预处理算法流程:

(1) 在波段中进行数据采样，采样间隔为1个波数单位，每组数据采样得到n1个采样点Wori,i=[woi,1,woi,2, …,woi,n1];

(2) 对wori,i进行三次插值拟合，并对拟合后的曲线进行采样，采样间隔为0.1,每组数据采样得到n2个采样点Wcub,i=[wci,1,wci,2,…,wci,n2]；

(3) 求取各组数据wori,i中原始采样点处的平均梯度Gradi=[gi,1,gi,2, …,gi,n3]，每组数据得到n3个平均梯度点，各点平均梯度计算公式为

(1)

3.2 神经网络模型选定、训练、测试

选取拉曼光谱中300～2 000 cm-1段作为原始数据，数据采样间隔为1,进行数据预处理后的梯度数据维度与原始数据一致。数据集样本归一化处理后，见表1所示。

表1 数据集样本Table 1 Sample distribution of the dataset

共设计了4种神经网络模型用于污染物浓度的估计，如图3所示。

图3(a)中模型为6层全连接层结构，该结构用FCs(fully connected layers)表示。图3(b)中模型在图3(a)中模型的基础上增加单层结构的LSTM层，该结构用LSTM-FCs-1表示。图3(c)中模型含有两个分支，LSTM分支和全连接分支构成分支结构。该结构用LSTM-FCs-2表示。图3(d)中模型在两个分支结构中的末端分别增加1个全连接层。该结构用LSTM-FCs-3表示。

图3 神经网络模型图Fig.3 Neural network model diagram

从数据集中每个类别抽取其中80%的数据作为神经网络训练集中样本，剩余20%作为测试集样本。在模型的训练过程中，选用L1损失函数; 训练策略选用随机梯度下降法，batchsize取值为8，学习率更新策略选用step，初始学习率选择为0.01,学习率更新间隔为每10次完全迭代，学习率衰减比例为0.1。

3.3 冷却液污染定量估计

四个模型在数据集上最终测试结果对比见表2，前两项平均误差指标分别为标签值下的平均误差和浓度值下的平均误差，标签值下的平均误差度量为模型的输出与样本真实标签之间的差值，浓度值下的平均误差度量为模型估计值换算至污染物实际浓度后与样本实际浓度之间的差值，平均误差越小表示污染物浓度估计预期准确；准确率的统计依据为模型估计的单个样本浓度值误差小于0.05%，则判定为定量估计准确。

表2 四个模型在数据集上测试结果对比Table 2 The test results of each model were compared on the data set

四个模型在数据集上的损失曲线如图4所示。图4(a)和(b)中分别为各模型在训练集、测试集上的损失与迭代次数的关系，随着模型训练迭代次数的增加，各模型在数据集上的损失逐渐降低，最终均趋于稳定，误差越低，代表网络模型的输出结果越接近真实的标签值。根据损失曲线进行对比不难发现，LSTM-FCs-3模型在训练过程中的收敛速度最慢，且最终的平均损失最大。

图4 损失曲线(a)：训练集上的损失曲线； (b)：测试集上的损失曲线Fig.4 Loss curve(a)： Loss curve on training set； (b)： Loss curve on the test set

四个模型在测试集上的准确度如图5所示。四个模型在测试集上的鲁棒性测试如图6所示。鲁棒性测试会对测试集中每组样本随机抽取1%的波数数据上随机添加不大于1%的噪声，测试模型的抗扰动能力。

图5 测试集上的准确率曲线Fig.5 The accuracy curve on the test set

结合图5、图6和表2分析，LSTM-FCs-2模型的估计最高准确率达到98.3%，且该模型在训练集上的表现明显优于其他模型；且在鲁棒性测试中对测试集添加1%的随机噪声后进行测试，LSTM-FCs-2模型最高准确率仍能达到96.7%，鲁棒性明显优于其他模型。

将B组的两个已知冷却液污染含量分别为0.2%和0.4%的在用油的拉曼光谱，输入LSTM-FCs-2神经网络模型中检测，分别得到冷却液含量的估计值分别为0.19%和0.43%，相对误差分别为5.0%和7.5%。

图6 测试集上的鲁棒性测试Fig.6 Robustness testing on test sets

4 结论

(1)拉曼光谱是一种检测柴油机润滑油冷却液污染的有效技术，但是无法直接获得拉曼光谱数据信息与润滑油污染物浓度含量之间的对应关系。

(2)通过对FCs，LSTM-FCs-1，LSTM-FCs-2和LSTM-FCs-3四种神经网络模型的实验计算结果对比，LSTM-FCs-2网络模型对冷却液污染浓度估计准确率达到96.7%，鲁棒性优。因此，相对于其他三种网络模型，LSTM-FCs-2网络模型更适用于润滑油冷却液污染的拉曼光谱数据分析处理。通过对某在用润滑油进行冷却液污染浓度检测试验，表明该方法鲁棒性好，可适用于在用油冷却液污染浓度的检测。