基于GWO的SVM在红外甲烷传感器测量误差分析中的应用

2021-11-01陈红岩刘嘉豪盛伟铭赵永佳

计量学报 2021年9期

陈红岩，刘嘉豪，盛伟铭，黄瀚，赵永佳

(1. 中国计量大学现代科技学院，浙江杭州 310018; 2.中国计量大学机电工程学院，浙江杭州 310018)

1 引言

天然气的主要成分为甲烷，在使用中需要对甲烷气体进行检测。现在红外甲烷传感器具有精度高、使用寿命长等优点，被广泛用于气体的测量，所以如何进一步减小甲烷气体的测量误差成为一个被关注的问题[1,2]。

近年来，径向基(RBF)、小波神经网络以及SVM等在数据处理领域有了广泛应用。不断涌现出的算法也为气体定量分析和数据仿真提供了新的途径，如Ali Gulbag等提出一种应用在混合气体浓度定量识别中的径向基函数神经网络降维方法，简化了数据集，加快了收敛速度[3]；杨景明等采用改进果蝇算法与最小二乘支持向量机相结合的方法，用于铝热连轧现场数据的仿真，减小了预测误差[4]；吴永忠等以RBF网络为核心提出了一种新型甲烷定量分析模型，有效减少了环境温度和难以满足朗伯-比尔定律约束条件带来的误差[5]；梁杰等以前向和反向两种修正算法为基础，提出了一种多级修正模型，解决了车载气体传感器测量结果不易修正及准确度低的问题[6]。

本文用实验室研制的红外甲烷传感器对浓度在0～5.05%范围的25组标准甲烷气体进行测量，选取其中20组样本作为训练集，使用不同算法和SVM结合建立了多种回归模型，其余5组样本作为测试集用来验证模型的预测精度。通过计算对比表明，基于灰狼优化算法(grey wolf optimization，GWO)的支持向量机(support vector machine，SVM)更具优势。

2 SVM回归模型

支持向量机SVM是一种统计学习理论回归方法[7,8]。其主要思想是将输入数据(低维空间)映射到高维特征空间，然后构造一个核函数来实现线性回归函数。

本文将已知浓度的甲烷气体样本和相对应的红外甲烷传感器测量输出的电压差值比作为数据集T={(x1,y1),…,(xN,yN)}∈(R×R)，其中xi∈R为红外甲烷传感器输出的电压比值，yi∈R为对应的甲烷气体浓度值，i=1,2,…,N。按照式(1)进行回归分析。

f(xi)=ω·φ(xi)+b

(1)

式中：ω·φ(xi)为向量ω与φ(xi)的内积；ω为回归系数；φ(xi)为输入空间到特征空间的映射函数；b为阈值。

在此引入松弛变量ξ，ξ*≥0求解ω与b，根据SRM准则，将式(1)转换为凸二次规划问题：

(2)

(3)

式中：正则化参数C为惩罚因子；ε为不敏感损失函数。

引入Lagrange函数求解式(2)，通过核函数k(xi,xj)将高维空间的内积运算转换在原二维空间计算，有：

(4)

得到的SVM回归模型的回归函数为：

f(x)=ω·φ(x)+b

(5)

在非线性情况下，一般的核函数是高斯径向基核函数(RBF)，其表达式如式(6):

K(xi,xj)=exp(-g||xi-xj||2)，g>0

(6)

式中：g为gamma参数函数设置(若k为属性的数目，则g默认为1/k)。

在支持向量机模型中，惩罚因子C和核函数自带参数g的取值将对训练数据和预测数据的精度产生较大影响。惩罚因子C即对误差的宽容度，C过大或过小都会产生不好的影响(过拟合和欠拟合)。参数g隐含地决定了数据映射到新的特征空间后的分布，g的大小和支持向量的个数息息相关。因此，寻找最优参数至关重要。

3 GWO-SVM模型

3.1 GWO算法

2014年，澳大利亚学者Mirjalili等提出了一种新的元启发式算法——GWO[9]。该算法的灵感来自于灰狼，是一种模仿了灰狼的等级关系和自发的捕猎行为来实现目标优化的新型群智能优化方法，具有较强的收敛性、参数小、易实现等特点。在该方法中，把狼群分为4个社会阶级α、β、δ、ω(其中α最高，ω最低)，如图1所示。

图1 灰狼等级制度(从上到下递减)Fig.1 Grey wolf hierarchy

上层阶级领导指挥开展狩猎行动，GWO算法的具体步骤如下:

1) 包围猎物：进行狩猎行动时，狼群会先开始包围猎物。这种包围行为的数学建模为：

(7)

2) 追捕猎物：灰狼可以搜索猎物的位置和猎杀它们，这种行为通常由α阶层指导，目前为止获得的前3个最佳位置会被保存，并要求其他搜索代理(包括ω)根据最佳搜索代理的位置更新其位置。这种行为的数学建模为：

(8)

3.2 GWO-SVM

在支持向量机参数优化方法中，GWO方法在复杂搜索空间的全局搜索中具有传统方法所不具备的优势。此外，与人工神经网络等其他机器学习算法相比，GWO-SVM模型更适合小样本数据而不是大样本数据，而且具有更好的学习效果[10]。

样本大小以30个单位为界，因此本次实验的样本数据属于小样本数据，完全契合GWO-SVM模型的使用范围。基于GWO的SVM参数优化过程如图2所示。

图2 GWO-SVM模型流程图Fig.2 Model flow chart of GWO-SVM

4 实验及数据分析

实验采用基于Non-Dispersive InfraRed(NDIR)原理制作的甲烷传感器对甲烷气体进行检测[11,12]。向甲烷传感器气室中充入待测浓度的甲烷气体，当MCU调制的红外光源通过气室时，由于甲烷对特定波长的红外光有吸收，因此当特定波长的红外光通过待测气体后，在特征吸收峰附近的红外能量会被全部吸收，导致光强的衰减，探测器将检测剩余的光强度并转化为电信号，经过信号调理电路处理后作为模型的输入，其原理如图3所示(U1、U2分别为测量通道和参考通道的电压值)。图4、图5为红外甲烷气体传感器和实验采样图。

图3 甲烷气体测量系统原理图Fig.3 Methane gas detection schematic diagram

图4 红外甲烷传感器结构Fig.4 Infrared methane sensor

图5 实验采样系统Fig.5 The experimental sample

本次实验用红外甲烷传感器对0～5.05%浓度范围的25组标准甲烷气体进行测量[13]。根据朗伯比尔定律(Lambert-Beer law)对气体浓度公式进行推导后发现，对于一个确定的传感器系统而言，只需得到测量通道和参考通道的电压差与参考通道电压的比值即可求出气体浓度，因此把这个电压差值比作为最终输出。从中选取20组数据作为训练集，用3种不同的方法各自建立SVM回归模型，对比3种模型的回归效果。把剩余浓度分别为0.18%、0.94%、2.01%、3.13%、4.53%的5组数据作为测试集，用已建立好的回归模型进行预测，验证SVM回归模型的预测精确度，检测数据如表1。