基于改进PSO算法的SVM在甲烷测量中的应用*
2017-09-22陈红岩郭晶晶袁月峰李孝禄
鲍 立,陈红岩,郭晶晶,袁月峰,李孝禄
(中国计量大学机电工程学院,杭州 310018)
基于改进PSO算法的SVM在甲烷测量中的应用*
鲍 立,陈红岩*,郭晶晶,袁月峰,李孝禄
(中国计量大学机电工程学院,杭州 310018)
针对甲烷气体定量分析过程中,传统SVM模型预测精度低、收敛速度慢等问题,提出了一种基于改进PSO算法的SVM回归模型。该模型在传统PSO算法寻优的基础上,引入动量项的同时增加随机粒子个体极值的追随因子,使粒子不仅追随全局最优解和局部最优解,还跟随种群中任一粒子的个体极值,使得寻优算法后期收敛速度较快,不易陷入局部最小值。实验中,对0~5.05%浓度的25组标准甲烷样气进行建模分析,并与传统PSO算法寻优模型和Grid搜索法寻优模型进行对比。结果表明,采用改进PSO算法建立的SVM回归模型均方根误差小,收敛速度快。
检测技术与自动化装置;SVM;改进PSO算法;回归分析;红外甲烷传感器
随着国民经济的不断发展,对采矿行业的需求与日俱增,但要保证煤矿开采安全顺利的进行,对甲烷的测量精度具有较高的要求,因为甲烷气体属于易燃易爆危险气体,稍有不慎就会引发爆炸,造成重大的人员伤亡和经济损失。目前,由于红外甲烷传感器[1]测量精度较高,使用寿命较长,越来越多的被用于煤矿开采过程中甲烷气体的测量。但其测量精度仍需进一步提高,以确保工作人员的生命财产安全。
近些年来,众多国内外学者致力于如何减小甲烷气体的测量误差,提出了许多方法,如分段插值法、最小二乘法、多元回归、小波神经网络以及SVM等。John Leis等[2]针对固态红外光源的光学通量易受温度影响的问题,提出了利用脉冲结电压测量发射的红外通量并引入补偿算法;梁永直等[3]在最小二乘法的基础上提出了改进的分段最小二乘法,减小了拟合误差,节省了存储空间,加快了运算速度;李卯东等[4]提出了改进的BP神经网络算法,克服了传统最小二乘法拟合时计算复杂、误差较大的缺点;曲健等[5]提出了利用改进的网格搜索法进行SVM核函数参数寻优,建立出预测精度较高、用时较短的SVM回归模型;刘文贞等[6]在传统单核SVM的基础上提出了一种混合核ε-SVM,对汽车尾气进行定量分析,提高了模型的泛化能力以及预测精度。
由于SVM具有小样本学习能力强、预测误差小以及泛化能力好等突出优点,已被广泛应用于许多领域。本文在前人的基础上提出了一种基于改进PSO算法的SVM,采用红外甲烷传感器对浓度范围在0~5.05%的25组甲烷标准样气进行采集,将其中20组数据作为训练集建立SVM回归模型,5组数据作为测试集验证模型的预测精度。
1 SVM回归模型
SVM[7-8]是由Vapnik等人根据统计学习理论中结构风险最小化原则提出的,它能够尽量提高学习机的推广能力,即使由有限数据集得到的判别函数对独立的测试集仍能够取得较小的误差,此外,SVM是一个凸二次优化问题,能够保证找到的极值解就是全局最优解。SVM回归分析模型利用核函数将红外甲烷传感器测量得到的原始数据映射到高维空间,然后在高维空间进行回归分析,建立红外甲烷传感器测量输出的电压差值比与待测甲烷气体浓度的回归模型。
本文将甲烷浓度值和对应的红外甲烷传感器测量输出的电压差值比构成数据集T={(x1,y1),…,(xl,yl)}∈(R×R),其中,xi∈R为红外甲烷传感器输出的电压差值比,yi∈R为对应的甲烷浓度值,i=1,2,…,l。按照式(1)进行回归分析:
f(xi)=ω·φ(xi)+b
(1)
式中:ω为回归系数,φ(xi)为输入空间到特征空间的映射函数,b为阈值。
优化问题可以转化为如下最小化式:
(2)
(3)
引入Lagrange函数求解式(2)和式(3),通过核函数K(xi,xj)将高维空间的内积运算转换到原二维空间计算,有:
(4)
(5)
经求解得到:
(6)
从而可以得到SVM模型的回归函数为:
(7)
在SVM建模过程中常用到的核函数有线性核函数、多项式核函数、径向基(RBF)核函数以及两层感知器核函数。本文选择RBF核函数,其表达式如下:
K(xi,xj)=exp(-g‖xi-xj‖2)g>0
(8)
式中:参数g为核函数中gamma参数,若k为属性的数目,则g默认为1/k。
2 改进的PSO算法
在使用SVM建立回归模型分析时,想要得到较满意的结果,需要调整相关参数(主要是惩罚因子C和核函数参数g)才能得到比较理想的预测准确率。本文选择PSO算法实现SVM的参数寻优[9-10],但是传统的PSO 算法存在后期收敛速度缓慢、易陷入局部极小点等问题,为了同时克服这些缺陷,本文在引入动量项的同时增加随机粒子个体极值的追随因子,使得粒子不仅追随全局最优解和局部最优解,还跟随种群中任一粒子的个体极值以达到既缓和后期震荡又解决后期趋同的目的。
传统的PSO算法速度和位置更新公式为:
(9)
(10)
(11)
改进后的粒子群速度和位置更新公式为:
(12)
动量项的引入使得算法在修正粒子速度时,不仅考虑了个体最优值和全局最优值,还考虑了速度修正量历史变化趋势的影响,从而减小了进化过程中的震荡。此外,在粒子的迭代过程中,通过pgbest、pibest和pi共同向下一代传递信息,增大了粒子所获得的信息量。由于pi的权重值很小,相当于在原有基础上增加了一个小能量干扰以实现粒子的多样性,从而避免了算法的过分早熟。
图1 红外甲烷传感器检测原理框图
3 实验分析
本实验采用红外吸收光谱原理[1]制作的甲烷传感器对浓度范围在0~5.05%的25组标准甲烷样气进行测量,其输出为测量通道和参考通道的电压差与参考通道电压的比值。该红外甲烷传感器检测原理框图如图1所示,上位机界面如图2所示,测量数据见表1。选择其中20组数据作为训练集,建立SVM回归模型并检验模型在训练集上的回归效果;选择浓度为0.35、1.38、2.42、3.52、4.79的5组数据作为测试集,用建立好的回归模型进行预测,验证SVM回归模型的预测精度和水平[11]。
图2 上位机界面
甲烷浓度/%电压差值比甲烷浓度/%电压差值比0-2.31422.42-1.93150.18-2.27762.68-1.90470.35-2.25342.88-1.86960.57-2.21323.13-1.83970.78-2.18083.34-1.81230.94-2.15683.52-1.78111.13-2.12563.77-1.75871.38-2.08853.98-1.72961.55-2.05474.26-1.69311.71-2.03214.53-1.66231.89-1.99854.79-1.63592.01-1.97935.05-1.60212.25-1.9562
模型的建立需要找到最优的惩罚因子C和RBF核函数参数g,本文采用改进的PSO算法进行参数寻优,选择最小化式(13)所示的均方根误差函数为目标函数,选择适应度函数为式(14)所示,
(13)
Ffitness=Fmse(C,g)
(14)
参数寻优具体步骤如下:
输入:粒子的维数和个数;
输出:SVM最佳参数组合(C,g)。
①初始化。随机初始化SVM参数组合(C,g)在解空间中的位置、粒子的初始位置和速度,设置粒子的最大速度vmax、最大迭代次数、权重取值范围以及SVM各参数取值范围。
②计算每个粒子的适应度值。设置每个粒子的个体极值pibest为当前位置,根据式(14)计算每个粒子的适应度值,取适应度值最优的粒子个体极值为最初的全局极值pgbest。
③根据式(12)更新粒子的速度和位置,根据式(13)、式(14)更新适应度值Ffitness,令pipresent=Ffitness。
④比较当前粒子的个体最优极值pibest和当前适应度值pipresent,若pipresent>pibest,则pipresent=Fibest。
⑤比较更新之后pipresent和全局最优位置pgbest的大小,其中较小的即为最终的全局最优解。
⑥判断是否满足迭代终止条件,满足则停止迭代,输出最优的SVM参数组合,不满足则转步骤②。当使得最优解的参数组合不唯一时,取C值最小的那组。
目前,学者们普遍采用传统PSO算法和Grid搜索法[5]来进行SVM参数寻优。为了显示改进PSO算法优化SVM参数的优势,本文分别采用3种寻优方法建立SVM回归模型,进行对比分析。表2为3种寻优方法建立SVM回归模型时的最优参数、所需时间以及均方根误差。
表2 模型参数寻优对比
图3~图5分别为3种寻优方法建立SVM回归模型时在训练集上验证模型回归效果图[12-13]。
图5 改进PSO算法-SVM
图3 传统PSO算法-SVM
图4 Grid搜索法-SVM
由表2可知采用改进PSO算法寻优得到的参数C明显小于传统PSO算法和Grid搜索法,而过大的C容易引起模型的过学习;寻优时间明显缩短;并且均方根误差最小。由图3到图5对比可知采用改进PSO算法建立SVM回归模型的回归效果最好。
将改进PSO算法寻优得到的最优参数组合(C,g)=(1.253 8,1.624 5)代入SVM建立模型并进行预测分析,可以得到模型的预测结果如图6所示[14]。从图6可以看出基于改进PSO算法的SVM模型预测曲线很好的逼近期望曲线,达到较高的预测精度。
图6 甲烷气体模型预测输出与期望输出对比图
3种模型预测误差对比如表3所示。
表3 模型预测误差对比
由表3可知,基于改进PSO算法-SVM模型预测的绝对误差和相对误差都明显低于传统PSO算法-SVM模型和Grid搜索法-SVM模型,并且绝对误差小于0.1%,相对误差小于5%,满足行业内对甲烷测量误差的要求。
4 结论
本文在传统的PSO算法寻优的基础上,引入动量项的同时使得粒子不仅追随全局最优解和局部最优解,还跟随种群中任一粒子的个体极值以达到既缓和后期震荡又解决后期趋同的目的,使得寻优算法后期收敛速度较快,不易陷入局部最小值。通过采用3种寻优方法建立SVM回归模型进行对比分析,结果表明,改进的PSO算法寻优速度最快,建立的SVM模型回归效果最好,预测精度最高。因此,该方法可以考虑用于煤矿开采过程中甲烷气体的定量分析,在一定程度上可以提高甲烷的预测精度,给工作人员的生命财产安全增加保障。
[1] 谭秋林. 红外光学气体传感器及检测系统[M]. 北京:机械工业出版社,2013:1-139.
[2] John Leis,David Buttsworth. A Temperature Compensation Technique for Near-Infrared Mathane Gas Threshold Detection[J]. IEEE Transactions on Industrial Electronics,2016,63(3):1813-1821.
[3] 梁永直,李卯东,夏路易,等. 红外甲烷传感器检测中的算法研究[J]. 仪表技术与传感器,2012,27(11):149-150.
[4] 李卯东,梁永直. 基于遗传优化的BP神经网络法在甲烷检测中的应用[J]. 工矿自动化,2013,39(2):51-53.
[5] 曲健,陈红岩,刘文贞,等. 基于改进网格搜索法的支持向量机在气体定量分析中的应用[J]. 传感技术学报,2015,28(5):774-778.
[6] 刘文贞,陈红岩,李孝禄,等. 基于自适应变异粒子群算法的混合核ε-SVM在混合气体定量分析中的应用[J]. 传感技术学报,2016,29(9):1464-1470.
[7] 王宏伟,韩云涛,彭继慎. 基于TSPSO支持向量机红外甲烷传感器动态补偿[J]. 传感技术学报,2013,26(9):1193-1197.
[8] 张丽. 基于支持向量机的矿用红外瓦斯检测系统研究[D]. 北京:中国矿业大学(北京),2010.
[9] 邹心遥,陈敬伟,姚若河. 采用粒子群优化的SVM算法在数据分类中的应用[J]. 华侨大学学报(自然科学版),2016,37(2):171-174.
[10] 王利霞. 改进的粒子群优化算法及其在数据分类中的应用[D]. 西安:西安电子科技大学,2014.
[11] 曲健,陈红岩,刘文贞,等. 基于自适应变异粒子群优化的SVM在混合气体分析中的应用[J]. 传感技术学报,2015,28(8):1262-1268.
[12] 王小川,史峰,郁磊,等. MATLAB神经网络43个案例分析[M]. 北京:北京航空航天大学出版社,2013:1-394.
[13] 余胜威. MATLAB优化算法案例分析与应用(进阶篇)[M]. 北京:清华大学出版社,2015:298-310.
[14] 徐云升,黎瑞珍,张铁涛,等. 实验数据处理与科技绘图[M]. 华南理工大学出版社,2010:1-176.
鲍立(1991-),男,汉族,安徽省安庆市,在读研究生,主要研究方向为检测技术与物联网,2298926413@qq.com;
陈红岩(1965-),男,浙江杭州市,教授,研究生导师,浙江大学内燃机工程专业硕士、博士学位;上海交通大学动力与机械工程专业博士后。主要研究领域为汽车电子、发动机排放与控制、气体检测等,bbchy@163.com。
ApplicationofSVMBasedonImprovedParticleSwarmOptimizationAlgorithminMethaneMeasurement*
BAOLi,CHENHongyan*,GUOJingjing,YUANYuefeng,LIXiaolu
(College of Mechanical and Electrical Engineering,China Jiliang University,Hangzhou 310018,China)
In the process of methane gas quantitative analysis,the traditional SVM model has some problems of low prediction precision and slow convergence speed and so on. To solve these problems,a SVM regression model based on improved PSO algorithm is presented. On the basis of the traditional PSO algorithm,the model introduces momentum and simultaneously increases following factors for the individual extremum of random particles to make the particles not only follow the global optimal solution and local optimal solution,follow the individual extremum of any particle in the population. This method makes optimum algorithm have a faster convergence speed and be not easy to fall into local minimum. In experiments,building a model and analyzing for 25 groups of methane gas that the concentration is range from 0 to 5.05%,and then doing a comparison with traditional PSO algorithm and Grid search method. Results show that the SVM regression model based on improved PSO algorithm has a smaller root-mean-square error and faster convergence speed.
detection technique and automatic device;SVM;improved particle swarm optimization algorithm;regression analysis;infrared methane sensor
项目来源:浙江省大学生科技创新活动计划暨新苗人才计划项目(省级)(2016R409)
2017-02-23修改日期:2017-04-14
TP274.2
:A
:1004-1699(2017)09-1454-05
10.3969/j.issn.1004-1699.2017.09.026