APP下载

基于遗传算法优化支持向量机的辐射测温方法

2015-02-16卢艳军周小敏

沈阳航空航天大学学报 2015年3期
关键词:测温遗传算法遗传

卢艳军,周小敏,任 艳,房 芮

(沈阳航空航天大学 自动化学院,沈阳 110136)

基于遗传算法优化支持向量机的辐射测温方法

卢艳军,周小敏,任 艳,房 芮

(沈阳航空航天大学 自动化学院,沈阳 110136)

温度的监控与测量在工业生产和科学研究等众多领域都发挥着重要的作用。遗传算法(Genetic Algorithm,GA)是模拟生物界中自由配对和自然选择现象的一种过程全局搜索算法。而支持向量机(Support Vector Machine,SVM)是以统计学习理论为基础的,并致力于研究少样本情况下机器学习规律的新兴学习算法,具有非常好的非线性函数拟合和泛化能力。针对目前支持向量机的结构参数多采用经验或者试取,提出遗传算法来优化支持向量机的参数,并应用于红外辐射温度测量。结果表明,遗传算法优化方法较网格搜索方式无论是学习效率和预测精度都优于后者,表明遗传支持向量机算法能有效地用于目标辐射温度测量。

支持向量机;遗传算法;参数优化;温度测量

在高温辐射测量现场一般工作环境比较恶劣,因此对于辐射本身尤其内部温度测量比较困难。现在主要测温方式分为接触式和非接触式测温方法。接触式测温方法利用传感器接触测量,一般适用于点温度的测量,而且不能长时间工作,故这种测量方式很难在高温辐射测量问题上派上用场;对于高温红外辐射测量系统,非接触式测温方法建立数学模型的方法有机理建模方法和实验建模方法两种[1]。机理建模是通过对系统本身的内部过程研究而得出的,它的定性结论一般正确,但实际精度一般达不到要求,而一些实际系统中的机理较为复杂,甚至目前尚未清楚。实验建模方法即系统辨识,根据系统运行过程中的输入与输出数据,利用系统辨识模型来建立相关的数学模型。釆用这种方法建立系统的模型,需要有足够多的试验数据,这正好是本文辐射测温系统所能满足的。而目前对于高温物体温度辨识建模的非接触软测量,已经受到越来越多学者的关注[2]。例如文献[3]中用BP神经网络对高温物体的彩色图像进行测量,取得不错的效果。支持向量机与神经网络一样能在高度非线性甚至严重不确定性的系统中有自适应、自学习和非线性逼近的能力,但由统计学理论发展起来的支持向量机是基于结构风险最小化,能真正实现期望风险最小化[4-5]。但目前有个非常关键性的问题就是它的结构参数如何选择,因为结构参数对支持向量机模型在实际应用中有很大的影响[6-7]。本文选择径向基RBF作为SVM的核函数,而实验证明核函数径向基参数对训练模型有重大的影响,因为σ隐含地决定了训练数据映射到高维空间中新的特征向量的空间分布[8-9]。但可惜的是目前还没有明确的理论基础来指导参数的选择,所以支持向量机的参数寻优问题一直被广泛研究。1975年由密执安大学教授J.H.Holland等提出了遗传算法,受到了世界研究者的高度关注[10]。由于GA算法不但在大型复杂非线性系统的参数全局寻优,而不陷入局部最小,而且具有很强的鲁棒性,在各种工程搜索过程和优化问题上都有它的应用。因此本文利用遗传算法对支持向量机参数进行优化,并应用于辐射测温建模中。

1 遗传算法对支持向量机结构参数的优化

1.1 遗传算法参数优化过程

遗传算法的基本思想来源于达尔文的进化论和孟德尔遗传学说[11]。它模拟自然界中生物繁衍与进化的现象,这样的进化过程实质上遵从优胜劣汰、适者生存的自然法则,生物的遗传不仅是生物个体的遗传,更是生物种群群体的遗传,同时还遭受自然的选择。简单地说,种群基因中适合自然环境生存的会继续遗传,而那些不利于生存的基因逐渐遭到淘汰直至消亡。下面介绍遗传算法的主要步骤:

首先初始化种群的所有染色体及基因,设计符合实际问题的适应度评价函数。本文用支持向量回归机在对样本进行训练时,用交叉验证的方法取得平均均值误差作为评价染色体适度值函数。由于在遗传算法中适度值函数不但要求为正,而且是对最大值求解,故我们通过式(1)将最小值问题转换为最大值问题。

(1)

然后对种群祖先的所有基因在经过解码后带入到适应度评价函数中,计算第一代每个染色体个体在种群中生存的频率(概率)。通过杂交和变异等操作进化下一代种群染色体的基因。这样在经过若干代遗传后,重新计算下一代的适度值,找出其中最好的染色体,它即作为待求解问题的一个可能的全局最优解,直到循环得到最优解的时候就结束遗传。

1.2 支持向量机回归建模原理

基于统计学习理论的SVM可以通过定义适当的损失函数来解决连续函数拟合问题[11-14]。令训练样本数据集为{xi,yi},其中i=1,…,l,xi∈Rd,yi∈Rd,x与y存在某种映射关系。用线性回归函数f(x)=w·φ(x)+b拟合训练数据集{xi,yi},假设在精度ε(又称不敏感函数)下,所有训练数据集可以用式(1)进行线性函数拟合:

(2)

(3)

(4)

此时,如果输入空间特征是通过核函数映射到高维空间,即满足K(xi,xj)=φ(xi)·φ(xj),再将式(4)带入式(3)得出支持向量回归预测函数为:

(5)

2 辐射测温建模与仿真

2.1 基于遗传算法和SVM的辐射测温模型

首先用CCD相机对各个温度下标定的黑体炉进行高温图像采集,然后通过对图像进行分割、去噪、矩阵平均,从而求取出图像样本在RGB各个通道下的灰度值,然后在[0,255]进行归一化处理[15],再将所对应的标定温度分别作为训练样本集的输入与输出,系统结构流程图如图1,取得的部分数据如表1所示:

表1 测温模型训练部分数据

图1 系统结构流程图

支持向量回归机中有三个重要的参数,即核函数的径向基带宽σ、控制模型复杂程度和拟合误差大小的惩罚系数C、不敏感系数参数ε。由于本文在测温实际应用中,所期望的温度预测精度在1 ℃内,我们不妨取ε=0.001(1 ℃/1 000 ℃)。接下来我们采用遗传算法来选取参数C,σ。

步骤1:使用CCD相机对标定后的黑体炉在不同温度下的颜色光进行采集,得到一系列一定间隔温度的样本,对图像进行处理,得到RGB通道下的颜色特征值空间集,并将样本平均分成5等分;

步骤2:设定遗传基因的种群规模、遗传总代数、遗传交叉概率及突变概率(例如popsize=20,popstep=30);

步骤3:将所需要选取的变量编码成二进制串。我们设定惩罚因子C的选取范围为[1:5 000]、核函数参数σ的范围为[0.01:1.28];

步骤4:染色体评价。本文采用支持向量机对颜色测温样本值进行训练,交叉验证取得的平均MSE作为染色体评价函数。如果染色体评价函数fitvalue满足系统指定要求或者遗传算法达到最大遗传步骤,则转步骤5;否则转步骤3;

步骤5:取出fitvalue满足系统指定精度条件的染色体,或取出全体fitvalue值最高的最佳染色体(当算法计算到设定的遗传代数最大值时),再解码得到支持向量机模型在辐射测温中最佳参数C,σ。

步骤6:取样本输入到SVM模型进行训练,拟合高温图像颜色特征值与温度T之间的非线性关系,并利用样本验证训练好的SVM模型,并与网格搜索法取得最优参数进行预测仿真比较。

2.2 仿真结果与分析

支持向量机结构参数通过遗传种群的初始化,染色体适度值评估,基因选择,杂交,变异,解码等一系列遗传算法后,遗传算法取得的最佳参数为[3 500,0.03],而网格搜索法我们同样取C的范围为[1:10:5 000],搜索步长为10;核函数参数σ的范围为[0.01:0.02:1.28],搜索步长为0.02,取得的最佳参数为[2 000,0.21]。分别将以上两组参数带入SVM模型进行训练与预测,得到预测误差如图1所示。

遗传算法在SVM参数询优迭代中,将训练数据的交叉验证取得的所有MSE平均值作为适度值函数,随着迭代次数,MSE的结果趋势如图2所示。在选择遗传算法与网格搜索法优化SVM参数时,最终取得的SVM模型在对温度预测结果中,所取得的最大误差、最小误差及平均误差如表2所示。所有仿真实验在MATLAB7.6,Intel Core i5-2310 CPU @ 3.00 GHz中运行。

图2 遗传算法与网格搜索法模型结果与真实温度之差

表2 遗传询优算法与网格搜索法数据比较

从图2中我们可以直观地看出,遗传算法所得出的参数结构对SVM模型预测精度明显比网格搜索出的参数结构所取得的要高。从表2中数据比较可以看出,遗传算法取得的模型预测最大误差有3.165,而最小误差只有0.013,这比网格搜索方法得到的预测无论是最大还是最小误差都要小,最重要的是所有训练样本集在模型预测中的平均误差比后者小的多。从图3中,我们又可以看出遗传算法在到达第10步以后,训练误差直线下降,说明遗传算法收敛非常快,运算效率很高。

图3 遗传SVM在迭代过程中预测总体误差(MSE)趋势

3 结论

本文基于遗传算法和支持向量机应用拟合高温物体颜色图像的灰度值与真实温度之间的映射关系,利用遗传算法优异的全局搜索能力选取支持向量机网络的结构参数。与常规搜索方法网格搜索法获得的结果进行了对比。实验结果表明,基于遗传算法的支持向量机不但拥有SVM的良好的拟合和泛化能力,还同时结合了遗传算法全局搜索和快速收敛的智能优化优势,验证了遗传支持向量机在辐射温度预测以及其他回归拟合领域有着十分广阔的应用前景。后续研究更需考虑实时性,因为这种基于图像颜色和支持向量机的测温技术是通过CCD相机采集了图像之后,再通过计算机进行图像处理,取得高温图像的颜色特征值后利用支持向量机模型的训练而预测温度,这会影响到温度的实时测量,而且高温图像的采集设备和后续数据处理设备并没有集成在一起,不利于商业化的生产和使用,这将是本文后续研究的重点。

[1]陈凯迪.基于CCD图像传感器的温度测量系统的研究[D].哈尔滨:哈尔滨工业大学,2010:3-8.

[2]Tschudi H R,Schubnell ML.Measuring temperatures in the presence of external radiation by flash assisted multiwavelength pyrometry[J].Review of Scientific Instruments,1999,70(6):2719-2727.

[3]朱丽娟,周永华,周黄斌.基于BP神经网络的彩色温度软测量[J].计算技术与自动化,2007,26(4):113-116.

[4]O.Chapelle,V.Vapnik.Choosing multiple parameters for support vector machines[J].Machine Learning,2002,46(1):131-159.

[5]Cherkassky V,Ma Y Q.Practical selection of SVM parameters and noise estimation for SVM regression[J].Neural Networks,2004,17(1):113-126.

[6]李娇.支持向量机参数优化研究[D].武汉:华中师范大学,2011:45-50.

[7]Ruxandra Stoean,D.Dumitrescu,Mike Preuss.Evolutionary support vector regression machines[R].Symbolic and Numeric Algorithms for Scientific Computing,2006.

[8]Seifeddine Souahlia,Khmais Bacha,Abdelkader Chaari.SVM-based decision for power transformers fault diagnosis using rogers and doemenburg ratios DGA[R].2013.

[9]Maya Kallas,Clovis Francis,Lara Kanaan.Multi-class SVM classification combined with kernel PCA feature extraction of ECG signals[R].Telecommunications,2012.

[10]Holland J H.Genetic algorithm[J].Scientific American,1992,256(1):66-70.

[11]臧淑英,张策,张丽娟,等.遗传算法优化的支持向量机湿地遥感分类[J].地理科学,2012,32(4):434-440.

[12]李海生.支持向量机回归算法与应用研究[D].广州:华南理工大学,2005:34-39.

[13]李翠平,郑瑶瑕,张佳,等.基于遗传算法优化的支持向量机品位插值模型[J].北京科技大学学报,2013,35(7):84-89.

[14]刘海,张俊红,倪广健,等.基于遗传支持向量机的柴油机辐射噪声品质预测技术[J].振动与冲击,2013,32(2):111-115.

[15]孙元,彭小奇,严军.基于彩色CCD的高温场辐射测温方法[J].仪器仪表学报,2011,32(11):2579-2585.

(责任编辑:刘划 英文审校:刘敬钰)

Radiation temperature measuring based on support vector regression and genetic algorithm optimization

LU Yan-jun,ZHOU Xiao-min,REN Yan,FANG Rui

(College of Automation,Shenyang Aerospace University,Shenyang 110136,China)

Thermometry plays a very important role in many fields such as industrial production and scientific studies.Genetic Algorithm(GA)is a global search algorithm which simulates the phenomenon of open cross and the natural selection in the biosphere.Support Vector Machine(SVM)is a new learning algorithm based on statistical learning theory with good nonlinear fitting and generalization abilities.According to the present situation where the parameters of SVM are selected by experience,puts forward genetic algorithm to optimize the parameters of SVM and applies them to the infrared radiation temperature measurement.Simulation shows that the GA optimization method has more excellent performance in learning efficiency and prediction accuracy than the grid search method.Therefore,the results prove the validity that GA and SVM can be well used in the target radiation temperature measuring.

Support Vector Machine;Genetic Algorithm;Parameter Optimization;Thermometry

2014-01-07

沈阳航空航天大学博士启动项目(项目编号:13YB11);沈阳航空航天大学大学生创新项目(项目编号:2013105)

卢艳军(1968-),女,辽宁义县人,副教授,主要研究方向:复杂系统故障诊断技术及飞行器主动安全技术,E-mail:sylyj2004@126.com。

2095-1248(2015)03-0058-05

TN219

A

10.3969/j.issn.2095-1248.2015.03.011

猜你喜欢

测温遗传算法遗传
非遗传承
还有什么会遗传?
还有什么会遗传
还有什么会遗传?
基于WiFi无线通信测温系统的设计
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
变压器光纤测温探头的安装固定
基于遗传算法和LS-SVM的财务危机预测
基于DS18B20的单片机测温系统