APP下载

基于支持向量机算法的连铸漏钢预报模型研究

2015-06-01尹少峰张瑞忠安领军燕山大学国家冷轧板带装备及工艺工程技术研究中心河北秦皇岛066004河北钢铁集团邯郸钢铁集团有限责任公司河北邯郸05605燕山大学亚稳材料制备技术与科学国家重点实验室河北秦皇岛066004

燕山大学学报 2015年1期
关键词:粒子群算法支持向量机遗传算法

王 葛,尹少峰,李 珊,张瑞忠,安领军,李 强,3,*(.燕山大学国家冷轧板带装备及工艺工程技术研究中心,河北秦皇岛066004; .河北钢铁集团邯郸钢铁集团有限责任公司,河北邯郸05605; 3.燕山大学亚稳材料制备技术与科学国家重点实验室,河北秦皇岛066004)

基于支持向量机算法的连铸漏钢预报模型研究

王葛1,尹少峰1,李珊1,张瑞忠2,安领军2,李强1,3,*
(1.燕山大学国家冷轧板带装备及工艺工程技术研究中心,河北秦皇岛066004; 2.河北钢铁集团邯郸钢铁集团有限责任公司,河北邯郸056015; 3.燕山大学亚稳材料制备技术与科学国家重点实验室,河北秦皇岛066004)

摘要:漏钢预报系统的性能往往取决于其算法模型的性能,支持向量机(SVM)算法在解决小样本、非线性及高维模式识别中具有许多特有优势,能够避免神经网络隐含层节点选择及局部极小值等问题,而不同的SVM算法参数往往会对其性能产生显著影响。为此,本文利用GS网格搜索法、PSO粒子群算法和GA遗传算法对SVM支持向量机的算法参数进行了优化,并将优化后的SVM支持向量机算法应用到连铸漏钢预报系统中;利用某钢厂CSP连铸生产线的历史生产数据对各优化后的SVM支持向量机算法进行了训练和测试。测试结果表明,用GA遗传算法优化后的SVM支持向量机算法测试效果较好,得到了98.33%的预报率和100%的报出率,从而验证了基于SVM支持向量机漏钢预报系统的可行性和有效性。

关键词:漏钢预报;支持向量机;遗传算法;粒子群算法

0 引言

漏钢是连铸过程中的灾难性事故,不仅会影响正常生产,还会导致设备损坏,造成巨大的经济损失。采用漏钢预报系统对漏钢作出早期预警和处理是解决连铸漏钢事故最有效和最直接的手段[1]。粘结性漏钢在所有漏钢事故中占到70%以上,成为漏钢预报系统的研究重点。目前采用的漏钢检测方法主要有热电偶测温法、结晶器热交换分析法、摩擦力测量法、振动波形分析法以及超声波探测法等[2]。其中热电偶测温法是根据埋设在结晶器铜板内的热电偶所测得的结晶器表面温度的变化情况来判别是否漏钢,因其能够快速准确的反映结晶器内的温度分布,具有实时性和可操作性,成为现有漏钢预报系统所采取的主要检测方法[3]。

支持向量机(Support Vector Machine,SVM)[4]以统计学习理论为基础,在解决小样本、非线性及高维模式识别中表现出许多特有的优势,避免了神经网络隐含层节点选择及局部极小等问题,已经成为模式识别技术中最实用的方法之一。但目前对SVM算法参数选择尚缺乏成熟的理论依据,不同的算法参数选择往往会对算法的实际识别性能和效果产生显著影响。对SVM参数进行优化,国际上尚没有公认的最好方法,目前较为常用的SVM参数寻优方法主要有网格搜索法、遗传算法和粒子群算法等。

网格搜索法(Grid Search,GS)是一种最基本的参数优化算法,其基本思想是让待搜索参数在一定空间范围内按照规定步距划分网格并遍历网格内所有点进行取值,并将每次取出的参数组带入系统中验证其性能,最终取使系统性能达到最优的参数组作为最佳参数。该算法实质上就是通过暴力搜索的方式,对每一组参数进行试算,因此当规定的搜索范围比较大且网格划分比较密集时,网格搜索寻优法会非常耗时。遗传算法(Genetic Algorithm,GA)[5]是一种基于自然选择和遗传学原理的优化方法,它从一个初始种群开始,利用选择、交叉和变异等遗传算子对种群进行不断进化,最后得到全局最优解;其优点是擅长全局搜索,对中小规模优化问题能够获得较满意的最优解。粒子群优化算法(Particle Swarm Optimization,PSO)[6]是一种基于群体智能的进化式算法,它采用实数求解,需要调整的参数较少且易于实现,且每代种群中的解具有“自我”学习和向“他人”学习的双重优点,可以在较少的迭代次数内找到最优解。因此可以将GS网格搜索法、GA遗传算法、PSO粒子群算法与SVM支持向量机算法相结合,对SVM支持向量机算法参数进行优化,以开发出更适合用于连铸漏钢预报系统的算法模型。

为此,本文将SVM算法应用于连铸漏钢预报系统结晶器热电偶的温度模式识别中,并通过GA遗传算法、PSO粒子群算法和GS网格搜索法对SVM的算法参数进行了优化,建立了GA-SVM算法模型、PSO-SVM算法模型和GS-SVM算法模型,并利用某钢厂CSP连铸生产线上现场采集的热电偶温度数据对其进行了训练和测试。

1 粘结漏钢预报原理

粘结漏钢的发生主要是由于结晶器液面不稳定,弯月面处润滑不好,凝固坯壳与弯月面间发生粘结时拉坯阻力增大,粘结处坯壳被拉裂并向下和两侧扩展,随着结晶器振动和铸坯的向下运动,当铸坯坯壳破裂位置移出结晶器而产生的,其基本原理如图1所示[1]。正常浇铸过程中,上排热电偶温度高于下排热电偶温度,热电偶温度随时间变化的曲线相对平稳,如图1(a)所示;当铸坯在弯月面处与结晶器发生粘结时,随着结晶器的振动及坯壳的下移,粘结部位以下的坯壳很容易被拉裂,如图1(b)所示;当粘结裂口扩展至上排热电偶处时,钢水与结晶器铜板直接接触,热电偶温度会迅速上升,如图1(c)所示;随着粘结裂口的继续下移,上排热电偶温度因坯壳的固化弥合而逐渐下降,如图1(d)所示;同样,当粘结裂口通过下排热电偶时也会出现一个先上升后下降的温度变化模式,只是在时间上要延后一些,如图1 (e)和(f)所示。

基于热电偶测温法的漏钢预报系统,主要目的是对热电偶的温度模式是否具有粘结漏钢特征进行判别,其本质是热电偶温度曲线的模式识别问题,而基于SVM的漏钢预报系统,就是利用SVM算法将正常温度模式数据和漏钢温度模式数据区别开来。

图1 粘结漏钢预报原理Fig.1 Mechanism of sticking breakout prediction

2 SVM算法基本原理

SVM是建立在统计学习理论的VC维理论和结构风险最小原理基础上,根据有限样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(或称泛化能力)的一种算法[8]。其基本思想是在寻求分类超平面的同时引入一个核函数,并通过非线性映射的方式将输入样本映射到一个高维特征空间中,然后在这个高维特征空间中构造最优超平面,从而将其转化成为一个求解线性约束的凸二次规划问题。

对于n个训练样本(xi,yi),i = 1,2,…,n,其中xi是输入模式的第i个实例,yi是对应的期望输出。假设由yi= + 1代表的模式和yi=-1代表的模式是线性可分的,用于进行分类的超平面方程表示为

式中,xi为输入向量;ω为超平面的法向量,为可调权值的向量; b为偏置量。

由于样本线性可分,则可以固定函数间隔为1,则训练样本即满足如下条件

将式(2)合并为一个不等式,可得

计算几何间隔γ

求最大间隔超平面,即最小化‖ω‖,也就是最小化。转化为求解如下优化问题

若求解上面的约束优化问题,可构造拉格朗日函数

式中,αi≥0,为拉格朗日乘子。

分别对ω和b求偏导数,并令αi[1-yi(ωxi+ b)]=0,i

其中,Lp和L的最大值发生在相同的ω、b和αi处。

在真实的数据中,噪声是不可避免的,对于线性不可分的输入样本,原优化问题的对偶形式为无界的目标函数,不能得到解决,需要引入松弛变量ξi,来放松约束条件。这样的SVM分类器又称作软间隔分类器。对于每个样本松弛变量ξi定义如下

同时指定一个惩罚参数C,来调节对输入样本误分带来的影响。根据ξi的定义,只有被错误分类的点对应的ξi非零,那么就表示训练误差的上界,通过引入松弛变量ξi和惩罚参数C把最大化分类间隔的问题转化为同时最大化分类间隔和最小化分类误差的问题,即

通过非线性映射将输入样本映射到一个高维特征空间中,并求解优化问题,可得到

引入核函数K,根据泛函理论,只要核函数K满足Mercer定理[9],即K(xi,xj) =(xi)(xj),则可避免(x)的直接运算。

因此,最终优化问题可转化成为

通过决策函数可以将不同类型的输入数据进行识别,从而输出不同的结果,达到分类的目的。决策函数为

3 基于SVM的漏钢预报模型

基于SVM的漏钢预报模型,最终目的是要找到能够正确区分正常温度模式和漏钢温度模式的最优超平面。其基本框架如图2所示。

图2 基于SVM的漏钢预报模型框架Fig.2 Model of breakout prediction system based on SVM

首先,从CSP连铸生产线现场所采集的热电偶温度数据中筛选出训练样本,并对其进行预处理;然后,选择恰当的SVM分类器类型和核函数类型;最后,确定合适的算法参数,并使用训练样本对SVM模型进行训练。

由于选择不同的SVM算法参数往往会对算法的性能产生显著的影响,为此本文采用GA遗传算法、PSO粒子群算法和GS网格搜索法对其算法参数进行了优化选择,再使用具有最优参数的SVM分类模型对温度数据进行了测试,以验证SVM模型的精度。

3.1SVM模型训练样本数据

1)样本的选择。训练数据为某钢厂CSP连铸生产线现场历史温度数据,从中选取70组典型温度模式作为训练样本对SVM分类器进行训练,其中包括20组正常样本和50组漏钢样本。

2)样本维数的确定。通过对生产现场采集到的历史温度数据分析发现,30秒数据就可以体现一个完整的热电偶温度波形。因为现场温度数据的采样频率为1次/s,所以训练样本输入数据为30维。设置正常样本输出为0,漏钢样本输出为1。

3)结晶器漏钢预报系统热电偶排布。文中CSP连铸生产线的结晶器内共装有120个热电偶,但实际用于漏钢预报系统的热电偶只有36个,分2排布置,其中宽面上每排16个,窄面上每排2个。结晶器液面距其顶部为80 mm,而第一排热电偶距结晶器顶部227 mm,所以第一排热电偶在正常浇注时液位下方的147 mm处。

3.2数据预处理

3.2.1不良数据的处理

连铸现场工况复杂,影响温度信号采集系统的因素较多,因此采集到的温度数据中难免存在不良数据,通过对生产数据进行分析发现,在正常情况下所采集到的热电偶温度波动较小,基本成一条直线,温度值范围在80℃~250℃之间;当漏钢发生时,温度数据变化幅度较明显,但在相邻2个采样时刻的温度值变化幅度不会超过30%,因此超过此范围的数据可当作不良数据进行处理,若当前温度值较前一采样时刻温度值变化幅度超过30%,就用前一时刻的温度值代替当前数据,以避免噪声数据对预报精度的影响。

3.2.2数据的PCA降维处理

现场采集到的温度数据中存在数据的冗余现象,本文采用PCA主成分分析法对其进行降维预处理。成分分析结果如图3所示。

图3 数据的PCA降维Fig.3 Dimensionality reduction of data by PCA

PCA主成份分析法,就是将给定的一组变量通过线性变换转换为另一组不相关的变量,这些新的变量按方差递减的顺序排列,构成相应的主成份[10],其具体步骤如下:

1)设X = (x1,x2,x3…xn)T是一个n维随机向量,计算X的协方差矩阵Σ= XXT;

2)计算Σ的特征值λi(i =1,2,…)及对应的特征向量Pi(i = 1,2,…),则X的第i主成分为Y=PTiX ;

由图3可以看出,3个主成分的累计贡献率已经超过95%。通过PCA算法降维后,不仅抑制了数据中的噪声,而且消除了数据中的冗余信息,降低了模型复杂度。

3.3SVM分类器的类型及核函数选择

因为不能保证漏钢样本和正常样本为线性可分的数据,所以本文在选择分类器时采用了式(13)表示的软间隔SVM分类器。由于选择不同的核函数对不同数据类型的分类效果存在较大差异,而RBF核函数对各种数据类型都有良好的分类效果,为此本文采用RBF核函数[11],其函数表达式为

因为式(13)中,对偶形式的目标函数和约束条件中,训练样本为已知数据,只有核函数参数σ和惩罚参数C需要选择,并且对SVM分类器性能有着显著影响,因此需要对参数C和σ进行优化选择。

3.4SVM分类模型的参数优化

分别采用GS网格搜索法、GA遗传算法和PSO粒子群算法完成参数的选择过程。

3.4.1网格搜索法优化SVM参数

网格搜索法(Grid-search,GS),是先指定SVM算法参数C和σ的范围和取值的步长,然后取参数(C,σ)的所有取值训练SVM分类器,经过比较后选取效果最好的一对参数值作为SVM模型参数。本文设定log2C∈(-5,5),log2σ∈(-5,5),C和σ取值步长为1。图4给出了网格搜索法选择SVM参数的过程。

3.4.2GA算法优化SVM参数

GA遗传算法是在对生物进化过程进行深入研究的基础上提出来的一种具有随机特性的全局寻优搜索算法,具有良好的全局优化性能和宏观搜索能力。利用遗传算法选择SVM算法参数的流程如图5所示,其具体步骤如下:

Step1:对参数进行编码并产生初始种群;

Step2:用训练样本对该初始种群构成的SVM模型进行训练,将样本5折交叉检验精度折算成该模型的GA适应度;

Step3:根据GA适应度,对参数进行选择、交叉及变异等操作,产生下一代参数种群;

Step4:用新一代的种群参数重新对SVM模型进行训练,计算适应度:如果满足停止准则,则转步骤step5,否则,返回step3;

Step5:训练结束,得到的参数即为SVM模型的参数。

图4 GS网格搜索法选择SVM参数Fig.4 SVM parameter selection by Grid Search Method

遗传算法的参数选择:

1)种群初始化。个体编码方法采用实数编码;种群数量设置为20。

2)适应度函数。把5折交叉检验的CV准确率作为适应度函数值。

3)选择操作。选择操作方法为轮盘赌法;个体i的选择概率pi为:式中,fi为第i个基因对应的个体适应度; N为种群规模。

4)交叉操作。交叉概率取0.4;由于个体编码采用的是实数编码,所以交叉操作的方法采用的是实数交叉法,第k个染色体ak和第l个染色体al在j位的交叉操作方法如下:式中,b为[0,1]间的随机数。

5)变异操作。变异概率选择0.01;选取第i个染色体的第j个基因aij进行变异,其操作过程为

f(g) = (r2(1-g/gmax))m(19)式中,ci,di分别为基因ai的下界和上界; g为当前进化次数; gmax为最大进化次数; r1、r2为[0,1]间的随机数; m为设定参数,它决定了变异结果对迭代次数的依赖程度。

6)终止条件。最大进化代数为100。

图5 GA-SVM算法流程图Fig.5 Flow diagram of GA-SVM algorithm

利用GA遗传算法选择SVM参数时所绘制的适应度曲线如图6所示。

3.4.3PSO算法优化SVM参数

PSO算法为迭代寻优算法,通过与个体最优值和全局最优值的比较不断更新自己的位置和速度,PSO算法优化SVM算法参数步骤如下:

Step1:初始化粒子群;

Step2:将5折交叉检验准确率的相反数作为适应度函数,并根据适应度函数计算每个粒子的适应度值;

Step3:对于每个粒子,将其自身适应度值与该粒子自身的最优适应度值进行比较,若较好,则更新粒子的当前最优位置;

Step4:对于每个粒子,将其自身适应度值与所有粒子的最优位置的适应度值进行比较,若较好,则更新全局最优位置;图6给出了遗传算法的适应度曲线。

Step5:按照如下规则对速度和位置进化并更新粒子的速度和位置,得到新的粒子位置式中,w为惯性权重,表明微粒原先的速度在多大程度上得到保留;下标“i”表示微粒i;“j”表示微粒的第j维;表示第七代; c1、c2为加速常数; r1~U(0,1)、r2~U(0,1)为两个独立的随机函数。

Step6:判断是否满足终止条件(达到最大迭代次数或最小适应度阈值),若不满足则返回step2重复上述过程,若满足则输出最优参数。

图6 遗传算法适应度曲线Fig.6 Fitness curve of genetic algorithm

PSO算法参数的选择:

1)种群大小n。n较小使算法陷入局部最优,n较大优化能力较好,但计算时间增加,文中取n为20。

2)粒子维度的确定。粒子维度是由具体的优化问题所决定的,优化C和σ两个参数,所以粒子维度为2,每一维粒子坐标范围都单独设定。

3) c1和c2的确定。加速度因子c1和c2代表了粒子向自身最优点和全局最优点推进的加速权值。文中取c1和c2为2。

4)惯性权重w的选择。惯性权重w描述了上一代粒子速度对当前代粒子速度的影响。较大的w具有较好的全局收敛能力,较小的w有较好的局部收敛能力。因此,惯性权重w要随着迭代次数增加而不断减小,选择如下更新方式

其中,t为当前迭代次数,T为最大迭代次数。文中取n为6,此时全局搜索时间和局部搜索时间都较长,w随着迭代次数的增加从0.9到0.4变化。

5)将SVM的5折交叉检验精度的相反数作为粒子群算法的适应度函数(适应度函数值越小表示效果越好)。

6)终止条件。最大迭代次数为200。

利用PSO粒子群算法选择SVM参数时所绘制的适应度相反数曲线如图7所示。

图7 粒子群算法适应度相反数曲线Fig.7 Fitness opposite curve of PSO

3.5SVM预报模型的测试

在对某钢厂CSP连铸生产线现场所采集3个月的历史数据进行提取、分析并处理后,将包含正常模式、粘结模式的温度序列作为测试样本对该漏钢预报模型进行测试。测试样本共120组,包含正常样本50组,伪报警样本20组,报警样本50组,测试样本与训练样本不存在任何交叉与重复。

对GA优化的SVM算法模型、PSO优化的SVM算法模型和GS优化的SVM算法模型进行测试,并将测试结果比较,如表1所示。表1中所采用的预报模型的性能测试指标[12]为预报率ηp和报出率ηr式中,ηr为正确报警次数;ηf为错误报警次数; no为漏报次数。

从表1中可以看出,采用GA算法优化的SVM预报模型具有更好的预报精度,在测试过程中,共做出51次报警,包括对50组报警数据的正确报警和对伪报警数据的1次误报,不存在漏报现象,其预报率为98.33%,报出率为100%。

表1 SVM预报模型训练及测试结果Tab.1 Training and test results of SVM prediction model

4 结束语

利用PCA法,对某钢厂CSP连铸生产过程中结晶器热电偶所采集的温度数据进行降维预处理,抑制了噪声,剔除了冗余数据,减小了模型复杂度;分别利用GS网格搜索法、PSO粒子群算法和GA遗传算法,对以RBF核函数为映射函数的SVM算法参数进行了优化选择;将优化后的SVM分类模型应用到漏钢预报系统中,并对其进行了训练和测试。测试结果表明,利用GA算法优化的SVM分类模型具有更好的预报效果,得到了98.33%的预报率和100%的报出率,提高了漏钢预报系统对粘结漏钢温度模式的识别精度,降低了误报率。

参考文献

[1]Lee D,Moon C H,Moon S C,et al.Development of Healing Control Technology for Reducing Breakout in Thin Slab Caster[J].Control Engineering Practice,2009,17(1) : 3-13.

[2]张本国,李强,王葛,等.基于改进BP神经网络的漏钢预报[J].中国机械工程,2012,23(2) : 204-207.

[3]秦旭,朱光甫,高光河,等.板坯漏钢机理及基于热电偶检测的漏钢预报技术研究[J].钢铁研究学报,2011,23(1) : 7-14.

[4]Vapnik V.The Nature of statistical learning theory[M].New York: Springer,1999.

[5]Zhang Benguo,Zhang Ruizhong,Wang Ge,et al.Breakout prediction for continuous casting using genetic algorithm-based backpropagation neural network model[J].Modelling Identification and Control,2012,16(3) : 199-205.

[6]陈贵敏,贾建援,韩琪.粒子群优化算法的惯性权值递减策略研究[J].西安交通大学学报,2006,40(1) : 53-56.

[7]王葛,李珊,张瑞忠,等.基于粒子群优化的神经网络漏钢预报模型研究[J].燕山大学学报,2014,38(3) : 221-225.

[8]Cortes C,Vpnik V.Support vector networks[J].Machine Learning,1995,20(3) : 273-297.

[9]Nello C,Hohn S.An introduction to support vector machines and other kernel-based learning methods[M].Delfing China Machine Press,2005: 7.

[10]韩成茂.基于类内加权平均值的模块PCA算法[J].计算机工程.2009,35(22) : 194-196.

[11]奉国和.SVM分类核函数及参数选择比较[J].计算机工程与应用,2011,47(3) : 123-124.

[12]史建聚.板坯漏钢预报系统的研究[J].重庆科技学院学报,2008,10(1) : 66-68.

Breakout prediction model for continuous casting based on support vector machine method

WANG Ge1,YIN Shao-feng1,LI Shan1,ZHANG Rui-zhong2,AN Ling-jun2,LI Qiang1,3
(1.National Engineering Research Center for Equipment and Technology of cold Strip Rolling,Yanshan University,Qinhuangdao,Hebei,066004,China; 2.Hebei Iron&Steel Group Handan Iron&Steel Group Co.Ltd,Handan,Heibei 056015,China; 3.National Key Laboratory of Metastable Materials Science and Technology,Yanshan University,Qinhuangdao,Heibei 066004,China)

Abstract:The performance of the breakout prediction may largely depend on the performance of it's algorithm model.Support Vector Machine (SVM) method has a lot of preponderance for solving the small sample,nonlinearity and high-dimensional pattern recognition problems.SVM method has no local minima problem,but the algorithm parameters of SVM can largely influence on the performance of the algorithm model.Grid search (GS) method,particle swarm optimization (PSO) and genetic algorithm (GA) are introduced to optimize the parameters of SVM.The optimized SVM model by GA has better performance and is applied to the breakout prediction system of continuous casting.The optimized SVM model is trained and tested using the historical data of a CSP continuous casting production line.A prediction ratio of 98.33% and a quoted ratio of 100% are obtained.It is shown that the breakout prediction system based on the SVM algorithm is feasible and effective.

Key words:breakout prediction; support vector machine; genetic algorithm; particle swarm optimization

作者简介:王葛(1975-),男,河北玉田人,博士,副教授,主要研究方向为连铸过程漏钢预报算法研究; *通信作者:李强(1962-),男,江苏赣榆人,博士,教授,博士生导师,主要研究方向为连铸坯凝固过程研究和漏钢预报算法研究,Email: liqiang@ ysu.edu.cn。

基金项目:国家自然科学基金资助项目(51205342)

收稿日期:2014-09-12

文章编号:1007-791X(2015) 01-0022-08

DOI:10.3969/j.issn.1007-791X.2015.01.004

文献标识码:A

中图分类号:TF345

猜你喜欢

粒子群算法支持向量机遗传算法
基于遗传算法的智能交通灯控制研究
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
电力市场交易背景下水电站优化调度研究
基于粒子群算法的产业技术创新生态系统运行稳定性组合评价研究
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
交通堵塞扰动下多车场车辆路径优化
基于改进的遗传算法的模糊聚类算法