APP下载

基于CPA-SVR的RH炉终点温度预测模型

2022-10-14刘惠康

冶金能源 2022年5期
关键词:食肉命中率适应度

杨 磊 柴 琳 刘惠康 易 振

(1.武汉科技大学信息科学与工程学院,2.武汉科技大学冶金自动化与检测技术教育部工程研究中心)

RH炉(真空循环脱气)是目前炉外精炼的主要设备之一,是一种具有脱碳、脱气和净化除杂功能的二次精炼炉。在精炼过程中,精准控制钢水的冶炼温度十分重要,钢水温度对后续的吹氧脱碳、加铝脱氧和合金化等工序有较大影响[1-2]。传统的炼钢大多根据经验来估计钢水的温度,该方法既不靠谱又低效,直接影响生产者对后续工序的控制,导致钢品质不合格[3-5]。

为了精准预测终点温度,保证炼钢工艺的质量,学者们对炼钢的温度控制进行了研究。陈伟庆、段贵生等人[6]基于神经网络建立了转炉出钢—连铸过程钢液温度的数据模型,但是预报偏差较大,训练样本较少,无法学习到完整的模型特征。丁容、刘浏等人[7]运用BP神经网络建立了转炉炼钢人工智能模型,得到的终点温度预测精度较低,误差在±10 ℃内的命中率仅为65.4%。刘浏、杨强等人[8]分析了RH精炼过程中钢水的热传递物理过程,提出了RH精炼钢水温度预报模型,该模型预报的准确性较高,误差在±5 ℃内的命中率为72%。但是,该方法理论上可行,实践时许多参数难以获取。刘锟、刘浏等人[9]把增量模型和神经网络结合起来,提出了增量神经网络模型预报,误差在±5 ℃和±10 ℃内的命中率分别为80%和93%,与普通的增量模型相比准确度有所提高。但是该模型把重心放在了变量上,忽略了结构的影响。王鹏鹏[10]用遗传算法优化支持向量机,建立了终点温度预报模型,误差在±5 ℃和±10 ℃内的命中率分别为58%和96%。该模型精度比BP神经网络和SVM命中率高,但是容易过早收敛。

针对现有研究成果存在的不足,文章采用支持向量回归来建立预测模型,该模型具有较强的逼近能力和泛化能力。引入核函数将非线性问题转化为线性问题,引入松弛变量将非线性问题转化为凸优化问题,保证结果是全局最优解。但是,仅仅依靠支持向量回归预测终点温度收敛速度较慢,精度不够,无法达到最佳的预测效果。因此,文章引入了一种新型智能寻优算法——食肉植物算法来优化支持向量回归。仿真实验结果表明优化后的模型收敛速度和精度都有所提高,可以更精准地预测终点温度,为后序炼钢工艺提供依据。

1 研究方法

1.1 支持向量回归(SVR)

支持向量回归(Support Vector Regression,SVR)[11]是支持向量机(Support Vector Machine,SVM)在回归拟合分析上的拓展,由SVM解决分类问题向SVR解决回归问题拓展。假设有p个样本,每个样本有n个特征,用(x1,y1),(x2,y2),…,(xp,yp)表示,则输入量为矩阵A=[x1,x2,…,xp]T∈Rp×n,输出量为向量Y=[y1,y2,…,yp]T∈Rp×1。

RH炉冶炼钢铁生产系统涉及到的非线性变量多,变量间的耦合性强,直接处理比较复杂。将输入空间映射到高维特征空间,在高维特征空间寻找线性回归函数,可将非线性问题转化为线性问题。

设建立的线性回归函数为:

f(x)=wΦ(x)+b

(1)

式中:Φ(x)为非线性映射函数;w为权值向量;b为偏置常数。

训练模型的过程即寻找最佳参数w,b的过程,使得预测值f(x)与真实值y之间的差最小。引入松弛变量,将上述寻找最佳w,b的问题转化为凸二次规划问题。引入Largrange函数,结合KKT条件,并转换为对偶形式,得到原问题的对偶问题。

(2)

最终得到的决策函数为:

(3)

式中:K(xi,xj)=Φ(xi)Φ(xj) 为核函数。

为了避免遇到高维空间中“维数灾难”问题[12],核函数选择高斯核函数,通过在低维空间计算并把结果映射到高维空间,可以高效处理高维输入变量。核函数参数g=1/(2σ2),可调整的σ使得高斯核函数灵活性很高[13]。

1.2 食肉植物算法(CPA)

食肉植物算法(Carnivorous Plant Algorithm ,CPA)最早由Ong Kok Meng等人[14],于2020年受食肉植物如何适应恶劣环境(比如捕食昆虫和传粉繁殖)的启发而提出的一种智能优化算法。该算法模拟了食肉植物吸引、诱捕、消化和繁殖等行为。CPA首先随机初始化一组解决方案,然后将这些解决方案分类为食肉植物和猎物,接着依据生长和繁殖过程分组。更新它们的适应度值,组合所有解决方案。重复分组过程直到满足停止条件。根据适应度由小到大排序(考虑最小化问题时),适应度较小的解决方案被认为是食肉植物,剩余的解决方案被认为是猎物。使用CPA算法的目的是利用它在解决全局优化问题上的优越性来寻找SVR模型中的最优核心参数C,g值,最终提高SVR模型的性能。

肉食植物算法的具体描述如下:

Step1:初始化位置

individuali,j=Lbj+(Ubj-Lbj)×rand

(4)

式中:Ub,Lb是搜索域的上界和下界;i=1,2,…,n;j=1,2,…,d;rand为区间[0,1]内的随机值。

利用(4)式初始化位置后,每一行代表一个解决方案,可理解为一个个体。即有n个解决方案,每个解决方案有d个特征。

将个体位置代入适应度函数f(x),即

f(xi)=f(individuali,1,individuali,2,…,individuali,d)

(5)

式中:xi为第i个个体的位置向量。适应度数值越小,则解向量的质量越高。

Step2:分类与分组

按式(5)来评估n个体的适应度。将n个体按适应度值由小及大排序,其中前nCPlant个个体被认为是食肉植物,其余的nPrey个个体被认为是猎物。

分组过程即猎物的分配过程,在上述适应度序列中,将猎物按前后次序每nCPlant个为一组,然后把每组中的猎物依前后次序分配给对应级别的食肉植物,如表1所示。

表1 CPA的分组过程

Step3:吸引与生长

食肉植物通过散发气味吸引、诱捕猎物,然后消化它们来生长。猎物有可能会挣脱束缚而逃出陷阱。以吸引率为衡量标准,文章指定为0.8。

在表1中,每一行都随机选择一个猎物。如果吸引率大于随机生成的数,则食肉植物会成功捕获猎物并消化它来生长。肉食植物生长模型为:

NewCPi,j=growth×CPi,j+(1-growth)×Preyv,j

(6)

growth=growth_rate×randi,j

(7)

式中:CPi,j为i级食肉植物;Preyv,j为随机选择的猎物;growth_rate为待设定的生长率;randi,j为区间[0,1]内的随机数。

如果吸引率小于随机生成的数,则食肉植物会失手,猎物挣脱逃生。数学描述为:

NewPreyi,j=growth×Preyu,j+(1-growth)×Preyv,j,u≠v

(8)

growth=

(9)

式中:Preyu,j为另一个随机选择的i级猎物。食肉植物与猎物的生长周而复始,直到达到指定的迭代次数,group_iter。

Step4:消化与繁殖

食肉植物消化吸收猎物,进而生长繁殖。只有1级食肉植物允许繁殖。

NewCPi,j=CP1,j+Reproduction_rate×randi,j×matei,j

(10)

(11)

式中:CP1,j为最优解;CPv,j为随机选取的食肉植物;繁殖率Reproduction_rate为设定值。这个过程会重复nCPlant次。

Step5:适应度更新与组合

将新生成的食肉植物和猎物与之前的原始种群结合(即来自原始种群的n个个体、来自生长过程的nCPlant(group_iter)个个体和来自繁殖过程的nCPlant个个体),得到一个[n+nCPlant(group_iter)+nCPlant]×d维的新种群。依据适应度由小及大排序,最优个体为新的候选解。

Step6:停止准则

重复分类、分组、生长和繁殖过程,直到终止条件得到满足。

上述步骤模拟了食肉植物的生长、繁殖和捕食等过程,以及猎物的逃脱、生长等过程。

2 RH炉预测模型的建模

2.1 数据预处理

采用某钢厂2020年1月份31天的RH炼钢数据,剔除异常数据和补全缺漏数据,筛选出362组实际生产数据建立数据库。从中随机抽取240组训练模型,其余122组测试模型的精度。对模型的输入与输出进行归一化处理可消除影响RH炉终点温度的因素数量级相差较大,单位也不尽相同的差异,利用式(12)将输入与输出映射到[-1,1]区间。

(12)

式中:xi为第i个原始输入或输出;xmax和xmin分别为原始输入或输出的最大值和最小值;xj为第j个原始输入或输出归一化映射后的输入或输出。

2.2 输入量的选择

将终点温度作为因变量,与钢水质量,开始温度,处理时间,吹氧量,平台温度等影响因素做相关性分析。计算得到各个影响因素对终点温度的皮尔逊(Pearson)相关系数,舍去相关性不显著的影响因素(绝对值小于0.05),选取相关性较为显著的影响因素作为自变量[15],终点温度影响因素的皮尔逊相关系数见表2。

表2 终点温度影响因素的皮尔逊相关系数

通过相关性分析,确定输入变量为:罐况、钢水质量、渣厚、开始温度、平台温度、真空度、到站氧含量、处理时间、氮氩流量、吹氧量。

2.3 终点温度的预测

传统的SVR依靠网格搜索法来确定核函数参数g和惩罚因子C,两组数值交织成网,通过全局搜索找到误差最小的交叉点对应的(g,C)坐标。参数的选择没有任何指导,需要反复调整参数的变化步长和范围,预报的偏差可能较大。为了提高预测模型的收敛速度和精度,避免盲目选择参数,引入CPA算法来优化SVR[16-18]。利用2.2节的模型输入,结合SVR原理,按以下步骤建模:

(1)将362组原始数据做归一化处理。

(2)初始化或更新C,g,ε参数。

(3)求解原问题的对偶问题,得到参数w,b。

(4)将结果代入SVR线性回归函数f(x)中,得到RH炉预测模型。

(5)判断模型的精度,偏差较大则返回第二步,直到满足要求为止。

3 仿真实验及分析

3.1 模型的检验指标

为了评判模型的拟合程度,文章以平均误差MAE、均方根误差RMSE、相关系数R2和预报命中率(误差绝对值在5 ℃以内视为预报命中)作为模型的评判指标。

(13)

(14)

(15)

式中:N是测试集样本数据的总数;Xtesti是测试样本数据;Xpredicti是预测数据。

3.2 仿真结果分析

为了直观地、科学地判断模型的效果,将食肉植物算法优化的支持向量回归(CPA-SVR模型)与多元线性回归、BP神经网络、支持向量回归(SVR)三个模型作对比。在同一台电脑上利用MATLAB软件进行仿真实验,训练240组数据,测试122组数据。表3为四种模型终点温度预测值对比。

表3 四种模型终点温度预测值对比

多元线性回归的模型为Y=KX+b⟹y=k1x1+k2x2+…+knxn+b,以2.2节提到的10个输入量为自变量,以终点温度为因变量,建立了10输入1输出的线性回归模型。

BP神经网络模型,包含输入层、隐含层和输出层。首先按2.1节的方法进行归一化处理,然后反复调整隐含层节点数进行实验,最终得到最佳隐含层节点数为11,即结构为10-11-1的BP神经网络模型。

建立SVR模型,取回归误差ε=0.01,利用网格搜索法,进行5折交叉验证,得到最佳的参数C=22.0,g=2-6.9。

按2.3节所述步骤进行操作,选取适应度函数为模型的平均绝对误差MAE来建立CPA-SVR模型。通过调整参数,得到终点温度预测模型的最优参数(C=1.0721,g=0.0793,ε=0.01)。进而建立RH炉炼钢终点温度预测模型。

仿真实验结果表明,对于终点温度的预测,CPA-SVR模型的预测误差在1.9 ℃左右,多元线性回归模型的预测误差在4.2 ℃左右,BP模型的预测误差在2.9 ℃左右,SVR模型的预测误差在2.2 ℃左右。CPA-SVR模型的相关系数R2为0.8768,在四个模型中最接近于1,略高于SVR模型的0.8530,高于BP模型的0.8464,远高于线性回归模型的0.5915。这说明CPA-SVR模型的拟合效果最好,多元线性回归模型的拟合效果最差。精度要求|Δt|≤5 ℃,即预测值与真实值的差值在±5 ℃以内;CPA-SVR模型仅有8个炉次不符合,SVR模型有12个炉次不符合,BP模型有20个炉次不符合,多元线性回归模型多达40个炉次不符合。

CPA-SVR模型和BP模型的预测误差如图1所示。从图1可以看出,CPA-SVR模型有8个误差点落在了±5 ℃的误差范围外,命中率达到了93.442 6%;全部误差点都在±10 ℃以内,命中率达100%。BP模型有20个误差点落在了±5 ℃的误差范围外,命中率达到了83.606 6%;2个误差点不在±10 ℃误差线以内,命中率达98.360 7%。综上所述,CPA-SVR模型在终点温度预测上确实优于另外三种模型,预测精度均表现为最高,可以为后序炼钢工序的展开提供温度参考。

图1 CPA-SVR模型和BP模型预测误差对比

4 结语

(1)温度对炼钢工艺的开展至关重要,受限于工艺环境只能预测温度,现有的模型精度和收敛速度无法同时满足工艺要求,需要更为契合的终点温度预测模型。文章将寻优性能较好的CPA算法和支持向量回归结合起来,提高了模型的收敛速度和精度,对终点温度预测有一定的参考价值。

(2)针对利用网格搜索法选择支持向量回归(SVR)的参数较为繁琐的问题,引入了食肉植物算法(CPA)来优化SVR的方法,利用CPA算法优秀的全局寻优性能寻找最佳的SVR参数,并将CPA-SVR预测模型运用到RH炉钢水终点温度预测上。

(3)根据冶金工艺流程,结合相关性分析,选择了与终点温度相关性较为显著的因素,将这些因素作为自变量,终点温度作为因变量,依次建立了基于多元线性回归、BP神经网络、SVR和CPA-SVR的四种终点温度预测模型。通过362组实际生产数据测试CPA-SVR预测模型,结果表明,终点温度预测的绝对误差|Δt|≤5 ℃条件下的命中率可达到93.442 6%,该模型在终点温度预测效果上比多元线性回归、BP神经网络和未优化的SVR模型好,命中率更高。

猜你喜欢

食肉命中率适应度
改进的自适应复制、交叉和突变遗传算法
基于文献回顾的罚球命中率与躯干稳定性影响因素研究
Meat-eating plant discovered in Canada加拿大发现食肉植物
2015男篮亚锦赛四强队三分球进攻特点的比较研究
看看你是不是天生“食肉瘦” 解开DNA之谜&重回瘦身正轨!
投篮的力量休斯敦火箭
启发式搜索算法进行乐曲编辑的基本原理分析
入秋食肉
基于人群搜索算法的上市公司的Z—Score模型财务预警研究
食肉袋鼠