基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发
2020-06-05段海洋王旭东
段海洋,王旭东✉,姚 曼
1) 大连理工大学材料科学与工程学院,大连 116024 2) 辽宁省凝固控制与数字化制备技术重点实验室,大连 116024
漏钢是连铸过程中的灾难性事故,不但会严重干扰生产顺行和铸坯质量,而且严重损害结晶器、扇形段等连铸机设备,在造成巨大经济损失的同时,带来重大安全隐患[1]. 因此,开发一种准确而高效的结晶器漏钢预报方法对于保障连铸顺行具有重要意义.
为了预防和避免漏钢,可利用结晶器与铸坯之间的摩擦力对其进行预测[2]. 但现有方法主要通过在结晶器铜板上嵌入测温热电偶,根据热电偶温度的变化来监测是否发生漏钢[3-4]. 目前,基于温度测量的漏钢预报方法主要分为两类:逻辑判断和人工智能[5-6]. 逻辑判断法对铸机设备、浇铸工艺和物性参数十分敏感,当工艺调整和拉速提升时,阈值变动大,导致误报率和漏报率大幅上升,自适应性和鲁棒性较差;人工智能方法主要通过神经网络、支持向量机等算法识别漏钢发生时单偶和组偶的温度模式,该方法对学习和训练样本的要求较高,样本不全或无效时都会严重影响其预报效果,模型的迁移能力较低.
鉴于漏钢模式温度之间相似度较高,而漏钢与正常工况模式温度之间差异性较大,本文提出一种结合动态时间弯曲(DTW)和密度聚类(DBSCAN)的新型漏钢预报方法. 动态时间弯曲能够有效提取漏钢温度模式的相似性,在此基础上,密度聚类可以将漏钢样本聚为同一类簇,同时过滤正常工况样本,从而最大化漏钢与正常工况温度的差异性. 因此,将动态时间弯曲和密度聚类相结合能提取和融合漏钢过程中结晶器温度的特征,挖掘热电偶温度变化的共性规律,识别和区分正常与漏钢工况下的温度波动,为机器学习在连铸过程中的应用提供参考和借鉴.
1 黏结漏钢形成机理及温度特征
漏钢主要发生在结晶器弯月面附近[7],由于保护渣润滑不良、结晶器液位波动、拉速较大等原因,较薄的初生坯壳直接与结晶器铜板接触发生黏结[8-9]. 在结晶器的振动和冷却作用下,黏结坯壳被反复拉断和愈合,直到黏结点离开结晶器,较薄坯壳无法支撑钢水静压力的作用而发生漏钢[10].
图1(a)是结晶器铜板热电偶分布示意图. 结晶器由四块铜板组成,包括两块宽面铜板和两块窄面铜板. 其中,内、外弧宽面各安装57支热电偶,左、右侧窄面各安装3支热电偶,四块铜板共安装热电偶120支. 图1(b)为漏钢时同列的三排热电偶温度变化示意图. 正常工况下,结晶器铜板热电偶温度随时间的变化较为平稳,不会出现较大波动. 沿浇铸方向,坯壳厚度逐渐增加,铸坯向结晶器铜板传热的热阻增加,下排热电偶的温度逐次下降. 漏钢发生时,黏结点向下移动,当其经过第一排热电偶时,从坯壳渗出的钢液将与结晶器铜板直接接触,相应位置的电偶温度会急剧上升,待黏结点下行远离电偶后,其温度逐渐下降.随着黏结点继续下移,当其经过第二、三排热电偶时,其电偶温度亦会先上升后下降. 同列热电偶温度上升、下降及其峰值在时间上有明显的“时滞性”. 部分情况下,也会出现下排热电偶温度高于上排热电偶温度的情况,称之为“温度倒置”. “时滞性”和“温度倒置“是漏钢的典型特征,也是漏钢预报方法捕捉和预报漏钢的重要依据[11].
图1 示意图. (a)结晶器热电偶分布;(b)黏结漏钢热电偶温度变化Fig.1 Schematic diagram: (a) thermocouple distribution of mold; (b) thermocouple temperature variation of breakout
图2为正常(N)、漏钢(B)和误报(F)(生产正常而漏钢预报系统发出报警)模式下的温度曲线,每种情况各展示5个例子. 从图2(a)中可以看出,正常模式下温度几乎没有波动,不具备漏钢时典型的“时滞性”和“温度倒置”特征;而漏钢(图2(b))时的温度模式具有单一性和相似性,其“时滞性”和“温度倒置”的特征与上述情况一致,如图 2(b)所示;误报(图 2(c))时的温度模式各异,如误报−1温度同时上升,误报−3和误报−4第二排温度虽上升,但第一排温度均不具备漏钢特征,误报−2和误报−5温度虽有上升和下降,但不具有“时滞性”. 由此可见,漏钢温度模式相似,而包括正常和误报在内的正常工况温度模式却不尽相同,与漏钢模式差别较大.
基于逻辑判断的漏钢预报方法需要设定温度上升幅值、温度上升速率、温度下降速率以及时滞参数等,从图2所示的漏钢温度可以看出,上述参数难以统一和准确设定,参数设置不合理将增大误报率,严重时会引起漏报. 基于神经网络的漏钢预报方法首先需要积累大量完整的温度变化模式,而后从漏钢、正常工况的历史样本中训练网络参数,样本数量和质量都会对网络训练结果造成影响,此外,当出现了新的温度变化模式时,该方法难以准确识别和判定,容易导致误报.
图2 不同工况下的温度变化. (a)正常;(b)漏钢;(c)误报Fig.2 Temperature comparison of different situations: (a) normal; (b) breakout; (c) false alarm
2 机器学习中的密度聚类方法
基于以上分析,依据黏结漏钢温度模式的共性特征,可借助机器学习方法对黏结漏钢温度样本进行学习,以挖掘其温度特征的共性规律,为此需选择合适的机器学习方法. 聚类作为机器学习中的典型方法,广泛应用于挖掘具有相似特征的数据集. 聚类是将数据样本聚集为多个类簇的过程. 经过聚类分析后,在同一类簇中数据样本之间的相似性较高,不同类簇中数据样本之间的相似性较低即差别较大.
黏结漏钢时温度彼此相似,与正常工况温度差异较大,并且正常工况下温度的变化模式彼此千差万别,针对上述温度数据的特点,本文采用密度聚类[12]方法对不同模式的温度进行区分和识别. 密度聚类是聚类算法中的一个分支,利用参数邻域半径(Eps)和邻域内最少样本数(MinPts)以及样本之间的相似度或距离将簇聚集为密度相连的样本的最大集合. 密度聚类借助参数邻域半径和邻域内最少样本数所形成的样本捕获规则进行聚类. 该规则可表示为:在邻域半径内包含的样本数量不少于邻域内最少样本数设定值. 在聚类时仅捕获数据集中彼此相似即距离较近的样本,如漏钢样本,然后将捕获的样本聚集为簇;而对于诸如模式差异较大的正常工况样本,由于其彼此之间距离较大,不满足捕获规则,算法将自动识别为噪声样本,从而与漏钢样本分离. 因此,密度聚类可将漏钢样本和正常工况样本组成的样本集聚类为两个类簇,分别为漏钢类簇和正常工况类簇.
3 基于聚类和动态时间弯曲的漏钢预报方法
3.1 全时间序列的温度特征提取
为更好地度量温度数据的相似性,需对粗糙的原始温度数据进行处理,以提炼其共性特征. 首先检查第一、二排温度在升温前的波动情况,当升温前的温度连续k秒内上下波动超过1 ℃时,则求取波动温度的平均值以替代升温前波动的温度;然后计算第一、二排电偶温度同一测点处的温度数据在k秒内的温度变化率及其差值;最后对作差后的结果作z-score均值标准化处理. 此处k取 5,计算公式如(1)~(3)所示:
式中:vi、vminusi、vminuszi分别表示温度的变化率、变化率差值及上述差值的z-score均值标准化结果,Ti表示第i时刻的温度,v1i、v2i分别表示第一、二排温度对应的温度变化率,avg、std分别表示温度变化率差值vminus的平均值、标准差.
式(1)~(3)可以有效提取“时滞”和“倒置”等典型特征的温度数据,且能将不同拉速及工艺条件下相差较大的温度数据缩放至同一变化区间,便于相似性度量. 图3~5分别为正常、误报和漏钢工况下温度及其预处理后的曲线图. 从图中可以看出,经过预处理后三种工况下的温度虽处在相同的数值区间,但特征明显不同. 值得注意的是,预处理不仅保留了漏钢温度的典型特征,还增大了其与正常工况下温度特征的差异性.
图3 温度及其特征提取. (a)正常工况温度;(b)正常工况温度预处理结果Fig.3 Temperature and features extraction: (a) temperature of normal status; (b) processing results of normal status
图4 温度及其特征提取. (a)误报温度;(b)误报温度预处理结果Fig.4 Temperature and features extraction: (a) temperature of false alarm; (b) processing results of false alarm
图5 温度及其特征提取. (a)漏钢温度;(b)漏钢温度预处理结果Fig.5 Temperature and features extraction: (a) temperature of breakout; (b) processing results of breakout
上述三种类型的历史温度数据,分别选取20例正常、30例误报及30例漏钢样本作为训练样本.
3.2 动态时间弯曲样本相似性度量
动态时间弯曲[13]对具有相似波形序列的距离或相似性度量具有良好的效果,广泛应用于数据的相似性度量,如时间序列数据. 时间序列存在平移和伸缩等复杂变形,传统的欧氏距离对时间轴的变化非常敏感,轻微的变化就会导致欧氏距离发生很大的变动,动态时间弯曲有效克服了欧氏距离的局限[14-16].
给定时间序列p、q,动态时间弯曲首先找到它们的最佳匹配来计算距离[17]. 具体匹配公式如下:
图6所示为三例温度样本的特征提取结果,即序列x、y、z,及其欧氏距离(Euclidean)和动态时间弯曲映射对比示意图,表1为x、y、z彼此之间的欧氏距离和动态时间弯曲距离计算结果. 从表1中可以看出,序列之间的动态时间弯曲距离普遍小于欧氏距离. 尤其是波形相似而波峰不对应的序列,如x、y,其动态时间弯曲距离远小于欧氏距离. 由此表明,对于漏钢温度在不同拉速及工艺条件下的温度极值不对应的情况,运用动态时间弯曲可以有效度量其相似性,避免了因使用其他距离度量方式,如欧氏距离,所导致的漏钢温度相似性差异较大的问题,进而为漏钢样本的聚类打下良好的基础.
3.3 聚类参数邻域半径和邻域内最少样本数的选择
参数邻域半径和邻域内最少样本数对密度聚类的效果有巨大的影响,因此,选择合适的参数尤为重要.
图6 欧氏距离和动态时间弯曲映射对比Fig.6 Mapping comparison of Euclidean and DTW
表1 欧氏距离和动态时间弯曲距离计算结果对比Table 1 Comparison of calculation results for Euclidean and DTW distance
(1)参数邻域半径的确定.
首先,计算每个样本与其距离最近的五个样本的平均值;然后,将所有样本对应的平均值距离由大到小排序并做图;最后,选择上述图中明显的转折点所对应的平均值距离作为参数邻域半径,如图7所示.
从图7中可以看出,在平均值距离为3.0处存在一个明显的转折点. 因此,本文设定邻域半径为3.0.
(2)参数邻域内最少样本数的获取.
对于每一个样本,计算以该样本为中心、以邻域半径为半径的邻域内包含的样本数量,即
图7 参数邻域半径选择示意图Fig.7 Diagram of parameter Eps selection
然后,计算所有样本对应的上述样本数量的平均值:
基于上述计算结果,设定邻域内最少样本数设定为7.
3.4 训练样本密度聚类
使用密度聚类算法对样本库Q实施聚类,算法中涉及的核心样本定义为:在样本p的邻域半径内包含的样本数量不少于邻域内最少样本数设定值,即:
密度聚类首先根据参数邻域半径、邻域内最少样本数确定样本库Q中所有的核心样本,然后以任一核心对象为出发点,找出与其密度相连的样本生成类簇,直到所有的核心对象均被访问为止[18]. 令邻域半径为3.0、邻域内最少样本数为7,对样本库Q实施密度聚类,聚类结果如表2所示,其中0和−1分别指代两个类簇标号.
聚类结束后,共计捕获了30个漏钢样本(标号为0),其余未被捕获的样本标记记为噪声(标号为−1),包括20个正常模式样本和30个误报模式样本. 将标号为0的类簇称之为漏钢类簇,记为CB,将标号为−1的样本归为噪声类簇,即包括正常和误报在内的正常工况类簇记为CN. 训练样本的聚类可视化结果如图8所示. 图中横坐标表示每个样本与其所在类簇的中心的距离,纵坐标表示每个样本与其所在类簇中最近的7(邻域内最少样本数设定值)个样本距离的平均值.
表2 训练样本密度聚类结果Table 2 DBSCAN clustering result of training samples
从图8中可以看出,正常工况样本彼此较为分散,因此不能被规则捕获. 然而,聚类得到的漏钢类簇样本彼此距离较近且集中,表明其易于被规则捕获形成类簇. 聚类结果与漏钢温度模式相似而正常工况下的温度异常样本模式多样化的特点高度吻合,说明采用动态时间弯曲距离度量方式和密度聚类方法是合理的.
图8 训练样本密度聚类可视化结果Fig.8 Training samples visual result after DBSCAN clustering
3.5 漏钢预报方法开发
依据上述聚类结果及构建的聚类模型,鉴于漏钢样本从属于同一类簇,且同一类簇样本属于同一类别,可根据新样本在模型中的聚类结果,即新样本与样本库Q重新聚类后所属的类簇,对其是否属于漏钢进行识别和判定. 判定流程如图9所示. 漏钢识别与判定时首先需要对实时温度数据进行温度预处理,然后将新样本与样本库Q一起实施密度聚类,最后根据聚类结果即新样本的类簇标号判断新样本是否属于漏钢类簇. 如果类簇标号为−1,说明不属于漏钢类簇,则更新温度序列,继续漏钢识别与判定;否则,系统发出漏钢警报,继而采取降速等相应措施,以避免和预防漏钢.
图9 漏钢预报流程Fig.9 Flowchart of breakout prediction
4 结果与讨论
基于上述漏钢预报方法,本文对未经训练的30例正常工况、20例误报和20例漏钢样本进行测试,将测试样本分别与样本库实施密度聚类,得到其所属类簇标号并对其进行判定.
图10中(a)和(b)为正常模式和误报模式测试样本的第一、二排热电偶温度图;图11中(a)和(b)为两例漏钢模式测试样本的第一、二排热电偶温度图. 图中右侧垂直线表示在线检测时的当前时刻,左侧垂直线表示当前时刻之前的第24个时刻,两个垂直线之间表示所取的当前时刻及前24 s共计25 s的温度数据.
图10 不同工况下测试样本的热电偶温度. (a)正常;(b)误报Fig.10 Thermocouple temperature of test samples under different working mode: (a) normal; (b) false alarm mode
图11 黏结漏钢测试样本热电偶温度. (a)漏钢样本实例1;(b)漏钢样本实例2Fig.11 Thermocouple temperature of test samples at breakout mode: (a) sample 1; (b) sample 2
将未经训练的30例正常模式、20例误报模式和20例漏钢模式样本分别作为测试样本与样本集聚类,得到其类簇标号,聚类结果如表3所示.
30例正常模式、20例误报模式和20例漏钢模式样本的聚类可视化结果如图12所示. 从图中可以看出,包含误报在内的50例正常工况测试样本对应的二维坐标位置分散在正常类簇中,这些测试样本经聚类后与黏结漏钢样本的相似性较低,且同训练样本一样不满足捕获规则而被过滤为噪声样本. 而20例黏结漏钢测试样本对应的位置均位于漏钢类簇样本所在区域,分布较为密集,表明这些测试样本经聚类后与漏钢样本的相似度较高. 更重要的是,测试样本的集中分布同样易于被规则捕获,从而被识别为漏钢类簇样本. 从测试效果来看,该方法可以有效区分样本特征,准确区分和判定正常工况和漏钢样本,可为开发基于聚类的新型黏结漏钢预报方法提供参考.
表3 测试样本密度聚类结果Table 3 DBSCAN clustering result of samples testing
图12 测试样本密度聚类可视化结果Fig.12 Testing samples visual result after DBSCAN clustering
5 结论
本文依据漏钢时结晶器铜板温度变化的单一、相似特性,提取、融合黏结漏钢温度典型的共性特征,将密度聚类和动态时间弯曲算法应用于漏钢预报,建立和开发了一种基于机器学习的新型漏钢预报方法. 结果表明,该方法能够准确地识别正常工况样本和黏结漏钢样本的特征,对于未经训练的在线实测样本,该方法亦能准确地判定其是否为漏钢. 建立的方法受连铸工艺和铸机设备参数的影响小,在样本的特征识别和判定过程中,不需依赖人工经验设置相应的预报参数,同时回避了制作训练样本的繁琐过程,在保证报出率的同时,可大幅度降低误报次数,具有较好的稳定性.