基于KPCA和Cam加权距离的带钢热镀锌生产过程监测
2015-03-05刘昌杨世文吴澈中北大学机械与动力工程学院山西太原030051
刘昌,杨世文,吴澈(中北大学机械与动力工程学院,山西 太原 030051)
基于KPCA和Cam加权距离的带钢热镀锌生产过程监测
刘昌,杨世文,吴澈
(中北大学机械与动力工程学院,山西 太原 030051)
摘 要:针对复杂生产过程存在着参数众多,而且工艺参数间、产品质量参数间各自呈现复杂的多变量非线性耦合关系,提出基于KPCA的非线性生产过程监控与诊断方法。结合数据重构和基于Cam加权距离的领域选取策略这两种方法,计算出故障指数的变化情况,具体分析引起过程异常的工艺参数。利用冷轧带钢热镀锌生产线的生产数据进行实验,实验表明:KPCA具有处理非线性的能力,且能准确地实现对故障的识别。
关键词:非线性;核主成分分析;SPE;故障诊断
10.16638/j.cnki.1671-7988.2015.10.032
CLC NO.: TP183 Document Code: A Article ID: 1671-7988(2015)10-86-04
引言
然而KPCA在映射后的特征空间中进行PCA,就没法找出原始观测变量与特征空间中的监控统计量之间的对应关系,即难以找出从特征空间到原始空间的逆映射函数,这导致基于KPCA的故障诊断方法很难辨识过程的异常是由什么变量引起的。因此,提出了一种将核主成分分析的数据重构方法和基于Cam加权距离的领域选取算法相结合引入到故障诊断中,能更准确地辨识故障原因,方便操作工及时控制现场,提高经济效率。
1、核主成分分析
主成分分析的实质是对将工艺过程的历史数据与线性主成分的距离总和最小化的过程,KPCA与其不同的是:KPCA直接采用核函数并把原始变量映射到非线性主成分上,使得样本点与非线性主成分距离之和达到最小。KPCA算法[4-5]如下:
Step2 计算步骤:
其中:λ为的特征值,V为特征向量。
其中,特征值kλ较小的主元tk一般被认为由噪声引起的,因此,主成分的选取一般依据主成分累计解释率表示前q个kλ的和与所有kλ总和比值超过E值,认为选取q个主成分就能够反映主体信息(E为既定常数,代表着噪声的影响程度)。为了消除噪声、降低样本数据维数,通常维数q的选取普遍都要低于非零特征值数目。
2、核主成分分析的数据重构
PCA的故障识别一般是通过计算各个元素对主成分的贡献率,贡献多的就为故障值。但是KPCA算法本身存在限制,导致基于PCA的故障识别方法,不能直接用于基于KPCA的故障识别,因此可以考虑在高维空间进行线性主成分分析,通过特征空间中的q个主成分tk重构从而得到新的重构值:
因为计算核变换的逆是非常复杂的,所以通常采用最小化下列式子来求出向量Z:
2017年是互助县国家马铃薯种植综合标准化示范区提升项目实施的第一年,我县以开展“两学一做”活动为动力,紧紧围绕国家标准委确定的2017年是标准化改革深化之年、标准化战略推进之年的有利时机,结合农业产业精准扶贫工作,严格按照项目要求,认真组织实施,建立马铃薯原原种标准化繁育技术示范田2.08 hm2,马铃薯生产标准化示范区133.3 hm2,辐射示范1200 hm2。通过示范区建设形成了较为完善的标准体系、检测体系、监管体系和保障服务体系,引用和推广2个国家标准、5个行业标准、11个地方标准,制定企业标准1 个,提升了全县马铃薯种植的质量安全水平,达到了项目实施的预期目标和要求。
其中,z1= x为迭代初值。通过迭代,矢量Z成为原始输入样本空间中x的一个很好的近似。
3、KPCA诊断模型
3.1 基于KPCA的故障检测策略
第i时刻的核主成分模型通常使用平方预测差[7]监控生产过程,即(squard prediction error,SPE):
其中,x为真实数据,z为重构数据,m为变量个数。SPE统计量度量了一个数据点偏离KPCA模型的程度,当其过大时,则说明过程中出现了不正常情况。其控制限为:
其中δa2代表置信水平为a时的控制限λj代表X的协方差矩阵∑的特征值,ca是标准正态分布在上述置信水平为a下的阀值。当SPE位于控制限内时,认为过程是正常的;反之,则异常。
3.2 基于KPCA和Cam加权距离的故障识别策略
定义故障指数:
故此,提出基于Cam加权距离的领域选取方法,选取图1中椭圆形内的k个近邻。
Cam加权距离:
上式包含代表数据的规模大小和在特定偏向的形变程度的数值的a和b(a> b0≥);代表数据变形方向的为单位向量τ。a, b , τ的计算参考文献[8]可得。使用此距离可以更为有效地解决数据分布不均匀的问题。因此邻域选取策略为:利用Cam加权距离求得正常生产过程中的样本的k个近邻,再将当前样本用正常样本中与其近邻的k个样本的加权线性表示:其中,jω为当前样本xi与其近邻样本xj的权值然后在利用替换后的数据ix带入建立的KPCA模型中,计算其估计值iz。
4、过程监控与诊断步骤
核主成分分析过程监控与诊断的具体步骤:
Step1原始数据归一化处理;
Step2利用历史正常生产过程数据建立KPCA模型,根据交叉验证法选取核参数c。根据主成分的总解释率是否超过95%,最终确定主成分的数量;
Step3使用公式(7)和公式(8)分别算出SPE值以及控制限,并用于生产监控;
Step4利用式子(7)计算待监测生产数据的统计量,当其超出控制限时则认为生产过程异常,否则认为生产过程处于统计稳态;
Step5若过程异常则利用式子(9)计算,分析各个工艺参数对统计量的作用,从而判断引起异常的原因。最小的故障指数对应的工艺变量认为是引起过程异常的主要原因。
5、实验及结果分析
将某钢铁厂的实时冷轧带钢热镀锌[9-10]生产线的产生的数据为样本源,将每一卷带钢作为取样点,以气刀压力、气刀到带钢的距离、带钢厚度、带钢速度等工艺参数和带钢上表面的锌层重量为样本特征,收集150组样本。现取(锌重<80)50个样本作为训练样本;取正常数据(锌重<80)50个,扰动后数据(90<锌重<125.5)50个,共100个数据作为测试数据。利用训练数据构建KPCA模型,而后利用测试数据检验模型的有效性。
在KPCA模型中选取高斯函数作为核函数,根据交叉验证法选取核参数c=2,根据主成分累计解释率大于95%的准则,选取了2个主成分。PCA分析过程中,同样根据主成分累计解释率大于95%原则,选取2个主成分。由(a)与(b)的SPE统计量控制图,可以看出KPCA模型SPE统计量控制图可以明显看出后50个样本的SPE统计量绝大多数超出了控制限,认为此时过程出现了故障,而PCA模型的异常捕捉能力明显不如KPCA模型。
在过程诊断中,通过实验选取近邻k=5,由图3的故障指数图可以明显看出,后100个样本点的第一个变量(气刀压力)从第50号样本开始对SPE的故障指数明显小于另外三个变量(气刀到带钢的距离、带钢厚度、带钢速度),可以认定第一变量的变化偏离了正常分布状态,气刀压力是引起生产过程异常的主要原因。
6、结论
利用冷轧带钢热镀锌生产过程中工艺参数和产品质量的统计数据,建立生产过程的质量模型,结合数据重构算法和Cam邻域选取算法运用到KPCA模型中,并运用此模型对冷轧带钢热镀锌生产过程的监控与诊断,不仅实现了对生产过程的监控,同时能较好地寻找引起异常的原因。
参考文献
[1] Jung D Y,Lee S M, et al. Fault detection method with PCA and LDA and its application to induction motor[J].J.Cent.South.Univ.Technol. 2010(17):1238-1242.
[2] Wang X,Kruger U,Irwin G W,et al.Nonlinear PCA with the local approach for diesel engine fault detection and diagnosis, IEEE Transactions on Control Systems Technology,2008,16(01):122-129.
[3] Lee J M,Yoo C K,Choi S W, et al. Nonlinear process monitoring using kernel principal component analysis[J].Chemical Engineering Science,2004,59 (01):223-234.
[4] Shawe-Taylor.J,.et al. Kernel Methods for Pattern Analysis[M]. BeiJing:China Machine Press.2005.
[5] 王姝,冯淑敏,常玉清等.改进的基于数据重构的KPCA故障识别方法[J].东北大学学报,2012,33(04):500-503.
[6] Scholkopf B, et al. Nolinear component analysisasa kernel eigenvalue Problem[J].Neural Computation, 1998,10(05):1299- 1319.
[7] 周东华,李钢,李元等.数据驱动的工业过程故障诊断技术[M].北京:科学出版社,2011.
[8] 韦立庆,陈秀宏.基于Cam加权距离的增量拉普拉斯方法[J].计算机工程,2011,37(22):171-173.
[9] 李培兴,张红梅,赵红阳等.连续热镀锌过程带钢边部气流特征的研究[J].材料科学与工艺,2014,22(06):90-95.
[10] 李培兴.带钢连续热镀锌镀层均与性改进研究[D].辽宁:辽宁科技大学硕士论文集,2014.
Based on KPCA and Cam weighted distance of strip hot dip galvanizing production process monitoring
Liu Chang, Yang Shiwen, Wu Che
( School of Mechanical and Power Engineering, North University of China, Shanxi Taiyuan 030051 )
Abstract:According to huge mass of parameters in complicated production process, which shows a complex multivariable nonlinear coupling relation between each processing parameters and product quality parameters, this paper proposed a method based on KPCA nonlinear monitoring and diagnosis. Combined with the data reconstruction and field selection, obtained the function of various process parameters for SPE statistics, specifically analysis process parameters that causes abnormal process. Using data of hot-dip galvanizing prove that this method not only retains the advantages of PCA, also has ability of dealing non-linear parameters, and even could identify fault.
Keywords:nonlinear; KPCA; SPE; fault diagnosis
作者简介:刘昌,硕士研究生,就读于中北大学机械与动力工程学院,从事设备故障诊断和检测的研究。
中图分类号:TP183
文献标识码:A
文章编号:1671-7988(2015)10-86-04