APP下载

基于KPCA和LSSVM的过热器异常诊断

2021-03-15陈国超姜礼洁

山东电力技术 2021年2期
关键词:查准率过热器工况

陈国超,张 悦,卢 聪,李 帅,姜礼洁

(1.华北电力大学自动化系,河北 保定 071003;2.华北电力大学 河北省发电过程仿真与优化控制技术创新中心,河北 保定 071003)

0 引言

据统计,近几年我国所有的火电设备事故中,锅炉事故占一半以上,而四管爆破事故达到锅炉事故的69%[1],四管爆漏已经成为妨碍提高机组安全性的重要因素。过热器的温度是所有受热面中温度最高的,更容易发生异常。

基于模型的故障诊断需要高精度的模型,但过热器复杂的工况决定了难以建立精确的数学模型。目前,对过热器异常的诊断主要通过对化学分析或者人工观察爆管现场进行,比较复杂[2,3]。火电厂运行数据中包含运行工况信息,因此,提出从过热器运行数据中提取信息进行异常诊断。

火电厂运行过程中测点多达数千个,其中包含许多与检测无关或关联不大的数据,核主元分析(Kernel Principal Component Analysis,KPCA)方法能够舍弃不相关的变量,进行数据降维,进而增加故障诊断的准确率。最小二乘支持向量机(Least Square Support Vector Machine,LSSVM)在模型构建时具有抗干扰能力强、对样本规模要求不高的优点[4-5]。应用LSSVM 时,核宽度和惩罚因子的选取对最终分类性能影响很大。针对建立模型时LSSVM 参数选择盲目性的问题,考虑使用粒子群方式进行参数寻优作为KPCA-LSSVM 的参数来搭建模型。首先对过热器热负荷进行分析,采集现场数据搭建KPCA-LSSVM 模型,进行过热器异常工况分类。

1 基本原理

1.1 核主元分析

KPCA 分析的核心是利用核函数,将原始数据在高维的特征空间中进行映射,再通过传统PCA 算法对升维的数据计算特征值与特征向量,确定主成分[6]。

假设原始数据X为矩阵,则将每个样本映射到高维空间,可以得到数据矩阵

式中:φ(x)为初始矩阵X的非线性映射;wi为高维空间中特征向量;λi为对应特征值。

将特征向量wi利用φ(x)线性表示,得到

式中:κ为φ(x)的系数矩阵。

将式(1)代入式(2)可得

两边同时乘φ(x)T,得到

引入核函数KP代替φ(x)Tφ(x),得到

1.2 最小二乘支持向量机

LSSVM需要解决二次规划问题:

式中:yk、xk分别是第k列样本输出和输入;φ(x)是样本空间到高维空间的映射;ek为容许误差;γ为惩罚因子;k为输入输出矩阵的维数;N为最大维数。

采用Lagrange乘数法,可得

式中:αk为Lagrange 乘子;b为偏移量;α为αk组成的矩阵。

分别对w,b,ek,αk求导,有并带入核函数K(x,xk),可以得到线性方程组

式中:I为单位矩阵;y为样本输出矩阵。

最终得到LSSVM分类表达式为

同时需要注意,RBF 核函数中会引入一个新的参数:核宽度,核宽度的选取对最终分类结果也有很大影响。

2 过热器异常分析

由于过热器高温高压环境的特殊性,选材上使用耐高温高压的特制金属。出于经济方面的考虑,过热器在设计时选用钢材的允许极限温度已经接近于过热器正常运行的温度,所以过热蒸汽温度必须相对严格地控制在预设值附近,温度过高或过低都会对过热器工况产生负面影响。

考虑热工过程的复杂性,采用机理建模的难度较大,采用数据驱动的方式进行建模是一个比较好的选择。过热器运行时影响工况的因素很多,主要有主蒸汽压力及温度、过热器进口处烟温、炉膛负压等。此外,过热器工作与锅炉其他部分密切相关,所以判断过热器是否异常时,尾部烟道含氧量、尾部烟道温度、燃烧器倾角等都是可以参考的运行指标。

过热器受热面平均热负荷可表示为

式中:Tg为烟气温度;Ts为管内工质温度;β为过热器管的内外径之间比值;μ为均流系数;δ为过热器管厚度;σ为过热器管导热系数;h为管内受热介质放热系数[7]。

合适的监测变量能够提高模型的准确度,选取的监测变量要获取简单,测量方便,还应该要涵盖尽可能多的信息。同时过热器的工作与锅炉其他部分的工作密切相关,在判断过热器工况是否异常时也可以作为参考[8]。针对过热器结构进行分析,选取了锅炉四壁温度、锅炉左侧烟温、锅炉右侧烟温、减温器进出口温度、末级过热器出口温度、末级过热器出口压力、尾部烟道含氧量、尾部烟道烟气温度作为监测变量。

3 仿真结果与分析

3.1 算法流程

算法流程如图1所示。

图1 算法流程图

算法描述:1)输入训练样本,KPCA 分析得到主元特征集合;2)粒子群算法优化惩罚因子和核宽度,初始化种群参数和更新迭代次数等参数,通过计算适应度函数保证集合最小方差,同时引入遗传算法中的变异,避免惩罚因子和核宽度的结果陷入局部最优;3)将高维特征空间的数据映射作为输入LSSVM模型,进行预测,并与实际类别进行对比。

3.2 算法验证

选取了过热器正常工况、左右烟道烟气相差过大、尾部烟道二次燃烧以及过热器积灰四种工况下的数据进行研究,分别用CN、CT、CF、CA 表示,每种工况数据取250 组,其中训练样本200 组,测试样本50组,表1为样本数据说明。

表1 样本说明

首先进行降维可行性分析,选用KMO(Kaiser-Meyer-Olkin)检验统计量作为标准。经过计算,数据集KMO 统计量为0.726 6。统计量大于0.7 可以认为适合进行数据降维处理。

核函数映射选用RBF 核函数,所以还需确定核函数中的核宽度。采用粒子群算法对核宽度和惩罚因子进行寻优,确定核宽度和惩罚因子大小,适应度曲线如图2所示。

图2 PSO算法适应度

特征提取后,前五维主成分贡献率如表2所示。

表2 主元贡献度统计 单位:%

为了更直观地表示KPCA 降维后的结果,将前三个主成分在三维空空间进行显示,所有训练样本的三维分布如图3所示。

图3 KPCA处理后数据分布

由图3 可知,KPCA 处理后的数据聚类性能较好,不同类别样本间有较好的可分性。LSSVM 分类结果如图4所示。

图4 LSSVM分类结果

KPCA-LSSVM 分类结果如图5所示。

图5 KPCA-SSVM分类结果

为方便比较,引入查全率与查准率概念。假设在一次预测中,预测总数目是n个,其中m个是预测结果中正确的数据,g是预测出和没预测出正确结果的总和,那么查准率p=m∕n,查全率r=m∕g。

针对四种不同的数据类型分别计算器查全率和查准率,结果如表3所示。

表3 分类结果对比分析

对比KPCA-LSSVM 与LSSVM 分类结果可以发现,未经过KPCA 进行特征提取时,分类模型的分类识别率不高,特别是针对CA 故障,查准率只有0.74;经过KPCA 提取主成分后,CT、CF、CA 故障查准率达到1.00,CT 故障查准率也有0.98,识别效果有较大提升。

4 结语

利用所述研究方法对过热器异常进行分类,通过对比LSSVM 搭建的模型的分类结果,证明而该方法的有效性,得到以下结论:利用KPCA 方法对原始数据进行主成分提取,减少特征间的冗余,提取出对后续分类更有效的特征向量;利用PSO算法优化LSSVM的参数,避免了传统LSSVM在参数选择时的盲目性,且通过对比表明该方法的故障识别率得到提高。

猜你喜欢

查准率过热器工况
WGZ1165/17.5-2型锅炉前包墙过热器拉稀管断裂原因分析及处理措施
某电厂锅炉屏式过热器爆管原因分析
热网异常工况的辨识
某500MW塔式锅炉包墙过热器频繁泄漏分析与诊断
生物质锅炉高温过热器失效的原因分析
变工况下离心泵性能研究
不同工况下喷水推进泵内流性能研究
基于非负矩阵分解的高速列车走行部工况识别
基于数据挖掘技术的网络信息过滤系统设计
大数据环境下的文本信息挖掘方法