基于偏最小二乘的汽包水位影响因素相关性分析
2015-05-30李洋
李洋
摘要:汽包水位是锅炉正常运行中最主要的监视参数之一。受各个因素的影响和制约,导致水位经常发生变化。引起汽包水位发生变化的因素较多,本文应用偏最小二乘方法对其进行了多重相关性分析,并在马头电厂9#机组的水位变化因素分析中进行应用取得了良好的效果。
关键词:汽包水位 多重相关性分析 偏最小二乘
0 引言
锅炉在正常运行中,汽包水位是最主要的监视参数之一。通常情况下,如果水位过高,就会压缩蒸汽空间,进而造成蒸汽带水,进一步恶化蒸汽品质,在过热器管内就会产生盐垢,金属强度因管子过热而降低,进而发生爆破[1],在一定程度上损坏设备。
受各种因素的相互影响,导致锅炉在运行过程中,经常出现水位变化的情况,其中物质平衡关系和汽包水空间内工质状态变化是引起汽包水位发生变化的主要因素[2]。
1 分析方法的选择
在实际热工过程中,采用偏最小二乘法对所得数据进行分析筛选,其原因为:①偏最小二乘回归是一种多因变量对多自变量的回归建模方法;②偏最小二乘回归可以较好地解决许多以往用普通多元回归无法解决的问题;③可以实现回归分析、相关分析及主成分分析等多种数据分析方法综合应用。分析影响汽包水位的因素,可以得出其自变量之间具有多重相关性,若如果采用普通的最小二乘方法,这种变量多重相关性就会严重危害参数估计,扩大模型误差[3],并破坏模型的稳定性。
2 偏最小二乘法离线建模原理
设有q个因变量y1,…,yq和p自变量x1,…,xq,在提取这两个成分时,为了回归分析的需要,有下列两个要求[4]:①t1和u1应尽可能大地携带他们各自数据表中的变异信息;②t1和u1的相关程度能够达到最大。
3 偏最小二乘法离线辨识算法推导
第一步,记t1是E0的第一个成分,t=E0w1,w1是E0的第一个轴,它是一个单位向量,即w1=1;记u1是F0的第一个成分,u=F0c1,c1是F0的第一个轴,它是一个单位向量,即c1=1。如果要t1,u1能分别很好的代表X与Y中的数据变异信息,根据主成分分析原理,应该有:
Var(t1)→max(1)
另一方面,由于回归建模的需要,又要求t1对u1有最大的解释能力,由典型相关分析的思路,t1与u1的相关度应达到最大值,即r(t1,u1)→max(2)
综合起来,在偏最小二乘回归中,要求t1与u1协方差达到最大,即
Cov(t1,u1)=■→max(3)
故求解下列优化问题:
max〈E0w1,F0c1〉w■■w1=1c■■c1=1 (4)
因此,将在w1=1和c1=1的约束条件下,去求(w■■E■■F0c1)的最大值。此种情况下我们就可以用拉格朗日算法求其最优解,记
s=w■■E■■F0c1-λ1(w■■w1-1)-λ2■(c■■c1-1) (5)
对s分别求关于w1、c1、λ1、λ2的偏导,并令之为零,有:
■=E■■F0c1-2λ1w1=0 (6)
■=F■■E0w1-2λ2c1=0 (7)
■=-(w■■w1-1)=0 (8)
■=-(c■■c1-1)=0 (9)
由(2)~(5)可以推出:
2λ1=2λ2=w■■E■■F0c1= (10)
记?兹1=2λ1=2λ2=w■■E■■F0c1,所以?兹1是优化问题的目标函数值。
把式(2)和式(3)写成:
E■■F0c1=?兹■■w1(11)
F■■E0w0=?茲■■c1(12)
将式(7)代入式(6),有:
E■■F0F■■E0w1=?兹■■w1(13)
由式(8)可知,w1是矩阵E■■F0F■■E0特征向量,对应的特征值为?兹■■,?兹■■是目标函数值,要求取得其最大值,所以w1 是对应于矩阵E■■F0F■■E0最大特征值?兹■■的单位特征向量。
求得轴w1和c1后,即可得到成分
t1=E0■w1(14)
u1=F0■c1
然后,分别求E0和F0对t1和u1的回归方程
E■■=t1P■■+E1,F■■=u1Q■■+F■■,F■■=t1r■■+F1(15)
其中,P■=E■■t1/t12,Q■=F■■u1/u12,向量r1=F■■t1/t12;E1,F1*,F1为回归方程的残差矩阵。
第2成分t2的提取,以E1取代E0, F1取代F0, 用上面的方法求第2个轴W2和第2个成分t2有
W2=■,t2=E1W1(16)
同样,E1,F1分别对t2做回归, 得到
E1=t2P■■+E2,F1=t2r■■+F2(17)
同理可推得第h 成分th,h的个数可以用交叉有效性原则进行,h小于X的秩。
如此计算下去,如果X的秩为A,则会有
E0=t1P■■+…+tAP■■(18)
F0=t1r■■+…+tAr■■+FA
由于t1,…,tA均可以表示成E01,…,E0P的线性组合,因此,上式可以还原成YK=F0K关于XJ=E0J的回归方程形式:
YK=bk1X■■+…+bkPX■■+FAK k=1,…,q(19)
4 马头电厂水位分析
根据影响汽包给水因素,选取1给粉机平均转速(AMCCS10707)、2汽泵出口压力(LAC10CP003)、3负荷给定值(AMCCS10106)、4热量信号(AMCCS10701)、5锅炉主控信号(AMCCS10702)和6总燃料量(AMCCS10706),分析其对汽包水位实际测量值之间的相关性;拟合所需数据由系统DCS给出,采样间隔为1s,实际采样点为42303个,如图1所示:
■
图1 汽包水位影响因素分析
由图所示,横坐标依次代表给粉机平均转速,汽泵出口压力,负荷给定值,热量信号,锅炉主控信号和总燃料量六个测点;纵坐标代表权值。
■
图2 汽包水位的预测分布
上图为根据采样数据得到的拟合预测曲线,图中直线代表实际测量值与采用偏最小二乘法得到的拟合预测值相等情况下的边际线。
5 结论
本文采用偏最小二乘算法对其影响因素进行多重相关性分析,由于负荷对其影响显而易见,这与直观分析结果是一致的,但负荷不能作为调节量,要想使其水位波动减小只能从热量信号,汽泵出口压力两个方面着手分析。通过分析发现该逻辑中热量信号构建误差较大,经修改过后投入,水位波动明显降低。
参考文献:
[1]李树全.200MW燃煤机组汽包水位的控制[J].电力科学与工程,2007,23(5):14-7.
[2]郑丽娜.锅炉汽包水位非稳态影响因素及水位控制分析[J].电站信息,2012.
[3]谢小韦,印凡成.解决多元线性回归中多重共线性问题的方法分析[J].2007.
[4]董玉才,李红燕,朱连军,等.基于偏最小二乘回归的油田产量预测[J].信息系统工程,2009,10:27-30.
[5]吴琼,原忠虎,王晓宁.基于偏最小二乘回归分析综述[J].沈阳大学学报,2007,19(2).