基于偏最小二乘法的锅炉飞灰含碳质量分数预测模型研究

2013-12-20葛彦鹏董丽丽

发电设备 2013年2期

葛彦鹏，崔凝，董丽丽，杨琛

（1.华北电力大学能源动力与机械工程学院，保定071003； 2.天津大学机械学院，天津300072）

电站锅炉效率与其排烟热损失、固体未完全燃烧热损失、灰渣物理热损失、可燃气体未完全燃烧热损失和散热损失有关［1］，其中固体未完全燃烧热损失是锅炉的最主要热损失之一，仅次于排烟热损失。影响固体未完全燃烧热损失的因素多而复杂［2-3］，其中飞灰含碳质量分数是一个重要因素。过高的飞灰含碳质量分数会对电厂的经济运行及安全生产造成许多不利影响，及时有效地获得其数据对机组运行人员调节机组状态有着重要意义［4］。

长期以来飞灰含碳质量分数数据的获得一直沿用传统的质量燃烧法［5］，但此方法在时间上有很大的延迟性，很难及时地反映锅炉的燃烧运行状况，在安全生产上存在一定的隐患。因此对于飞灰含碳质量分数预测技术的研究显得格外迫切［6］。

偏最小二乘法（PLS）是由 S.Wold 和C.Albano等人于1983年首次提出［7］，此方法是一种多因变量对多自变量的回归建模方法，较好地解决了许多以往用普通多元线性回归难以解决的问题，尤为重要的是当变量之间存在高度相关时，用偏最小二乘法进行建模，其分析结论更加可靠，整体性更强。而飞灰含碳质量分数的影响因素众多，各影响因素之间也是存在高度相关性，因此使用偏最小二乘法对其建立数学模型，并分析预测能达到很好的效果。

1 偏最小二乘法回归模型

在实际工作中，有一组因变量数据Y＝｛y1，…，yq｝（q为因变量个数）和一组自变量X＝｛x1，…，xp｝（p 为自变量个数）。

1.1 数据标准化处理

数据的标准化处理可以使新坐标系的原点与样本点集合的重心重合，并消除变量间的量纲差异，数据处理后不会改变其样本点间的相互位置及变量间的相关性。以自变量X为例，具体公式为：

处理后自变量数组记为E0＝（E01，…，E0p）n×p，同理因变量数组记为 F0＝（F01，…，F0p）n×q。

1.2 第一个主成分提取

t1是E0的第一个主成分，t1＝E0w1；w1是E0的第一个轴，是一个单位向量，即‖w1‖＝1。同样，u1是F0的第一个主成分，u1＝F0c1，c1是F0的第一个轴，并且‖c1‖＝1。为使t1、u1能很好地代表X、Y 中的数据变异信息，同时t1对u1有最大的解释能力，应使t1对u1的协方差（Cov（t1，u1））达到最大，即：

式中：Var（t1）、Var（u1）分别表示t1与u1的方差，r（t1，u1）表示t1与u1的相关度。

经推导有：

可见w1是矩阵E′0F0F′0E0的特征向量，其特征值是θ21。θ1是目标函数值，它取最大值时对应的w1是矩阵E′0F0F′0E0的最大特征值的单位向量。同样c1是对应于矩阵F′0E0E′0F0最大特征值θ21的单位特征向量。求得w1与c1后即可得主成分：

然后得回归方程：

式中E1、F＊1、F1分别是三个回归方程的残差矩阵，方程回归系数为：

1.3 回归方程的拟合

数学原理及方法与第一个主成分的提取相同，用残差矩阵E1和F1分别取代E0和F0，求出第二个轴w2和c2及第二个主成分t2和u2。如果矩阵X的秩是A，则依次进行循环计算得到主成分t3，…，tA，则会有：

由于t1，…，tA均可以表示成E01，…，E0p的线性组合，上式可以变成y＊k＝F0k关于x＊j＝E0j的回归方程形式：

式中：k＝1，2，…，q，FAk是残差矩阵FA的第k列。

1.4 交叉有效性

在偏最小二乘法回归建模中，为防止不充分拟合及过度拟合的发生，应确定合理的参与建模的主成分个数，目前广泛采用“舍一交叉验证法”选定建模的主成分个数。假设有n组样本点，先使用去掉第i组样本点所得样本集合（含n-i组样本点），并且用h主成分拟合一个回归方程；再将之前排除的第i组样本点带入拟合的回归方程，得到yi在样本点i上的拟合值＾yhj（-i）。对于每一个i＝1，2，…，n重复以上步骤，得到Y的预测误差平方和Bh（PRESSh，h＝1，2，…，n）：

当回归模型不稳定时，B的值就会增大，当B达到最小时模型的预测能力最好，则选择对应的h个主成分拟合方程。

2 飞灰含碳质量分数预测模型

2.1 数据样本

影响飞灰含碳质量分数的因素众多，本文选取了发电负荷、总煤量、一次风压、二次风压、排烟温度、省煤器出口烟温、燃尽风风门开度、烟气含氧体积分数等8个因素（x1～x8）作为输入变量，利用内蒙某电厂2011年6月的运行数据进行计算，从中选取具有代表性的40组数据作为样本建立预测模型，15组数据用于模型精度的检验。建模数据见表1，检验样本见表2。