基于GBDT+LR分类器的工业过程区域控制性能评价
2020-06-03王斌宇柴骅迅王永健李宏光
王斌宇,柴骅迅,王永健,李宏光
(北京化工大学 信息科学与技术学院,北京 100029)
在工业生产中,随着时间的推移,控制系统设备往往会出现老化、损耗等一系列的问题,导致控制器的性能下降。由于控制回路之间往往存在着比较强的相关性,面向工业过程区域的控制性能评价更加具有实际意义。
由于计算机技术和信息技术的快速发展,DCS在流程工业生产中得到普及,生产中采集和保存过程变量的数据变得非常方便,而大量的历史数据中包含了丰富的潜在知识,为分析控制系统的性能和参数提供了丰富的资源。近年来,相关的研究重点已经从SISO控制系统发展到了MIMO系统。在Qin[1]和Qin AND Yu[2]的文献综述中介绍了几种多变量控制系统的评价方法和评价指标。从评价的思想上讲,几乎所有的评价方法都遵循以下流程: 首先,定义控制性能最优时的状态作为评价基准,通常基准量化为一个数值型指标;然后,计算实时的状态指标;最后,将实时评价指标与基准进行对比,得出评价结果。
对控制系统的随机性性能进行评价,最常用的基准是Harris根据最小方差控制理论提出的最小方差基准,并且Harris在研究中将单回路最小方差基准扩展到了多变量控制回路中。这是一种统计性质的评价方法,但是最小方差基准通常是不可达到的,所以许多专家对更贴近实际的基准进行了研究。Jelali[3]在其综述文章中对常用的基准进行了总结和比较,像线性二次高斯(LQG)、最优PID(OPID)和广义最小方差(GMV)基准等。Yu和Qin[4]提出一种基于协方差的性能评价方法,选取历史数据计算基于协方差的基准,求解实时协方差矩阵的广义特征值,评价多变量控制系统性能,并且根据特征值和特征向量确定系统性能下降最快的方向。
在过程统计监控领域(SPM)[5-6],曾提出几种从数据驱动角度量化当前系统状态的方法[7],SPM通常基于多元统计和机器学习的方法来进行故障检测和诊断。主成分分析方法 (PCA)和偏最小二乘方法(PLS)常作为分析多变量控制系统的重要工具,在过去十几年中PLS方法也被众多学者改进,包括与自适应、递归方法融合,以及方法的动态扩展[7]。然而,SPM领域和控制性能监控(CPM)领域没有直接的关系。所以Zumoffen[8]将分块递归PLS与最小总方差指标SSD进行整合,提出了数据驱动的监控指标。Zumoffen[9]给出了SSD指标最优值以及SSD指标对控制策略的影响。
本文给出基于数据驱动的多变量控制性能评价各项指标的计算,再由工程师根据经验人工综合分析各项指标,最后给出性能评价结果标签。利用各项指标作为区域性能特征,工程师评价结果作为标签,进行有监督的梯度增强决策树(GBDT)+逻辑回归(LR)[10]分类器训练。分类器模型训练完成后,就可以在线使用模型。首先,采集区域过程数据,然后计算过程区域控制性能指标,最后将区域过程特征指标作为分类器模型的输入,分类器模型的输出便是过程区域控制性能的评价结果。分类器给出的实时评价结果分为“优”、“良”、“差”三个等级,它比传统的控制性能指标更加直观。可以辅助操作工判断过程区域的控制性能,指导生产操作。
1 过程区域控制性能指标
1.1 ISSD指标
首先考虑单回路的开环传递函数:
y(s)=G(s)u(s)+D(s)d(s)
(1)
式中:y(s)——被控变量的测量值;u(s)——操纵变量的测量值;d(s)——潜在的扰动变量。
多变量控制系统的开环传递函数为
(2)
式中:ys(s),yr(s)——被控变量CV的测量值;us(s),ur(s)——操纵变量MV的测量值;d*(s)——潜在的扰动变量。它们的大小分别是(ny×1), (nu×1), (nd×1),多变量控制系统的开环传递函数如图1所示。
图1 多变量开环传递函数示意
(3)
由式(3)可以将SSD定义为
(4)
在实时性能监控过程中,需要将实时SSDk同用户自定义的基准SSDn做对比,构成性能监控指标ISSD,公式如下:
(5)
David Zumoffen[11]在数据驱动的区域控制性能监控方案中给出在线监控指标NISSDk,其计算公式如下:
(6)
NISSDk≤1,说明ISSD性能接近基准时期;NISSDk>1,说明ISSD性能出现下降。
1.2 BW-RCID指标
在计算控制系统性能时,过程输出的方差显得极为重要,多变量的控制性能评价需要充分考虑变量间的相关性,Qin和Yu[4]提出基于用户自定义基准的协方差指标。核心思想是从历史数据中选取一段可以参考的数据作为基准B。而实时协方差矩阵由实时数据A计算,协方差指标Iv数学定义为
(7)
式中: cov(A)——多变量系统实时数据CV值计算协方差矩阵;cov(B)——基准时期数据计算协方差矩阵。一定程度上利用了系统整体的信息,考虑了变量之间的耦合,具有较高可信度。通过进一步的推导可以化简为
(8)
式(8)可以解释为所有广义特征值的乘积。这样整个监测过程就得到了量化,当Iv越接近1,说明控制系统的性能越接近基准时期,说明控制系统性能良好;当Iv大于1时说明变量间耦合比基准时期强,控制器性能变差,需要对控制器参数进行调整或者更新生产设备;当Iv小于1说明变量间耦合程度低,控制器性能比基准时期要好。
BW-RCID是一种依赖数据区块方式给出的协方差指标,并且引入了遗忘因子β,第k块数据的协方差矩阵与前面的每个数据块协方差矩阵都具有联系,可以表述为
(9)
这种自适应的协方差性能指标应被表述为
(10)
David Zumoffen[11]在数据驱动的区域控制性能监控方案中给出在线监控指标NIvk,其计算方式为
(11)
1.3 相对增益指标
相对增益矩阵常用来反应多变量控制系统中回路之间的耦合关系,相对增益矩阵发生变化,意味着回路之间的耦合关系发生变化。如果相对增益矩阵发生较大变化,流程控制变量和操纵变量的配对关系可能存在问题,需要重新评估,改变变量的配对关系。
David Zumoffen等[11]提到了相对增益指标来评估变量间的配对关系,其数学描述为
(12)
在线监控过程中,如果相对增益指标大于1,则表示变量间的耦合关系发生较大变化,需要重新调整操纵量和被控变量的配对关系,或者重新设计控制策略。
2 过程区域控制性能评价
2.1 GBDT+LR模型
GBDT是一种基于Boosting思想的迭代决策树算法。GBDT的算法思想是: 从训练集用初始的权重训练一个弱分类器1;增强分类器1学习出现错误的样本权重训练分类器2;如此迭代直到满足设定的分类误差或者达到预设分类器个数上限。最终将这些训练好的分类器整合成一个强分类器。GBDT的训练过程如图2所示。
图2 GBDT训练过程示意
在GBDT训练过程中,前一轮学习到的分类器为ft-1(x),损失函数为L(y,ft-1(x)),该轮迭代过程就是找到一个弱学习器ht(x)来优化损失函数的过程。
最终模型可以描述为
(13)
进行了M轮的训练以后,会产生M个弱分类器,整个模型的损失函数为
(14)
因为主要是拟合训练样本的残差,所以选择平方差损失函数作为训练过程的损失函数。
逻辑回归(LR)是一种广义的线性回归分析模型,逻辑回归在二分类以及多分类问题上应用广泛。它有一个重要前提就是需要进行有监督的学习。从概率学的角度讲二分类LR是将给出的自变量映射到{0, 1}两种情形,而线性函数结果大多数不在该范围,于是人们提出了Logit变换来解决该问题。在LR中必须要用到的函数为Sigmod核函数,数学表达式为
(15)
该函数是S型函数,可以将自变量x映射到{0, 1}范围内。将其中z进行线性函数变化可以得到LR的基本模型:
(16)
GBDT+LR是一个特征交叉的过程,GBDT的路径可以直接作为LR的输入特征来使用,避免了人工组合交叉特征的过程,其算法结构如图3所示。
图3 GBDT+LR算法结构示意
可以看到图3中示例的2个树均是GBDT训练出的回归树模型。在线过程中样本数据经过树种的路径最终到达子节点。将所有子节点作为LR的输入特征,进行分类。
2.2 GBDT+LR分类器
GBDT+LR是一种特殊的分类算法,因为其寻找特征和组合特征能力的强大,非常适用于多个指标特征且特征之间存在关联,各特征非线性共同影响类别结果的情况,并且分类准确率高。分类效果显示,应用GBDT+LR算法训练得到的分类器评价结果准确度要远高于其他分类算法。
分类器模型建立一般要经历数据采集、数据预处理、划分训练集和验证集、模型训练、模型测试和模型保存等几个过程。首先收集带有区域控制性能评价指标并且经过工程师分析完成标签评价的历史数据;之后进行数据预处理,处理数据中的缺失和异常错误的数据;随后按照7∶3的原则划分训练集和测试集;最后测试模型。分类器模型建立流程如图4所示。
图4 分类器模型建立流程示意
1)采集数据。需要从数据库中截取一段多变量同一历史时期的时序数据,用于分类模型的训练和测试。
2)数据预处理。需要对采集好的数据进行处理,提高数据的质量和可利用率。数据处理主要包括: 重复数据处理、数据缺失值处理、数据噪声处理。
3)划分训练集和测试集。将采集和预处理后的数据,按照7∶3的比例划分训练集和测试集。
4)模型训练。用训练数据集对未经训练的GBDT+LR分类器进行训练,初始化模型参数,训练数据通过GBDT模型进行回归,将GBDT中生成的决策树的叶子节点进行特征组合,寻找训练集的特征及特征组合,再将其作为输入给LR分类器模型进行分类训练,从而完成对GBDT+LR分类器的训练过程。
5)模型测试。测试集主要用于测试模型的泛化能力,使训练集和测试集正确率达到一个平衡,可以防止过拟合,提高模型泛化能力。
6)模型保存。分类器模型建立完成后,需要保存,使用时调用即可。
2.3 控制性能评价方法
本文提出的基于分类器的评价方法是数据驱动的,不需要知道工厂流程的具体数学模型,仅通过足够数量的历史标签数据,就可以通过分类器训练,得到准确的分类器模型。在线通过分类器模型就可以评价当前控制回路的性能。基于分类器评价方法的步骤如下:
1)收集历史数据,在工厂的DCS中存储了大量历史数据,经验丰富的工程师根据数据曲线的变化给出系统总体的性能评价结果,分为 “优”、“良”、“差”三个等级,给数据贴上标签,方便监督训练。
2)利用工业现场数据,再根据前面提出的多变量指标,可以计算指示某方面性能的指标,如偏差指标指示被控变量的跟随特性,协方差指标一定程度描述回路之间的关联性和时延特性。将该类指标作为分类器输入。
3)将带标签的指标数据集,按照一定的比例划分训练集和验证集,利用训练集训练的分类器模型,让分类器学习工程师分析评价多变量系统性能,并将结果在测试集上做验证。
4)在分类器模型训练完成后,就可用该分类器模型对当前回路性能给出评价。首先需要对回路当前的状态进行各项性能指标的计算,得到计算后的指标值,再将其输入到训练完成的分类器模型中,分类器输出结果则作为该回路的最终评价结果。
3 实例研究
3.1 精馏塔过程
某精馏塔工艺过程如图5所示。
图5 精馏塔工艺过程示意
可以看出,精馏塔控制模型的控制结构主要为3个单回路PID控制,被控变量分别是塔顶分离出的轻组分y1,塔釜分离出的重组分y2,塔釜温度y7;操纵变量是塔顶流出阀开度u1,旁流出阀开度u2,塔底回流阀开度u3;扰动变量是塔上部回流负荷d1,塔中部回流负荷d2。
3.2 分类器训练
在实验过程中首先令精馏塔装置进入稳态,各变量处于大致稳定的状态。这时多次修改控制器参数、扰动参数、控制对象模型仿真生成5×103组数据。由于上述指标的求解,每组数据为1×103个时间点采样构成的数据块,由专家成员分析每组数据的控制质量,给出评价标签。在数据准备工作完成后,需要将数据集按照4∶1的比例,划分为训练数据集和测试数据集,即训练数据4×103例、测试数据1×103例;然后进行分类器模型训练,将训练数据集中4×103组训练数据的性能指标作为分类器的特征输入,评价结果作为分类器目标值,对GBDT+LR分类器进行训练,部分训练数据集见表1所列。
表1 训练集数据样本
训练后用1×103组测试数据对GBDT+LR分类器进行测试,将这1×103组数据经分类器分类评价的结果与其原先的评价结果对比,若对比准确度足够高,则完成GBDT+LR分类器建立,可将其投用,用来对该回路进行性能评价;若对比准确度未达到要求,则重新对其进行训练,直至准确度达到要求。对于分类结果可能存在4种情况,给出了混淆矩阵,见表2所列。
表2 混淆矩阵
真阳性是指分类结果为正例,同时数据确实为正例的情况;假阳性是指分类结果为阳性,但数据确实为负例的情况;真阴性是指分类结果为负例,同时数据确实为负例的情况;假阴性是指分类结果为阴性,但数据确实为负例的情况。真阳性率为分类输出为正例样本的个数TP与真实正例个数P的比值;假阳性率为分类输出为假正例的样本个数FP与真实负例样本个数N的比值。
ROC曲线是指分类问题中真阳性率和假阳性率构成的图形。精馏塔数据多种分类器的ROC曲线对比如图6所示。
图6 多种分类方法ROC对比曲线
对于ROC曲线,正确率为分类方法所包围的面积,由图6可以看出,GBDT+LR 的分类器训练准确度为92%,单独的GBDT分类器训练准确度为89%,BP神经网络分类器训练准确度为83%,SVM分类器只有69%的准确率。GBDT+LR相比其他三种方法效果最好,可以作为性能分类评价器使用。
3.3 控制性能评价
对精馏塔进行时序数据采集,采样时间为1 s。总的数据采样点为2×104个,将总的时间序列数据划分为10个连续时间区块,每个时间区块中包含2×103个数据点,计算其性能指标如图7所示,图7中横坐标表示按时间序列采样得到的10个区块,每个区块包含2×103个采样点,纵坐标为无量纲的指标数值。
图7 实时评价指标示意
将图7所示时序的评价指标输入训练好的分类器GBDT+LR模型,可以得到时序的综合评价结果,见表3所列。
表3 性能评价结果
从表3中可以看出,前几个周期指标显示系统性能良好,后几个周期性能由好变差。这与在第5个采样区块增大了u1和y1间的增益导致系统性能变差的结果是一致的。
4 结束语
本文提出了一种数据驱动的区域控制综合性能评价技术,现有的评价指标常侧重指示控制系统某一方面的性能,工程师在评价控制系统性能时要充分考虑控制系统的快、准、稳等多个方面的性能,因此会综合考虑多个性能指标,这样的方法费时费力,针对该问题,本文提出基于分类器的控制性能评价方法,让机器学习工程师评价过程,输出综合性指标。目前仅处于仿真阶段,希望接下来可以将本方案使用到工业实际中。目前该研究只针对工况稳定的控制系统进行评价,在工况转变的过渡过程及实际工业中多工况的情况,仍需再进行深入研究。