现场控制仪表的故障诊断与补偿容错控制系统
2011-05-10张祖鹰
张祖鹰
(南京化工职业技术学院,南京 210048)
0 引言
一般的过程控制系统基础层往往包含90%以上的常规控制回路,回路之间又存在关联耦合现象,一旦局部某一控制回路发生故障(例如,传感器故障或者阀门故障),导致控制回路发生波动,性能退化,故障通过回路之间关联传递机制传播到相关回路,其性能也被退化,致使整个厂级控制系统出现波动,轻则导致产品质量下降,能耗上升,重则导致厂级控制系统瘫痪,发生安全事故。这时往往都是现场工程师通过对故障现象分析,准确定位控制回路,并经过维护消除故障,整个工业控制系统恢复正常运行状态。因此,问题回路的有效定位是解决厂级范围控制回路性能降低退化的重要因素[1]。另一方面对于连续的流程工业生产线,其往往只是一年大修一次,因此对于一些性能衰退的设备或者故障设备,一时又难以进行维修或者更换,需要从控制补偿的角度提出主动容错控制方法,最大限度地将控制回路性能维持在正常状态。
1 故障现象的合理描述
工业过程目前绝大部分己采用了计算机控制系统,且以计算机控制的可靠性可以达到较高水平,随之而来的问题是执行器和传感器可靠性的不足。实际上,传感器和执行器的故障已成为导致控制系统失效的主要原因,据统计,80%控制系统失效,起因于传感器和执行器故障[2]。然而,传统控制理论的研究大多都是基于传感器和执行器工作正常的假设。因此,研究传感器和执行器的故障检测和容错控制问题有重要的理论和应用价值。另一方面,目前大部分故障容错控制研究中广泛采用了“二状态故障模型”,虽然这种描述可以简化故障诊断和容错控制的研究,但这种描述不能很好的反映实际的工程系统中所发生的故障现象。因此,如何建立合理的实际故障的解析模型是非常必要的。
1.1 传感器故障的合理描述1.1.1 传感器故障问题的描述
对于一个多输入多输出的非线性动态系统,其传感器故障数学模型描述为:
这里,x∈Rn是状态矢量;u∈Rm是输入矢量;f(x,u)∈Rn表示系统的非线性系统模型;η(x,u)表示模型的不确定性;F(x,u,t)∈Rn表示传感器故障函数;g(x,u)∈Rq表示系统的输出函数;g(t)∈Rq表示测量的随机误差,或称自由噪声。通常自由噪声服从零平均值的正态分布,即ε(t)~N(0,σ12),其中σ1
2为自由噪声的方差,它主要是由于测量系统本身或测量过程本身的随机性造成的,是不可预期的。
1.1.2 传感器故障分类及其特性描述
在实际的工业过程中,传感器由于外界环境的干扰和其本身的特性,会发生许多种不同类型的故障,例如:偏差故障、漂移故障、精度下降故障和完全故障。前三种故障被称为“软故障”,而后一种故障被称为“硬故障”。软故障由于故障现象不明显,难于被检测,使得软故障在某种程度上比硬故障危害更大[3]。这四种传感器故障的解析模型可以被描述为:
1)偏差故障:是指故障测量值与正确测量值相差某一恒定常数的一类故障,即:F(x,u,t)=b,b为常数。
该类有故障的测量与无故障的测量是平行的,只是两者之间相差一个常数b。
2)漂移故障:是指故障大小随时间发生线性变化的一类故障,其表示形式为:
F(x.u.t)=d(t,T0),d为常数,T0为的故障起始时刻。
该类有故障测量值与无故障测量值之间的差距随时间的推移而不断加大。
3)精度下降故障:发生精度下降故障时,测量的平均值并没有变化,而是测量的方差发生了变化。具体表示形式为:F(x.u.t)~N(0,σ22)。这里,N(0,σ22)表示高斯白噪声,σ2
2表示方差。精度下降故障类似于自由噪声的方差增大的情况。其表现形式有故障测量与无故障测量混杂在一起。正是由于这一点,使得该类故障的检测较其他三类故障更难。
4)完全故障:完全故障时测量值不随实际变化而变化,始终保持某一读数。通常这一恒定值一般是仪表量程的最大或最小值。该类故障可以表示成为:F(x,u,t)=c, c表示仪表量程的最大或最小值。
此类故障检测的关键是早期检测,防止故障步的扩大。
1.2 执行器故障的描述[4]
执行器位于控制回路的终端,控制系统的控制性能与执行器的性能和正确有着直接的十分重要的关系。阀门是流程工业最常用的执行器,其使用不当或阀障引起的生产不能正常进行甚至造成事故的情况不胜枚举。另一方面在一个装置阀门的数量众多,一些关键部位的阀门价值昂贵且难于更换。
1.2.1 阀门装置的基本结构
阀门由执行机构、调节机构和阀门定位器组成。执行机构将控制器输出信号转换成控制阀的推力,由推力力矩进一步转化为角位移信号;调解机构将位移信号转换为流通面积的变化,从而影响流体流量。阀门定位器可改善控制系统功能,与阀杆位移量组成副回路控制,克服摩擦力、不平衡力和回差干扰。阀门定位器构成一个负反馈回路与原有的被控变量组成串级控制,如图1所示。
图1 阀门控制原理结构图
1.2.2 阀门常见故障的合理描述
阀门故障按照其机构可以划分为:调节机构故障、执行机构故障、定位器故障和一般外部故障。常见的故障大致可以归纳19种故障情况,同时列出了每种故障的类型及其数学描述模型。
1)调节机构常见故障
表1 调节机构常见故障描述
2)执行机构常见故障
表2 执行机构常见故障描述
3)定位器常见故障
表3 定位器常见故障描述
4)一般外部故障
表4 外部故障描述
2 基于多模型的鲁棒故障检测技术
基于解析模型的故障检测与诊断方法是通过系统实际行为与基于模型的预期行为的差异的分析与比较,检测系统是否发生故障,并对故障发生部位、故障的大小及类型进行诊断。这种基于解析模型的故障诊断方法具有不需要另增加其他物理设备的优点,在理论研究和工程应用方面都具有很强的吸引力[5,6]。
2.1 残差的生成
故障诊断领域的残差主要指被监控系统的真实行为与基于系统数学模型的预行为之间的不一致性或差异,是过程故障检测系统的核心。由于噪音和模型的不确定的存在,即使在无故障时,残差也不可能为零。
残差不仅与加性故或乘性故障相关,而且与系统参数的不确定、噪声和扰动相关。系统的扰动、噪声模型误差导致了残差在正常工况时为非零值,增加了故障检测的难度。所以在设计差发生器时,就应考虑到残差受外界扰动、噪声和模型误差的影响尽可能的少,也是说残差对这些未知输入应具有一定的鲁棒性。
2.2 自适应阈值区域估计
这里自适应阈值区域主要由三部分组成:1)测量噪声引起的随定误差ε(k);2)线性模型不确定误差范围;3)线性化误差试[7]。
2.3 闭环系统的鲁棒故障检测技术
采用加权移动平均残差和自适应阈值包络保守的故障检测技术进行带有不确定相和测量噪声的故障检测。故障检测的方框图如图2所示。
图2 闭环系统鲁棒故障检测结构图
2.3.1 加权移动平均残差技术
为了有效地解决由于测量噪声和外界扰动对残差造成的影响,采用基于一个移动时间窗L定义一个滤波器,由起始于当前采样时刻k的过去L个残差加权组成,此移动时间窗在每一时刻都进行更新。
2.3.2 自适应阈值包络故障检测
采用自适应阈值包络轨迹与加权移动平均残差及在每一个移动时间窗内L内相比较检测系统故障。自适应阈值发生器是基于动态优化和假定参数不确定下,最小可能的阈值等于由于模型的不确定相造成的正常模型产生的最大可能偏离。自适应阈值的最大最小值随着时间变化曲线就成为包络轨迹。也可以采用基于知识方法(例如神经网络方法、模式识别等)建立正常工况的最大和最小边界,从而形成残差阈值包括轨迹。在移动时间窗内,若加权移动平均残差落在自适应阈值包络轨迹内,认为残差主要由模型的不确定和噪声引起,系统正常,反之系统发生故障。利用上述故障检测方法可以大大减少由于不确定干扰和测量噪声导致的误报警,故障检测鲁棒性明显提高了。
3 主动补偿容错控制方法的设计
对于复杂的工业控制系统,由于负反馈控制和控制回路之间耦合等因素使得故障迅速在整个回路传播,从而故障引起系统动态的变化往往不明显。因此,针对实际闭环控制系统进行在线故障调节策略的设计不容易实现。在工业系统中,有些故障经常发生,或者是可预见的故障,例如系统元件的随着使用时间性能退化的故障,我们把这些故障称为“历史故障”。对于“历史故障”可以离线建立故障描述模型和故障特征,设计相应的主动容错控制策略,并储存在历史故障库和历史故障容错控制策略库中。如果系统检测到故障,故障诊断模块被启动,确定故障的大小、位置后,与历史故障模型匹配,实现故障的隔离,根据故障匹配结果,切换到相应的补偿容错控制策略。尽管这种基于多模型的切换控制系统的稳定性在理论上并没有被很好的证明,但这种基于多模型的主动容错控制思想己被广泛地应用在实际工业中[8]。
根据以上思想,可构成一个容易工程实现的故障检测、诊断与主动补偿容错控制方法的结构图,如图3所示。
图3 主动补偿容错控制方法的结构图
该方法可以初步认为由三层结构组成;第一层:工业系统的基础闭环控制层;第二层:基于多模型的故障检测诊断与补偿容错控制层(FDT);第三层:人机监督管理层。
3.1 工业系统的基础闭环控制层
这一层主要由传感器、执行器、信号转化和控制器组成的常规控制回路组成。在流程工业生产过程中,这一层常采用集散控制系统、可编程控制器或计算机直接控制等。一般的过程控制系统基础层往往包含90%以上的常规控制回路,回路之间存在着关联耦合现象。一旦局部的控制回路发生异常(如调节阀/传感器发生故障),导致波动,由于系统关联传递机制,可能整个系统会出现厂级范围波动。基础层控制性能对于工况的稳定有着直接的影响,也对故障的产生,故障的检测和诊断性能,以及进一步容错控制策略实施有很大的影响。
3.2 基于多模型的故障检测诊断与容错控制层
本层的在线智能故障容错控制方法采用一个单独的故障检测模块、故障诊断模块、主动补偿容错控制模块。
3.2.1 故障的检测模块
采用一个成本有效的保守故障检测与诊断方案。故障检测模块采用加权移动平均残差和自适应阈值包络的保守故障检测方法。检测模块根据正常行为模式,周期性地检测系统的“健康”状态。3.2.2 基于多残差动态描述的故障诊断模块
根据不同的故障模式在过程操作单元和控制回路之间故障传播的途径不同,可设 “多残差描述故障特征”。即根据可测量的变量信号和控制信号以及故障信号在闭环系统中的传播途径,建立多个操作单元或控制回路的数学模型。通过系统测量值与模型估计值之间形成多残差描述。
3.3.3 主动容错补偿调节模块
如图3所示,一个控制策略协调器平行置于历史故障容错补偿调节控制库和正常控制器之间。在线过程监控时,根据系统目前运行状况,控制策略可能来源于下述三种控制方式之一:正常控制器(对应正常运行工况)、历史故障调节控制器(对应于历史故障情况)和在线智能调节控制器(对应于未知故障情况)。在这种模式下,系统正常采用正常控制策略,当系统检到故障,故障诊断模块诊断故障的类型与大小,如果判断是历史故障,则相应的历史故障补偿容错控制器被切换到当前控制。否则,被认为故障为“未知故障”,在线智能控制调节器被切换到当前策略。
3.3 人机监督管理层
人机监督管理层主要功能包括:报警系统、紧急停车和人机对话功能。工程师和管理人员可以通过权限修改相关指令,例如:控制目标的变化,参数的整定等操作,并与智能调节器相联结。如果系统诊断出当前故障属于未知故障,系统发出警告,监督层密切注意生产状况,紧急切断电源,防止不曾预计的未知故障带来灾难性的后果。
4 结束语
随着过程控制系统的自动化程度以及复杂程度不断提高,故障检测、诊断与容错控制成为现代过程控制系统的一个重要组成部分。本文在分析了过程控制系统的主要特点与现状的基础上,建立了多种传感器故障和执行器故障(阀门故障)合理描述形式,使其更加贴近于工业实际情况;研究基于数据驱动的多种故障模式下的快速故障检测诊断方法;由于生产过程的控制的目标不仅是产品质量,而且要求成本、能耗和环境等多项性能指标同时满足要求,进一步探索了在多目标或多约束条件下的满意容错控制方法。
;
[1] Sang Wook Choi,Changkyu Lee.Fault deteetionandidentifie ationofnonlin Proeesses based on kemel PCA[J].Chemometrics and Intelligent Laboratory Systems75(2005):55-67.
[2] 张华春.复杂系统的故障检测与容错控制研究[D].中国科学院自动化研究博士学位论文,2001.
[3] Gary G.Yen,Liang-Wei Ho,Online MultiPle-Model-Based Fault Diagnosis Accommodation[J].IEEE transactions on industrial electronics,2003,150,(2):296-311.
[4] 周东华,叶银忠.现代故障诊断与容错控制[M].北京:清华大学出版社,2006.
[5] Micha Bartys,Ron Patton,Mieha Syfert.Introduetion to the DAMADICS actuator FDI benehlnark study[J].Control Engineering Practice,2006,14;577-596.
[6] Michel Par ty's,Michel Syfert.Using Dramatics Actuator Benchmark Library(Adlib [M].'DABLIB'Simulink Library Help File,ver.1.22,APril26,2002.
[7] 胡峰,孙国基.过程监控技术及其应用[M].北京:国防工业出版社,2001.
[8] Gertler,J.J.Fault detection and diagnosis in engineering systems [M].NewYork: Mareel Dekker.1998.