一种基于PCA和贝叶斯分类的气动调节阀故障诊断方法
2020-01-09王印松吴军超
王印松,吴军超
(华北电力大学控制与计算机工程学院,河北 保定 071003)
0 引 言
气动调节阀是工业控制回路中应用十分广泛的终端执行设备,其主要功能是根据控制回路中控制器的输出信号,调节工艺中流经调节阀介质的流量或压力。气动调节阀具有结构简单、性能稳定、维修方便、价格便宜等优点,被广泛的应用于电力、化石、冶金等行业。气动调节阀与生产工艺紧密相关,自身由于频繁的机械运动及常年工作在高压、高温、强腐蚀、易漏或易堵等恶劣工况下,经常会出现各种异常和故障。在气动调节阀的维护中,如果仅仅根据经验进行维修或者替换,费时费力,所以亟需采用智能诊断方法对气动调节阀进行故障诊断,使得维护更加具有针对性,提高维修效率[1]。
多位学者对气动调节阀的故障诊断进行了深入研究,目前对气动调节阀的故障诊断研究主要可以分为两类,基于机理模型的方法和基于数据驱动的方法。基于机理模型的方法是通过系统辨识为调节阀建立动态的数学模型,当调节阀出现故障时,模型的输入输出变量就会改变,通过观测模型参数的变化就能判断是否有故障发生以及故障发生的位置。文献[2]从动力学、热力学、机械运动等数学角度出发对气动调节阀进行建模,运用状态估计的方法重构调节阀的运行状态,将估计值与测量值进行比较构成残差序列,通过对残差值的统计分析判断是否有故障发生。基于机理模型的方法一般存在较大的困难,如果建模对象是非线性的,那么不易对其建模,并且模型的精确度也得不到保证。考虑气动调节阀存在粘滞特性,并且包含多种非线性因素,在进行数学机理建模时涉及到很多参数的动态特性,很难建立较精确的气动调节阀数学模型。基于数据驱动的方法运用各种方法对过程现场的数据进行建模分析,从而达到故障诊断的目的。文献[3]提出了基于神经网络的气动调节阀故障诊断方法,文献[4]提出了基于最小二乘支持向量机的气动调节阀故障诊断方法。由于基于数据驱动的气动调节阀故障诊断算法不需要建立精确的数学模型,可直接根据采集的数据进行分析,但文献[3-4]中的方法均需要训练大量的数据,且算法复杂。贝叶斯分类方法根据贝叶斯公式计算得出后验概率,把具有最大后验概率的类作为该属性的类,这种方法巧妙地把先验概率和后验概率联系起来,根据先验信息和样本集确定分类。贝叶斯分类算法原理简单,计算过程中所需的参数易计算,文献[5-6]将这种方法应用于岩性分类中,文献[7]将其应用于光谱分类中,均取得较好的分类效果。
基于以上分析,本文从数据驱动角度出发,将贝叶斯分类方法与PCA结合,对所监测的信号数据集经过PCA处理,降低数据集的维度,采用贝叶斯分类方法判断每个测试集数据样本所属的故障类型,将所提方法与SVM和k-NN这两种方法进行对比,验证了所提方法的可行性。
1 气动调节阀仿真平台简介
DAMADICS仿真平台是在实际气动调节阀的研究基础上开发出来,用于评价故障检测与故障诊断算法的一个平台[8],该平台考虑到工业现场典型气动调节阀详细的物理和电器结构特性,充分仿真气动调节阀的工作状态。如图1所示,该平台的气动调节阀由气动执行机构、调节结构、阀门定位器和一些附件组成。执行机构将控制器输出信号转换成控制阀的推力,由推力力矩进一步转化为角位移信号。调节机构将位移信号转换为流通面积的变化,从而影响流体流量。阀门定位器可以改善控制系统功能,与阀杆位移量组成副回路控制,克服摩擦力、不平衡力和回差干扰。
图1中主要有6种信号,分别为控制器的输出信号CV、阀门入口处压强P1、阀门出口处压强P2、流体温度T1、流体流速F和阀杆位移x。文中主要采集这6种信号进行故障诊断,简化后如图2所示。
图1 气动调节阀基本结构
图2 简化后的调节阀模型
气动调节阀内部结构较为复杂,组成气动调节阀的执行机构、阀体、定位器以及与之相连的附件装置均有可能发生故障。故障发生时,气动调节阀动作会发生异常,这些异常主要表现为阀位、流量等信号的异常。利用DAMADICS仿真平台可以仿真气动调节阀19种故障,具体见表1。本文研究的故障类型的选取主要考虑两个方面:1)考虑到气动调节阀衰减型故障和快变型故障包含许多不确定性,并处于不稳定状态,不适合进行故障诊断,因此在之后的故障诊断中只考虑突变型故障;2)考虑每种故障实际生产中发生可能性的大小。因此,本文主要研究f1阀门堵塞故障、f7流体过热蒸发或临界流故障、f8执行机构推杆扭曲故障、f10膜头穿孔故障和f15定位器反馈故障这5种故障。
2 基于PCA和贝叶斯分类的故障诊断
2.1 主成分分析
PCA是一种常用的数据集降低维度的方法[9]。当选取的数据集维数较高,可以通过PCA方法将其向低维数转化。
假设进行故障诊断需要监测m种信号,其中第k种监测信号为xk,则组成的监测信号数据集的单个样本x可以表示为:
表1 故障描述
每单个样本x均对应着气动调节阀的故障类型,如阀门堵塞故障、定位器反馈故障。假设数据集中选取了n个样本,进而组成了样本矩阵X:
目标将数据集维度由m维降低到d维度,其中m>d。首先按照下式对所有样本进行中心化:
样本矩阵中心化处理后,计算处理后的样本矩阵的协方差矩阵XTX,并对协方差矩阵XTX做特征值分解,获取协方差矩阵的特征值对角矩阵和特征向量矩阵。取最大的d个特征值所对应的特征向量w1,w2,…,wd,组成降维完成后的投影矩阵W*:
其中,d的选取可根据累计方差百分比方法确定。
2.2 贝叶斯分类方法
贝叶斯分类方法是概率框架下进行类别判断的基本方法,对于分类任务来说,通过似然概率和先验概率取推断后验概率,根据后验概率的大小来进行分类[10]。
假设气动调节阀中有q种故障类型,第i种故障类型为:mi(1≤i≤q)。则所有的故障类型可以组成集合M:
气动调节阀故障诊断的主要任务是:对于输入进故障诊断模型的测试集样本x*,计算出后验概率P(mi|x*),其中mi∈M。
根据贝叶斯定理,P(mi|x*)可以写为:
其中,P(mi)为故障类型的先验概率;P(x*|mi)为信号样本x*相对于故障类型mi的条件概率,或者称似然概率;P(x*)为用于归一化的缩放因子。对于给定样本,缩放因子与所属故障类型mi无关,因此先验概率P(mi)估计P(mi|x*)的问题就转化为如何估计先验概率P(mi)和似然概率P(x*|mi)。
对于先验概率P(mi),气动调节阀中有q种故障类型,假设第i种故障类型mi的训练数据集样本个数为numi,则有:
对于似然概率P(x*|mi),连续属性可考虑概率密度函数,假设经过PCA处理后的气动调节阀特征信号符合多元高斯分布,根据训练数据集来估计所满足的多元高斯分布的均值和协方差。
若训练数据集中有n个训练数据样本x,对应似然函数为:
其中:
所需要求取的参数为:
应用极大似然估计,可得:
根据训练数据集估计出μ*和Σ∗后,计算测试数据集中的每一个测试样x*相对于故障类型mi的条件概率P(x*|mi):
计算得出故障类型的先验概率和似然概率,根据式(6),便可以得到后验概率,其中后验概率值最大所对应的mi即为x*对应的故障类型。
基于PCA和贝叶斯分类方法的具体流程如图3所示。
图3 故障诊断流程图
3 仿真验证
首先,在DAMADICS仿真平台上获取各种故障的监测信号数据集。仿真过程中,所有的输入输出信号均掺杂了有限带宽的白噪声干扰,白噪声中还叠加了电磁干扰,使得仿真过程更能模拟一个相对真实的噪声环境,具体参数设置如表2所示。
各种故障的仿真结果经过归一化处理后,用于故障诊断的各个监测信号变化情况如图4所示,受故障发生的影响,不同故障模式下的监测信号表现出不同的特征。
利用DAMADICS仿真平台,产生5种故障的训练集和测试集,其中每种故障中,训练集选取200个样本,测试集选取500个样本。将数据进行PCA处理后,原始6维的数据被降为2维时,其成分总和在所有成分中的贡献率总和为91.163 5%,表明原始6维数据可以用2维数据来表示。经过PCA处理后的训练数据集的二维分布如图5所示。
表2 仿真参数设置
图4 各种故障发生时监测信号变化情况
图5 PCA处理后训练集分布情况
将PCA处理后的训练数据集用来训练贝叶斯分类器,获取每种故障训练数据集的均值和协方差。将测试数据集的样本输入贝叶斯分类诊断模型,由于每种故障选取的训练数据集样本个数是相等的,故每种故障发生的先验概率相同。计算测试数据集中每个样本相对于故障类型的似然概率,似然概率越高,对应的故障类型发生的可能性就越大。以故障f10为例,随机选取故障f10测试集中的10个样本,似然概率如图6所示,其中P1、P7、P8、P10、P15分别为样本发生故障f1、f7、f8、f10、f15的似然概率。
图6 故障f10部分测试样本的似然概率
将所有测试集进行诊断,多种方法的故障诊断结果如表3所示。
从表中可以看出,与SVM、k-NN相比,整体上,基于贝叶斯分类方法的诊断性能较高,故障f8执行机构推杆扭曲故障的预测准确度较低,而故障f7流体过热蒸发或临界流的诊断准确度达到了100%。究其原因,是因为故障f8与其他故障的症状类似,不易分离。而故障f7与其他故障的症状极易分离。从图6中可以看出,随机选取的故障10部分测试样本中,大部分的诊断结果正确。而在样本4、7、9中,诊断结果最有可能发生的故障为故障f1,其次为故障f10。虽然诊断结果错误,但按照方法可确定检查故障的次序,检查出气动调节阀未发生故障f1,接下来可检查是否发生故障f10,大大提高了确定故障源的速度。
表3 结果准确度对比 %
分析以上3种算法的原理,SVM算法[11]应用于多故障分类中,需要构造多个分类器,计算时间长;k-NN算法[12]中因为对每一个待分类的文本都要计算它到全体已知样本的距离,才能求得它的k个最近邻点,计算量大、内存开销大,而贝叶斯分类方法从统计学角度对数据进行分析处理,模型训练过程中只需求取各种故障信号的均值和协方差,对于输入诊断系统的测试样本根据贝叶斯公式进行后验概率的计算,计算量小,易于现场进行实时故障诊断。
4 结束语
本文应用DAMADICS仿真平台仿真工业过程中气动调节阀5种典型故障,获取用于进行故障诊断的训练集和测试集。然后,利用主成分分析将维数较高的数据集转化为维数较低的数据集,获取数据集中的有用信息。最后将处理后的训练集用来训练贝叶斯分类模型,通过测试集来测试准确度。将本方法与SVM、k-NN进行对比,结果表明,本方法的诊断准确度较高,方法可行。贝叶斯分类方法还能输出各个故障发生的概率大小,即使在故障诊断中发生误判,依然可以根据诊断结果排列出各个故障发生的可能性大小,这在实际应用中具有十分重要的现实意义。