APP下载

一种基于改进核Fisher的故障诊断方法

2017-10-14马立玲徐发富王军政

化工学报 2017年3期
关键词:投影故障诊断距离

马立玲,徐发富,王军政



一种基于改进核Fisher的故障诊断方法

马立玲,徐发富,王军政

(北京理工大学自动化学院,北京 100081)

针对化工过程故障数据呈非线性分布,数据类别复杂,难以进行故障诊断的问题,提出一种改进核Fisher的故障诊断方法。对于原始样本数据投影后,样本出现因类间距离存在很大差异性而导致部分类别样本存在混叠的现象,以及不同类别的边界数据归类模糊问题,给出了统一的解决办法。该方法首先采用改进类间距的方法来改变样本投影空间的分布,使得样本具有较好的投影效果,然后通过定义阈值参数来筛选出边界数据,对于边界数据,采用改进的近邻(-NN)算法来分类,对于非边界数据,采用马氏距离来分类。最后在TE过程中进行了仿真验证,结果表明方法在兼顾了故障诊断时间的同时,有效提高了故障诊断精度。

核Fisher;故障诊断;改进-NN算法;实验验证;优化

引 言

在实际的化工过程中产生了大量的数据,化工过程的故障诊断问题是如何利用这些故障数据,对其进行分类。这种基于数据驱动的统计方法在化工过程中得到了广泛运用[1]。目前基于数据驱动的故障诊断方法主要有:统计分析方法、信号处理方法、基于定量的人工智能方法[2-3]。统计方法主要包括:主元分析、最小二乘、独立元分析、Fisher判别分析、贝叶斯理论等方法;基于信号处理的方法主要有:小波变换、希尔伯特变换等;基于定量的人工智能方法主要有:模糊数学、支持向量机等[4-6]。然而这些方法有其局限性,对于复杂的化工过程,单纯的这些方法已经不能满足需要。而将核方法[7]引入Fisher判别分析中,很大程度上解决了原始数据呈非线性分布问题,适用于复杂的化工过程。在过去的十多年中,核Fisher方法得到了广泛的运用[8-17]。

近年来,运用Fisher判别分析进行故障诊断取得了许多成果。文献[18]提出了基于改进的生物地理学优化算法的加权核Fisher判别分析法,对非线性大规模的工业过程进行及时、准确的故障诊断;文献[19]提出了在类标签指导下最小化同类流形的离散度并最大化异类流形的离散度来实现类判别;文献[20]提出了基于核Fisher的正常工况与故障包络面模型,给出了基于该模型的在线故障诊断流程,该方法能够及早诊断出故障的发生;文献[21]提出了基于核Fisher判别分析的非线性统计过程监控方法,能有效捕获过程变量之间的非线性关系;文献[22]所提方法充分利用了蕴含于无标记故障样本中的故障信息。这些方法一定程度上提升了故障诊断的正确率,但是故障诊断的快速性、准确性还有待进一步提升。

运用核Fisher分析法进行故障诊断时,还是存在一些问题:①对于故障样本在投影空间的投影数据,存在边界数据由于远离类中心且处于不同类的分界处,导致归类模糊误判的问题;②在投影空间,有的样本类间距离存在很大差异性,导致类间距小的类别间出现投影数据混叠,互相掩盖的现象。针对以上问题,提出了统一的解决办法,基于改进的核Fisher方法,有效改善了核Fisher的投影效果,并很好减少了故障样本的分类错误率,这一方法在TE平台上得到了验证。

1 核Fisher判别分析

Fisher判别分析是模式分类领域研究发展的一种数据降维及分类方法。它的核心思想是投影,依据样本的不同特征,将测试数据投影到某个方向,使得测试数据的投影的类间离散度最大化并同时最小化类内离散度。虽然传统的Fisher判别在故障诊断方面有了广泛的运用,但是当变量之间的非线性化很严重时,很难找到一个合适的方向使得测试数据的投影能最大程度地分离。针对非线性分类,将核函数方法引入Fisher判别中取得了很好的效果,Mika等[23]最早提出了核Fisher判别分析。下面对核Fisher判别进行简述。

假设在维空间的所有样本点有类,即1,2, …,G,样本总数为。第(=1, 2, …,)个类G包含N个样本记做1,2,…,。

样本∈R通过非线性高维映射后对应的模式()∈。在高维特征空间中,训练样本的类内离散度W和类间的离散度B分别为

(2)

式中,表示特征空间中第类采样均值:,而表示所有样本点在特征空间中的均值:。在特征空间中,Fisher判别准则为

式中,为任一非零列向量。Fisher判别就是通过最优化式(3),找到最佳投影矢量。由于特征空间维数太高,不能直接求取,因而引入核函数

(4)

式(4)表示任意2个在高维空间中的向量内积可以用核函数表示。则式(3)中最优解可以表示为:,其中=(1,2, …,)T为一列向量。于是在高维特征空间中Fisher准则变为

式中,B和W的求法如下

因此式(5)的问题转化为求W−1B的最大特征值以及对应的特征向量。在实际应用中,往往不能保证W是非奇异的,因此,采用W+来替换W,其中是一个极小的正数,通常取=10−7,为单位矩阵。

在核函数Fisher判别方法中,核函数的选取至关重要。核函数有很多种,最为常见的有线性核函数、多项式核函数、径向基函数和Sigmoid核函数等,但是如何构造一类最优核还没有一个好的方法,缺乏深入的理论研究。在文献[24]中,通过实验研究发现,在默认参数的情况下,RBF核函数(高斯核函数)具有较好的分类能力。在本研究中,采用RBF核函数

式中,参数为正常数,的选取是一个优化问题,目前常采用的参数选择方法有:交叉验证法[25]、Bayesian法[26]、梯度下降法[27]等。本研究采用交叉验证法选取参数。

2 基于改进核Fisher的故障诊断

2.1 类间距的改进

在很多研究情况下,类间距离存在很大差异,通常计算类间离散矩阵B如式(2)所示,计量类间差异的权重仅仅是依据不同类别样本数在总体样本中所占比例计算,但是在实际情况中,会出现有部分类距离其他类别很远,但是有些类别的间距很小,容易出现类间差异较小的类信息被差异较大的类信息覆盖的情况,导致故障分类效果不佳。

为解决上述问题,在原先的核Fisher判别中,保证类内离散度不变,重新定义映射后类间离散度,与Dai等[28]一样,采用Euclidean距离的函数来对类间距进行加权。重新定义的类间离散度如下

式中,为第类和第类的平均值;d为第类和第类的类间距离,如式(8),权重函数(d)为关于d的一个函数。

(8)

式中,k1,i2=〈(x1),(x2)〉,k1,j2=〈(x1),(x2)〉,k1,j1=〈(x1),(x1)〉。

文献[28]中,权重函数定义为(d)=d−q(∈,≤3),即权重与类间距离呈反比。一般取3~10。

2.2 故障分类的改进

将任意一个原始故障数据样本=[1,2, …,x]T经过核Fisher判别投影后得到投影向量=[1,2, …,y]T(≤),同样第类组均值x经过投影后得到投影向量=[,, …,]T。传统的判别方法通过计算两个投影向量之间的欧式距离来判断故障类别,即:若

欧式距离虽然简单易用,但缺点明显,将样本的不同属性间的差别等同看待,这一点有时不能满足实际需要。而马氏距离不受量纲影响,可以排除不同变量间的相关性干扰,能计算样本与不同总体间的相似性,因而更适合用来判断故障类别。

2.2.1 马氏距离 分别计算待判样本到每一个类别的马氏距离,则该样本点属于马氏距离值最小的那一类。

具体判别规则如下:

虽然通过马氏距离能够有效且快速地对大多数故障样本进行准确分类,但是对于不同类别边界上的数据归类仍然存在较大的错误率,归类模糊。因此考虑使用-NN算法来对样本进行归类。

-NN算法根据与待判样本最邻近的个样本来决定归类,具有很好的分类能力。但是-NN算法本身也存在一些不足:①-NN算法需要存储全部训练样本,具有繁复的距离计算量;②-NN算法没有考虑距离远近,当样本不平衡时,可能导致待判样本直接归入大数量类的类别,从而导致误判。针对以上两点,提出了相应的改进措施:①仅仅针对占少量的边界样本采用-NN算法,其余大多数样本仍然采用马氏距离来判别;②采用加权的方法来改进-NN算法,将距离因素考虑在内,提升判断的准确率。

2.2.2 改进-NN 具体做法如下:

(1)找出边界点。求出待判样本距离每个类别的欧式距离dis1, dis2, …, dis,按照距离由小到大排序为dis'1, dis'2, …, dis',边界判别标准如下

式中阈值参数是一个(0,1)间的小数。当满足式(9)时,认为待判样本属于边界点。

(2)针对确定为边界点的待判样本点,求出距离待判点最近的个样本点1,2, …,z到待判点的距离dis1, dis2, …, dis。设函数(dis)=1/dis,表示和待判样本点距离小的邻近点权值大,这与加权的初衷相吻合。记这个样本点属于个类别G1,G2, …,G,该待判样本属于样本点加权和最大的类。判别准则如下:若

2.3 故障诊断算法的具体步骤

经过对传统的核Fisher方法的改进,能够很大程度地提高故障诊断正确率,具体的算法步骤如下:

(1)采集原始故障数据,对原始数据进行归一化处理,并将处理后的数据分为两部分:训练集和测试集。

(2)将训练集输入改进类间距的核Fisher方法中,用交叉验证法优化选取RBF核函数的参数。

(3)输入测试集,根据式(9)判断测试数据是否为边界点。

(4)如果测试数据不是边界点,则采用马氏距离来判断该数据的故障类别。

(5)如果测试数据是边界点,则用改进后的-NN算法来判别该数据的类别属性。

3 故障诊断的实验及分析

本研究依托于田纳西-伊斯曼过程来验证算法的正确性。TE过程是伊斯曼化工公司创建的一个真实工业过程仿真,该过程作为各种统计数据分析算法的数据源,得到了广泛的认可与运用。TE过程包括5个主要过程单元:反应器、冷凝器、压缩机、分离器、汽提塔。该过程包含12个控制变量,41个观测变量,20个类型的典型故障,文献[29]对其有详细描述。

3.1 实验1:数据归类模糊的故障诊断实验

在文献[30]中提到,有3种典型的故障类别(故障4、故障9、故障11),其原始观测数据空间重叠严重,各类别之间具有很强的非线性,如图1所示。

同时,在文献[30]中经过实验证明,特征9和51与输出故障类型间具有很高的互信息值,对区分故障类别能提供很多的有用信息,而且选用特征{51,9},所建的故障诊断模型简单,因此本研究选择特征{51,9}来对故障4、9、11进行区分。

对于故障4、9、11每一种类型,各自选用两组数据:训练集和测试集,各自包含400个样本。即训练集共400×3个样本,测试集共400×3个样本,且每个样本包含2个特征,特征51和9。

采用传统的核Fisher对训练集进行投影,投影效果如图2所示(为方便观看,每类故障仅画了100个样本的投影情况)。

由图2可以看出,3类故障数据的投影间距较均匀,没有出现混叠现象,主要是投影边界点处点存在归类困难问题。

针对上述采集到的故障数据,输入训练集共1200个样本,测试集共1200个样本,采用标准的核Fisher对样本进行投影,采用马氏距离对所有样本进行故障分类,表1显示的是随着核参数的变数,训练集和测试集的故障诊断准确率的变化。

表1 不同核参数δ的故障诊断结果

通过表1可以看出,随着核参数的增大,从0.01到100,测试样本的故障诊断正确率并不是随的变化呈递增或递减的关系,很难找出最优的。目前对于核参数的选取并没有统一的标准,在常用的参数选择标准中,本研究采用的交叉验证法能得到的一个较优值。

对故障数据采用标准的核Fisher对样本进行投影,用马氏距离结合改进-NN的方法来进行故障诊断。经过交叉验证法选取核参数的平方取0.08。表2显示的是随着边界判断阈值的变化,训练集和测试集的故障诊断准确率的变化。

表2 不同阈值ε的故障诊断结果

通过表2可以知道,当阈值0.1≤≤0.6时,随着的增大,训练样本的准确率由93%提高到95.83%,测试样本的准确率由91.67%提高到92.83%,准确率均有明显增大。但是当超过0.6以后,测试样本的准确率不再上升,始终保持着92.83%的准确率,说明对于>0.6的投影数据,用改进的-NN方法并不能有效提高故障诊断正确率,反而会增加诊断时间,如图3所示。

从图3可以看出,随着阈值的增大,越来越多的测试样本投影后采用改进的-NN算法来归类,花费的时间越来越长,=0.6时,仅需要0.21 s,而当=140时,即几乎所有的测试样本投影后都用改进的-NN算法归类时,需要将近3 s。最重要的是,当≥0.6后,测试精度基本都是92.83%,不再增大。通过以上分析可知,当取0.6时,在保证分类精度达到最大的同时,保证测试时间最短。

将训练集和测试集通过核Fisher投影后,将投影样本分别用传统的欧式距离(method 1)、传统的-NN算法(method 2)、马氏距离结合改进的-NN算法(method 3)进行分类,得到的训练精度和测试精度见表3。

表3 不同方法的故障诊断结果

通过表3可以看出,用马氏距离结合改进的-NN算法能显著提高核Fisher投影后的分类效果,优于传统的分类效果,无论是训练样本,还是测试样本,都提高了故障诊断正确率。

前面都是采用核Fisher方法对样本进行投影,下面采用改进类间距的核Fisher方法对样本进行投影,得到取不同值时的投影图像如图4所示,并用马氏距离结合改进的-NN算法进行故障分类,得到训练样本和分类样本的诊断精度见表4。

从表4可以看出,随着的增大,训练精度和测试精度都几乎不变。另外,改进类间距的核Fisher方法跟仅用核Fisher投影得到的诊断精度也相差不多。换言之,改进类间距几乎不影响实验1数据的投影结果,从图4(a)、(b)也可以看出这一点。而上述结论的得出也符合理论分析,因为通过图2可以知道,实验1的3类故障数据本身经过核Fisher投影后,3类投影数据间距相差不多,不存在某些类信息被某类信息覆盖的情况,因此改进类间距对实验1数据几乎没有影响。

表4 不同q值的故障诊断结果

为了验证本研究所提方法的有效性,分别采用极限学习机(ELM)、支持向量机(SVM)、相关向量机(RVM)、本研究提出的基于改进的核Fisher方法(MKF)分别对数据集进行离线建模及故障诊断。其中,ELM模型选择Sigmoid函数为激活函数;SVM模型选择RBF函数作为核函数;RVM模型也选用高斯核函数;本研究提出的方法MKF,其中核参数的平方取0.12,边界阈值取0.6,权重函数参数取3。

不同模型的测试样本的故障诊断精度及诊断时间见表5。

表5 4种模型的故障诊断结果

通过表5可以看出,ELM模型测试时间最短,但是其测试精度是几种模型中最低的。本研究所提出的方法MKF在保证较短的测试时间的情况下,测试精度是最高的,体现了其优越性。

3.2 实验2:数据混叠的故障诊断实验

TE过程故障诊断,共有21种故障类型,这21个故障都是预先设定的,其中前7类故障类型均为阶跃的,选取其中的第3、4、5、7类故障作为研究对象,见表6。

表6 故障样本集描述

每一种故障类型,取两组数据,即训练数据和测试数据,每组数据各100个样本,每个样本由所有52个特征变量组成。训练集和测试集各包含400个样本。

对训练集样本采用核Fisher投影,得到的在第一、二特征轴上的投影图如图5所示,核参数取200。同样的对训练集样本采用改进类间距的核Fisher投影,得到的投影图如图6所示,核参数取100,权重函数参数取3。

通过图5可以看出,通过核Fisher投影,得到的故障3和5的投影信息互相掩盖,难以凸显二者的类间差异,不利于后续的分类。而在图6中,通过采用改进类间距的核Fisher投影,可以将故障3、5区分开来,增大两者间的类间距。

采用改进类间距的核Fisher投影(不同的值)、核Fisher投影,用马氏距离结合改进-NN算法对样本进行分类,得到的故障诊断结果见表7。

表7 不同方法的故障诊断结果

由表7可以看出,改进类间距的核Fisher投影分类方法明显比核Fisher投影分类方法要好,前者的训练样本和测试样本的诊断精度可以高达100%和99%,后者的诊断精度分别为95.25%和92.25%。

通过对比上述两个实验可以发现,本研究提出的方法因为引入了改进的类间离散度计算方法,对于故障样本3、4、5、7,投影后类间距离呈现很大差异性的样本,很好地改进了样本在投影空间的分布,更有利于故障的分类,而对于故障样本4、9、11,投影后类间距离差异性不大的样本,没有任何负作用。因而改进类间距的核Fisher方法对于类间距离存在很大差异性的实验样本具有良好的分类效果。

4 结 论

化工过程产生了大量的故障数据,这些故障数据呈现非线性特性,用传统的核Fisher方法进行投影后,部分故障样本的映射空间仍然会出现混叠现象以及类别边界上数据归类模糊问题,使分类效果不是很理想,本研究有针对性地提出了改进方法,改进后的核Fisher方法具有通用性,不仅适用于映射样本空间不同类别数据出现混杂的情况,而且适用于映射样本空间出现边界样本较多的情况。

改进的方法在TE平台上得到了验证。本研究提出的方法一方面因为引入了改进的类间离散度计算方法,使得样本数据在投影空间的区分度更加明显,更利于后续的故障分类。另一方面本方法改进了投影后故障样本的具体分类方法,通过引入边界阈值参数,有效分离出了边界样本点,通过改进-NN算法,大大提高了边界样本点的分类准确率,通过马氏距离与改进-NN算法的配合,不仅有效兼顾了测试样本的分类时间,而且保证较高的分类准确率。在本研究提及的方法中,核参数的选择方法有待做进一步的深入研究。

References

[1] LENNOX B, HIDEN H G, MONTAGUE G A,. Application of multivariate statistical process control to batch operations[J]. Computers and Chemical Engineering, 2000, 24(2/3/4/5/6/7): 291-296.

[2] 文成林, 吕菲亚, 包哲静, 等. 基于数据驱动的微小故障诊断方法综述[J]. 自动化学报, 2016, 42(9): 1285-1299. WEN C L, LÜ F Y, BAO Z J,. A review of data driven-based incipient fault diagnosis[J]. Acta Automatica Sinica, 2016, 42(9): 1285-1299.

[3] 李晗, 萧德云. 基于数据驱动的故障诊断方法综述[J]. 控制与决策, 2011, 26(1): 1-9, 16. LI H, XIAO D Y. Survey on data driven fault diagnosis methods[J]. Control and Decision, 2011, 26(1): 1-9, 16.

[4] 于春梅, 杨胜波, 陈馨, 等. 多元统计方法在故障诊断中的应用综述[J]. 计算机工程与应用, 2007, 43(8): 205-208. YU C M, YANG S B, CHEN X,. Survey of multivariate statistical methods for fault diagnosis[J]. Computer Engineering and Applications, 2007, 43(8): 205-208.

[5] 张可, 周东华, 柴毅, 等. 复合故障诊断技术综述[J].控制理论与应用, 2015, 32(9): 1143-1157. ZHANG K, ZHOU D H, CHAI Y,. Review of multiple fault diagnosis methods[J]. Control Theory & Applications, 2015, 32(9): 1143-1157.

[6] 苏中鲜. 基于数据驱动的工业过程故障诊断方法综述[J]. 软件导刊, 2016, 15(3): 149-150. SU Z X. Review of fault diagnosis based on data-driven in industry process[J]. Software Guide, 2016, 15(3): 149-150.

[7] SCHOLKOPF B, MIKA S, BURGES C J C,. Input space versus feature space in kernel-based methods[J]. IEEE Transactions on Neural Networks, 1999, 10(5): 1000-1016.

[8] HU W P, HU H F. Heterogeneous face recognition based on modality-independent kernel Fisher discriminant analysis joint sparse auto-encoder[J]. Electronics Letters, 2016, 52(21): 1753-1755.

[9] FRANCK D. A one-class kernel fisher criterion for outlier detection[J]. IEEE Transactions on Neural Networks and Learning Systems, 2015, 26(5): 982-994.

[10] BO L F, WANG L, JIAO L C. Feature scaling for kernel fisher discriminant analysis using leave-one-out cross validation[J]. Neural Computation, 2006, 18(4): 961-978.

[11] VAN GESTEL T, SUYKENS J A K, LANCKRIET G,. Bayesian framework for least-squares support vector machine classifiers, Gaussian processes, and kernel Fisher discriminant analysis[J]. Neural Computation, 2002, 14(5): 1115-1147.

[12] VOLKER R. Kernel Fisher discriminants for outlier detection[J]. Neural Computation, 2006, 18(4): 942-960.

[13] JIANKE Z, STEVEN C H H, MICHAEL R L. Face annotation using transductive kernel Fisher discriminant[J]. IEEE Transactions on Multimedia, 2008, 10(1): 86-96.

[14] LIU Q S, LU H Q, MA S D. Improving kernel Fisher discriminant analysis for face recognition[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2004, 14(1): 42-49.

[15] SANG W L, ZEUNGNAM B. Representation of a Fisher criterion function in a kernel feature space[J]. IEEE Transactions on Neural Networks, 2010, 21(2): 333-339.

[16] WON K J, SAUNDERS C, PRÜGEL-BENNETT A. Evolving Fisher kernels for biological sequence classification[J]. Evolutionary Computation, 2013, 21(1): 83-105.

[17] 祝志博, 宋执环. 故障分离——一种基于FDA-SVDD的模式分类算法[J]. 化工学报, 2009, 60(8): 2010-2016. ZHU Z B, SONG Z H. Fault isolation: an FDA-SVDD based pattern classification algorithm[J]. CIESC Journal, 2009, 60(8): 2010-2016.

[18] SHI H T, LIU J C, WU Y H,. Fault diagnosis of nonlinear and large-scale processes using novel modified kernel Fisher discriminant analysis approach[J]. International Journal of Systems Science, 2016, 47(5): 1095-1109.

[19] 李锋, 王家序, 汤宝平, 等.有监督不相关局部Fisher判别分析故障诊断[J]. 振动工程学报, 2015, 8(4): 657-665. LI F, WANG J X, TANG B P,. Fault diagnosis method based on supervised uncorrelated local Fisher discriminant analysis[J]. Journal of Vibration Engineering, 2015, 8(4): 657-665.

[20] 王晶, 刘莉, 曹柳林, 等. 基于核Fisher包络分析的间歇过程故障诊断[J]. 化工学报, 2014, 65(4): 1317-1326. WANG J, LIU L, CAO L L,Fault diagnosis based on kernel Fisher envelope surface for batch processes[J]. CIESC Journal, 2014, 65(4): 1317-1326.

[21] 赵旭, 阎威武, 邵惠鹤, 等. 基于核Fisher判别分析方法的非线性统计过程监控与故障诊断[J]. 化工学报, 2007, 58(4): 951-956. ZHAO X, YAN W W, SHAO H H,. Nonlinear statistical process monitoring and fault diagnosis based on kernel Fisher discriminant analysis[J]. Journal of Chemical Industry and Engineering(China), 2007, 58(4): 951-956.

[22] 苏祖强, 汤宝平, 刘自然, 等. 基于正交半监督局部Fisher判别分析的故障诊断[J]. 机械工程学报, 2014, 50(18): 7-13. SU Z Q, TANG B P, LIU Z R,. Fault diagnosis method based on orthogonal semi-supervised local Fisher discriminant analysis[J]. Journal of Mechanical Engineering, 2014, 50(18): 7-13.

[23] MIKA S, RATSCH G, WESTON J,. Fisher discriminant analysis with kernels[C]// Proceeding of the IEEE International Workshop on Neural Networks for Signal Processing, 1999: 41-48.

[24] 彭陈松. 基于核函数Fisher判别的数据分类算法研究[D]. 杭州: 浙江理工大学, 2011. PENG C S. Data classification algorithm based on kernel Fisher discriminant[D]. Hangzhou: Zhejiang Sci-Tech University, 2011.

[25] 王炜, 郭小明, 王淑艳, 等. 关于核函数选取的方法[J]. 辽宁师范大学学报(自然科学版), 2008, 31(1): 1-4. WANG W, GUO X M, WANG S Y,On the method of kernel-function selection in support vector machine[J]. Journal of Liaoning Normal University (Natural Science Edition), 2008, 31(1): 1-4.

[26] 武优西, 郭磊, 柴欣, 等. 基于优化算法的核函数参数选择的研究[J]. 计算机应用与软件, 2010, 27(1): 137-140. WU Y X, GUO L, CHAI X,. On parameter selection of kernel function based on optimisation algorithm[J]. Computer Applications and Software, 2010, 27(1): 137-140.

[27] 张翔, 肖小玲, 徐光祐, 等. 一种确定高斯核模型参数的新方法[J]. 计算机工程, 2007, 33(12): 52-53, 56. ZHANG X, XIAO X L, XU G Y,A new method for determining the parameter of Gaussian kernel[J]. Computer Engineering, 2007, 33(12): 52-53, 56.

[28] DAI G, YEUNG D Y, QIAN Y T. Face recognition using a kernel fractional-step discriminant analysis algorithm[J]. Pattern Recognition, 2007, 40(1): 229-243.

[29] DOWNS J J, VOGEL E F. A plant-wide industrial process control problem[J]. Computers and Chemical Engineering, 1993, 17(3): 245-255.

[30] 吕宁, 于晓洋. 基于二阶互信息特征选取的TE过程故障诊断[J]. 化工学报, 2009, 60(9): 2252-2258. LÜ N, YU X Y. Fault diagnosis in TE process based on feature selectionsecond order mutual information[J]. CIESC Journal, 2009, 60(9): 2252-2258.

A fault diagnosis method based on improved kernel Fisher

MA Liling, XU Fafu, WANG Junzheng

(College of Automation, Beijing Institute of Technology, Beijing 100081, China)

A fault diagnosis method of kernel Fisher projection was proposed to solve issues of nonlinear data, complex classes, and difficult fault-diagnosing in chemical processes. The proposed method provided a uniform solution for partial sample mix-up induced by a large difference in category distances and nebulous classification of different category’s boundary data after projection of the original data sample. First, an improved category distance was used to change sample distribution in the projection space so that the sample had a good projection. Then, boundary data was screened out by a defined threshold parameter and classified by improved-Nearest Neighbor (-NN) algorithm, which none-boundary data was classified by Mahalanobis distance. Simulation in a TE process showed that training accuracy was increased by 2.25% and testing accuracy was increased by 2.41% in the first experiment, whereas training accuracy was increased by 4.75% and testing accuracy was increased by 6.75% in the second experiment. Therefore, the method improved both fault diagnosis time and accuracy.

kernel Fisher; fault diagnosis; improved-NN algorithm; experimental verification; optimizing

10.11949/j.issn.0438-1157.20161000

TP 277

A

0438—1157(2017)03—1041—08

国家自然科学基金项目(61503027)。

2016-07-14收到初稿,2016-11-23收到修改稿。

联系人:徐发富。第一作者:马立玲(1974—),女,博士,副教授。

2016-07-14.

XU Fafu, bitrenqq@sina.com

supported by the National Natural Science Foundation of China (61503027).

猜你喜欢

投影故障诊断距离
基于包络解调原理的低转速滚动轴承故障诊断
解变分不等式的一种二次投影算法
基于最大相关熵的簇稀疏仿射投影算法
找投影
找投影
算距离
数控机床电气系统的故障诊断与维修
每次失败都会距离成功更近一步
因果图定性分析法及其在故障诊断中的应用
爱的距离