自组织特征映射网络在故障诊断中的应用
2011-01-22陈忠一
李 鹏 ,陈忠一
(1.91550部队 92分队,辽宁 大连 116023;2.大连海事大学 轮机学院,辽宁 大连 116023)
自组织特征映射网络在故障诊断中的应用
李 鹏1,陈忠一2
(1.91550部队 92分队,辽宁 大连 116023;2.大连海事大学 轮机学院,辽宁 大连 116023)
运用自组织特征映射神经网络的工作原理和具体实现算法进行故障诊断分析,在对已有神经网络聚类分析方法概括和总结的基础上,结合实验数据、仿真数据对自组织特征映射算法故障模型诊断进行研究,得出了有意义的结论。
数据挖掘;神经网络聚类;自组织特征映射;特征提取
实时监测设备运行状况,在运行参数发生变化时及时报警并提示操作人员进行检查,对于保障设备的正常运行具有重要的意义。传统的故障诊断方法一般都是采用基于知识的故障诊断系统,以领域专家和操作人员的启发性主观经验知识为基础,经过产生式推理和演绎推理来获得大量的规则,从而获得诊断故障原因和部位。但由于基于知识的故障诊断系统不具有学习功能,知识的获取途径只有通过专家或操作人员总结经验获取,从而制约了其进一步的发展[1,2]。
神经网络是模拟人脑结构开发的一种并行运算的数字算法,由输入层、输出层和隐层组成,可以用来建立输入输出之间复杂的映射关系。由于具有良好的记忆联想功能,因此在故障诊断领域得到了广泛的应用。但是传统BP神经网络只能用于确定性关系的学习,不能处理矛盾样本,而故障诊断系统中的数据有些具有一定的离散性,因此需要将输入层的确定性信息模糊化之后变成模糊量,将传统神经网络变为模糊神经网络,将与故障运行参数相对应的隶属度数值作为输入,从而使神经网络系统更加适合设备故障状态的描述。
1 自组织映射算法
1.1 拓扑机构与权值调整
1981年KOHONEN T教授提出一种自组织特征映射 SOFM(Self-Organizing Feature Map),又称为 SOM网或Kohonen网。他认为当一个神经网络接受外界输入模式时将会分为不同的对应区域,各区域对输入模式具有不同的响应特征。SOFM网共两层,输入层模拟感知外界输入信息的视网膜 ,输出层模拟做出响应的大脑皮层。输入层各神经元通过权向量将外界信息汇集到输出层的各神经元。输出层属于竞争层,神经元的排列有多种形式,如一维线阵、二维平面阵和三维删格阵。输出按照二维平面组织是SOFM网最典型的组织方式,结构如图1所示。SOFM网采用的学习算法是在“胜者为王”算法基础上改进的,主要区别在于调整权向量与侧抑制的方式不同。SOFM学习算法中不仅获胜神经元本身要调整权向量,其周围的神经元在其影响下也要不同程度地调整权向量。权向量的调整函数称为墨西哥帽函数。由于该函数的复杂性,在实际中采用较为简化的大礼帽函数或厨师帽函数来处理。
1.2 学习算法
SOFM网采用的学习算法称为Kohonen算法,按如下步骤进行:
(1)初始化。对输出层各权向量赋小的随机数并进行归一化处理,得到,j=1,2,…,m;建立初始优胜邻域Nj*(0),学习率 η 赋初始值;
(2)接受输入。从训练集中选取一个输入模式并进行归一化处理,得到,p∈{1,2,…,P};
(4)定义优胜邻域Nj*(t)以j*为中心确定t时刻的权值调整域,一般初始邻域Nj*(0)较大,训练过程中Nj*(t)随训练时间逐渐收缩;
(5)调整权值。针对优胜邻域Nj*(t)内的所有节点调整权值:
其中,η(t,N)是训练时间 t和邻域内第 j个神经元与获胜神经元j*之间的拓扑距离N的函数。该函数一般有以下规律:t↑→η↓,N↑→η↓;
(6)结束检查。训练结束是以学习率η(t)是否衰减到0或某个预定的正小数为条件,不满足条件则回到步骤(2)[3,4]。
2 自组织映射算法在故障诊断中的处理
2.1 理论依据
任何聚类算法的参数对聚类结果都具有直接的影响,当考虑高维数据的时候,合理的降维是一个很重要的方面,降维应该遵循一定的方法。在算法中处理高维数据时将更高维密集单元的搜索限制在子空间密集单元的交集中,这种候选空间的确定采用基于关联规则挖掘中的先验性质,该性质在所有空间中利用数据项的先验知识以裁减空间。采用的性质是:如果数据在k维单元是密集的,则它在k-1维空间上的投影也是密集的。也就是说,给定一个k维的候选密集单元,检查它的k-1维投影单元,如果发现任何一个不是密集的,则知道第k维的单元也不是密集的[5]。由此进一步得出结论,如果聚类的某一维是密集的,则它对于整个k维聚类也是可用的,否则,在整个k维数据聚类中不起作用。把这一关联规则挖掘中的性质应用到故障特征属性的降维中。
SOFM的数据压缩和特征抽取的功能,将高维空间的样本在保持拓扑结构不变的条件下投影到低维空间,在高维空间中很多模式的分布具有复杂特性,但当映射到低维空间后,由于维度和节点数量(从多维对象映像到二维的神经网络节点)的降低,其规律很明显。
2.2 算法
2.2.1 预处理:选择合适的维参与映射
自组织特征映射网络聚类是模型聚类的一种,其自组织学习过程也可以描述为:对于每一个网络的输入,只调整一部分权值,使权向量更接近或更偏离输入矢量,这一调整过程,就是竞争学习。随着不断学习,所有权向量都在输入矢量空间相互分离,形成了各自代表输入空间的一类模式,这就是自组织映射网络的特征自动识别的聚类功能。每个故障模式参数样本作为聚类的一个“典型”,可以根据新对象与哪个参数样本最相似(基于某种距离计算方法)而将其分派到相应的聚类中。被诊断设备状态可以由一系列的特征参数来描述,一旦设备出现某个故障或多个故障,其状态特征参数也会发生相应的变化。因而,特定的特征参数值反映了相应的设备故障。在故障诊断领域,当设备处于故障状态时,将特征参数呈现出的特定取值称之为故障征兆,即不同的故障征兆对应着不同的故障类型;通常,设备的故障类型不止一种,因此用故障域来表述设备可能出现的多种故障类型,用征兆域来表述可能出现的多种故障征兆。由此可见,可以认为故障诊断即进行由征兆域到故障域的模式识别,或是由征兆域到故障模式的具有联想能力的判别分类[6-8]。
需要指出的是,文本型数据转换以后应该作为分类数据来处理。一般,在聚类过程中,如果分类维和密集维表示的是非空间属性中不同特征的某个方面,包括太密集的数据或者太分散的数据,都不适合进入聚类,如果不是作为分类数据,则太集中的数据不会对聚类产生影响,只会增加处理的时间。而太分散的数据会对聚类结果产生不良的影响。但是对于表示同一特征的不同维来说,有些维是密集的,有些维不是密集的,因此需要在这些维中选择合适的维进行聚类。
2.2.2 诊断实例
在故障诊断分析应用中,用户应该根据聚类的目的先选择一些候选维,准备参与聚类。取X1~X10作为征兆参数,在系统中各自参数点具有不同特点,在发生可能的故障时,它们的变化范围和方向各不相同,对征兆参数进行归一化处理,如表1所示。
表1 发射分系统故障样本特征参数值
应用自组织特征映射网络来模拟模糊聚类故障诊断的全过程,应用Matlab工具箱进行编程,根据故障样本,利用newsom创建网络的竞争层为 6×6的结构,网络结构是可以调整的,可以根据数据规模进行调整,然后输入样本p(如表1参数值进行训练),利用函数 train和函数sim对网络进行训练,并对故障样本进行模糊聚类。由于训练步数大小影响着网络的聚类性能,分别设置 100、200 和 500 步对网络进行训练,观察性能[7,8];选用聚类效果较好的训练步数为500步的网络,利用自组织特征映射网络选取聚类数目为6类,应用训练数据对网络进行训练,保存网络参数的训练结果,以及训练数据的离散结果,然后利用训练后的网络对测试数据进行离散化处理,即可得到离散化结果,如图 2所示,可见6种故障模式分别占据不同区域,可作为故障诊断故障基准。
竞争层输出的不同的神经元代表了不同的故障类型,系统某种故障与标准样本的故障类型越相似,在竞争层上的兴奋神经元的几何位置也就越接近。模拟某电子设备的典型故障,试验中选取了5个故障样本,经模糊量化后得到待检故障模式,如表2所示。
表2 模糊量化后的待检故障模式
将其输入到已训练好的SOFM神经网络,在竞争层中出现了图3的分类结果。第1组故障样本输出的几何距离Di最接近故障形式A,表明该故障形式为末级组件电路故障;同理,可判断第2组故障样本的故障形式为激励产生故障;第3组和第4组故障样本的输出分别与D和B的位置重合,表明第3组和第4组故障样本的故障形式分别为PIN开关故障和前级组件电路故障;第5组故障样本的输出最接近F,表明该故障形式可能为馈线故障。诊断结果与仿真机模拟的故障一致。
模糊聚类分析是依据客观事物间的特征、亲疏程度和相似性,通过建立模糊相似关系,对客观事物进行分类的数学方法。用模糊聚类分析方法处理带有模糊性的聚类问题更客观、灵活和直观,且计算更加简便。实践表明,它突破了常规逻辑推理方法的局限,在很少先验知识的情况下,能快速而准确地解决故障诊断问题。
[1]杨军,冯振声,黄考利,等.装备智能故障诊断技术[M].北京:国防工业出版社,2004:119-122.
[2]何青,张海岩,张志.基于 C8051F的便携式多通道数据采集系统[J].仪器仪表学报,2006,27(6):140-141.
[3]WANG X,ILTON H.DBRS:a density based spatial clustering method with random sampling[C].Proceedings of the 7th PAKDD.Seoul,Korea,2003:563-575.
[4]TROST B,L IANG M.Mechanical fault detection using fuzzy index fusion[J].International Journal of Machine Tools&Manufacture,2007(47):1702-1714.
[5]CZESLAW T K,TERESA O K.Neural networks application for induction motor faults diagnosis[J].Mathematics and Computers in Simulation,2003(63):435-448.
[6]程昌银,李琳.模糊神经网络故障诊断研究[J].武汉理工大学学报,2002,24(1):220-225.
[7]罗志勇.雷达系统智能故障诊断技术研究[D].西安:西北工业大学,2006.
[8]PAKKANEN J.The evolving tree,a new kind of self-organizing neural network[C].Proceedings of the Workshop on Self-Organizing Maps,Kitakyushu,Japan,2003:311-316.
Fault diagnosis based on self-organizing feature map
Li peng1,Chen Zhongyi2
(1.PLA91550 92 Unit,Dalian 116023,China;2.Marine Institute of Dalian Maritime University,Dalian 116023,China)
In this paper,the theory and algorithm of SOFM are considered.And on the basis of analysis and summary of current neural network clustering,researches in algorithms of self-organized mapping with some experimental data of simulation,at last gets several meaningful conclusions.
data mining;neural network clustering;self-organized feature map;feature extraction
TP182
A
1674-7720(2011)02-0116-03
2010-08-26)
李鹏,男,1978年生,工学硕士,主要研究方向:无线电测量与控制,电子设备故障诊断。