基于人工智能技术的不完备信息系统智能诊断方法研究
2018-09-19周
周
(四川文理学院智能制造产业技术研究院,四川达州 635000)
0 引言
随着计算机技术、通信技术和网络技术的不断发展,现代计算机系统朝着复杂化、自动化、智能化等方向发展,其系统结构逐渐复杂,性能要求逐渐提高[1]。然而当系统中的设备出现故障时,一些智能信息处理技术被用于准确定位系统的故障,并正确处理出现的故障。智能故障诊断是一个极其复杂的信息处理系统,主要借助信息采集和传输技术等,得到被测对象的大量数据信息。对于复杂系统而言,很多问题都是在信息不完备的条件下,利用各种方法与技术来做出决策的。所以故障智能诊断系统也应该能够在故障信息不完备的条件下,具有故障检测、诊断、处理的能力[2]。但在实际的故障诊断中,由于系统的复杂性,存在着故障征兆属性空缺、属性值丢失、属性值无从知道、属性值描述不确定、数据稀疏等不完备信息。所以许多学者对知识获取中数据所表现出的不完备进行了深入研究。文献[3]提出一种近似测度和删除空缺属性值方法,实现了不完备数据集的完备化处理;文献[4]提出了容差关系概念,给出不完备信息系统粗糙近似,获取决策规则;在此基础上,文献[5]提出了量化容差关系概念来刻画样本对象的相似程度;文献[6]提出了限制容差关系的概念,更加符合实际情况;文献[7]提出了基于联系度的拓展粗糙集模型;文献[8]进一步提出了具有加权联系度的拓展粗糙集模型;文献[9]研究了不完备信息系统的基于集对分析的粗糙集模型;文献[10]提出了基于全相容粒度的粗糙集模型;文献[11]提出了不完备信息系统相似类概念,用于挖掘关联规则;文献[12]利用确定属性值来替换具有相同的决策属性的值。然而这些处理方法也可能会使原始数据和经过处理获得的知识存在不同程度的失真等。针对这些情况,本文首先对原始数据进行完备化处理,再融合粗糙集、蚁群算法和径向基神经网络等人工智能技术的优势,提出一种不完备信息系统的故障智能诊断模型与方法。
1 不完备信息系统及其完备化处理方法
虽然复杂信息系统出现故障的种类多种多样,本文从复杂系统论来看,这些多种多样的故障在本质上具有不少的共性。因此通过分析归纳总结复杂系统的故障,具有以下特性:(1)故障的复杂性;(2)故障的层次性;(3)故障的相关性;(4)故障的延时性;(5)故障的不确定性;(6)故障的规律性。
对复杂信息系统故障诊断而言,空值存在的影响主要有:(1)丢失大量有用信息;(2)增加系统不确定性;(3)空值导致不可靠的输出。
为了提高故障诊断的正确性与效率,所以需要对不完备信息进行完备化处理。本文采用“条件组合补齐算法”将缺失的故障信息进行合理的补充。该方法是通过选取具有相同决策的实例相应属性所有取值试探,选择最好的一种情况,作为补齐的结果。
2 粗糙集理论和RBF神经网络
2.1 粗糙集理论
糙集理论是1982年提出的一种能够有效处理不精确、不确定与不完备等信息的新数学工具。它能能发现隐含知识,揭示潜在的规律的特点。经过30多年的发展,已在数据挖掘、模式识别、机器学习、智能控制、故障诊断等领域获得广泛的应用粗糙集理论的基本概念描述如下[13-14]。
定义1:一信息系统S=<U,R,V,F>,其中U是对象集合,C∪D=R是属性集合,子集C和D分别称为条件属性和决策属性。V=Ur∈RVr是属性的集合,Vr表示了属性r∈R的属性值范围,F:U×R→V是一个信息函数,它指定U中每一对象x的属性值。
定义2:一信息系统S=<U,R,V,F>,对于每个属性子集B⊆R,定义一个不可分辨关系Ind(B)为:Ind(B)={(x,y) ∈U2}。
定义3:一信息系统S=<U,R,V,F>,B⊆R,X⊆U,定义集合R-(X)= {x∈U:[x]IND(B)⊆X} 为X的B下近似集,R-(X)= {x∈U: [x]IND(B)∩X≠φ} 为 X的 B上近似集。
定义4:一信息系统S=<U,R,V,F>,A=CUD且B⊂C,定义D的 B正域 PosB(D)=∪ {B(X):X∈IND(D)}。
定义5:一信息系统S=<U,R,V,F>,A=CUD且B⊂C,B和D间的依赖度定义为:K(B,D)=card(PosB(D))/card(U)。
2.2 神经网络
人工神经网络 (ANN)是从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络[15]。本文采用具有数逼近能力、分类能力和学习速度等优点的RBF神经网络,其网络结构如图1所示。
从图1可知,RBF神经网络从输入到输出的映射为:
其中:x=(x1,x2…,xn)T∈Rn为输入矢量,W= (w1,w2…,wm)T∈Rm是权值,φ为径向基函数,f为输出,ci是RBF的第i个聚类中心。RBF神经元的传递函数有多种形式,但最常用的是高斯函数,即:
图1 RBF神经网络结构
影响RBF神经网络性能的参数主要是隐含层节点数及相应中心节点位置和宽度。因此需要进一步研究RBF神经网络参数优化问题。
3 基于蚁群算法优化神经网络参数
蚁群优化 (ant colony optimization,ACO)算法是一种典型的群智能算法[16]。ACO算法通过信息素的调整较好地控制了种群的多样性,具有较强的全局优化能力。因此充分利用蚁群优化算法的优点,对神经网络参数和学习规则进行优化处理,为提高RBF神经网络性能提供了一种新的途径。由于蚁群算法具有全局搜素能力,所以用蚁群算法优化网络隐含层,能提高RBF神经网络的性能。
基于蚁群算法优化神经网络参数和学习规则的步骤如下:
1)蚁群优化算法的参数初始化。
2)构造适应度函数:取为总失真的倒数:
3)蚁群优化算法寻优过程。
4)径向基函数中心和宽度:将蚁群优化算法所得的每一类都作为隐含层节点,分别求取径向基函数的中心(cj)和宽度():
5)隐含层到输出层权值的调整:用梯度下降法训练网络隐含层与输出层之间的权值。
4 基于粗糙集、蚁群优化算法和神经网络的故障智能诊断方法
本文将粗糙集理论、蚁群优化算法和神经网络引入到故障诊断中,充分利用粗糙集理论知识约简能力,蚁群优化算法的全局优化能力和RBF神经网络的自学习与知识获取的能力,提出一种基于粗糙集理论、蚁群优化算法和RBF神经网络相结合的智能故障诊断方法,其故障智能诊断模型,如图3所示。
图3 基于粗糙集、蚁群算法和神经网络的故障智能诊断模型
基于粗糙集、蚁群优化算法和神经网络的故障智能诊断模型的具体步骤如下。
Step 1:输入原始样本数据,即从关系数据库中随机读取历史故障样本信息。
Step 2:通过数据预处理,建立系统关系数据模型,形成原始故障信息的二维决策表。
Step 3:连续属性离散化:是在特定连续属性的值域范围内设定若干个离散化的划分点,获得若干个离散化区间,使用不同的符号来表示子区间的属性值。从本质看,就是对初始断点的选择与合并过程。
Step 4:属性约简:采用粗糙集理论对属性进行知识约简,以获得能够覆盖原数据特征的最小条件属性规则集。其属性的重要程度可以用公式 (6)和 (7)来计算[17]:
Step 5:启动蚁群算法,用于优化RBF神经网络;
Step 6:把粗糙集理论处理得到的具有最大完备度的最小规则集输入优化得RBF神经网络,训练得到RARNN模型;
Step 7:根据RARNN模型的诊断误差,判断是否满足要求。如果满足,转至Step 8,否则转至Step 4;
Step 8:将待诊故障信息输入RARNN模型,获得故障诊断的结果。
5 故障诊断模型的应用
5.1 数据来源
以电机子系统为例进行振动故障诊断[18],由于系统的复杂性,导致采集的数据有些存在一些缺失。U是论域,a~e是条件属性,分别表示信号频域特征频谱<0.5 f,0.5 f~0.6 f,1 f,2 f, ≥3 f的幅值分量能量。h是决策属性,表示发电机不同的故障,q分别对应油膜振荡故障、不平衡故障和不对中故障。本文选取实验部分数据进行研究。对采集的信号进行归一化处理后,构成不完备故障诊断决策表,如表1所示。
5.2 数据完备化处理
首先采用“条件组合补齐算法”将缺失的数据进行合理有效的完备化处理,获得完备化的故障诊断决策表,如表2所示。
5.3 数据离散化
离散化数据的连续属性,是为了使用不同的符号来表示子区间的属性值。这里采用通过模拟自然进化过程搜索
表1 不完备故障诊断决策表
表2 完备化的故障诊断决策表
最优解的遗传算法,在保持数据不可分辨关系的前提下,以最小断点集为目标,实现数据连续属性的离散化处理,获得离散化的故障诊断决策表,如表3所示。
表3 离散化的故障诊断决策表
5.4 属性约简
采用具有具有实现最大完备度的最小规则集的粗糙集理论,对离散化的故障诊断决策表。通过对原始样本决策表属性的计算,得到属性集 {a,c,d,e}对于原始样本决策表来说是重要的,并且可以证明 {a,c,d,e}是该决策表的最小约简。说明 {a,c,d,e}保持该决策表5个属性的分类能力,因此,{a,c,d,e}是该决策系统必不可少的4个属性。整理属性约简之后的决策表,合并相同规则,删除冗余的规则,获得能够覆盖原数据特征的最小条件属性规则集。
5.5 RBF神经网络的优化
采用具有全局寻优能力的蚁群优化算法,来优化RBF神经网络的基函数的中心、方差和隐含层到输出层的权值3个参数,获得3个参数组合的最优参数值,作为RBF神经网络的初始参数值;然后采用属性约简获得能够覆盖原数据特征的最小条件属性规则集训练RBF神经网络,以获得优化的RBF神经网络模型 (故障诊断模型RARNN)。
5.6 故障诊断验证
把采集到的待诊信息{(0.024,*,0.748,0.122,0.023), (0.015,0.055,0.483,* ,0.311)} 经过完备化和属性约简处理后,输入RARNN模型进行故障诊断,得到故障诊断结果:第一组数据是不平衡故障,第二组数据是不对中故障。
通过电机子系统故障诊断实例的分析可知,基于将粗糙集理论、蚁群优化算法和RBF神经网络相结合的故障智能诊断方法 (RARNN)能够正确诊断电机子系统的故障,并且该方法能快速收敛,具有较高的故障诊断正确率。
6 结语
本文利用“条件组合补充算法”进行了信息的不完备化处理,同时根据复杂系统故障诊断困难的特点,提出了基于将粗糙集理论、蚁群优化算法和RBF神经网络相结合的故障智能诊断方法。该方法通过复杂系统故障诊断实例,给出了该方法的应用步骤。通过仿真实验,结果表明故障智能诊断方法能够加速收敛,具有较高的故障诊断正确率。为其它设备故障诊断提供了一种新的思路。