基于改进BP网络的IVC故障模式识别
2013-12-10苏州高博软件技术职业学院谷慧娟
苏州高博软件技术职业学院 谷慧娟
IVC(Individually Ventilate Cages),又称为独立通风笼盒,是目前国际上普遍使用的实验动物饲养系统[1,2]。在我国,IVC被引入国内之前,通常采用独立屏障系统来饲养实验动物。但是,由于实验动物饲养要求的特殊性,其对饲养环境的高要求使得传统的独立屏障系统在实际使用过程中,需要饲养人员人为地做大量工作来保证其符合基本要求,不但耗费人力物力,效果也并不是太好。
国内的技术人员结合国内实际情况,对引进的产品进行了二次开发,改良了一部分的性能,使其适用于国内使用环境。开发的方向主要集中在两方面:
(1)故障报警模块的开发。特别是利用日益发展的3G网络实现远程报警和控制。
(2)针对通风系统的故障问题自动识别模块的开发。识别方法主要包括故障树、人工神经网络等。
本文主要介绍针对通风系统的故障问题的自动识别。
1.故障模式识别模型
IVC是一个密封的系统,虽然有较为完善的过滤系统,但空气中的微尘,动物自身携带的粉尘和国内主要使用的垫料、食物中的粉尘微粒等仍然容易引起通风系统的堵塞。一旦通风系统不能正常工作发生故障,密封笼盒内的气流速度、内外压差、噪音、相对湿度、温度、氨气浓度等参数指标就会发生改变,达不到实验动物饲养环境的要求,对医学实验结果的正确性也有影响。
IVC系统中,由于包含生物生理活动这样一个不确定因数,常规的故障树等故障诊断方法难以实现对其故障类型的准确判断。而神经网络作为一种自适应的模式识别技术,不需要预先给出有关模式的经验知识和判别函数,而是通过自身的学习机制自动形成所要求的决策区域。并且环境发生改变的时候,通过学习而得到的映射关系还可以自适应地进行调整。神经网络的这些特性,决定了它适合用于系统模型比较复杂,环境多变的场合。因此,对IVC的故障模式识别采用基于人工神经网络的识别方法更合适。
表1 测试结果
图1 误差变化曲线图
1.1 标准BP网络
误差逆传播网络(Error Back-Propagation network.,简称BP网络)是人工神经网络中,理论最成熟,运用最广泛的网络模型之一。
基于梯度下降的标准BP算法,最突出的优点是寻优具有精确性,且具有自学习能力,但同时存在易陷入局部极小、初始值对网络结果影响大和引起振荡效应等缺点。虽然近年来提出不少改进方法,一定程度上提高了BP网络在实际应用上的可行度与准确度,但是仍然无法解决BP网络所固有的易陷入局部的问题。
1.2 基于遗传算法的改进BP网络
遗传算法(Genetic Algorithm,简称GA)是一种基于自然选择和群体遗传机理的搜索算法[3]。它模拟生物在自然环境中的遗传和进化过程,形成的一种自适应全局优化概率搜索算法,不存在局部收敛问题[4,5]。由于遗传算法的寻优过程是随机的,带有一定的盲目性和概率性,所以遗传算法具有难以得到精确解的缺点。
可见,BP算法和遗传算法各有利弊,并且优缺点呈互补性,可以用遗传算法对BP模型进行改进,利用遗传算法的全局搜索能力,优化解空间,再发挥BP算法的局部搜索能力强的优势,找出最优解。本文提出应用基于遗传算法的改进BP算法来实现对IVC故障诊断,以满足IVC故障模式识别对实效和精度的高要求。
2.基于遗传算法的改进BP模型的IVC故障模式识别
2.1 模型的初步确定
网络的输出是IVC故障的四个类型,包括进风过滤网膜轻微堵塞、出风过滤网膜轻微堵塞、进风过滤网膜严重堵塞、出风过滤网膜严重堵塞4种。网络的输入是发生故障时被影响的参数,考虑到样本的相关性和冗余性,本系统选择氨气浓度、气流速度、内外压差、相对湿度四个量作为网络的输入。因此,对应的网络输入神经元个数为4个,输出神经元也为4个,隐含层神经元个数通过调试最终确定为7个。
2.2 模型参数的确定
选择适合的编码方式是遗传算法的关键。将参数编码成对应的子串,再将各子串首尾相联,构成染色体,每条染色体代表解空间的一个解。不同的编码方式对遗传算法的求解精度和收敛速度有一定的影响。本系统根据权重、阀值的特点,采用二进制编码方式。BP模型为4-7-4结构,包括56个权重,11个阀值,共67个参数,每个参数用8位二表示,联起来形成一条染色体,长度为536。
目标函数唯一的条件是:针对输入可计算出能加以比较的非负结果。因此,系统的目标函数采用网络误差平方和函数,表达式为:
其中E(i)为网络误差平方和,i为染色体数,j为学习样本数,k为输出层节点数,Yk为输出层输出,Tk为训练目标值。
适应度函数反映个体对问题环境的适应能力的强弱,是个体竞争的测量准则,它可以很好的控制个体的生存机会。误差越小,个体的适应度应越高。系统的适应度函数f(i)选择目标函数的倒数,表达式为:
种群规模影响遗传优化的最终结果和遗传算法的执行效率。种群规模过小,会导致优化性能降低;种群规模过大,会减少遗传算法陷入局部最优解的机会,但是会导致过大的计算量。考虑最优解所占空间在整个问题空间中的分布范围,本系统设定种群规模P=70。
经过实验对比,确定网络的学习速率lr=0.05,变换函数取logsig,交叉概率Pc=0.25,变异概率Pm=0.05,最大进化代数为250。
3.仿真结果与分析
将真实状态下,IVC系统故障发生时记录下的数据作为初始样本集,将这些样本做归一化处理,并进行冗余分析,剔除冗余项,保证样本空间无重叠。将处理好的样本的70%作为训练样本集,剩下的30%作为测试样本集,分别对网络进行训练和测试。训练结果见图1。
可以看出,基于标准BP网络的训练,需要经过66步才能收敛于目标函数0.00001,而基于遗传算法的改进BP网络的训练仅需要18步,大大缩减了训练的时间。
测试结果见表1。可明显看出:
(1)改进后的BP网络,收敛率达到95.7%,一定程度上克服了标准BP网络易出现振荡效应的缺点;
(2)改进后的BP网络,正确识别率可以达到92.4%,相比标准BP网络70.2%的正确识别率,识别的准确性有了很大的提高,减少了陷入局部极小的可能性,基本上可以达到实际应用所要求的误差范围要求;
(3)改进后的BP网络,识别时间缩短,能更好地满足本系统对实效性的要求。
可见,基于遗传算法的改进BP网络,能更好地对IVC进行故障模式的识别,并且能达到实际应用中对实效和精度的要求,可以解决目前制约IVC在国内广泛应用的问题。
[1]Krohn TC.Method developments and assessments of animal welfare in IVC-systems[M].Printed by DSR Gra fi k,2002,5.
[2]柯贤福,陈文文等.四种独立通风笼具(IVC)的检测[J].中国比较医学杂志,2009,19(9):78-82.
[3]王德明,王莉等.基于遗传BP神经网络的短期风速预测模型[J].浙江大学学报(工学版),2012,46(5):437-842.
[4]Li Weiqing,Wang Chengbiao,etal.An edge detection method based on optimized BP neuralnetwork[J].International Symposium on Information Science and Engineering,2008(2):40-44.
[5]K.P.Ferentinos,L.D.Albright.Fault Detection and Diagnosis in Deep-trough Hydroponics using Intelligent Computational Tools[J].Biosystems Engineering,2003,84(1):13-30.