APP下载

系统级故障诊断综述

2014-07-28宣恒农赵冬苗春玲刘田田张润驰

电脑知识与技术 2014年17期

宣恒农 赵冬 苗春玲 刘田田 张润驰

摘要:该文对现有的系统级故障诊断算法按模型、诊断方式、诊断目标分别进行了分类,进而阐述了系统级故障诊断算法的近期主要研究成果,最后预测了该领域的未来研究方向与发展前景。

关键词: 系统级故障诊断;集团诊断算法;方程诊断算法;智能诊断算法

中图分类号:TP301 文献标识码:A 文章编号:1009-3044(2014)17-4153-03

A Summary of System-level Fault Diagnosis

XUAN Heng-nong, ZHAO Dong,MIAO Chun-ling, LIU Tian-tian, ZHANG Run-chi

(School of Information Engineering, Nanjing University of Finance and Economics, Nanjing 210046, China)

Abstract: In this paper, the system level fault diagnosis algorithm are classified according to the model,the existing diagnostic methods, the diagnostic target. and expounds the system level fault diagnosis algorithm of the recent main research results, finally forecasts the development direction of future research and the prospect.

Key words: System-level fault diagnosis; Group diagnosis algorithm; equation diagnosis algorithm; intelligent diagnosis algorithm

随着科技的高速发展,单个计算机的运算能力已经不能满足人们的需求,取而代之的是大规模计算机群。大规模计算机群已经运用于诸多领域,如军事、金融、天气预报、交通管理等,人们在享受大规模计算机群带来便利的同时,也承担着一定的风险,人们希望计算机群能够在长时间内稳定的工作,否则一旦计算机群发生故障将给人们带来及其大的损失,历史上这类的事件时常发生。为了能够提高计算机群的可用性和可靠性,同时减少投入的维护资金,系统级故障诊断在这样的需求下产生。与此同时测试结果的数据量也呈现爆炸式增长,如何从这些大量的数据中获得有用的信息,系统级故障诊断因此也和大数据联系了起来[1]。

系统级故障诊断方法是由Preparata,Metze和Chien在1967年首次提出[3],最初用来解决多处理机系统的故障诊断问题。系统级故障诊断的基本思想是:让系统中的节点机互相测试,通过对测试结果进行逻辑分析与判断,确定故障设备。经过了四十多年的发展,研究成果颇丰。

本文第一节对现有的各类系统级故障诊断算法按照不同的分类方法进行了分类,第二节重点分析了几个当前具有代表性的系统级故障诊断算法,该文在最后对系统级故障诊断的前景和研究方向进行了阐述和预测。

1 系统级故障诊断的分类

1.1按模型分类

系统级故障诊断问题是建立在模型的基础之上的。按照测试方式与故障症候的不同,故障模型主要分为以下四种:

其中“+”代表正常机,“-”代表故障机,“1”表示通过测试,“-1”表示不通过测试。

1.2按诊断方式分类

按诊断方式分类,人们将系统级故障诊断的方法分为集中式诊断和分布式诊断。

集中式诊断的实施条件是在系统中必须有一台计算能力较强并且相对可靠的计算机,系统产生的测试结果都要集中到该计算机,由该计算机判断系统中的故障节点。虽然该方法的判断结果相对来说比较准确,但是中心机的任务也相当繁重,不利于整个系统,因此该方法的适用度不高。

分布式诊断的基本思想是由Kuhl和Reddy等人于80年代初提出的,其主要含义为:系统中的结点获取自己需要的测试结果,然后进行自我的诊断。分布式诊断方法能够有效地解决集中式诊断方法的缺点,同时分布式诊断方法的效率较高,并且会极大的降低整个系统的负载。但是分布式诊断方法的问题在于它不能有效的对测试产生的结果进行分析和汇总。

1.3按诊断目标分类

按诊断目标分类,诊断算法可以分为确定性诊断算法和概率性诊断算法。

确定性故障诊断对于系统的要求是没有故障的结点能够绝对正确的测出被测结点的状态,因此会带来系统的开销比较大,同时确定性故障诊断要求故障结点的数目限制在一定的范围内。确定性故障诊断带来的优点是能正确的完成诊断任务。

概率性故障诊断与确定性故障诊断不同,它对于诊断没有要求做到绝对的正确,它只有求系统能够以比较高的概率进行诊断分析故障结点。由此可知,概率性故障诊断能够极大地降低系统的负荷,同时也没有了故障结点数目的限制。

2 系统级故障诊断的发展动态及相关成果

系统级故障诊断经过了这么多年的发展,研究成果颇丰。根据算法所用核心工具的不同,大致上可分为两类:一类是基于图论原理的故障诊断算法,另一类是基于人工智能的故障诊断算法。后者的思想是:结合现有的各类人工智能、群体智能等算法来确定系统中的故障结点。近几年的主要研究成果主要如下:

1)集团诊断算法

张大方等人结合图论诊断的相关原理,首次提出了集团诊断算法[5]。文献[5]第一次将图论中的极大独立点集理论与系统级故障诊断相结合,张大方等人基于集团的性质研究了系统级故障诊断的特征,详细阐述了基于集团的一步t-可诊断算法,同时也在文献中证明了该算法的正确性。集团算法的基本理论是:通过一定的运算,将系统中的状态相同的单元进行合并,然后对这些合并后的单元进行故障分析。由于进行了系统单元的合并,因此系统的规模将大大的降低。因为集团中的结点性质相同,在进行故障诊断的时候,只要确定集团中一个结点的性质,就可以得出该集团中结点是故障还是无故障。endprint