APP下载

基于故障树的电力IMS业务故障诊断专家系统研究应用

2018-08-29缪巍巍吕顺利蒋承伶吴海洋毛润宇

计算机与数字工程 2018年8期
关键词:知识库运维故障诊断

缪巍巍 吕顺利 蒋承伶 吴海洋 毛润宇

(1.国网江苏省电力公司 南京 210024)(2.南瑞集团公司(国网电力科学研究院) 南京 210003)

(3.上海普坤信息科技有限公司 上海 201203)

1 引言

电力通信网是为了保证电力系统的安全稳定运行而应运而生的。它同电力系统的继电保护及安全稳定控制系统、调度自动化系统被人们合称为电力系统安全稳定运行的三大支柱。随着电力通信业务及网络技术的快速发展,电力通信软交换逐渐向IMS演进[1~2],IMS在电力通信专网中得到推广应用,IMS业务系统可靠性成为影响着电力生产安全的重要组成部分。电力IMS业务故障受网络复杂性及电力业务特殊性的制约,IMS核心网和接入网耦合度也较高,故障诊断的难度较大,当发生故障时,对有些故障恢复的操作是分秒必争的,如电力调度、安稳自动化等业务等。然后由于维护人员的能力和水平限制,当发生复杂、复合、规模故障时,仅仅依靠运维人员判断是很难达到快速恢复要求的,而且容易由于误操作等导致故障延误甚至扩大的风险[3]。本文旨在充分运用专家多年积累的有效经验和专门知识,通过模拟专家的思维过程,解决需要专家才能解决的问题,提出基于故障树的IMS业务故障诊断专家系统方法,并给出故障处理流程,结合故障处理知识库,协助运维人员进行故障处理。

2 专家系统和故障树分析

2.1 专家系统

专家系统(Expert System)产生于20世纪60年代中期,是一种在特定领域中具有专家水平解题能力的智能系统,能运用领域专家多年积累的经验与专门知识,模拟专家的思维过程,最适合用来解决需要依靠大量知识和经验才能解决的问题。

专家系统属于人工智能的一个发展分支,自1968年费根鲍姆等人研制成功第一个专家系统DENDEL以来,专家系统获得了飞速的发展,并且运用于医疗、军事、地质勘探、教学、化工等领域,产生了巨大的经济效益和社会效益。现在,专家系统已成为人工智能领域中最活跃、最受重视的领域。

国内外学者对专家系统做了大量的研究,文献[4]给出了基于知识网格的故障诊断专家系统模型,文献[5]开展了基于故障模式分析的运载火箭发射决策系统推理技术研究,文献[6]设计了基于故障树分析的核动力装置实时智能故障诊断专家系统,文献[7]阐述了基于模糊推理的分布式电力系统故障诊断专家系统的研究和实现,文献[8~11]给出了专家系统及数据分析挖掘在电力通信网络业务可靠性方面的研究应用。

IMS业务系统的正常运行以及故障处理过程包含一系列复杂的动态多元、非线性、数据量庞大的事件,IMS业务运维人员如能第一时间对业务系统故障和隐患准确判断并及时处理,可以大大减少故障处理时间,迅速恢复业务系统的正常使用,保证电力生产安全有序的进行。为解决上述问题,使普通运维人员都能具有IMS业务故障诊断领域专家的水平,充分利用故障诊断专家多年积累的知识和经验,需以IMS业务故障诊断过程为研究对象,研究设计IMS业务故障诊断专家系统。

专家系统最重要的是知识获取和推理能力,借助故障树分析可以解决知识获取的瓶颈,也有助于实现高效准确的推理机制,故将故障树分析技术引入专家系统是一个有效的方法。

2.2 故障树分析

故障树分析(Fault Tree Analysis,FTA)技术是美国贝尔电报公司的电话实验室于1962年开发的,是安全系统工程中最重要的分析方法。近年国内外学者对基于故障树的诊断分析做了大量的研究,文献[12]开展了故障树分析法在电力变压器可靠性跟踪方面的研究,文献[13]系统阐述了动态故障树的理论和方法,文献[14]结合故障树分析相关理论,并从定性、定量两个方面展开探讨,给出了智能变电站故障诊断的多个实例和成效,文献[15]从系统故障角度出发,提出了一种基于故障判明时效比的故障树诊断方法,对故障诊断方法做了一定的改进。

故障树分析从一个可能的故障开始,自上而下、一层层地寻找顶事件的直接原因和间接原因事件,直到基本原因事件,并用逻辑图把这些事件之间的逻辑关系表达出来,特点是直观、明了,思路清晰,逻辑性强。这种方法既能分析软、硬件本身的故障影响,又能分析人为、环境等的影响,不仅能对故障产生的原因进行定性分析,找出导致系统故障的原因和原因组合,确定最小割集,识别出系统的薄弱环节及所有可能的故障模式,还能进行定量计算,根据各已知最小单元的故障分布及发生概率,求得最小割集重要度,明确诊断流程及优先级。

本文提出的基于故障树分析的故障诊断专家系统如图1所示。

图1 基于故障树的故障诊断专家系统结构

3 IMS业务故障诊断专家系统

3.1 IMS业务故障树知识库的构建

1)故障树构建

考虑到IMS系统及业务特点,故障树模型主要采用与、或门构成;顶事件代表某个IMS业务故障,比如无法建立连接、通话异常中断等,用T表示;底事件代表IMS某个最小的单元故障,比如IAD故障、话机故障、核心网线路故障、呼叫信息错误等,用X1、X2等来表示;中间事件指未充分拆解的故障原因,比如核心网故障、接入网故障、接入网网络故障等,用M1、M2等来表示。通话异常中断的IMS业务故障树模型如图2所示。

图2 IMS通话异常中断故障的故障树模型

2)最小割集求解及重要度分析

最小割集(minimal cut set)是可靠性统计的基本概念之一,最小割集中的部件都失效,即会使系统失效。最小割集囊括了分析系统的全部故障原因,描述了系统最薄弱的环节,是故障诊断需要把握的重点和关键。而顶事件的发生概率则定量刻画了系统发生故障的可能性。

为了快速确定系统故障原因,需要计算出分析模型中顶事件及最小割集的发生概率,采用下行法求解最小割集,并由底事件发生的概率求得故障树的所有最小割集和顶事件的发生概率。

针对图2的故障树模型,采用下行法求解最小割集,从顶事件开始,逐层拆解,遇到或门就拆解为并列写出,遇到与门就串行写出,最后需要进行约减,可得到最小割集,分别为:{K1:IAD故障},{K2:话机故障},{K3:接入网交换机故障},{K4:接入网线路故障},{K5:IAD参数错误},{K6:呼叫格式错误},{K7:主SBC故障,备SBC故障},{K8:主CSCF故障,备CSCF故障},{K9:主HSS故障,备HSS故障},{K10:核心网交换机故障},{K11:核心网线路故障},{K12:限制名单},{K13:呼叫信息错误},{K14:会话信息错误},{K15:无配置}。

设某最小割集K{X1,X2,…,Xn}中包含n个底事件,且各底事件之间是相互独立并且不相容的,则最小割集概率PK可由底事件发生概率的积来求得:

顶事件发生概率可利用最小割集来计算,设已知故障树包含m个相互独立最小割集Mi,计算公式为

为直观地表述最小割集对顶事件发生所做的贡献,定义最小割集重要度PMT如式(3)所示:

针对图2的故障树,采用下行法求解最小割集,得到最小割集及其重要度排序,如表1所示。

从表1可知,割集排序重要性由高到低为:K2>K14>K15>K12>K5>K13>K11>K6>K4>K7>K3>

K10>K1>K8>K9,确定最小割集及其重要度之后,即可以明确诊断流程及诊断顺序。

表1 下行法求解最小割集

3.2 模糊推理知识库的构建

故障树模型由事件和门构成,门即是事件之间的相互关系,与门、或门都有输入和输出事件,模糊推理规则库是根据输出事件的发生及检测参数来更新各输入事件的重要度。推理规则如式(4)所示:

若仅考虑故障树结构,则输入事件的重要度是固定的,未考虑实际运行中动态变化情况,较为呆板、不灵活;引入模糊推理知识库后,可充分利用运行及故障维修过程中的检测的相关数据,提高推理的智能性和准确性,根据检测参数的不同,及时调整推理策略,推理路径短,效率高。

3.3 故障处理知识库的构建

对运维专家的故障处理经验进行积累和沉淀,形成故障处理知识库,再有类似故障发生,则可以快速给出处理的措施和方法。故障处理知识库采用规则库形式存储,IMS业务故障知识主要包括IMS业务系统发生故障的原因、故障的解决方案、发生该故障的置信度等信息,因此,结合故障信息领域的知识特点,采用产生式表示法来表示故障知识。

IF(条件),THEN(动作,结论)。只要IF后面的条件或者事实成立,就可以得到THEN后面的动作或结论,如式(5)所示:

故障知识库的建立采用基于产生式规则的知识表示方法,IMS故障知识库的建立包括对事实库和规则库的简历。在建立事实库时,故障知识需要按照专家提供的IMS故障字典的分类逐一添加入库,放入不同的故障类型表中。规则库是知识库的一个重要组成部分,进行推理的基础就是知识库中用规则表示的知识。

对规则库的规则建立要求遵循两个原则:

1)规则应尽可能最简化;

2)规则之间不能够有冲突存在。

根据以上步骤和要求,结合IMS系统自身的实际运行需要,利用已获知的故障知识,分别建立规则表和事实表,如表2、表3所示。

表2 故障处理知识库规则表

表3 故障处理知识库事实表

4 IMS业务故障诊断流程及应用

结合某省公司的IMS业务故障及检修情况,给出基于本文提出的业务故障诊断专家系统的故障诊断流程及验证结果。

4.1 故障诊断流程

故障诊断流程包含三个主要步骤,步骤一完成故障树及知识库的构建;步骤二通过专家系统对当前故障进行诊断,输出诊断报告;步骤三基于诊断报告产生案例到故障处理知识库,并根据维修和检测情况更新模糊推理知识库。

步骤一包括:

1)搜集数据,并依据业务专家、经验积累及实际要求,建立故障树知识库;

2)确定故障树底事件概率,建立初始的模糊推理知识库;

3)建立初始的故障处理知识库。

步骤二包括:

1)基于故障树和知识库对当前故障进行诊断;

2)输出诊断报告,给出故障处理建议。

步骤三包括:

1)产生案例到故障处理知识库;

2)通过维修和检测情况更新模糊推理知识库。完整的诊断流程如图3所示。

图3 专家系统故障诊断流程

4.2 故障诊断专家系统的实现及验证

基于本文给出的方法,设计实现了基于故障树的电力IMS业务故障诊断专家系统。借助故障树知识库、模糊推理知识库、故障处理知识库可以使该专家系统实现灵活的知识获取和强大的推理能力。针对电力IMS网络运行中遇到的大多数业务故障均给出了处理建议,对于部分参数配置类的错误可由系统自动检测和修复,对于硬件故障等也给出了维修建议,极大提高了故障的发现及处理效率。借助模糊推理知识库和故障处理知识库,使得该专家系统具备自动更新完善的能力,也是业务故障诊断更加准确、高效。

该省电力公司IMS业务故障诊断专家系统试运行一年以来,运维故障记录统计分析显示,IMS业务故障的准确性提高了40%以上,处理效率提高了50%以上,显著提高了IMS网络承载的电力业务运行的可靠性。

5 结语

基于故障树的电力IMS业务故障诊断专家系统方法,结合IMS业务故障特点,借助故障树分析技术和专家系统的优势,实现了电力IMS业务故障诊断,并能给出具体的故障处理措施和建议;同时由于模糊推理知识库及故障处理知识库拥有自我学习和完善功能,可使故障诊断越来越准确、高效。

仿真结果和实际应用效果均表明,相较于传统的人工故障诊断方法,基于故障树的电力IMS业务故障诊断专家系统方法能够准确、有效地定位故障,使运维人员能及时发现故障并快速解决,缩短运维人员故障处理的时间,提升了通信运维管理水平,确保重要电力业务安全稳定运行。

猜你喜欢

知识库运维故障诊断
比亚迪秦EV充电系统故障诊断与排除
高速公路智能运维平台
汉语近义词辨析知识库构建研究
基于包络解调原理的低转速滚动轴承故障诊断
基于BIM的供水管网智能运维管理系统设计
配电线路的运维管理探讨
江淮同悦纯电动汽车无倒档故障诊断与排除
我国联合虚拟参考咨询系统知识库现状研究*
——基于与QuestionPoint的对比
我国机构知识库建设中存在的问题及对策探研
位置与方向测试题