北斗监测站故障诊断专家系统设计及实现
2018-08-23孙守航
厉 剑,孙守航,张 杰
(中国人民解放军61769部队,黑龙江 哈尔滨 150039)
0 引言
北斗监测站是北斗地面运控系统的重要组成部分,及时解决监测站运行过程中出现的各种故障,确保监测站的可靠运行,对提高整个北斗系统服务质量具有重大现实意义。目前,监测站故障诊断主要由值勤人员根据自己的专业知识和经验进行人工故障诊断与定位,存在故障诊断时间长、诊断结果对值勤人员专业素质依赖性比较大等问题。
故障诊断专家系统能够模拟领域专家推理过程进行故障诊断及定位,并给出故障处置方案,实现设备故障诊断的自动化和智能化[1]。随着人工智能和信息处理技术的发展,故障诊断专家系统在机械电力、交通运输和航空航天等领域有着广泛的应用[2-4],并创造了巨大的经济效益。目前常用的故障诊断专家系统主要有基于规则的故障诊断专家系统、基于实例的故障诊断专家系统以及基于人工神经网络的故障诊断专家系统等[5]。文献[6-10]介绍了基于故障树分析法的故障诊断专家系统设计方案,本文在此基础上,结合监测站设备工作原理,对故障树知识表示方法和推理机设计进行了改进,通过为故障树节点设置故障判断规则索引的方法,缩小了推理机的知识搜索范围,大大提高了推理机的工作效率。
1 总体设计
为了提高系统故障诊断速度,增强故障诊断的实时性,监测站故障诊断系统采用故障树分析法与专家系统相结合的故障诊断方法。其工作原理为:首先根据监测站设备故障排查方案,建立监测站设备故障树知识库及故障判断规则库,用于进行故障推理及故障定位。故障诊断专家系统通过局域网自动获取故障特征值,并根据故障树知识库及故障判断规则库进行故障推理和故障诊断,并将故障推理过程和故障判断依据通过人机交互界面提供给值勤人员。
根据故障诊断专家系统工作原理[11],将系统分为故障特征值获取模块、故障监测模块、故障诊断模块、参数设置模块以及数据库读写模块。故障诊断专家系统总体结构如图1所示。
图1 故障诊断专家系统总体结构
故障特征值获取模块通过监测站局域网自动获取监测站设备故障特征值,用于故障监测及故障推理;故障监测模块通过遍历故障特征值中的故障标志,实现对监测站设备状态的实时监测;故障诊断模块是整个故障诊断专家系统的核心模块,主要实现监测站设备故障诊断,并向值勤人员提供故障推理过程、故障判断依据以及故障情况处置预案等信息,为值勤人员进行故障处置提供辅助决策支持;参数设置模块主要对故障诊断专家系统的知识数据库进行编辑和修改以及基本参数的设置;数据库读写模块用于系统数据库的管理和操作,为系统其他模块读写数据库提供统一的接口和操作方法;知识数据库用于存储故障树知识及故障判断规则,用于故障推理和判断;综合数据库用于存储监测站设备故障特征值,为设备故障推断提供数据。
2 知识表示方法及知识数据库实现
专家系统运用知识来进行推理和判断,合理的知识表示方法是进行准确判断的重要前提。知识表示应满足以下2点要求:利于推理机的推理和方便存储[12]。知识表示方法主要有产生式规则表示法、框架表示法、面向对象表示法和神经网络表示法等,其中产生式表示法和框架表示法是目前较为常用的2种方法[13]。
2.1 基于故障树的知识表示方法
故障树分析法是一种评价复杂系统可靠性与安全性的重要方法,把系统最不希望发生的事件作为故障树的顶事件,找出导致这一不希望事件所有可能发生的直接因素和原因,并由此逐步深入分析,直到找出事故的基本原因,即故障树的底事件为止[14]。
基于故障树技术的故障诊断专家系统进行故障诊断时,推理机首先根据故障现象定位到故障树某一节点,然后遍历该节点所有的底事件,并根据各底事件的故障规则表达式判断该底事件是否发生故障。根据推理机工作原理,监测站故障诊断专家系统采用框架和规则相结合的方法来进行知识的表示,利用框架来表示监测站故障树结构,利用规则来表示故障树底事件的故障判断方法。
用故障树表来存储故障树结构及相关信息,故障树的每个节点对应一个框架,每个框架包括故障树编号、故障树名称、所属系统、父事件、故障判断规则、故障等级、故障现象和故障处置流程等属性。将每个框架的上述属性作为一条记录存储在知识数据库中形成框架表。推理机进行故障推理时,可以根据故障树表中的上述属性进行故障树的遍历以及故障树各节点判断规则的索引。例如,对于如图2所示的故障树,可以用表1所示的故障树表进行表示。
图2 故障树示例
表1 故障树表(部分属性)示例
序号故障ID父节点故障判断规则1A01NULLNULL2A11A01R013A12A01NULL4A21A12R02&R035A22A12R04
用规则库表来存储故障树底事件的故障判断规则。规则库表中每条记录对应1条产生式故障判断规则,利用规则库表中的1条或者几条规则可以对故障树底事件的故障进行判断。故障判断规则库表如表2所示。
表2 故障判断规则库表(部分属性)
规则ID变量名1变量名2运算符1运算符2门限值R01接收信号强度NULLNULL>-105R02理论方位角实际方位角->0.5
对于规则R01,其判断规则表述为:如果接收信号强度大于-105,则判定该故障发生;对于规则R02,其判断规则表述为:如果理论方位角与实际方位角之差大于0.5,则判定该故障发生。
2.2 知识数据库设计及实现
故障诊断专家系统知识数据库E-R模型如图3所示。
图3 故障诊断专家系统知识数据库E-R模型
为方便知识数据库的设计及管理,将知识数据库用3个相关联的知识表表示,分别为故障监测表、故障树表和规则库表。知识数据库3个知识表及综合数据库之间的相互关系如下:
① 根据故障现象在故障监测表中获得故障节点编号;
② 根据故障节点编号对故障树表进行检索,获得该故障节点的相关信息,对该故障树遍历,获得该故障树所有底事件的故障判断规则索引;
③ 根据故障判断规则索引对规则库表进行检索,获得该底事件的故障判断规则表达式;
④ 根据故障判断规则表达式中的变量名称对综合数据库进行检索,获得该变量名对应的故障特征值。
3 推理机设计及实现
推理机是故障诊断专家系统的核心模块,其工作原理是根据当前已知的事实,利用知识库中的知识,按一定的推理策略进行推理,从而求得问题的答案或证明某个假设的正确性[15]。故障诊断专家系统能够高效地求解复杂的问题,除了拥有大量的专业知识外,更重要的是能够合理选择及有效运用知识。推理机要解决的问题是如何在问题求解过程中选择和运用知识。
3.1 推理机设计
监测站故障诊断专家系统采用正向推理方法进行故障推理,即根据监测站故障现象,通过遍历该故障树,寻找故障原因(底事件)[16]。
监测站故障诊断专家系统推理机工作原理如图4所示。
图4 推理机工作原理示例
在设计中,采取以下措施提高推理机的故障诊断效率:
① 为故障现象设置故障树位置索引。通过为故障现象设置故障树位置索引,确保每次遍历的故障树为导致顶事件发生的最小割集,从而避免推理机对与该事件无关的故障树节点进行遍历,在不影响故障诊断正确率的前提下,有效地减少推理机故障诊断时间。
② 为故障树底事件设置故障判断表达式。通过为故障树底事件设置故障判断表达式,可以有效地减少推理机在故障推理时对规则库的搜索和匹配时间。推理机在进行故障诊断时,只需判断底事件的对应故障判断规则是否成立就可确定该节点是否发生故障,而不需要对整个规则库的搜索和匹配,也不需要知识冲突消解,因此可大大减少故障推理时间。
3.2 推理机工作流程
推理机主要根据当前故障特征值进行故障诊断及定位,并向值勤人员提供故障判断依据以及故障情况处置预案等信息。推理机进行故障诊断时,首先将最新的故障特征值更新至综合数据库中,然后对故障树进行遍历,并通过判断当前综合数据库中的故障特征值是否满足故障判断规则,实现监测站设备的故障诊断及故障定位。根据推理机工作原理,推理机工作流程可分为故障树的遍历和利用故障判断规则进行故障判断两部分。
3.2.1 故障树遍历
在故障树知识库中,故障树信息是以表格的形式存储的,而故障树的表现形式是树形结构,因此在设计中,推理机采用递归调用的方法实现故障树所有节点的遍历,具体方法如下:
① 根据故障现象的故障树位置索引,获取故障树的入口;
② 故障树知识数据库中搜索以该编号为父事件的节点。如果不存在这样的节点,说明该编号对应的节点为底事件,获取该节点的故障判断表达式进行故障判断,确定该节点是否发生故障;如果存在这样的节点,则说明该编号对应的节点为中间事件,将新的中间事件编号设置索引值,重复上述步骤。
在图4示例中,推理机首先获取故障现象的故障树位置索引A01,然后在故障树知识数据库对父事件为A01的节点进行检索,得到节点A10和A11,再分别以A10和A11为索引值对故障树知识数据库进行检索,检索结果没有以A10和A11为父事件的节点,则说明节点A10和A11为底事件,利用底事件A10和A11的判断规则进行故障判断,得到本次故障诊断结果。
3.2.2 故障判断
在故障树知识库中,每个底层事件节点都有对应的故障规则表达式,用于判断该节点是否发生故障,底层事件节点故障判断具体方法如下:
① 获取底层事件节点对应的故障规则;
② 根据故障规则表达式中规则ID对规则数据库进行检索,获得该条规则的数学表达式;
③ 根据规则数学表达式中的变量名称,在综合数据库中获取该变量名称对应的故障特征值;
④ 将故障特征值代入规则数学表达式中,判断该表达式是否成立,如果成立,则说明当前故障特征值符合故障判断规则,该底层事件节点存在故障,否则说明设备正常;
⑤ 如果故障规则表达式由多条规则组成,需要首先对规则表达式进行解析,将其分解成多个规则和规则运算符,然后重复步骤③和步骤④,得到每个规则的逻辑计算结果,将上述逻辑结果代入故障规则表达式中得到该底事件节点的最终结果。
在图4示例中,需要对底事件节点A10和A11进行故障判断。对于节点A10,其故障判断规则为R01,通过检索规则库获得其数学表达式VAR1-VAR2>0.1;再根据表达式中的变量名称通过检索综合数据库获得故障特征值,将故障特征值代入规则R01数学表达式,其计算结果为真,说明满足故障成立条件,则节点A10发生故障。对于节点A11,其故障判断规则为R02&R03,是由多条规则组成的故障判断规则。首先对其进行解析,分解成规则R02和R03,重复节点A10故障判断过程,得到规则R02计算结果为真,R03计算结果为假,利用故障判断规则表达式中的逻辑运算符(&)对这2个结果进行运算,得到最终该节点的最终规则运算结果为假,即该节点设备运行正常。
推理机具体工作流程如图5所示。
图5 推理机工作流程
4 应用结果及分析
根据故障诊断专家系统总体设计方案,对系统各模块进行详细设计,完成软件开发,并将系统部署在监测站局域网内进行功能测试和验证。应用结果证明,系统能够自动获取故障特征值实现故障自动诊断和准确定位,并将故障诊断依据和故障处置预案等信息通过人机交互界面提供给值勤人员,为值勤人员进行快速故障处置提供决策支持。故障诊断专家系统故障诊断界面如图6所示。
图6 故障诊断专家系统故障诊断界面
与传统故障诊断专家系统相比,北斗监测站故障诊断专家系统具有以下优点:故障诊断自动化、智能化程度高,系统能够自动获取故障特征值,根据知识数据库中故障树信息及故障判断规则进行故障推理和定位,不需要任何人工干预即可完成故障诊断;故障诊断速度快,通过对知识表示方法以及推理机的优化设计,解决了当专家系统知识库比较庞大、知识间关系比较复杂时,易出现知识“组合爆炸”和推理中“匹配冲突”的问题,大大缩小了推理机的知识搜索范围,提高故障诊断效率。
5 结束语
本文介绍了一种基于故障树分析方法的北斗监测站故障诊断专家系统设计方案,并对知识表示方法、知识数据库实现以及推理机设计等方面进行了详细介绍。北斗监测站应用结果表明,系统能够自动获取故障特征值,在不需要人工干预的情况下,实现监测站设备故障的实时在线诊断及准确定位,具有故障诊断速度快、自动化和智能化程度高等优点,改变了目前北斗监测站主要依靠人工进行故障诊断的现状,将故障诊断时间由15 min左右缩短至1 min之内,有效地缩短了故障处置时间,从而减小设备故障对系统造成的影响。