组合多方法快速诊断卫星导航系统故障
2015-04-20刘晓萍吴晓莉孙伟杰董恩强黄双临
刘晓萍,吴晓莉,孙伟杰,董恩强,黄双临
北京卫星导航中心,北京,100094
组合多方法快速诊断卫星导航系统故障
刘晓萍,吴晓莉,孙伟杰,董恩强,黄双临
北京卫星导航中心,北京,100094
卫星导航系统功能多、结构复杂、集成度高,其故障具有复杂性、层次性、相关性、延时性和不确定性等特点。因此,当卫星导航系统在实际运行过程中出现故障,单一的故障诊断方法已远远不能满足故障诊断的需要。本文主要针对卫星导航系统故障诊断复杂性的现实需要,提出了一种多技术手段融合的卫星导航系统故障快速诊断技术,探讨了故障快速诊断推理过程,详细分析了故障诊断的知识获取、知识表示和诊断推理方法等快速定位故障中的一些关键问题,并利用COMPASS系统实际数据对该方法进行了试验验证。结果表明:该方法可以对复杂故障进行快速准确定位,从而有效提高系统故障诊断的效率,提升了系统故障诊断的智能化水平。
故障诊断;案例推理;案例匹配;相似度;状态监测
1 引 言
卫星导航系统是复杂的软硬件集成系统, 其故障具有复杂性、层次性、相关性、延时性和不确定性。系统某一局部的故障往往造成整个系统的中断或可用性下降,引发安全隐患和经济损失。
卫星结构的复杂性、运行环境的独特性和诱发故障的多源性,使卫星故障的诊断与预测较一般设备困难,单粒子翻转等因素会造成导航业务信息中断等问题。此外,灾害性空间天气事件、卫星内部软件运行异常等原因均会引起卫星导航业务信息中断。卫星发生故障后,就该星向用户提供的服务而言,可能产生三种结果:无法提供服务、服务性能下降、错误服务。卫星较长时间处于不可用状态是对卫星可用资源与寿命的浪费,也将降低系统提供导航定位服务的可用性[1]。
因此,对卫星导航系统故障进行快速诊断与恢复,既是保证卫星导航系统连续稳定运行,最大限度保证系统可用性的需要,也是充分利用卫星可用资源与寿命的需要。
由于故障模式多样、复杂,因此单一诊断模式已远远不能满足故障诊断的需要。为适应导航系统故障多样性要求,必须探索、应用新的诊断技术以适应系统要求。一方面,在实际诊断过程中,只有从多方面获得关于诊断对象的多维信息,才能对系统进行可靠、准确的诊断;另一方面,随着所获取诊断信息的增多,非常有必要引入和研究适用于卫星导航故障诊断领域的信息融合技术,充分挖掘信息的内涵,并对多诊断信息进行有效地融合利用,从而提高故障诊断的准确性、有效性和可靠性。本文融合6种诊断方法对卫星导航系统故障的快速诊断进行了研究,实现了卫星故障的快速诊断。
2 多方法组合的卫星导航系统故障诊断方法
智能诊断作为一种仿生诊断方法,为复杂系统的故障诊断提供了新的解决办法,也使诊断系统朝微型化、“傻瓜化”迈进。但是,每种智能诊断方法都有其优缺点,因此,研究融合智能诊断方法即如何把多种智能方法有机结合起来、取长补短,以提高诊断准确率显得十分必要。下面对智能诊断对卫星故障快速定位的应用进行分析。
2.1 故障模式与影响分析(FMEA)
FMEA是分析产品所有可能的故障模式及其产生的影响,并按每个故障模式产生影响的严重程度予以分类的一种归纳分析方法,是属于单因素的分析方法。FMEA是产品可靠性分析的一个重要的工作项目。其分析的目的是在早期发现产品的各种缺陷与薄弱环节,减少过多的晚期修改带来的损失,并采取有效的改进和补偿措施以提高其可靠性水平。
FMEA工作需提前至从方案设计一开始就进行,而不是局限在事后分析上。FMEA是以预防为主的可靠性分析手段,从根本上保证产品的可靠性。基于地面运控系统目前的设计方案:
(1)分析的产品层次
初始约定层次:地面运控系统。
约定层次:地面站,包括主控站、注入站、一类监测站、二类监测站。
最低约定层次:主控站的系统,监测站的设备。
(2)故障判据
故障判据:性能中的精度和参数更新周期指标,超出指标要求极限即为故障;发生无法实现系统功能的事件,都定义为故障。
地面运控系统能够实现规定的功能,按照指标要求实现导航系统日常运行维护即为正常。
(3)严酷度分类
所有故障影响将根据运控系统严酷度类别进行评估,结合地面运控系统特点,严酷度分类规定见表1。
表1 运控系统严酷度类别
严酷度类别故障影响I灾难的运控系统功能完全丧失,造成系统巨大损害,或使人员伤亡;II严重的运控系统功能丧失,任务失败,造成系统严重损坏,对人员伤害有严重威胁;III中度的运控系统功能明显下降,对系统造成一定的损害,对人员伤害有轻度威胁,甚至无威胁;IV轻微的系统功能有轻度下降,对系统未造成损害,对人员完全无害。
2.2 基于贝叶斯网络的故障数据挖掘技术
卫星导航系统运行过程中,可能出现的故障模式多样化,故障之间具有动态随机性和相关性。部分故障由于缺乏数据关联性,无法快速分离问题;无法通过综合的失效分析和针对业务能力的故障分析进行快速故障定位。这些特点给系统故障分析带来较多困难。因此,对系统运行管理、故障诊断和恢复等都提出了严峻的挑战。当故障发生时需快速进行故障定位,排除故障,缩短故障时间以保障北斗导航系统服务的连续性。
本文将贝叶斯网络结构故障树分析引入至卫星导航系统[2],为分析和解决复杂而繁琐的任务提供一个全新的视角和思路。该分析把系统看成一个大的开放的贝叶斯网络结构,将问题域中的节点(变量)当成一个子系统,在专家知识、先验信息、观测数据的相互作用和影响下,通过最大后验概率与最小描述的协调计算,得到一个最佳匹配的贝叶斯网络结构。这样,不仅有利于综合相关知识和信息解决计算复杂性的问题,避免主观偏见带来的片面性,而且还有机结合网络结构的精确性,使结构模型与数据实例达到最佳匹配。
提出和设计了卫星导航地面运控系统的贝叶斯网络结构学习算法。首先,基于样本数据和专家知识,通过互信息测度和条件独立性检验学习出一个无向图;其次,运用最大后验概率和最小描述长度的集成准则,确定节点之间连接的方向性;最后,通过相关的知识和规则,对有向无环图中的连接边和方向进行优化和调整,达到最佳匹配的网络结构模型。
为了进一步提高诊断系统的工作效率,根据对象系统和故障的层次性特点,确定层次诊断策略、合适的诊断粒度、浅知识和深知识有机结合等确定诊断力度。根据系统诊断的要求来进行,在满足诊断要求的前提下,使划分的“块”大一些,以降低工作量。
卫星出现导航业务信息中断问题,进行故障发现与确认的输入数据源主要包括:监测站观测数据、卫星遥测数据和主控站监测数据。
对监测站观测数据进行实时的数据判读与比对是发现卫星异常问题最有效可靠的数据源。每个监测站的监测接收机都可实时对其可视范围内的在轨卫星进行监测、测量,具有接收卫星导航电文,完成电文解析的功能。若在轨卫星出现异常问题、引起星地数据异常时,异常卫星可视范围内的多个监测站将在第一时间收到异常的星地数据。监测站的观测数据通过专用通道传送至地面运控监视管理分系统,管理分系统实时提取监测站观测数据,对其进行数据判读和比对。一旦发现多数监测站观测数据出现针对单星相同的中断、超差、不连续等现象时,即可发出报警信息,提示出现卫星异常问题。如星地时间同步中断贝叶斯网络故障树分析如图1所示。
图1 星地时间同步中断贝叶斯网络故障树
2.3 基于案例推理方法(Case Based Reasoning)
CBR是人工智能和故障诊断方法的一次新发展[3]。它规避知识和规则难以获取这一瓶颈,运用以前积累的经验直接求解问题,成为人工智能领域的一个研究热点。它是由目标案例的提示而得到历史记忆中的源案例,并由源案例指导目标案例求解的一种策略。在CBR中,知识单元是案例(case),合理的案例表达方式是CBR推理的基础和关键。其基本思路是:首先将已解决的故障做成案例并按照一定的格式存储于案例库,当有新的诊断任务时,程序依某一匹配算法检索案例库,若能匹配相关案例,则输出结果;如果不能匹配,则对该故障采取其他诊断方法进行处理,如专家会诊等,得到的诊断结果经规范化处理后,作为新的案例添加到案例库中去。
卫星故障模式多样、复杂,单一诊断模式已远远不能满足故障诊断的需要。为适应卫星故障多样性要求,必须探索、应用新的诊断技术以适应系统要求。
2.4 系统参数判断技术
卫星导航系统有多个系统,每个系统有上千个参数,这些参数按一定速率快速传到监视与控制分系统。由于参数太多,主要靠计算机程序来实现故障报警,报警方法有3类,具体如下。
2.4.1 参数门限判断技术
该方法是卫星管理中应用最早的方法,它的算法能及时发现参数的变化[4]。只要参数在给定的上、下限范围内,就表明系统工作正常,否则通过显示或声音报警。
参数门限判断方法的问题主要是参数的上、下限合理取值困难,这反映在2个方面:第一,当上、下限值相差较大时,不容易发现参数变化,只有当设备故障到一定程度,超过给定的上、下限值,才能报警,这样会错过故障处理时间,不利于系统缓变故障的发现;第二,当参数值本身变化较大时,判断门限不好掌握,无法正确报警。
2.4.2 参数相对值判断法
参数相对值判断法的结构与行为描述方法是,将诊断对象看成由一系列单个零件通过相互连接而构成,进而对这些零件的输入、输出进行行为描述,建立好结构与行为模型后即可预测系统的行为。将模型预测值与实测值相比较以获取异常征兆,然后利用这些异常征兆搜索那些可使预测模型与实测值相一致的各种可能行为的状态假设,对于每一个偏离指定正确行为的上述状态的假设被视为故障。该报警算法简单,只要超限报警门限设置合理,就能够及时发现系统出现的异常。2.4.3 参数关联判断法
当一个故障导致多个参数超限,将所超限参数都显示出来,会让使用人员无法正确判断故障源;或者地设备切换时,相应的参数会从发令前的值跳变至发令后的值,属于正常情况,如果在对参数变化进行判断时未考虑发令的影响,就会造成误判。因此,对数据的实时监测与比对也非常必要。在完成对数据的解析后,根据判定策略,对其进行数据判读和比对,一旦出现异常数据,及时发出提示信息。
2.5 卫星和地面站综合监视与控制技术
监视管理系统实时接收并处理地面系统的各类观测数据和定轨与时间同步软件的预处理数据,以图形化的方式显示与业务信息中断现象相关的监测接收机测量数据、星地时间同步上下行数据、导航电文、遥测信息、卫星钟差。结合地面接收机工况、规划设备工况、卫星任务规划、任务规划回执、测站预报等因素,对卫星导航业务数据综合状态进行实时监视,用于辅助人工判断,提高地面运控系统对故障判定的及时性和准确性[5]。
监视管理系统的数据库接收并保存重要数据、事件、控制指令,对故障前后数据、设备工况进行备份。支持对故障前后的数据进行事后分析和场景再现,帮助分析人员进行经验积累,对故障相关信息进行统计汇总。
2.6 故障模型扩展技术
针对系统的灵活性和扩展性要求,数据处理和监控分系统以目前已知的各种异常现象及故障为基础,设计并实现了具有一定扩展性的故障模型[6]。故障模型扩展性技术实现流程见图2。
图2 故障模型扩展性技术实现流程
故障模型的扩展性表现在:
①异常现象参数可修改。在故障模型库中可以配置每一种异常现象的多类阈值,包括参数报警阈值、时间阈值、概率和差值阈值等。可以根据情况调整和优化异常现象参数。
②故障定位策略可扩展。在故障模型库中,针对每一种故障,建立了可扩展的故障定位模型。通过配置,每一类故障的定位策略可以修改或新增,实现了卫星故障判断策略的可扩展,异常现象与故障的判定逻辑之间的关系可配置。在故障定位过程中,故障定位策略是从故障模型库中读取的,在故障模型库变化后,相关软件通过读取数据库,自动适应新的需求。
故障发现与定位软件的软件架构具有较好的可扩充性,可以加入新的异常现象判定模块,在整体架构不变的前提下,通过较少的代码修改,实现对新增异常现象的支持。将新的异常现象加入故障定位策略,只需通过配置故障模型即可实现,故障定位代码无需修改。
3 多方法融合诊断技术
综合考虑系统功能、效果和客观条件等各方面因素,本系统采用了故障模式与影响分析(FMEA)、卫星和地面站综合监视与控制、系统参数判断、基于贝叶斯网络的故障数据挖掘、故障模型扩展等技术、故障模式与影响分析(FMEA) 等技术相融合的混合智能诊断技术方案。
通过故障模式与影响分析(FMEA)技术、基于贝叶斯网络的故障数据挖掘技术进行系统故障关联性的深入分析,全面分析系统故障状态的原因,在实际应用中复杂的故障树结构函数会造成顶事件概率计算出现组合爆炸的问题,避免障树分析方法复杂、费时,并形成初步详细的诊断方法和策略。卫星和地面站综合监视与控制主要实现实时的监视与控制,发现系统参数异常等故障。根据故障诊断方法和策略,通过基于案例推理方法实现复杂故障的诊断。寻找一个类似的、成功的过去案例,并对其进行修改直至符合当前问题的需要。此方法克服了分析系统机理的费时工作,并且不需要人从故障实例中提取规则,降低了知识获取的负担,提高了故障诊断效率。
将基于案例的推理和多方法相结合应用于导航系统的故障快速诊断研究中,取长补短,从而使整个系统达到更高智能水平。
3.1 融合案例推理
在进行故障诊断过程中,根据系统故障产生的大致部位及故障现象情况,应用案例推理的方法进行诊断。如果从案例库中检索到相同或相似故障的故障案例,则按此案例的故障原因进行故障定位,若故障定位成功,则说明诊断成功,即可按照此案例的维护方案展开维护工作;否则,系统启动基于规则的诊断流程,使用由故障树获得的维修知识进行精确诊断,诊断成功后将此次信息增加到故障案例库,从而实现故障快速诊断和精确诊段。
一般来说,归纳为以下4个步骤:
①案例检索:与给定问题的特征相比较,将最符合的案例从案例库中检索出来;
②案例重用:将最符合案例的解决方案作为新问题的解决方案;
③案例修改:分析检索出案例与问题间的差异部分,运用领域知识对案例的解决方案加以修正,形成新的案例;
④案例学习:根据一定的策略,把新案例加到案例库中,当新的问题到来时,系统从案例库中检索出与新问题最相似的旧案例,如果旧案例和新案例完全一致,则采用旧案例的解决方案解决当前问题;否则,需要对相似案例进行修改,修改后的案例被添加到案例库中。
相似度匹配算法公式如下:
式中,i表示第i个匹配的关键特征;相似度[i]表示案例间第i个关键特征的相似度;权重[i]表示第i个关键特征的权重因子。
3.2 案例检索策略的基本思想
案例检索是故障快速诊断的核心技术,每个案例都是在导航设备使用或诊断实践当中的故障现象、原因以及排除过程与方法的积累和总结。不断丰富的案例形成系统诊断案例库,以方便系统诊断的查询和推理[7]。
每一个故障的发生都是由其内部机理决定的,因此可以根据系统的内部机理对所有故障案例进行合理分类。故障表现通常包括故障数据和故障状态。故障数据是对故障的定量描述,故障状态是对故障的定性描述,可以用它来确定当前案例所属的类别。因此,先根据目标系统的内部机理对故障案例进行合理分类,并在不同的案例集中分别计算权重向量;然后根据权重向量的差异大小(表明其重要的程度),生成案例集状态向量,并将当前故障状态向量与各个案例集状态向量相比较,确定当前故障案例所属的类别;最后,通过逼近全指标的故障状态匹配进一步缩小范围,采用改进的灰色关联度计算方法精确定位相似案例。案例检索流程图如图3所示。
图3 案例检索流程图
3.3 案例知识的获取
案例知识的获取可以采用以下几种方法:一是参考已有的故障资料和广泛征求专家的意见,从他们成功的故障判断和故障恢复经验中提取案例;二是一线工作人员与专家合作,根据具体故障特点,进行故障梳理,找出系统故障间的关联信息,确定最优故障定位方案,来获取新的案例;三是通过系统的自学习能力来丰富案例。
3.4 建立检索树
检索过程是通过检索案例库中的故障集来和用户输入故障的故障现象集匹配,按照案例的故障现象集中的各个故障现象的重要程度,组成如同故障树一样的树结构。树的根节点为某系统故障时对应的信息,因为信息是本系统中故障诊断的启发性信息,通过确定信息可以缩小诊断的范围,提高故障诊断的速度。通过计算各个可见征兆和系统参数的重要度,确定每层节点的节点值。
3.5 案例的修改
案例修改阶段包括两个任务:①对检索出的相似案例进行评估,若可行则进入案例学习过程,将问题形成新的案例添加至案例库中;②若检索结果评估不可行,则要对相似案例进行修改,从而得到新案例的解决方案。
提出了基于特征差异的案例自修改方法。其核心是从已存在的案例数据中搜索修改知识,根据相似案例中不满足要求的特征值进行修改,将故障问题之间的差异转换为故障案例解决方案的修改。在故障诊断系统中,对比故障案例与检索出的相似案例,根据存在差异的征兆,对相似案例再次采用CBR方法进行相似匹配,根据匹配结果对案例的解决方案进行修改。案例的规范化表示与存储见表2。
表2 故障案例库
系统功能故障模式故障原因任务阶段与工作方式故障影响局部影响高一层次影响最终影响严酷度类别故障检测方法星间时间同步上行测距无上行测距信号输出硬件、软件故障;天线故障星间时间同步测量上行测距功能丧失星地时间同步功能降级星地时间不能同步II数据接收、工况、检测仪联合上行测距信号不连续硬件、软件故障星间时间同步测量星地时间同步功能降级星地时间同步功能降级星地时间同步周期延长III数据接收、工况、检测仪联合上行测距信号输出错误硬件、软件故障星间时间同步测量星地时间同步功能降级星地时间同步功能降级星地时间同步数据出错III数据接收、工况、检测仪联合
4 试验验证
实现对卫星导航业务信息故障判断的前提是实现对故障的快速发现与定位。对星地异常现象和参数的分析与判断是发现与定位卫星导航业务信息中断及故障单机的主要途径。主要采用对监测站观测数据、卫星遥测数据、系统工况数据的综合判读,实现异常问题的定位。
图4 卫星故障快速定位图
数据处理实时处理多监测站、多星数据,对其进行数据判读和比对。观测数据的判读设计门限、正常超差等多个判据,减少误警率。一旦发现在轨卫星出现观测数据中断、超差、不连续等现象时,即可发出报警信息,提示出现卫星异常问题或是地面系统的问题。同时通过对数据的比对判读,实现对故障以及原因的初步定位。图4为卫星故障快速定位图,原故障定位方法与快速诊断方法故障定位时间比较见表3。
表3 原故障定位方法与快速诊断方法故障定位时间对比表
5 结束语
针对卫星导航系统故障诊断和预测中,故障相关信息多及故障趋势难以预测问题,本文提出一种多方法融合的卫星导航系统故障快速诊断的技术解决方案,该研究有效提高卫星导航系统故障诊断的智能化水平。根据研究和开发实践,得出以下结论:
1)对于卫星的不同故障类型和危险趋势,需要应用不同的推理方法进行诊断。只有这样,才能使卫星故障诊断和危险趋势预测更加准确、有效。
2)在应用多形式推理方法进行卫星故障诊断和危险趋势预测中,相关知识的形式化描述是其中的一个难点,这也是专家系统中研究的一个热点问题,它直接影响着推理的自动化。
3)通过贝叶斯网络数据挖掘技术建立正确合理的规则库、模型库和案例库是应用多形式进行卫星故障诊断和危险趋势预测的关键。
[1]刘鹏.专家系统在卫星测控管理中的应用技术研究[J].军事通信, 2006, 37 (8):66-68.
[2]尹伟,章卫国,李斌等. 结合贝叶斯理论的飞控系统故障树诊断方法[J].计算机应用, 2007, 27 (7):1802-1805.
[3]宋东,刘飞,吴信永.CBR故障诊断系统中的案例自修改方法研究及应用[J].测控技术,2008,27(5):81-83.
[4]单长胜.在轨卫星异常报警和故障诊断方法研究[J].飞行器测控学报, 2011, 30 (3):6-10.
[5]杨天社,杨开忠,李怀祖.基于知识的卫星故障诊断与预测方法[J].中国工程科学, 2003, 5 (6):63-66.
[6]向睿.在轨卫星远程诊断体系架构[J].华中科技大学学报(自然科学版), 2009, 37 (8):194-197.
[7]侯霞.基于系统级诊断理论的卫星网络故障诊断[J].电子学报, 2005, 33 (11):2066-2068.
Fault Rapid Diagnosis for Satellite Navigation System by Combined Multi-means
Liu Xiaoping, Wu Xiaoli, Sun Weijie, Dong Enqiang, Huang Shuanglin
Beijing Satellite Navigation Center, Beijing 100094, China
The satellite navigation system has the feature of multiple function, complicated architecture and high integrity, which makes the system fault full of complexity, hierarchy, dependency, delay and indeterminacy. Therefore the single-means diagnosis method can not satisfy the need of the satellite navigation system fault diagnosis. To cope with the complexity of system fault diagnosis, a kind of fast diagnosis method with multi-means combination is put forward, this paper discusses the knowledge obtaining, representation and diagnosis reasoning. The method has been verified with real data from BeiDou system and the results show that the method can locate the system fault fast and precisely, which greatly improves the intelligent level of the satellite navigation system fault diagnosis.
fault-diagnosis; case reasoning; case matching; similarity; status monitor
2015-03-17。
刘晓萍(1976—),女,工程师,主要从事卫星导航系统运行管理与控制方面的研究。
P228
A