在轨卫星异常实时处置技术研究
2015-07-07朱海洋胡文静陈浩孙海忠北京空间信息中继传输技术研究中心
朱海洋 胡文静 陈浩 孙海忠(北京空间信息中继传输技术研究中心)
在轨卫星异常实时处置技术研究
朱海洋 胡文静陈浩 孙海忠(北京空间信息中继传输技术研究中心)
1 引言
传统的卫星控制中心主要采用信号链路和软件进行卫星状态的实时诊断,但对于故障与异常的处置过程仍采用基于人工干预的方式,其处置的正确性主要通过事先制定的故障处置预案来保证。对于同时对多颗卫星实施长期管理的卫星控制中心,由于对卫星平台的操作和对用户服务交织在一起,任务种类繁多、系统构架复杂,对卫星故障定位的准确性、处置的实时性要求更高,传统的人工现场处置方式难以保证处置的成功率,或者实现处置效果的最优化。因此,必须研究适应卫星组网运行模式的系统故障实时智能处置机制和实现方法,实现全任务过程故障识别、处置、效果评估的自动闭环流程,对有预案的故障实现自动化隔离处置,对无预案故障提供分析、判断和决策的辅助专家系统支持。通过对故障实时处置过程的基本要素进行分析,提出故障实时处置需要重点关注和解决的几个问题,为卫星控制管理中心进行故障实时处置系统建设提供参考。
故障实时处置流程示意图
2 卫星故障实时处置的基本要素
卫星控制中心的故障实时处置系统包含的基本要素有以下5个部分:故障实时检测、故障准确诊断与定位、故障处置策略的正确生成、故障的及时处置、处置效果评估。
(1)故障实时检测
它基于卫星的遥测、外测数据,实时分析卫星各分系统运行状态,针对卫星载荷任务中相应的状态变化,甄别、监视系统的运行状态,准确感知星上或地面系统出现的故障。系统故障的检测应具有高度的敏感度,尽量减少虚警、漏警发生的概率,从而确保后续操作流程的正确性。
(2)故障准确诊断与定位
融合故障检测结果和各分系统的状态监视信息,基于故障分析和建模,通过知识推理完成故障的自动诊断、识别。由于故障发生时会在多个分系统产生外在表现数据,因此,故障诊断、定位必须准确,其置信度要高。
(3)故障处置策略的正确生成
其关键在于建立正确、全面的故障知识库,故障知识库中既包括故障推理准则,也包括故障处置的决策建议,对于有预案的故障,给出详细的自动处置流程,对于无预案的故障,提供分析、判断和决策的辅助专家系统支持。
(4)故障的及时处置
它要求针对有预案的系统故障,能够实时检测故障处置的条件是否具备,必要时自动完成地面站设备、软件和中继卫星的控制。在此基础上,实现故障处置流程的自动化。系统故障处置时,必须处理好与正常控制流程之间的关系,对于实时性要求很高的故障处置,在处置过程中必须确保系统控制的优先权。
(5)处置效果的实时、准确评估
它是在故障处置过程中实时监视实施效果,并依据一定的评估准则对处置效果进行评估,评估结果可作为是否进行下一步处置的依据。
3 卫星故障实时处置关键问题分析
故障的诊断与检测
要实现卫星的实时处置,首先应对卫星各模块、分系统的健康状态有明确的认识,因此,故障检测和诊断技术是实现卫星实时处置的前提。
目前,国内航天器的故障检测是采用阈值形式进行判读,然后再根据阈值进行诊断,当部件或设备失效后直接切换到备机,复杂的故障情况基本上采用地面专家会诊方式实现,仅是某些对平台不具有安全性影响的故障可经设计师确认,由运管人员直接操控。因此国内在航天器的故障诊断方面仍处于实验阶段,并且如何将已有科研成果应用到实际型号任务中去还值得进一步研究,在理论和实践方面仍有大量的研究和开发工作要做,考虑到星载计算机的性能和在轨卫星的安全性和可靠性,航天器故障诊断仍以地面遥测数据分析诊断为主。当前国内基于遥测参数超限报警的主要方法有遥测参数门限判断、相对值判断和关联诊断方法;基于推理报警方法主要有规则、故障树、人工神经网络和模型的推理方法。
在工程实际应用方面,国内大部分卫星在设计时对一些突发故障进行了考虑,在轨卫星具有一定的自主判断和应急处理能力,主要是仪器设备的冗余使用,或者进行应急安全模式,也就是进行太阳搜索模式,同时关闭不必要的仪器设备,以保证整星能源供应为主。目前,国内在东方红-3、资源-1、资源-2和“神舟”飞船等项目应用中部分子系统已采用故障隔离、诊断和系统重构等智能化技术,收到了良好效果。对于星载计算机自身设计,一般会设计简单的部件故障检测能力,能在某些特定情况下自主切换部件和改变系统模式。同时星载计算机也具有一定的自检能力和容错能力,能通过心跳检测和看门狗检测实现一些突发事件的处理如单粒子翻转后的重启等。
地面采集的遥测、外测数据有几个特点:①卫星在轨运行后,由于部件的冗余备份关系,故障特征可能并不明显,有可能被淹没在大量正常的遥测数据当中。②卫星在轨运行后,大部分时间处于正常运行态,故障发生的情况并不是频繁出现的,但故障出现后往往会存在一段时间。③卫星在轨运行后,地面获得的遥测数据有可能由于人为因素或者仪器失灵等原因造成数据缺失。④卫星在轨运行后,由于天上的复杂情况,可能会出现某些地面没有想到的故障情况或者由于地面测试时无法进行的实验而造成某些故障情况出现,即出现“未知”故障。
因此,在故障现象的检测与诊断过程中需要考虑的问题主要有:
1)为解决大量遥测数据的绝对门限判读全面、准确的问题,可以增加相对门限判断,扣除因时间变化,或测控事件发生前后遥测参数正常变化引起的误判断,建立动态门限,以减少故障检测过程中的虚警,保证故障特征识别的准确性;
2)在进行故障诊断软件的容错、冗余性设计时,可考虑是否因遥测数据源切换导致遥测数据的误判,是否因为遥控指令的发送导致某些波道参数的误判、对于正常的星上遥测自主变化状态是否视为异常;
3)应定期对当前在轨卫星运行健康状况进行有效评估,对于故障的实时处置有很大帮助;研究表明,卫星在轨初期出现过的异常将在卫星全寿命期一直存在;针对以往出现过的卫星故障现象进行处置预案的制定,将非常有效。
知识库的完备性与有效性
知识库是故障诊断系统第一个重要组成部分,故障诊断系统工作性能优劣的重要因素取决于专家的知识和经验。知识库中的知识应该具有可用性、确定性和完善性。
建立一个好的知识库,首先是从领域专家那里获取知识,称其为知识获取;然后将获取的专家知识编排成数据结构存入计算机中而形成知识库,知识编排的过程称为知识表达。一个理想的知识表达,应能精确表达专家的思维与知识,应该能有效地通过计算机进行实现,应该简明、易于理解和便于改进。
建立卫星故障实时处置的知识库需要考虑的问题主要有:①卫星的应急处置预案是否完备,是否覆盖了在轨可能出现的所有故障;②故障预案与实时处置脚本集的对应关系是否准确;③对故障知识的描述是否可以准确表达卫星在轨故障。
在对卫星进行在轨故障预想与故障对策分析时,还应充分考虑其他同类型卫星在轨曾经发生过的异常现象的举一反三,并将这部分内容包括到故障预案处置卡中。
处置的准确性与时效性
卫星在轨阶段可能突发一些危害性较大的紧急故障,必须立即处理,否则导致整星失效,例如对动量轮掉电、星上计算机故障等异常处置不及时,可能使卫星姿态带来翻转。这部分采用故障实时处置可以很大程度地减少人工处置工作量,降低对岗位人员的要求,保证载荷操作的正确性。
在设计故障实时处置时,必须处理好与正常控制流程之间的关系:对于实时性要求很高的故障处置,在处置过程中必须确保遥控操作的优先权;对于实时性要求不高的故障处置,可以安排在正常载荷应用任务之后或任务间隙实施。
处置评估与再处置
它是在故障处置过程中实时监视实施效果,并依据一定的评估准则对处置效果进行评估,评估结果可作为是否进行下一步处置的依据。需要考虑的问题有:①故障处置评估的依据主要有星上下传的遥测数据,以及卫星的实时轨道数据;②影响处置评估的因素与故障检测的因素有相似之处,同样需要解决大量遥测数据的绝对门限判读全面、准确的问题,以及测控事件发生前后遥测参数正常变化引起的误判断、虚警,保证故障处置结果评估的准确性;③遥控指令脚本运行完毕后,应将运行结果反馈给系统的故障检测。
4 一个典型的卫星故障实时处置示例
下面以一个典型的卫星故障实时处置案例对卫星故障实时处置过程进行描述。
(1)故障检测
读取数据库中的地敏探头干扰预报结果,实时判断接收的卫星遥测数据,检测是否出现地敏探头禁止遥测位报警,从而完成故障的实时检测。
(2)故障诊断与定位
由于该故障在卫星长期在轨管理过程中出现过,因此,根据知识库中的先验知识,可以定位该故障为地敏探头自主切换异常。
(3)故障处置策略生成
根据事先制订的故障预案,处置策略为:地面遥控发令,设置受干扰地敏探头禁止。
(4)故障处置
故障处置包括如下两个过程:①根据地面站集中监视软件的输出信息,自主判断当前地面站是否已经加载测控上行,如果没有,通过调度软件自动调用“测控加上行”设备脚本,确保星地测控通道正常;②自主综合判断设备脚本运行结果和中继卫星遥控锁定情况,确认上行已经加载后,自主调用卫星控制脚本,设置受干扰地敏探头禁止。
(5)处置效果评估
卫星控制脚本正常运行完毕后,实时判断中继卫星遥测数据,确认受干扰地敏探头已经正常禁止,且系统其他状态均正常,则认为异常处置正常结束。
故障实时处置流程示意图
5 结论与建议
故障的实时处置在弥补人工处置时效性的不足时,也对故障的检测、识别、故障指令上行注入方式设计等提出了很高的要求。因此,在卫星控制中心进行故障实时处置系统设计与建设时,需要结合实际工程背景,采用多参数联合判断、多触发条件识别的方法,同时借鉴同型号卫星故障处置预案,建立开放的诊断知识库与故障处置库,提高诊断的准确性、处置的有效性与时效性。
Handling In-orbit Satellite anomalies in Real Time