导航卫星自主健康管理指标体系构建方法
2021-08-22潘宇倩冯文婧张弓夏岩
潘宇倩 冯文婧 张弓 夏岩
(中国空间技术研究院通信与导航卫星总体部,北京 100094)
导航卫星服务性能主要由精度、可用性、连续性、完好性指标表征。连续性是指在规定的时间内,空间信号能够持续健康而不出现非计划中断的概率。可用性则可理解为导航星座系统在规定的时间段和规定的精度要求下,提供健康空间信号的时间百分比。空间信号的连续性和可用性都与卫星服务的中断有关。北斗三号全球导航卫星星座系统是一个涉及多学科、多领域技术的复杂系统,需要在恶劣复杂的空间环境中长期飞行,尽管在设计、研制过程中采取了一系列可靠性的措施,但卫星在轨飞行中仍不可避免地发生这样那样的故障,使卫星的健康状况出现突然或逐渐的恶化,导致卫星服务中断。前期在北斗二号工程中虽然设计并实现了一些故障管理功能,但主要集中在平台部件级的故障诊断和恢复,缺乏面向卫星在轨服务性能的、全系统意义上的自主健康管理。本文根据导航卫星在轨长期连续、稳定运行的任务要求,以及非计划中断、空间信号连续性、空间信号可用性等系统指标要求特点,参照同类复杂装备系统健康管理技术的发展和典型应用[1-7],探索了一套适用于导航卫星健康管理系统指标体系构建方法,作为卫星自主健康管理与预测(PHM)系统设计实现和发挥效能的基础,尽量减少卫星故障对导航服务中断次数和中断时间的影响,提升单星连续服务的时间,确保星座系统可用性、连续性等指标满足要求。
1 导航卫星指标体系构建思路
导航卫星PHM 指标体系构建主要包括以下3个步骤,即PHM 系统任务分析、PHM 系统需求分析和定性定量指标体系确定、PHM 系统指标参数计算和验证。
(1)PHM 系统任务分析。对卫星在轨典型任务进行分解,明确与PHM 系统相关的、影响任务成功和载荷服务指标的具体因素,分析PHM 系统对任务和服务的影响,确定PHM 系统与顶层任务目标的关系。
(2)PHM 系统需求分析和定性定量指标体系确定。根据PHM 系统与顶层任务目标的关系,进行PHM 功能需求分析,从故障诊断、性能评估、故障预测等出发,考虑及时性和准确性需求,分析建立PHM 系统的定性和定量要求。
(3)PHM 系统指标参数计算和验证。综合利用指标计算、仿真分析等方法进行参数计算,确定PHM 系统方案和指标体系,并对PHM 系统设计和顶层任务目标实现情况进行验证,确保顶层任务目标满足要求。
2 导航卫星指标体系构建方法
按照第1节的构建思路,经任务及需求分析、定性定量指标体系确定、指标参数确定3个步骤完成导航卫星指标体系构建,即首先完成PHM 系统对任务成功的影响研究,形成功能需求分析,以此进一步依照故障诊断、性能评估、故障预测等方面形成指标体系,最后依据指标体系结合航天器特性确定指标参数,完成指标体系的构建。具体构建过程见图1。
图1 指标体系构建过程Fig.1 Index system design scheme
2.1 任务及需求分析
导航卫星的任务中断可分为短期计划中断、短期非计划中断和长期中断3类,其中短期非计划中断可以借助PHM 设计及措施来满足指标要求。短期非计划中断指标要求包括下行信号短期非计划中断平均间隔时间及恢复时间、接收上注信息的短期非计划中断平均间隔时间及恢复时间。根据卫星导航系统任务分解,导航卫星连续服务主要和下行信号、上行注入链路、卫星寿命等有关。
2.1.1 导航卫星任务分析
1)下行信号服务性能分析
导致导航卫星下行信号短期非计划中断的原因包括:①使用了大规模现场可编程门阵列(FPGA)、数字信号处理器(DSP)、中央处理器(CPU)等逻辑器件的单机,由于单粒子事件导致功能中断,继而造成导航下行信号中断;②与导航下行信号生成与播发直接相关的单机,由于硬故障而切机导致功能中断,继而造成导航下行信号中断。
2)接收上注信号服务性能分析
导致导航卫星接收上注信息短期非计划中断的主要原因包括:①使用了大规模FPGA、DSP、CPU等逻辑器件的单机,由于单粒子事件导致功能中断,继而造成接收上注信息中断;②与导航接收上注信息直接相关的单机,由于硬故障而切机导致功能中断,继而造成接收上注信息中断。
3)在轨安全稳定运行对健康管理系统需求分析
卫星在轨是否能够安全稳定运行,主要取决于卫星姿态、卫星轨道扰动、整星能源保障、热控保障等,涉及平台控制、推进、电源、热控等分系统,为了更好、更便利地对卫星实施控制和管理,平台测控、综合电子分系统功能至关重要。为了确保卫星平台服务不会引起导航信号中断,卫星平台需要充分的冗余备份手段,通过PHM 系统提供多种切换、处理等保证措施。
对于导航卫星行波管放大器、原子钟、蓄电池等具有典型退化和耗损等特征的产品,其故障将可能导致卫星任务失败或寿命终结,这对星载PHM 系统提出了预测的需求。考虑这些具有典型退化性能产品的趋势预测算法成熟,且需要快速紧急处理,因此需要对这些产品性能开展长期趋势预测与分析,全面了解产品性能变化情况,尽早发现并及时处置,以最大限度地减少中断发生的概率。
2.1.2 导航卫星PHM 系统功能需求
从卫星服务性能方面,导航卫星PHM 系统应具备与下行信号非计划中断和上注信息非计划中断相关的卫星健康管理能力,包括故障检测能力、故障预测能力、自主恢复管理能力等;从在轨安全稳定运行方面,应具备对卫星寿命评估分析和预测的能力,包括卫星推进剂寿命估计,卫星能源寿命估计,对具有典型退化、耗损特征产品的性能趋势分析和寿命估计。
面向导航卫星服务性能健康管理功能需求可进一步总结归纳如下。
(1)PHM 系统应具备对整星、分系统和单机部件的可检测故障模式进行检测,必要并可行的情况下完成故障隔离和恢复。
(2)对影响卫星下行非计划中断的故障应具备故障检测、诊断与隔离功能,通过采取故障自主诊断和恢复设计、重要数据备份等措施,减少下行中断发生次数,降低中断对系统恢复的影响;经分析,影响卫星下行非计划中断的故障模式主要涉及导航及平台相关分系统的故障模式。
(3)对影响卫星上行非计划中断的故障应具备故障检测、诊断与隔离功能,通过采取故障自主诊断和恢复设计、重要数据备份等措施,减少上行中断发生次数,降低中断对系统恢复的影响;经分析,影响卫星上行非计划中断的故障模式主要涉及导航、星间链路及平台相关分系统的故障模式。
(4)应具备对卫星寿命进行评估分析和预测,能够对典型退化产品性能趋势分析和预测功能,如铷钟、行波管放大器(TWTA)、推力器、控制活动部件、推进剂、蓄电池等,能够完成性能趋势分析、性能降级评价和寿命估计。
(5)通过软硬件自检或内部的连续性监测,能够产生健康状态参数,健康状态参数应能覆盖设备内部及各类通信接口通信状态的常见故障。
(6)卫星软件和硬件应具备配置管理及扩展能力。
2.2 指标体系的确定
根据2.1.2节中功能需求分解情况,导航卫星PHM 系统既强调故障的检测与隔离、状态的实时监视,同时强调对剩余使用寿命的预测。导航卫星PHM 系统指标参数应覆盖故障检测/隔离类,预测类和其他综合类。
1)故障检测/隔离类指标
为了使“下行信号短期非计划中断”、“接收上注信息的短期非计划中断”满足要求,需要对相关故障完成故障检测和隔离,并要求故障隔离时间尽可能短,虚警率尽可能低。根据2.1.2 节功能需求第(1)、(2)、(3)项,从故障诊断准确性度量、故障诊断时延度量、故障诊断鲁棒性度量等方面提出相应的故障检测指标参数,故障检测隔离类指标主要包含故障检测率、故障隔离率、故障隔离时间、虚警率、平均虚警间隔时间。
图2 导航卫星PHM 系统健康管理指标Fig.2 Index for navigation satellite PHM system
2)预测类指标
根据2.1.2节功能需求第(4)项,需要实现对具有典型退化、耗损特征的产品,如原子钟、行波管、蓄电池等进行趋势预测,从预测准确性度量、预测时延度量等方面提出预测类指标参数,预测类指标主要包含预测覆盖率、准确度和精度。
3)综合度量类指标
根据2.1.2 节功能需求第(5)、(6)项,在星载PHM 系统设计中,需要把星载PHM 故障检测、隔离以及故障恢复后的状态信息进行采集并传输至地面。同时需要具备对星载自主故障检测和处理功能的状态升级和扩展能力,因此,综合类指标主要包含:数据传输速率、数据存储容量等。
2.3 指标参数确定方法
PHM 指标确定方法主要包括类比法、参数权衡法、基于SIMLOX 仿真软件的参数确定法、层次分析-折中系数法、马尔科夫链法、可用度-费用优化权衡法等。导航卫星系统是一种软件密集型系统,其健康管理功能与卫星各系统高度耦合,因此采用参数权衡法,根据服务性能要求对卫星健康管理系统指标参数集进行定量计算,给出总体指标参数的定量计算方法和指标量化过程。
参数权衡法的主要计算过程如下。
(1)根据“下行非计划中断平均间隔时间及恢复时间”或“上行非计划中断平均间隔时间及恢复时间”系统指标要求,计算出系统的可用度为
式中:TU为能工作时间;TT为总拥有时间。
(2)利用故障检测率γFD与可用度、可靠度之间的关系,权衡分析确定故障检测率和维修度指标,即
式中:A(t)为系统在时间t 时的使用可用度,R(t)为可靠度,γFD为故障检测率,M(t)为维修度。对导航卫星而言要求故障发生之后能够及时准确检测,因此要求故障检测率高于0.999,进而计算得出M(t)。
(3)假定维修概率密度分母函数为指数分布
式中:tIN为无机内测试技术(BIT)时故障定位隔离时间,to为除tIN以外的其它时间之和,γFI为故障隔离率,根据类似产品凭经验估计,权衡确定to和tIN,进而计算得出故障隔离率γFI。
(4)虚警率γFA不仅与单位时间的虚警数有关,而且还与系统的故障率λS、虚警率λFA和故障检测率γFD有关,即
3 导航卫星仿真分析与在轨验证
3.1 PHM 建模分析及指标设计结果
卫星导航服务的连续性和可用性都与卫星服务的中断相关。从导致卫星服务中断各个子事件入手,在已构建的指标体系框架下,分析梳理各子事件下的故障模式,相关的分系统和单机设备,梳理提炼相应的故障检测点,以满足故障检测率的指标,设计分层级的故障诊断及恢复方法和处理策略,以满足故障隔离率等指标要求,开展卫星自主故障管理功能设计。见图3。
图3 面向服务性能的PHM 建模Fig.3 PHM modeling for service performance
北斗导航卫星服务的中断指标要求包括下行信号短期非计划中断、接收上注信息的短期非计划中断、影响在轨安全的非计划中断。
根据工程分析和卫星在轨飞行经验,导致导航卫星下行信号短期非计划中断的原因如2.1.1节所述,导航下行信号中断直接与导航分系统相关。经故障树分析,确定导航分系统导航任务处理机等单机会引起下行中断,因此在这些设备加入遥测数据检测点,对故障检测率、故障隔离率、故障隔离时间、虚警率、平均虚警间隔时间等自主健康管理体系指标进行设计和分解,并进行自主切机、复位等故障处置措施。
导致导航卫星接收上注信息短期非计划中断的原因包括:单粒子事件、单机切机导致的上行信号中断。导航接收上注信息是否中断直接和导航分系统、综合电子分系统和星间链路分系统相关。经故障树分析,确定星间收发信机等单机会引起上注中断,因此在这些设备加入遥测数据检测点,对故障检测率、故障隔离率、故障隔离时间、虚警率、平均虚警间隔时间等自主健康管理体系指标进行设计和分解,并进行自主切机、复位等故障处置措施。
导航卫星影响在轨安全的非计划中断直接和综合电子分系统和控制分系统、测控分系统、电源分系统相关。经故障树分析,确定中心处理单元等单机会引起影响在轨安全的非计划中断,因此在这些设备加入遥测数据检测点,对故障检测率、故障隔离率、故障隔离时间、虚警率、平均虚警间隔时间等自主健康管理体系指标进行设计和分解,并进行自主切机、复位等故障处置措施。
3.2 评估验证结果
1)仿真验证结果
北斗三号卫星各分系统相关单机按照3.1节指标要求开展设计研制,完成研制后得到单机基础数据,包括故障中断间隔、故障平均间隔时间、平均检测和恢复时间等。
根据卫星下行信号中断故障树及单机基础数据,计算得到下行信号中断概率为
式中:Mi为故障树第i个底事件平均无故障工作时间,Pdi为第i个底事件下行信号中断概率,N 为底事件数量。
由此,平均间隔时间为
式中:Td为下行平均间隔时间,H 为全年小时数。
导航下行信号中断平均恢复时间计算为
式中:Ri为故障树第i个底事件下行信号中断平均恢复时间。
经过仿真计算得到导航下行信号中断平均恢复时间为6.2 min,满足下行非计划中断次数0.4次/星/年、平均间隔时间≥21 900 h、恢复时间≤3 h的要求。
根据卫星接收上注信息中断故障树及单机基础数据,计算得到境内和境外接收上注信息中断概率Pu1,Pu2为
式中:Pui为故障树第i个底事件上注信息中断概率,K 为底事件数量,M 为与境内相关的底事件数量。
由此,境内和境外平均间隔时间为
经过仿真计算得到(境内)卫星接收上注信息中断平均恢复时间为14.8 min;(境外)卫星接收上注信息中断平均恢复时间为34 s,满足接收上注信息的短期非计划中断平均间隔时间≥2000 h、恢复时间≤1.5 h的要求。
2)在轨评估结果
北斗三号导航卫星空间信号连续性是指一个“健康”状态的导航卫星下行信号能在规定时间段内不发生非计划中断而持续工作的概率,空间信号可用性是指卫星提供“健康”状态导航卫星下行信号的概率。短期非计划中断是影响导航卫星信号“健康”的重要因素,本文从“下行信号短期非计划中断”和“接收上注信息的短期非计划中断”出发,进行了健康管理指标体系构建和卫星PHM 系统设计,以满足卫星导航信号短期非计划中断的要求,提升卫星的连续性和可用性。
经在轨统计分析,在PHM 系统支持下,北斗三号卫星在轨空间信号连续性整体统计优于每小时99.99%,满足≥99.8%的指标要求,相比于北斗二号所有卫星整体连续性每小时99.89%有较大提升,所有卫星整体统计空间信号可用性优于99.78%,满足≥98.0%的指标要求,相比于北斗二号所有卫星整体可用性98.93%有较大提升[8],有效保障了北斗全球系统连续稳定的运行和服务。
4 结束语
本文以导航卫星信号短期非计划中断为顶事件,通过分析引起卫星短期非计划中断的主要原因和故障模式,提出了相关的指标要求和健康管理设计,尽量减少故障对导航卫星信号服务的影响,对卫星连续性和可用性的提升具有意义。在实际型号研制中,围绕短期非计划中断开展了健康管理系统设计和实现,并对健康管理功能进行了测试、验证和在轨应用。在轨性能评估结果表明:北斗三号卫星空间信号连续性 每小时99.99%,空间信号可用性99.78%,均满足系统服务性能规范承诺的目标,为北斗导航系统服务性能和在轨安全稳定运行提供了支持保障。后续根据导航卫星在轨运行情况,对健康管理系统功能和要求不断完善,以提升系统和卫星的稳定运行能力,为我国同类航天器健康管理技术领域的发展和水平提升提供借鉴和参考。