空间环境态势感知技术研究进展*
2023-03-26侯鹏荣王哲龙武强仇森褚庆浩曾梓康
侯鹏荣, 王哲龙, 武强, 仇森, 褚庆浩, 曾梓康
(1. 大连理工大学, 大连 116024; 2. 北京卫星环境工程研究所, 北京 100000)
1 引言
空间目标是指所有外太空物体, 包括非功能性航天器、 火箭上面级、 空间碎片等[1]。 随着人类空间探索活动的逐渐增多, 空间碎片环境日益恶化, 严重威胁着在轨航天器的安全运行。 同时, 空间碎片的持续增加, 对有限的轨道资源构成了严重威胁。 由于级联碰撞效应, 即便大幅减少发射活动, 执行严格的空间减缓措施, 仍无法有效减少空间碎片。 因此, 空间目标探测、 跟踪对于避免空间碰撞, 保障航天器运行安全至关重要。 空间环境态势感知对于碰撞预警、 机动跟踪、 碎片清除等具有重要意义。 图1 为已知空间碎片的分布概况。
图1 已知空间碎片的分布概况Fig.1 The distribution of space debris known
空间环境态势感知旨在对空间目标开展全面的、 准确的、 实时的探测、 跟踪、 表征的过程,从而确定可能对合作目标构成威胁的非合作目标的行为、 意图。 空间环境态势感知技术依赖于空间目标监测平台和自主感知算法。 其中, 美国空间监视网络(SSN) 是目前世界上技术最先进且覆盖范围最广的空间目标探测系统。 该系统具备主动和被动的协同探测能力, 拥有天地一体的监测平台以及遍布全球的控制操作中心[2]。 SSN 的数据支持美国空间作战部队的任务, 也为世界其他国家的空间监测提供重要参考。 通过空间环境监测网络产生的传感数据, 具有多模态、 多时空、 多平台特点, 亟待发展面向复杂空间环境的多源数据融合、 态势全面感知、 空间事件推理和在线智能决策等技术。
AI 的高速发展将从根本上推动空间感知领域向智能化方向迈进。 首先, AI 可以大幅提高空间环境态势感知系统的性能和效率。 态势感知涉及海量的数据处理和分析工作, 例如, 图像解译、星座识别、 天体测量等。 AI 通过强大的计算能力和智能算法, 快速处理和分析海量数据。 其次,AI 将促进空间感知领域的自主学习和自适应能力。 通过机器学习, 从大量的历史数据中学习和推理, 并不断提升性能和精度。 这将支持更高效的轨道分析、 碎片预警和风险评估能力, 有助于实现实时监测和快速响应。 此外, AI 将提供更全面、 多维度的空间态势信息。 通过整合地基的雷达、 光学与激光测距和天基的雷达、 光学与碰撞探测等多种探测手段, 以提高航天感知系统的感知能力和准确性。 这将进一步提升空间环境态势感知的综合能力和智能化水平。
综上所述, 回顾和讨论AI 在空间环境态势感知的应用进展对于空间环境可持续性具有重要价值。 本文旨在探索空间环境态势感知的相关背景研究和适用的AI 算法, 并进一步讨论多源信息融合、 自主协同感知等未来研究方向。
2 典型空间环境态势感知系统
空间环境状态信息的感知和评估通常依赖传感器的高质量追踪。 美国、 俄罗斯、 中国、 欧盟在全球空间环境态势感知系统的建设中处于领先地位。 表1 粗略地给出世界各国和地区建立的空间目标监测平台清单[3-5]。
表1 SSA 数据来源Table 1 SSA data source
截止到2023年9月, 美国SSN 已编目包括有效载荷、 分析对象和空间碎片在内的空间目标数量超过4.4 万。 其探测范围覆盖低轨到高轨, 对特征尺寸在10cm 以上的中低轨目标跟踪分辨率达5cm, 24h 定轨精度达1km, 特征尺寸在30cm以上的高轨目标跟踪分辨率达50cm, 24h 定轨精度达3km[5]。
由表1 可知, 空间目标监测平台分为地基和天基两种方式。 地基监测平台不受体积、 质量等限制, 可以实现较高的空间目标分辨率和较远的探测距离。 然而, 由于地基监测平台的空间覆盖范围受其部署数量和分布位置影响, 而探测性能受地球大气衰减特性影响, 单独依靠地基监测平台难以满足近地空间环境日益复杂的监测需求。天基监测平台作为地基监测平台的有力扩展和补充, 弥补了地基监测存在的盲区问题。 相比地基监测平台, 天基监测平台具有全天候、 长时间连续观测的优势, 可进一步提升对空间目标监测的灵活性、 时效性以及覆盖范围。
综上, 两种监测方式各有利弊, 只有统筹兼顾实现天地一体协同监测才能更全面高效地掌握近地空间动态变化情况。 除此之外, 空间环境态势感知还需考虑部署位置和设备配置优化问题、传感器网络布设问题、 探测性能提升问题, 其核心是发展先进的空间目标感知算法。 只有充分融合发挥软硬件技术优势, 才能构建全天候、 多层次的空间环境感知体系, 实现长期可持续地利用空间资源。
3 数据层面
空间环境态势感知的核心是准确获取空间目标数据以及必要的数据处理。 在此过程中, 海量多源异构实际探测数据是不易获得的, 特别是对于天基监测平台的开发, 由于实际安装成本较高, 难以在短时间内获取所需的传感数据进行相关验证。 因此, 用于空间环境态势感知数据主要来自美国SSN 发布的两行根数(TLE)、 各天文站以及仿真成像。 表2 整理了空间环境态势感知在数据层面的研究。
表2 SSA 数据层面的相关研究Table 2 Related research on SSA data level
3.1 数据获取
到目前为止, 空间环境态势感知的主要来源是美国的SSN, 通过Space-Track. org 有选择性地公布空间目标的TLE。 除此之外, TLE 并没有包含轨道精度信息, 并根据物体位置和轨道的不同而变化, 使其应用受到限制。 同时, 空间目标范围广, 受地缘政治影响, 全天候持续监测面临巨大挑战。 在空间感知领域, 获得完整、 有标签、高质量的空间探测真实数据依然十分困难且昂贵, 特别是光学图像数据。 缺乏足够的空间注释数据限制了空间环境态势感知的研究工作。
目前, 研究学者对空间目标可见光成像的仿真进行了相关研究, 用以支持动态模拟目标跟踪和识别任务。 在空间可见光成像模拟中, 需要充分考虑空间目标光学特性和传感器成像特性。 针对研究重点的不同(如传感器种类[7]、 是否发生抖动[8]、 图像信噪比[9]、 静态或动态跟踪[10]、 照明角度、 超亮星拖尾[11]), 自定义模拟和生成空间目标的光学图像、 光变曲线以及轨迹数据。 据我们所知, 对于6D 航天器姿态估计任务, 公开可供科学研究的包括航天器姿态估计数据集SPEED[12]、 虚拟渲染航天器在轨数据集URSO[13]; 对于空间目标检测和识别任务, 包括SPARK[14]; 可用于3D 轨迹估计的数据集包括SPARK-T[15]。
此外, 已经有研究学者关注到空间感知中的数据共享和数据欺诈问题。 大多数卫星运营商无法独立获取SSA 数据, 必须依赖几个由主要太空强国运营的集中存储库。 考虑到各国在空间轨道上的合作竞争关系不断加深, 滥用共享信息进行攻击的威胁也日益增加。 因此, 在实现数据共享的同时, 如何避免欺诈行为成为一个更为迫切的问题。 James Pavur 首次提出了针对SSA 欺骗的防御技术, 进而开发了基于机器学习的异常检测工具, 使防御者在没有空间探测传感条件的情况下依然可以检测到90% ~98%的欺骗企图[16]。 Robert J 提出一个关于空间目标的本体架构, 用于空间领域数据共享、 互操作和知识发现, 从而促进空间环境态势感知社区之间的数据交换和知识共享[3]。
3.2 数据处理
数据处理是空间环境态势感知的前置环节。空间目标具有运行轨迹长、 飞行速度快等特性,仅靠单一传感器无法对其整个轨迹进行有效覆盖和精确跟踪[17]。 通过多探测系统组网协同探测,可满足对新目标、 动态目标快速发现的需求。 因而, 探测数据通常具有异站、 异时、 海量、 多模态、 探测精度不一等特点。 对各传感器获得的数据信息进行有效融合与处理, 能最大限度地提升空间态势感知的作用和能力。
数据融合旨在对来自多个同构或异构传感提供的局部不完整信息加以整合, 消除传感器间存在的冗余和矛盾, 形成更全面、 准确、 可靠的融合信息, 从而增强对空间态势的认知和理解。 数据融合难点和痛点在于数据格式的差异性、 数据质量的均衡性以及数据整合的复杂性。 传统的数据融合无法适应日益复杂的空间传感数据环境和多样化的应用需求, 需要通过引入新的方法和技术来提升数据融合的能力和适应性。
数据融合包括数据层融合、 特征层融合和决策层融合三个层次。 数据层融合涉及对来自不同传感器如雷达、 光学以及红外等的数据进行配准、 校正和归一化, 实现不同数据源之间的信息补偿和数据增强。 基于卡尔曼滤波的轨迹预测是最典型的数据融合的案例[18]。
特征层融合是在提取数据源的特征后进行分析并支持后续决策。 特征可以是轨道参数、 位置坐标、 面质比、 投影面积等手动提取的特征, 也可以是算法自动提取的特征。 基于多源信息融合的空间碎片检测就是利用神经网络自动提取RGB图像和深度图像的深层特征后进行融合, 最后利用分类头来实现目标检测, 这是一种端对端的特征层融合的方法[19]。
在决策层面, 不同的传感器和算法可能会产生关于目标的不一致结论。 利用贝叶斯推理[20]、DS 证据理论[21]、 神经网络等方法, 可以将不同数据源的单个决策综合得到更全面、 更可靠的结果, 增强空间感知的智能和决策支持能力。
4 感知层面
本节主要是围绕如何去收集、 整合、 分析和理解来自空间环境中各种数据和信息, 来获得对空间状态和态势的全面认知和理解的过程。 其核心任务
包括远距离跟踪测量和运动状态识别, 以及获取待测目标从整体到局部的属性、 轨道参数及运动姿态等, 进而对目标特性数据进行评估以支持太空交通管理。 图2 给出空间环境态势感知的一般流程。
图2 空间环境态势感知的一般流程Fig.2 General process of situational awareness of space environment
4.1 目标检测和识别
目标检测旨在识别和定位太空中的目标物体, 包括在轨卫星、 载人航天器、 火箭发射级、空间碎片以及小行星等。 实施空间目标检测任务时, 面临着多个挑战, 如复杂背景和遮挡、 尺度变化、 复杂光照和气象条件以及目标类型多样性等因素的影响。 这些挑战对于确保准确性、 效率和可靠性提出了要求。 为了克服这些挑战, 需要不断发展和改进适应性强、 鲁棒性好的空间目标检测算法。
目前已经开发了许多用于空间目标检测的技术。 Liu 提出一种基于拓扑扫描的多目标检测技术, 利用了几何对偶性, 支持在大量杂波和噪声中提取目标的近似线性轨迹[22]。 卷积神经网络(CNN) 在目标检测任务中较为常见, 这归功于其对图像特征的有效学习能力。 它可以自动学习图像的局部特征和全局特征, 并且具有平移不变性的特性, 使得它能够在图像中找到目标的位置和边界框。 然而, 将CNN 用于空间目标检测的复杂性在于: (1) 真实数据的信噪比有所不同;(2) 缺少标准的仿真数据集。 其中, CSAU-Net网络[23]、 EfficientDet + EfficientNet-v2 网络[19]等是通过模糊和添加噪声进行数据增强, 从而提高了模型的精度, 减少了漏检、 误检的事件发生。针对小碎片检测场景下存在误报而可能产生噪声标签的情况, Li 提出一种新的噪声标签学习范式-协同校正算法, 目的是在高噪声标签率下保持较高的空间碎片检出率[24]。
4.2 目标跟踪
目标跟踪旨在准确追踪和持续监测目标运动状态, 为后续分析和决策提供关键性数据支持。同时, 目标跟踪技术必须克服空间环境的复杂性和空间目标运动的不确定性, 如远距离探测下的目标信号微弱、 目标间可能存在遮挡与交叉运动等困难[25]。 因此, 审查与目标跟踪相关的关键技术对于空间态势感知的后续研究开展至关重要。
4.2.1 轨道确定
轨道确定问题可视为一个回归问题, 其关键在于如何充分利用多段极短弧观测数据, 与之对应的是目标在不同时间点的位置和速度信息。Feng 提出一种加权分布回归方法用于地球同步轨道(GEO) 的空间目标定轨, 该方法在白噪声和有色噪声干扰下优于Laplace 方法[26], 而支持向量机则被用于减少空间目标在定轨和传播过程后的位置误差[27]。
4.2.2 轨道预测
轨道预测对于空间环境态势感知相关任务(例如空间碰撞预警) 至关重要[28]。 然而, 由于观测稀疏且精度低、 目标几何特征未知以及对受力的简化, 传统基于轨道力学理论或者基于物理模型的轨道预测在较长时间内误差快速增长, 直接面临不可用的问题[29]。 通过机器学习从历史数据中学习轨道预测误差的潜在模式[30-33]或者直接用于轨道预测[34-36], 可以大幅提高轨道预测精度。 更进一步, 将机器学习方法和传统的轨道预测方法进行融合, 建立混合解析- 机器学习框架, 轨道预测的精度获得极大提升[37,38]。
4.2.3 机动检测
机动检测是通过对空间目标的运动和轨迹进行分析, 确定其机动的类型和特征, 实现对目标运动状态的动态监测, 从而更好地了解目标意图和行为模式。 LIU 等人通过假设检验实现对目标轨道数据分析, 判断目标是否处于机动状态。 这种方法可以有效地降低目标轨道机动检测的误报率, 提高检测的准确性和可靠性[39,40]。 而后, 针对传统的卡尔曼滤波器算法无法工作在非合作目标的机动检测任务这一不足, JIANG 等人提出了改进的扩展卡尔曼滤波器、 增广的无偏最小方差输入和状态估计等方法用于未知的机动检测[41]。此外, LI 提出了两种自适应的基于Unscented 信息滤波器, 用于追踪具有机动和有色量测噪声的目标[42]。
4.3 目标表征
部分研究集中在对空间目标进行建模和表征, 目的是提取目标关键信息, 了解目标可能来源、 轨迹和特征, 进而确定其威胁程度, 并制定相应的对策。
轨迹估计在空间目标轨道预测中起着重要作用, 特别是在观测数据有限或不准确的情况下。轨迹估计的目标是对目标历史轨迹数据进行分析和建模, 以预测目标未来可能的运动轨迹。 由于空间轨迹在时间和空间维度上具有强相关性, 仅凭单张目标图像的视角无法确定其三维位置[43]。研究表明, 通过单一摄像机连续捕捉空间目标的动态图像, 并通过两阶段的计算可以获得具有时间一致性的三维位置轨迹。 此外, Dave 提出了一种基于递归卷积神经网络的方法, 在低分辨率成像条件下实现了空间目标位置和速度的估计[44]。
姿态估计旨在推断目标的朝向和姿态参数,如目标的姿态角、 旋转角速度等。 迄今为止, 已经开发了很多针对空间目标的姿态估计方法。 现阶段空间目标在轨姿态的精确测量依赖于雷达与光学高质量连续高分辨成像感知, 目标状态参数的估计依赖于目标观测数据与历史积累观测数据库的特征匹配, 缺乏观测物理模型的支撑, 估计精度有限, 无法推广至具有复杂运动的目标、 非合作目标等实际应用场景。 基于深度学习的空间目标姿态估计方法具有潜在优势。 例如, 通过单站逆合成孔径雷达(ISAR) 观测目标, 隐马尔可夫模型描述目标投影变化, 采用不同优化算法进行求解计算[44,45]。 融合光学和ISAR 等不同测量手段实现空间目标的准确瞬时姿态[46,47]。 此外,多站ISAR 协同用于自旋航天器的动态估计[47]。深度学习在空间目标姿态估计的应用不多但潜力巨大, 已成功应用在光变曲线[48]、 单目视觉[49]、视频帧[50]等不同观测条件下的空间目标姿态估计, 实现了空间目标的姿态变化的精确捕捉和分析, 为碰撞预测和轨道博弈提供了更可靠的支持和指导。
特别地, Xu 等人提出了一种基于光度反射特性的卫星工作状态检测方法, 可以作为快速检测GEO 卫星工作状态的依据[51]。
5 决策层面
空间环境态势感知的决策部分实质是将感知到的空间环境信息转化为行动的过程。 决策可能涉及资源调度、 避免碰撞、 轨道博弈等。 本文对空间感知中的资源调度、 避免碰撞和轨道博弈等关键技术进行了回顾和讨论。 表3 整理了空间环境态势感知在决策层面的研究。
表3 SSA 决策层面的相关研究Table 3 Related research on SSA data level
5.1 资源调度
由于空间碎片的爆炸性增加、 巨型星座的任务实施, 导致空间监测任务较之前更为繁琐复杂, 需要新的资源调度方法来满足新需求。 在早期研究中, 调度问题被视为如何将传感器的探测时间有效地分配到空间目标的收集和测量上。Bussy-Virat 等人提出了NICO 调度器, 该调度器通过考虑气象和天文限制来协调各用户的请求。其核心思想是利用遗传算法来解决资源调度问题[52]。 此外, 其他学者还开发了基于禁忌遗传算法[53]、 基于假设和协方差[54]等调度方法, 旨在提高求解速度和推理精度。
此外, 博弈论在解决资源调度方面具有很大潜力。 Jaunzemis 等人提出一种自组织的空间目标跟踪方法, 将资源调度问题转化成潜在博弈问题, 参与者需要遵循同步最优反应准则来更新其动作, 获得了较大的跟踪精度提升[55]。 类似地, Peng 等人将因果关系考虑在内, 提出基于深度强化学习的资源调度解决方案, 在提高跟踪精度的同时, 使模型具有潜在的解释学习策略的能力[56]。
5.2 避免碰撞
避免碰撞技术的关键在于通过准确的碰撞预测和灵活的机动策略, 从而实现对在轨航天器的安全导航。 碰撞预测的核心是碰撞概率计算, 而机动规避算法则是机动策略的精髓。
5.2.1 碰撞概率计算
计算碰撞概率是避免碰撞的前置阶段。 Fan等人提出一种基于蒙特卡罗协方差演化的碰撞概率计算方法。 该方法精度高但计算极慢, 仅适用于少量受控的、 重点监测的空间目标间的碰撞演化计算, 不足以应对更加复杂的空间环境导致的大批量的轨道碰撞预警[57]。 Fernandez-Mellado 等人在仅提供初始开普勒参数的前提下, 用一组ANN 来预测卫星在一段时间内的分点参数。 该方法不依赖任何动态模型, 在传播中不涉及积分,因而执行速度更快[58]。 在实际应用中, 需要根据实测数据动态校正轨道预报协方差, 进行快速高精度的轨道误差传播, 以提供及时可靠的碰撞预警。
5.2.2 机动策略
机动规避策略旨在通过灵活的机动行为来避免潜在的碰撞风险。 在相对距离计算和机动策略的设计中, Ni 等人提出基于人工势函数的滑模控制策略, 在保证相对位置和姿态误差的收敛的同时避免发生碰撞[59]。 Qu 等人还提出一种自适应探索深度确定性策略梯度(DDPG) 算法, 这一训练控制策略相较于上述人工势函数方法能够在近距离阶段能耗减少16.44%。 此外, 引入元学习, 可以在短时间内训练出适用于其他受扰动场景的控制策略[60]。
5.3 轨道博弈
轨道博弈是两个(含) 以上空间运动目标在各自允许的控制能力和所获得的信息支持下, 通过施加主动控制实现相对位姿的动态变化的过程。 其中, 追逐-逃逸作为空间轨道博弈的典型代表, 旨在支撑整体空间博弈战略, 获得空间优势。
Zhang 等人提出将原始的追逐-逃逸问题等效为一个四维的单边最优控制问题(OCP), 利用深度神经网络建立OCP 和其解的映射关系, 进而解决自由时间椭圆轨道追逐- 逃逸的博弈问题[61]。 Zhang 等人将追逐-逃逸问题建模为差分博弈, 并给出一个闭合形式的边界解。 通过深度强化学习得到了轨道追逐-逃逸中近乎最佳的拦截策略[62]。 Zhao 将追逐- 逃逸问题转化为双边优化问题, 为了确定博弈双方的最优脉冲动作,设计了基于多代理强化学习框架的PRD-MADDPG算法[63]。 结果表明, 即使是在更复杂的约束下,该算法仍能有效地找到适用的策略。
6 研究前景
6.1 数据层面
准确的空间探测数据是不可或缺的。 这些数据来源包括地基的雷达、 光学、 激光测距以及天基的红外、 光学以及被动感知等, 对于目标的检测、 跟踪、 识别以及机动策略等至关重要。 为应对数据量少且涉及数据安全, 可以考虑
(1) 数字孪生技术的运用: 基于数字孪生技术建模空间场景, 进而提供高保真的空间目标仿真数据, 但需要注意数据与真实场景的匹配程度。
(2) 分布式机器学习的运用: 在保障数据安全的前提下, 建立国际间协作机制, 共同开展空间碎片的监测和跟踪工作。 联邦学习等先进技术的引入, 能够在不牺牲隐私的前提下, 促进全球范围内的合作, 实现信息共享与技术创新, 从而更好地应对不断增加的太空碎片问题。
6.2 感知层面
当前的空间环境态势感知系统在小目标和高轨目标的监测能力方面存在局限性, 需要进一步优化以提升性能。 此外, 对于空间目标的电磁和光学特性的监测与识别也需要精细化改进。 为了有效解决这些问题, 需进一步发挥人工智能在知识表示和迁移学习等方面的潜力
(1) 知识图谱的运用: 知识图谱可用于空间态势的知识表示与推理, 从而更好地组织表示空间物体、 行为事件之间的联系, 进行基于知识的目标检测、 跟踪、 识别等高级推理。
(2) 迁移学习的运用: 迁移学习可以将源域学习到的知识迁移到目标域, 空间环境态势感知涉及多样化的环境和场景, 对应的探测数据分布也存在差异。 通过域自适应技术, 将在一个空间场景获得的知识和模型迁移到另一个场景, 以提高跨场景的空间目标识别的一致性。 运用弱监督迁移学习提高对新发现空间目标的检测能力。
6.3 决策层面
现有地基雷达和光学等探测设备对空间的覆盖范围有限, 且受到地理条件的限制, 接收到的信号强度与被观测目标的距离成反比。 为了弥补地面监测网的不足, 基于天基光学的传感器被用于高轨目标探测。 为了提高跟踪性能, 需要使用多颗卫星来执行任务。
如何最大限度地降低消耗并获得更好地感知是需要进一步思考的方向。 构建多智能体协同算法,协调地面的雷达和光学传感器以及卫星上的红外和光学设备, 进而实现更为高效的分布式空间监测。
7 结论
在过去的几年里, 以深度学习和强化学习等关键技术为驱动, 以大数据和云计算为基础, 人工智能呈现出爆炸性的增长, 并在空间环境态势感知方面表现出卓越的能力。 因此, 将人工智能新技术应用于空间科学领域具有良好的发展前景。 可以预见, 数字孪生、 分布式机器学习、 知识图谱、 迁移学习、 多智能体协同将是未来空间环境态势感知的主要研究方向。 在此, 总结了本文关键结论和见解:
1. 在天地一体空间监测网络协同感知的背景下, 为了进一步强化空间态势感知能力, 通过多传感器的动态优化管理, 使系统取得整体性能最优。 通过数据融合, 将来自不同传感器的数据整合, 从而提供更丰富、 详尽的态势感知信息。
2. 在空间目标检测和识别任务中, 面临特征不确定性和样本稀缺性的双重难题。 因此, 需要针对典型目标的特征变化, 提出自动数据增强方法, 用于改进空间目标检测和识别的模型, 以提高其对空间目标特征变化的适应性。
3. 针对在空间复杂环境的不完全信息条件下的轨道博弈问题, 单个智能体的知识和计算能力有限, 难以有效应对各种不确定因素。 为了应对这一挑战, 可以考虑结合深度强化学习技术, 开展多智能体大规模博弈问题的建模和求解研究,以充分利用多智能体之间的交互信息, 并自适应地调整环境参数, 从而提高全局策略学习能力。