一种基于Bi-GRU 的卫星对地观测任务可调度性预测方法

2021-07-03陈浩罗棕杜春彭双李军

湖南大学学报（自然科学版） 2021年6期

陈浩，罗棕，杜春，彭双，李军

（国防科技大学电子科学学院，湖南长沙 410073）

随着成像卫星技术的不断发展，社会各领域对成像卫星的使用需求也越来越多，由于卫星资源有限，无法满足所有对地观测需求，导致观测需求冲突经常发生.卫星任务规划是从众多的卫星对地观测请求中选出一个无冲突子集，使得观测收益最大化.已有研究表明，卫星任务规划是一个典型的NPhard 问题[1-2]，目前尚没有多项式时间快速算法，大规模情况下，卫星任务规划具有庞大的解空间，通过随机搜索得到初始解的方法，需要较长的求解路径，规划计算费时费力[3].而卫星绕地球飞行，轨迹和任务均呈现周期性特点，可见历史规划方案对当前方案的制定有较大借鉴意义.如果把历史规划方案看作训练数据，这就使得通过构建机器学习模型，从而准确预测当前规划方案成为了可能，这就是卫星成像任务可调度性预测问题.通过预测得到卫星成像调度结果的方法计算量低，能够快速获得任务可调度性.此外预测结果不仅能初步表达最终调度结果、供操作员估算长期规划效益，还能为规划算法提供高价值的初始解.因而，卫星成像任务可调度性预测问题受到了学者的广泛关注.

Wang 等[4]、Tinker 等[5]提出基于案例学习的卫星观测任务规划方法，利用卫星规划历史数据集进行无监督学习，通过与已知的实例进行比对完成卫星任务规划.与无监督学习方法相比，监督学习方法具有针对性更强、预测计算更快、泛化能力更好的优点.鉴于此，Li 等[6]提出基于鲁棒性决策树和集成支持向量机的成像观测任务预测方法，取得了较好的预测效果，但从深度学习视角来看，其预测精度尚有提升空间.白国庆[7]、刘嵩[8]等提出基于全连接（fullyconnected）BP 神经网络的成像卫星可调度性预测方法，设计了一种由协同任务分配组件、任务调度组件、特征提取组件以及任务可调度性预测组件所构成的组件化求解架构，采用变隐含层节点的集成反向传播神经网络集成技术求解成像任务可调度性问题，预测准确率达到85%以上.邢立宁等[9]针对星上任务可调度性预测问题，在分析实际影响成像卫星任务执行因素（如任务重叠度、任务收益、气象信息等）的基础上，设计了一种基于BP 神经网络的预测方法，在卫星状况正常的情况下具有83%的预测准确率.BP 神经网络训练方法成熟，但没有考虑成像卫星任务可调度性预测问题中成像任务为时序任务的特点，难以建立相隔较远的两个成像任务之间的潜在依赖关系.随着深度学习的兴起，循环神经网络受到了越来越多的关注.相关研究表明[10-11]，循环神经网络（Recurrent Neural Network，RNN）能模仿短期记忆特性，尤其适合对时序数据进行处理.

由于循环神经网络在时序数据处理上比普通神经网络性能更优，Peng 等[12]针对星上任务调度问题，提出了基于长短记忆网络（Long Short-Term Memory，LSTM）的观测任务可调度性实时预测方法，其使用两个LSTM 网络来实现特征提取，再使用一个前馈BP 神经网络实现卫星自主规划，但每次仅能决策一个对地观测任务是否执行.连续的决策是一个多次序贯决策过程，该过程容易导致误差积累，从而使得预测精确度随时间的推移而下降.

本文提出一种基于双向门控循环单元[13-14]（Bidirectional Gated Recurrent Unit，Bi-GRU）的成像卫星观测任务可调度性预测模型，该方法可以有效观测建模前后任务之间的潜在相互影响，从而一次性实现对多个观测任务可调度性的准确预测.

1 问题描述与分析

1.1 相关定义

为了便于描述卫星对地观测任务可调度性预测问题，现作如下定义.

定义1 观测任务：卫星对单个地面目标进行一次有效观测，也称为成像任务.每个观测任务包含多种任务特征，相关符号记为：xi=〈f1，f2，…，fn〉，其中f*为任务特征，n 为特征总数，i 为观测任务的编号.

定义2 观测任务序列：观测任务按照观测时间窗口开始时间的先后顺序排成的序列，相关符号记为：X={xi|i∈[1，N]，N∈Z+}，N 为序列长度.此外定义{x1，…，xi-1}为xi的前驱任务序列，{xi+1，…，xN}为xi的后继任务序列.

定义3 成像方案：通过卫星任务规划系统计算得出的卫星对地成像的观测方案.

定义4 观测任务xi的可调度性预测结果记为yi，卫星任务规划系统真实计算结果记为.“yi=1”表示模型预测xi进入成像方案，“yi=0”则表示模型预测xi未进入成像方案.同理表示卫星任务规划系统将xi列入成像方案，表示卫星任务规划系统未将xi列入成像方案.此外定义观测任务序列X 对应的预测结果为Y={yi|i∈[1，N]，N∈Z+}，对应的系统规划结果为Y′={y′i|i∈[1，N]，N∈Z+}.

1.2 问题分析

卫星对地观测任务可调度性预测问题可以描述为：利用卫星任务规划系统的历史规划数据Strain=训练模型，模拟任务规划系统的映射关系，预测观测任务序列集合Stest={Xi|i∈[1，m]，m∈Z+}的可调度性.

利用历史规划数据预测卫星对地观测任务的规划结果实质是一个监督学习过程，而监督学习过程包括特征提取与选择、学习与训练、分类与识别.卫星在空间轨道上围绕地球做周期性运动，与地面目标之间并非时时可见，只有在观测时间窗口内才可能对该目标实施观测.除观测时间窗口约束条件之外，卫星受到其他约束条件的制约，如星上存储容量、星上能量、卫星动作切换时间、观测任务重叠度等等.因此，在对卫星观测任务进行可调度性预测时，需要考虑众多影响因素.参考文献[7-12，15-16]中关于成像卫星任务规划建模约束条件，本文主要考虑以下影响因素和约束条件.

1）优先级：观测任务的等级，代表观测任务的收益，优先级越高的观测任务越优先考虑列入成像方案.观测任务xi的优先级记为pi∈[1，40]，优先级40为最高优先级.本文定义任务规划优化目标为观测任务的收益（Fvalue）最大化：

2）观测持续时间：观测任务xi的观测时间窗口开始时间与结束时间之间的时间间隔.中低轨卫星对地面目标的观测时间窗口非常短，通常只有几秒钟到几十秒钟.观测持续时间过短影响观测任务有效性，过长则会引起资源的损耗，本文定义观测持续时间di∈[10，59].

3）卫星动作切换时间：成像方案中前一观测任务xi的观测结束时间与后一观测任务xj的观测起始时间的间隔需要不低于卫星动作切换所用时间tij：

4）任务冲突度：与观测任务xi发生观测时间窗口重叠的其他观测任务的数量.观测任务的任务冲突度越高，任务规划难度越大.

5）存储消耗：卫星执行观测任务所消耗的星上存储空间.记卫星在t 时刻的存储空间为m（t），执行观测任务xi的存储消耗为mi，mmax、mmin分别为卫星存储空间上限和下限.存储消耗满足约束条件：

6）能量消耗：卫星执行观测任务所消耗的星上能量.记卫星在时刻t 的能量值为e（t），在执行观测任务xi时卫星能量消耗为ei，emax、emin分别为卫星能量上限和下限.能量消耗值ei满足约束条件：

此外，本文还考虑卫星能量补充的情况：在成像方案相邻任务xi与xj的任务间隙，记光照条件下的能量补充为eij，满足约束条件：

考虑到传感器切换时间Ts（i，j）、卫星能量补充eij都与相邻任务之间的时间间隔有关，而任务冲突度与观测时间间隔、观测持续时间有关.因此本文选取优先级、观测持续时间、观测时间间隔、能量变化、存储变化作为输入特征.

2 模型分析

2.1 Bi-GRU 简介

循环神经网络（Recurrent Neural Network，RNN）是一类以序列数据为输入，在序列的演进方向进行递归且所有节点（循环单元）按链式连接的递归神经网络[14].由于标准的RNN 模型存在梯度消失或梯度爆炸等问题，一些学者提出LSTM[17-18]和GRU[19-20]等门控递归神经网络以增强RNN 的可用性.通常情况下GRU 和LSTM 的性能相似，但是GRU 参数更少，因此更容易收敛.GRU 中每个单元都可以通过重置门和更新门来控制信息的流动，并且在每个时间步都可以将所有的内存内容完全暴露出来.此外，GRU的输出是为了实现以前的内存状态和新的候选内存状态之间的平衡.

Bi-GRU 的基本思想是将规则GRU 中的神经元分为前向层和后向层，分别代表正的时间方向和负的时间方向.通过使用这种结构，很容易捕获到来自过去和未来的输入信息对当前状态的影响.

从机器学习视角来看，卫星对地观测任务可调度性预测是一个关于时序数据的“多对多”的二分类问题.模型在预测某个观测任务是否列入成像方案时，需要考察该任务的前驱任务序列和后继任务序列对当前任务可调度性的影响.利用GRU 的短时记忆能力，能够很好地建模当前任务与其前驱任务集合或者与后续任务集合之间的潜在关系.因此，我们采用了双向GRU（Bi－GRU）作为基本单元来构建预测模型，以期能够让模型从两个前后方向对当前任务的前驱/后继任务集合依赖性进行建模，以提升预测精准度.

2.2 模型构建

模型结构如图1 所示.基于Bi－GRU 网络的卫星对地观测任务可调度性预测模型（Earth Observation Satellite Task Prediction based on Bi－GRU，OTPre）由3 个部分组成，分别是MLP（Multilayer Perceptron）层、Deep Bi－GRU 层、分类层.

图1 模型结构框图Fig.1 Model structure block diagram

2.2.1 MLP 层

由图1 可知，N×5 维的观测任务序列X 首先进入MLP 层处理，经过L1次非线性变换得到矩阵UMLP.输入特征的非线性映射可以实现特征的精细划分，对时序特征提取和分类判断产生深远的影响.相关计算公式如下：

式中：W*、b*分别代表每一层的权重矩阵和偏置向量；f 为ReLU 激活函数.最后将MLP 层的输出矩阵传递到Deep Bi－GRU 层.

2.2.2 Deep Bi－GRU 层

由图1 可知，Deep Bi－GRU 层由N 个Deep Bi－GRU 单元组成，每个Deep Bi－GRU 包含4 层Bi－GRU 单元，每个Bi－GRU 单元包含前向GRU 单元和后向GRU 单元，每个GRU 单元包含hsize个隐含节点.每个GRU 单元的输入信息来自两方面，一是来自同一隐含层中前向（后向）GRU 传过来的信息二是来自上一层传递过来的信息

2.2.3 分类层

由图1 可知，分类层由L2个全连接层组成，负责将Deep Bi－GRU 层的输出Z 映射为预测概率.相关计算公式为：

2.3 模型训练

为了训练模型，本文采用交叉熵作为损失函数：

由于本文提出的网络模型内部参数较多，所以选择Adam 优化算法来求取使得损失函数最小的最优解.Adam 优化算法[21]同时具备AdaGrad 和RMSProp 算法的优点，适用于解决含大规模数据和参数的优化问题，计算高效且所需的内存少.如算法1 所示，模型输入训练数据集Strain和训练总迭代次数J；步骤1～2 对迭代计数参数j、ω 进行初始化；步骤3从训练数据选取样本数据；步骤4～5 利用初始化的参数计算样本数据的初始化预测结果和平均损失函数值C（0）；步骤6～12 对模型进行梯度计算、模型参数更新、预测结果更新、平均损失函数值更新.将损失函数取最小值的模型参数进行保存，重复上述步骤直到迭代循环结束.

3 实验仿真及结果分析

3.1 实验平台及数据准备

本实验程序在PyCharm 2019.03 编译器上使用Python+TensorFlow 编写，计算机配置为Inter（R）Core（TM）i7－9750H CPU @2.60GHz，内存为8.0 GB，操作系统为Windows10.

本次实验使用STK 软件计算观测任务的观测时间窗口，使用1.2 节所述约束条件构建卫星任务规划模型并使用遗传算法作为求解算法，计算结果作为观测任务的系统规划结果.本次实验数据集时间从2017－04－01T 00：00：00～2017－04－01T 23：59：59，共有4 791 组观测任务序列，每个观测任务序列中包含100 个观测任务，其中训练数据占比60%，验证数据占比20%，测试数据占比20%.

3.2 模型参数测试

模型参数设置与实验效果之间存在紧密的联系，为了得出模型最佳输出结果，分别对MLP 层、全连接层数和Deep Bi－GRU 的层数、GRU 隐含节点数的实验效果进行了测试.MLP 层数对比了层数0、1、2、3；Deep Bi－GRU 层数对比了参数3、4、5；隐含节点数对比了参数20、25、30；最后得出MLP 层L1为2、全连接层L2为3、Deep Bi－GRU 层数为4、隐含节点数为20 时模型分类准确率最高，平均预测准确率为92.21%.

3.3 Baseline 及评价准则

为了评估模型的实验性能，将本文提出模型OTPre 与广泛使用和最成功的传统机器学习分类模型支持向量机（SVM）、随机森林（RF）、文献[6]提出的稳健决策树和标准支持向量机模型（SVM－RF）进行了性能比较.此外，为了与文献[7－9]提出的模型进行性能比较，本文还选用MLP、GRU 模型作为Base－Line，其中MLP 层数设置为7 层、GRU 参数参照模型OTPre 设置.采用机器学习领域中普遍使用准确率、精确率、召回率、F1值对上述模型进行评价.

3.4 计算结果

表1 为各个模型预测结果的准确率、精确率、召回率、F1值.从表1 可以看出，与SVM、RF、SVM－RF、MLP 相比，本文所提出的方法在各项指标中表现出较为明显的优势，在准确率、精确率、召回率、F1值上分别平均高出6.95%、7.66%、10.11%、7.38%，这是因为这些模型难以建立相隔较远的两个成像任务之间的潜在依赖关系，对受多元约束（如存储消耗约束、能量消耗约束）影响的任务关联关系缺乏必要记忆.而模型OTPre 能更好地捕捉到这种潜在的依赖关系，从而取得了更好的预测效果.

表1 各类模型性能对比Tab.1 Performance comparison of various models %

模型OTPre 与GRU 相比，在准确率、精确率、召回率、F1值上分别高出2.27%、2.36%、3.45%、2.37%，说明双向循环神经网络各方面的预测能力更好，更适合卫星对地观测任务可调度性预测问题求解.

3.5 任务特征测试

本文选用优先级、观测持续时间、任务冲突度来测试任务特征与预测准确率之间的趋势关系.

3.5.1 优先级

图2（a）表示模型OTPre、GRU、SVM－RF 的观测任务优先级与预测准确率之间的趋势关系，通过分析可以得出以下结论.

图2 优先级、预测准确率与观测任务数量之间的趋势关系Fig.2 The trend relationship between priority，prediction accuracy and the task number

1）优先级12～40 的观测任务呈现优先级越高，预测准确率越高的变化趋势，这是因为在任务规划时优先级越高的观测任务，实际被列入成像方案的概率越高，预测更加容易.

2）优先级1～11 的观测任务呈现出优先级越高，预测准确率越低的变化趋势，这是因为优先级越低的观测任务，实际未列入成像方案的概率越大，预测更为容易.因此，介于高优先级与低优先级之间的观测任务（中优先级的观测任务）预测更加困难.如图2（b）所示，优先级11 是所有优先级中实际规划上的观测任务数量与实际未规划上的观测任务数量比值最接近1∶1.

3）3 种模型表现的趋势关系比较相似，均呈现出“V”字型，拐点都在优先级11 附近.

4）模型性能优良与模型对于中优先级观测任务的预测能力有关，模型学习能力越强，对中等优先级观测任务预测更加准确.

3.5.2 观测持续时间

图3（a）表示模型OTPre、GRU、SVM－RF 的观测持续时间与预测准确率之间的趋势关系.通过分析可以得出以下结论.

图3 观测持续时间、预测准确率与观测任务数量之间的趋势关系Fig.3 The trend relationship between observation duration of tasks，prediction accuracy and the task number

1）通过分析图3（a）可以得出，在相同观测持续时间的前提下，模型OTPre 的预测准确率要高于GRU、SVM-RF 模型，说明本文提出的模型针对本文场景具有更加优越的性能.

2）预测准确率曲线整体呈现观测持续时间越长，预测准确率越低，这种趋势随着模型预测性能的提升而呈现弱化的趋势.

3）预测准确率通常与观测任务实际规划情况有关，与优先级表现的趋势关系相似.通过分析图3（b）可得，随着观测持续时间的增加，实际列入成像方案的任务数量与实际未列入成像方案的任务数量的比值越接近1∶1.这是因为获取同等收益的情况下观测持续时间越长，消耗资源越多，需要综合衡量是否规划的获益与资源消耗，判断和预测都更加复杂.

4）模型性能优良与模型对于高观测持续时间的观测任务的预测能力有关，模型学习能力越强，对高任务观测持续时间的观测任务预测更加准确.

3.5.3 任务冲突度

图4（a）表示在模型OTPre、GRU、SVM-RF 中任务冲突度与预测准确率之间的趋势关系；图4（b）表示在不同任务冲突度的条件下，实际列入成像方案的观测任务和实际未列入成像方案的观测任务所占比例.通过分析可以得到以下结论：

1）通过分析图4（a）可以得出，在相同任务冲突度的前提下，模型OTPre 在预测冲突的观测任务的准确率最高，其次是GRU 模型，最后是SVM-RF 模型，这说明循环神经网络模型更适合卫星成像任务规划问题，可以对冲突的观测任务信息进行记忆.同时也说明双向循环神经网络模型比单向循环神经网络模型预测冲突观测任务的能力更强.

2）通过分析图4（a）可以得出，模型OTPre 相比于GRU、SVM-RF 模型在任务冲突度为0 时的预测准确率比较接近，但是在任务冲突度≥1 时的预测准确率具有更明显的优势.这说明OTPre 模型可以更好地学习到任务的冲突特征.当预测序列冲突任务数量越多，OTPre 模型与GRU 模型相比具有更加明显的优势.

3）由图4（a）可知，OTPre 模型在任务冲突度为1 时的预测准确率要比任务冲突度为0 时的预测准确率更高，这说明OTPre 模型能够有效发现相邻任务观测时间窗的冲突，并根据任务的特征进行准确决策.

4）由图4（a）可知，高任务冲突度（任务冲突度≥2）的预测准确率要明显低于低任务冲突度（任务冲突度≤1）的预测准确率.这是因为高任务冲突度的观测任务数量更多，而实际列入成像计划的比例更少，如图4（b）所示，正确预测高任务冲突度的任务难度更高.

图4 任务冲突度、观测任务所占比例与预测准确率之间的趋势关系Fig.4 The trend relationship between task conflict degree，performed tasks and prediction accuracy

4 结论

本文提出了一种基于Bi-GRU 的卫星观测任务可调度性预测模型，该模型能够有效预测建模前后观测任务之间的潜在依赖关系，充分考虑观测任务前后之间的影响，一次性预测多个观测任务的可调度性.实验中与SVM、RF、SVM-RF、MLP、GRU 等可调度性预测模型进行对比，本文提出的实验模型在准确率、精确率、召回率和F1值等指标上均表现更优.此外还测试了任务特征对预测准率趋势的关系.本文针对的是单星对地观测任务可调度性预测问题，下一步研究方向：

1）将本文模型预测结果作为初始解应用于任务规划系统中，研究初始解的质量对规划算法性能的影响.

2）利用多星任务规划经验数据，通过机器学习方法学习多星任务规划算法，实现对多星任务规划的预测.