星地融合网络中基于无监督图学习的卫星切换方法研究*

2024-03-04刘人鹏涂文康胡博王恒齐文

移动通信 2024年1期

刘人鹏，涂文康，胡博**，王恒，齐文

（1.北京邮电大学网络与交换技术全国重点实验室，北京 100876；2.中国电信股份有限公司研究院，北京 102209）

0 引言

随着全球移动通信需求的日益增加，未来6G 通信系统将整合地面移动通信和卫星通信两张网络，形成星地融合的网络结构，为全球各类用户提供泛在宽带服务[1]。当前，移动通信网络仅覆盖了大约20%的陆地面积，仍然有超过30%的人口无法接入互联网，全球通信覆盖能力和数据传输能力存在显著不均衡。卫星通信网络受基础设施建设等客观因素的限制较小，特别是低轨道卫星，相比高轨道和中轨道卫星，发射成本更低、通信时延更短、链路损耗更小，可解决地面移动通信在偏远地区覆盖和需要快速稳定的应急通信等方面的问题。卫星通信与地面通信遵循“5G 兼容，6G 融合”的理念——在人口密集区域使用地面通信网络，以发挥其大容量、高速率和低时延的优势，在其他偏远地区则使用卫星通信网络，以发挥其广泛覆盖的优势[3]。星地融合网络具有更为复杂、难以描述和预测的移动特性，需要研究高效的切换控制技术以确保星地融合网络中通信连续性[4]。

近年来，国际标准组织对移动性切换开展了众多标准化工作，如3GPP 在R17 版本开展了对非地面网络（NTN,Non-Terrestrial Network）中基于位置的移动性管理等技术的标准化工作。在R18 版本NR NTN Enhancements 项目中，进一步增强NTN-TN 和NTN-NTN 移动性和服务连续性，特别是针对非连续覆盖场景下移动性管理展开研究[5]。近年来，多位学者针对各种卫星网络以及星地融合网络的各种场景中的切换策略进行了详细论述。在文献[6]中，作者提出了一种以用户为中心的切换方案，通过多卫星同时缓存用户的下行数据地面实现用户的无缝切换，解决频繁切换的问题。在文献[7]中，作者提出了一种基于网络流的切换策略，在巨型低地球轨道（LEO,Low Earth Orbit）卫星星座中最大化用户体验质量（QoE,Quality of Experience）。随着LEO卫星的大规模部署，某一区域的移动设备可能同时拥有多颗可见卫星，面临多接入点选择的问题。如果切换条件不合适，可能会导致反复频繁切换，增大决策负担，文献[8]中作者研究了超密集LEO 卫星网络（UD-LSN,Ultra-Dense LEO Satellite Network）中的卫星切换模型，提出了一种基于双层分组和集群的移动性管理架构，旨在降低管理复杂性。文献[9–11]采用了强化学习的思想，用户以优化长期吞吐量为目标自主决策，从而避免非地面基站之间频繁切换。在文献[12]中，作者利用传输链路质量、LEO-BS 的负载均衡度以及剩余覆盖时间来设计切换决策度量，在保证服务质量（QoS,Quality of Service）的基础上，减少用户平均切换次数。文献[13]中作者提出了一种面向低轨卫星通信网络的基于图的卫星切换框架，通过根据不同的切换标准设置链路权重，基于图的框架可以支持多种卫星切换策略。文献[14]在图切换框架的基础上，为每条边设计切换参数，优化切换时机与切换序列。文献[15]中作者提出一种基于图框架的多属性图切换算法，以优化切换次数为目标，使用critic 方法对多个切换属性进行加权，从而降低平均切换时延。

现有方法如基于多属性决策的切换方法通过预设权重衡量各个切换属性，难以满足用户多样化需求，基于机器学习的切换方法需要大量的数据来进行训练，在卫星通信系统中，数据的获取和处理会受到星地大时空尺度信道变化的限制。本文提出一种基于无监督图学习的方法，引入卫星覆盖时空图，表征网络连接关系，定制面向切换决策的信息素感知机制，收集并监测候选卫星的切换信息，建立图学习模型挖掘卫星覆盖时空图中的特征信息和拓扑信息，求解包含节点和边之间复杂相互作用的星地网络切换问题，保证网络吞吐量，搭建星地融合通信仿真环境，测试所提切换方法的性能。

1 基于无监督图学习的切换方法

1.1 场景模型

本文构建了一个星地融合网络用户切换场景模型，由低轨卫星网络为地面用户提供网络接入服务，每个地面用户可以被多颗低轨卫星覆盖，但同一时间只与一颗低轨卫星建立通信链路[16]。用户在通信过程中会因卫星移动触发切换，根据星地链路的质量选择可见范围内的候选卫星，每颗候选卫星都为用户预留一定的缓存空间[6]。

星地融合网络场景如图1 所示，设覆盖区域内用户由低轨卫星持续提供通信服务，该场景主要由以下部分构成：低轨通信卫星表示为，卫星沿固定星历轨迹运动，当运动至用户可见范围内，可以作为潜在的切换候选卫星。地面用户表示为，利用可见关系矩阵来表示用户与卫星的覆盖关系[9]。

图1 星地融合网络切换场景图

其中R为地球半径，h为卫星轨道高度，卫星与用户之间的距离可以计算为：

每颗卫星节点的剩余服务时间属性可以依据星历导出的覆盖时间tM计算得到[18]：

卫星与地面用户的基本路径损耗PLb计算为为自由空间传播损耗、阴影衰落与杂波损耗之和：

可计算出地面用户信噪比为：

其中Ptr、Gtr、Gre分别为发射功率、发射天线增益、接收天线增益，用户可达速率通过香农定理计算为：

其中，Ps表示该用户成功切换的概率，Tr表示从切换失败到重新启动再到链路重建的等待时间，Tp包含了切换过程所需传播时延和处理时延，地面用户的平均切换时延可计算为：

定义卫星节点负载为该网络当前接入的用户数与最大可服务用户数之比，网络负载可以表示为卫星节点负载方差：

其中Mj为最大可服务用户数，为卫星节点负载平均值。

本文目标是在满足用户业务连续性和网络负载均衡的前提下提高网络吞吐量，可以将切换问题建模为：

目标函数表示最大化网络吞吐量，约束第一项中{0,1} 表示地面用户与卫星之间连接指示符的取值范围，第二项中表示用户最小速率需求阈值，第三项中Dth表示切换时延最大阈值，第四项中Lth表示网络负载最大阈值，第五项表示每颗卫星服务用户数的取值范围，其中为最大服务的用户数量。

1.2 接入请求及切换流程

整个星地通信过程分为接入和切换两个步骤，初次接入卫星网络时，地面用户需要根据卫星周期发送的广播信号强度选择连接的卫星节点，并向该节点发出接入请求。批准接入请求后，卫星给用户分配通信资源。当用户需要切换卫星节点时，用户需要根据候选目标卫星的信息抉择出目标卫星，如图2 所示，切换的具体流程如下[19]：

图2 星地融合网络切换流程图

第1 步：用户向源卫星发送链路资源控制（RRC,Radio Resource Control）测量报告，包括候选切换卫星列表，发起切换请求。

第2 步：源卫星检查基于信息素机制生成的候选卫星资源状态，生成候选卫星列表报告，并向列表中的卫星发送切换准入请求。

第3 步：收到切换准入请求的候选目标卫星进行准入控制，并告知源卫星是否确认切换准入请求。

第4 步：根据候选目标卫星反馈的信息，源卫星向用户发送RRC 重配置进程，用于选择切换目标卫星。

第5 步：用户按照RRC 重配置进程对候选卫星进行切换决策。

第6 步：在切换目标卫星为用户配置可用资源后，用户断开与源卫星之间的连接，开始与目标卫星进行同步。

第7 步：目标卫星发送用户上下文释放消息，告知源卫星已完成链路切换。

第8 步：源卫星告知其他候选目标卫星切换过程已结束，释放预留资源。

从上述步骤可以看出在LEO 卫星星座的切换过程中，用户需要在多个候选目标卫星中选择切换的目标卫星，网络服务质量与步骤5 中选择目标卫星的具体策略息息相关。

1.3 基于图学习的切换决策算法

在星地融合网络中，低轨卫星持续高速运动，为了描述用户与卫星之间的动态时空连接关系，引入卫星覆盖时空图[18]，其主要思想是将星地融合网络连续动态拓扑离散化，在每个离散切片认为拓扑不发生变化，描述每个切片下卫星与用户的连接关系[20]，然后确定用户接入请求时间段，利用星历信息计算在通信周期内经过用户可见区域的卫星，其次将每颗卫星的覆盖周期视为一个节点，潜在的切换选择视为一条有向边，构建切换时空覆盖演进图，则用户的切换决策可以转换为在图中寻找一条表示多次切换决策的最佳切换路径。通过潜在切换选择构建卫星之间的边时存在两种情况，当用户被两颗卫星覆盖，此时直接切换到下一颗卫星；当用户被三颗及以上卫星覆盖，需要进行切换决策。

图3 为卫星时空覆盖演进图：

图3 卫星时空覆盖演进图

对于已构建的卫星时空覆盖演进图，利用增强的信息素感知候选卫星节点可接入状态[21]，具体来说，本文采用定制的蚂蚁包，分为了前向蚂蚁（FA）和后向蚂蚁（BA）来发现切换路径并反馈给源节点，并通过转发BA 携带的信息来更新切换路径集合。

本文中将网络状态分为节点状态和链路状态，定制蚂蚁包为了适应动态卫星网络，信息素会随着蚂蚁包和时间的移动而不断更新，初始信息素浓度设置为0.1，当节点接收FA，信息素浓度正增加为：

其中τ(i,j) 为原始信息素浓度，∆τ为信息素浓度变化量。对于每个接收BA 的ISL，信息素的浓度更新为：

信息素自衰减为：

图学习方法可以捕获拓扑和属性信息，并且可以将这些信息建模为表示图中显式或隐式结构关系，基于信息素收集的卫星节点状态信息，采用图注意力网络进行特征嵌入学习，无监督训练过程直接调整模型参数以最大化目标函数，不需要任何数据标签。图4 展示了本文所用的图注意力网络架构，其中节点特征嵌入由复杂的多个图注意力层（GALs,Graph Attention Layer）完成。

图4 图注意力网络架构图

节点i在第m次迭代中向邻居节点j学习特征的注意力系数的计算如下：

其中f是LeakyReLU 激活函数，节点的嵌入特征可以表示为：

2 仿真设置与结果分析

本文利用仿真工具搭建星地融合网络仿真环境，对所提切换方法进行仿真试验测试。

2.1 参数设置

采用Teledesic 卫星网络的轨道参数，轨面数为12，每条轨道分布24 颗卫星，轨道高度为1 375 km，轨道倾角为84.7°，如表2 所示：

表2 仿真参数设置

2.2 实验结果分析

选取某地多个地面用户进行切换仿真实验，采用相同参数设置，首先验证所提基于图学习切换方法在有监督与无监督条件下的收敛情况，以达到训练数据集80%的时间为标准，分别测试了用户规模在10 到60 递增时的收敛时间。

图5 展示了监督模型和无监督模型的收敛行为比较，可以看出随着网络规模的增加，两种模型都需要更长的时间来收敛，无监督模型与监督模型相比，需要更长的时间才能收敛，特别是对于较大的网络规模，后续可以考虑自监督预训练帮助无监督模型收敛得更快。

图5 有监督模型和无监督模型收敛性比较图

图6 展示了有监督模型和无监督模型实现的网络吞吐量性能，其中监督模型的训练数据由穷举法搜索获取，可以看出两种模型都达到了穷举搜索的最佳总和率的80% 以上，但会随着网络规模的增加而下降，这是由于网络负载的增加与切换决策维度增长导致的。

图6 有监督模型和无监督模型网络平均吞吐量性能图

图7 对比了有监督模型、无监督模型和多属性切换算法的时延性能。其中多属性切换算法主要切换参数包括仰角、覆盖时间和空闲信道状态，采用critic 加权处理，以保证切换决策对各指标之间的客观评价。可以看出随着用户数量的增加，三种方法的平均切换时延都相应地随之增加，然而无监督模型相较于其他两种方法时延性能优势明显，这主要得益于无监督模型较短的处理时延，降低了切换失败率，减少了用户重新等待导致的排队时延。

图7 有监督模型和无监督模型切换时延性能图

3 结束语

在星地融合网络中，低轨通信卫星以持续高速运动，星间切换时卫星与用户时空连接关系的快速变化。在卫星移动过程中，切换请求的剧增使得有限的星上资源难以满足所有切换请求，从而降低了切换成功率。本文提出了一种基于无监督图学习的切换决策方法，引入卫星覆盖时空图以描述卫星节点与用户在不同时间与空间下的连接关系，设计信息素感知机制监测候选卫星的切换信息，为切换决策提供关键数据，通过无监督图学习模型挖掘卫星覆盖时空图中的特征和拓扑信息，求解了包含节点和边之间复杂相互作用的星地网络切换问题。搭建低轨卫星重叠覆盖切换场景，对不同规模用户进行了切换仿真实验。实验结果表明，无监督图学习模型以稍长的收敛时间换取了较大幅度的时延性能提高，增强了网络对动态切换环境的适应性。