基于卷积神经网络的卫星网络协调态势评估方法
2020-07-10刘和光陈志敏姚秀娟王春梅
高 翔,刘和光,陈志敏,姚秀娟,王春梅
(1. 中国科学院国家空间科学中心, 北京 100190; 2. 中国科学院复杂航天系统电子信息技术重点实验室, 北京 100190;3. 中国科学院微波遥感技术重点实验室, 北京 100190; 4. 中国科学院大学, 北京 100049)
卫星频率和轨道资源是卫星应用产业发展的基本要素,同时也是世界各国必争的一种宝贵的战略资源。世界各国必须按照国际电联(International Telecommunication Union, ITU)的《组织法》及《无线电规则》等,在划分的空间业务频段内,遵循“先登先占”原则,以卫星网络资料为基本单位,开展国际申报、协调、登记和维护工作,任何一个国家都不能单方面主宰卫星频率轨道资源的获取和使用[1]。目前,我国在国际电联登记的有效和获得一定保护地位的卫星频率和轨道资源的资料数量处于世界第4位(在美国、俄罗斯、法国之后)。
卫星网络资料的申报与国际协调是卫星频率轨道资源获取与频轨战略资源储备的唯一途径,同时,卫星网络资料的申报、协调是一个长期的过程,尤其是地球静止轨道(Geostationary Satellite Orbit, GSO)的资源竞争异常激烈[2-3]。相关技术人员在卫星网络申报、协调管理工作中,很难准确把握复杂的申报、协调态势,特别是协调涉及网络的申报地位、国家、政治、经济、技术、卫星操作者能力、谈判专家能力等多个维度的影响因素,且某些特征因素无法定量分析。为了能够提前做好GSO频率轨道资源储备的评估方案,解决GSO卫星网络的协调评估问题是关键工作。
在信息大数据时代的背景下,科学的管理决策离不开数据分析的支撑,空间频率轨道资源方面也不例外,用好卫星网络资料申报协调的历史数据,既是提升卫星频率轨道资源管理能力的有效途径,也是更好地服务于频轨资源储配、系统建设的重点方向。传统的GSO卫星网络资料的协调态势评估基本以频率领域专家的主观判断、经验及干扰兼容性技术分析[4]为主,多数实际的协调谈判甚至受利益的转让等谈判技巧策略的影响,这种串行的流程步骤均依赖于人工的仿真计算和专家的谈判能力,具有极大的不确定性。同时,对于某些轨位资源协调态势的论证评估工作往往需要不断地迭代,效率极低,单个轨位的论证评估时间基本需要1~1.5年,且受人工处理数据量的局限,基本以定性评估为主[5]。近年来,相关机构亦在探索基于模糊综合评价的层次分析方法[6]对GSO卫星的协调风险进行评估,依然受制于专家的主观因素,且需要1~2个月的时间。因此,急需对卫星网络资料历史数据加以深度利用,以增强卫星频轨资源协调态势的自主感知能力。
基于此,本文对协调态势分析因素进行研究,结合卫星网络数据特点,提出基于机器学习的态势评估方法,利用国际电联卫星网络历史数据库,建立训练数据集,验证并分析算法在处理卫星网络协调态势方面的有效性。结果表明,本文所提方法对卫星网络态势评估应用具有良好的适应性,对于提高卫星网络态势评估效能具有重要意义。
1 传统的卫星网络协调因素分析
1.1 卫星网络资料相关说明
卫星网络协调主要分为两大类:一是规划业务(planed services);二是非规划业务(non-planed services)。其中,规划类业务指国际电联考虑发展中国家的利益,避免发达国家抢先占用卫星频率轨道资源,为其成员国规划了相应的卫星轨位和频段,并用于卫星广播业务和卫星固定业务。除规划的卫星轨位和频段外,其余均为非规划业务,相比之下,非规划业务的竞争态势更加严峻,以GSO卫星频轨资源的竞争获取尤为突出,本文主要针对非规划业务GSO卫星网络的协调态势进行研究。非规划卫星网络资料申报、协调的整体流程如图1所示。
定义如下:
API(A资料):卫星网络提前公布资料,GSO卫星网络报送C资料时,自动生成。
C资料:卫星网络协调资料,描述卫星网络的各项申报参数,如轨道参数、频率指配参数、地面站参数,以及业务和业务区等。
N资料:卫星网络通知资料,进一步细化卫星网络资料参数,同时,涉及协调完成状态等。
RES49:决议49号数据资料,用于卫星固定业务(Fixed-Satellite Service, FSS)及卫星移动业务(Mobile-Satellite Service, MSS)的卫星网络资料,涉及发射、运载等方面信息。
图1 非规划业务卫星网络资料申报流程Fig.1 Application procedure of non-planed service satellite networks
如图1所示,卫星网络资料的申报不得早于其计划投入使用时间的前7年,即非规划业务频段卫星网络自国际电联收到完整申报材料之日起,须在7年内启用[7]。
1.2 影响因子分析
对非规划业务卫星网络资料,按照是否需要协调分类,如图2所示。
图2 卫星网络按协调需求分类Fig.2 Classification of satellite networks
虽然国际电联对于A+N程序的卫星网络无硬性协调要求,但随着低轨卫星数量的不断增多,星座、星群的发展建设,同样应重视。对于协调态势评估,主要还是依据现有电联建议书,进行干扰兼容性仿真计算。对于C+N程序的NGSO卫星网络,如国际的SpaceX的Starlink和OneWeb的L5 系统、我国的“虹云”“鸿雁”等[8-9],目前ITU尚未有相应的协调依据或参考,且卫星网络数据有限,因此,在协调评估方面,也只能通过干扰仿真计算或引入干扰规避策略方式进行结果判定[10]。对于C+N程序的GSO卫星网络的协调评估因素,如表1所示,需要考虑的因素多样,如谈判专家能力、操作者能力(是否具备漂星能力等)、国家战略意图等信息无法从网络资料数据上体现、获取,甚至量化。通常,频率领域专家基本靠经验、协调难易程度、干扰仿真结果等因素进行频率、轨道储备选取。由于每个专家的出发点不同,评估结果也必然存在差异,无法达成统一的定量化效果,且不同因素指标间重复迭代,反应速度也相应滞后。
表1 传统GSO卫星网络之间的协调因素
表1(续)
2 卫星网络协调态势数据特点分析
通过对GSO卫星网络协调影响因素等的分析,总结而言,卫星网络的态势评估主要具有以下两个基本特点:
1)评估过程具有数学回归特性。卫星网络态势评估的绝大部分分析过程,无论其影响因子是连续量还是离散量,对态势的发展程度均具有相对应的数学回归背景,即可以通过相应的数学模型体现出其当前的态势与发展。
2)影响因子具有多元非线性。影响评估过程的因素非常多,从表1可以看出,协调态势评估的影响因子不少于30个,因子的量化分析也极为复杂,某些因子需要进行概率统计等方式量化,而量化过程往往具有一定的非线性,同时,部分因子无法直接获取,或存在隐含的相关性。
3 算法设计
3.1 算法检选
根据卫星网络协调态势评估过程的特点,协调态势评估首先是个对未知模型的回归求解过程,评估过程所采用的算法应刻画出输入影响因子与输出评估结果之间的耦合关系,因此,类似遗传算法、蚁群算法等寻求问题最优解的算法无法满足协调态势的评估要求。而根据定理1,神经网络可以对任意连续函数g(x)进行最佳平方逼近,因此,人工神经网络可以通过对样本数据的拟合,刻画出协调态势的评估模型。此外,杨国为等[11]也证明,通过设计特定的神经网络结构,可无限逼近Rm上有界闭子集到Rn上的任意连续映射,从而使得神经网络具有广泛的非线性逼近能力,可以解决协调态势评估过程中影响因子的非线性问题。
本文拟采用卷积神经网络(Convolution Neural Network, CNN),除了具有上述传统神经网络的特点外,还有如下优点:
①具有多维度大数据处理能力;
②保存数据特征原始性;
③与传统神经网络算法相比,深度学习网络使用更多的数据可以更好地提高算法估计的正确率。
综上所述,本文通过采用基于卷积神经网络模型的协调态势评估算法,可以有效地刻画出协调态势影响因子与输出结果之间的耦合关系,并且可以较好地克服评估模型中影响因子的非线性问题。
3.2 数据集建立方法
3.2.1 建立原则
依据国际电联卫星网络数据库,建立训练集,属性集合尽可能体现目前所掌握的GSO卫星网络C资料数据库信息[13]。训练数据属性特征如表2所示。
其中,频率指配依据ITU无线电规则频率划分进行分段描述,选择GSO竞争激烈的FSS与MSS频段进行分析,在1~70 GHz范围内,共196个频段划分。此外,国家能力则以GSO有效资料数量、操作者数量等进行查询统计量化。最终,数据维度高达4009维,自2008年6月至2017年12月统计GSO卫星网络最终状态C资料为2878份,以此作为训练集合。
3.2.2 数据标定
卫星网络态势评估的模型训练属于监督学习,因此,需要对数据进行标定操作,标定结果为每个资料ITEM的协调通过概率,标定方法如下:
(1)
表2 训练数据属性特征示意
(2)
其中:P(Cn)为第n条卫星网络的通过协调概率,Cn为第n条卫星网络记录;Index_Countryi为协调国家的权重系数;grpNum_pass为通过协调的频率指配数量;grpNum为具备协调关系的频率指配数量;Num_GSO_N为该国GSO卫星网络有效资料(N资料)数量,Total_all为全球GSO卫星网络N资料数量。
这里需要说明的是,GSO卫星网络N资料的数量,即GSO有效资料数量在很大程度上代表了一个卫星网络操作者所占用的频轨资源,也体现了与其协调的难易程度。同样地,对于一个国家而言,亦可利用GSO卫星网络N资料数量评估一个国家的协调权重。
数据标定的数据基础为ITU卫星网络数据库,标定流程如图3所示。
3.2.3 数据降维
由于数据集中存在大量的多值属性数据,如时间数据、轨位数据,以及频率指配中的相关数据等,此时,采取增益比率(GainRatio)标准对数据打分,并作数据降维处理。
(3)
其中,Gain(S,A)为信息增益,SplitInformation(S,A)为分裂信息项,用以衡量属性分裂数据的广度域均匀性。
图3 数据标定流程Fig.3 Data label process
(4)
式中,Si为n个值的属性A分割S而形成的n个子集。
3.3 CNN评估模型
卷积神经网络(CNN神经网络)是一种特殊的深层神经网络模型,它的特殊性体现在两个方面:一方面,它的神经元间的连接是非全连接的;另一方面,同一层中某些神经元之间连接的权重是共享的,卷积神经网络具备良好的泛化能力[14]。
此外,CNN神经网络可以直接处理高维的样本数据[15],而不需要先进行特征提取,这是由于它具有局部感知、权重共享和多卷积核的特性。
CNN算法流程如算法1所示。
算法1 卷积神经网络
4 验证分析
利用处理好的数据样本,本文采用CNN模型对卫星网络协调态势进行评估,将数据集分为训练集、验证集及测试集,同时,通过模型调参,选取最优参数配置,验证了CNN对卫星网络协调态势评估的有效性。
4.1 验证流程
由于数据集合的维度高达4009,因此,需要对数据进行特征提取,采用分裂信息增益准则得到优选特征数据,特征提取后,数据降维至3437;随机地将样本数据分为三部分(训练集、验证集及测试集),然后用训练集来训练模型,进行参数调优,使用验证集验证模型和参数;对比前后评估结果,进行迭代;最终确定数据分割最优集和参数最优集,通过测试集进行测试。上述流程如图4所示。
图4 验证测试流程Fig.4 Verification test process
4.2 集合分割
将样本数据分为三部分(训练集、验证集及测试集),当训练集合验证集划分比例为7 ∶3时,采取交叉验证方式,验证集正确率最高,结合参数调优结果,确定划分比例为7 ∶3,此时,验证效果为最佳,如图5所示。
图5 CNN交叉验证正确率对比Fig.5 Cross validation correct rate comparison of CNN
4.3 参数调优
CNN模型参数如表3所示。
表3 CNN模型参数列表
测试结果如图6所示。
(a) 训练轮数确认(a) Confirmation of epoch
(b) loss=′msle′, optimizer=′Adadelta′, epoch= 50, batch_size=32, best_val_acc=0.838 0
(c) loss=′msle′, optimizer=′Adadelta′, epoch= 100, batch_size=32, best_val_acc=0.858 9
(d) loss=′msle′, optimizer=′Adadelta′, epoch=100, batch_size=32, lr=1.0, best_val_acc=0.861 3图6 参数调优结果示意Fig.6 Parameter tuning results
数据中尺度跨度较大,所以损失函数为均方对数损失(MSLE)效果最佳,由图6(a)可以看出,当epoch迭代训练高于100时,损失率已基本平稳,因此,epoch取值100;由图6(b)、图6(c)可以看出,网络中隐藏层为三层,相较两层,其训练效果相对有所提升。改变最终的调参结果如表4所示。
表4 参数选择
4.4 测试结果
选取数据集中的100条数据作为测试集合,测试结果如图7所示。
经统计,平均误差为19.65%,即待测样本准确率达到83.35%。
改变数据集大小,经过参数调优等上述过程,选取相同测试集,测试结果如图8、表5所示。
结果证明,数据集过小时,存在过拟合现象,但随着样本数量的增加,模型预测效果不断提高,呈现明显变好趋势。
5 结论
卫星网络资料的协调态势评估在空间频轨资源获取与储备中具有重要的指导作用。随着频轨资源竞争日趋激烈,频轨资源的储备与获取形势已变得日益严峻。随着卫星数量的剧增,协调难度不断提高,由于卫星网络协调因素繁多,传统的专家论证已无法满足未来频轨资源储备的反应需求。为充分利用历史卫星网络资料数据,本文在系统分析GSO协调因素特点的前提下,提出将CNN用于卫星频轨资源协调态势评估,建立GSO频轨资源协调态势评估训练数据集合与CNN模型。通过试验,验证了CNN应用于卫星频轨资源协调态势评估的有效性,并测试了其评估效能,为频轨资源储备论证提供了新的评估手段与技术基础,提高了决策效率,效果明显。
(a) 测试集数据1~50测试结果(a) Data 1~50 test results
(b) 测试集数据51~100测试结果(b) Data 51~100 test results图7 CNN测试结果比对Fig.7 CNN test results comparison
图8 数据量对CNN测试结果的影响Fig.8 Impact of data volume on CNN test results
表5 CNN测试正确率随数据变化统计