APP下载

基于访问偏好的卫星遥测时序数据存储方法*

2023-11-20孙红梅韩亚楠赵效鹏

火力与指挥控制 2023年10期
关键词:霍克遥测时序

邹 俞,孙红梅,韩亚楠,赵效鹏

(宇航动力学国家重点实验室,西安 710000)

0 引言

随着航天技术的发展,通信、导航和气象等卫星不断投入生产生活,在轨卫星数量不断增加,尤其是伴随着巨星星座的构建,在轨卫星数量在不断提升。测控系统是在轨卫星管理的核心节点,主要负责接收处理卫星测控数据,并根据卫星方业务需求及卫星状态对卫星开展轨控等业务操作,其中卫星遥测数据是获取卫星状态的最关键数据。

测控系统中将遥测数据分为时序数据存储和分布式文件系统存储,其中时序数据只存储最新的遥测参数,业务软件可从时序数据库中快速获取卫星最新状态开展业务操作。而时序数据库保持高效索引的关键是将数据索引建立在内存上,因此,数据量越大,对内存大小要求越高,带来了单台服务器管理卫星数量限制较高的问题。当前卫星设计越发复杂,高轨星每天产生可产生GB 级别的工程遥测数据、卫星数量就越多,如果有效管理使用遥测时序数据,根据实际需求对遥测时序存储策略进行调整,在保证数据访问效率的同时有效降低时序数据的存储量,是当前亟需解决的问题。

1 研究现状

遥测数据有以下两个特征,一是时序特征,所有遥测参数均按照数据产生时间使用;二是标识特征,遥测数据的标识决定遥测参数,如标识n 表示卫星发动机A 部位B 的温度。

业务软件访问遥测时序数据主要依据遥测标识和数据时间,即需求为访问某个遥测参数某个时间段的数据。因此,遥测参数存储策略是个典型的兴趣点推荐模型,即基于用户历史访问记录预测下次可能访问遥测参数及数据时间,从而决定存储哪些遥测参数及对应遥测参数的存储时间。

协同过滤模型是传统商业推荐系统中常用的模型,如LI 等建立矩阵分解模型,通过分解矩阵构建用户兴趣点表征,进而利用表征向量的内积对矩阵进行补全实现预测用户兴趣点偏好[1];YE 等基于地理学第一定律总结用户行为特征[2-5],认为用户倾向选择兴趣点同类型兴趣点,并提出了通过幂律分布、核分布和高斯分布作为衰减函数预测用户兴趣点的方法;YUAN 等在协同过滤方法基础上引进时间感知特征,考虑到了兴趣选取得周期性特征并建模求解[6]。传统的商业兴趣点推荐模型虽然考虑了用户签到记录,但未考虑签到记录的时序关系,而签到行为有着很强的序列关联性。因此,RENDLE 等引入马尔科夫模型进行兴趣点推荐建模,提出了分解个性化马尔科夫链的贝叶斯个性化排序方法来预测用户偏好[7];MATHEW 等提出了对兴趣点进行聚类,进一步提出了基于隐形马尔科夫模型的兴趣混合推荐模型[8];引入马尔科夫模型考虑了签到记录的时序关系,使用最近的签到信息来建模用户的偏好,但仍难以获取序列的长期依赖关系。近些年来,深度神经网络因其强大的拟合能力,在计算机视觉、自然语言处理等方面取得了巨大的进展。因此,深度神经网络模型进来也引入兴趣点推荐建模中。主流算法有卷积神经网络(convolutional neural networks,CNN)、多层感知机(multilayer perceptron,MLP)、循环神经网络(recurrent neural networks,RNN)等。ZHAO 等通过Word2Vec 模型学习用户签到数据及序列关系进行偏好预测[9];DING等利用矩阵分解得到用户签到数据特征的向量表征,建立了一种基于深度神经网络的推荐模型[10];上述模型虽然通过学习用户签到序列构建了模型预测用户偏好,但需要的用户签到数据样本较大,YANG 等提出了深度兴趣点时空推荐模型ST-NHP,通过长短记忆网和图注意网模型学习用户的历史偏好和周期偏好预测用户兴趣点,通过分解用户行为提高了学习效率,一定程度解决了学习成本的问题[11-12]。

针对上述问题,本文基于遥测数据实际业务需求,对单个遥测参数存储进行建模,考虑目标遥测参数、相关遥测参数和时间抑制作用,提出了深度线性规划霍克斯模型,在保证冷启动效率的前提下,通过预测用户访问需求有效降低了时序数据存储量。

2 基本原理

2.1 遥测数据存储架构设计

2.1.1 遥测参数结构

卫星遥测数据是反应卫星状态的重要参数,时序遥测存储是按帧存储,单帧遥测数据主要包含以下内容:

1)参数标识:遥测参数在测控系统中的唯一键,唯一标识一种含义遥测参数;

2)数据时间:遥测数据的产生时间;

3)数据内容:遥测数据的具体内同。

其中参数标识唯一标识了遥测数据的含义,依据遥测描述表可获取遥测参数的具体含义,其中遥测描述表主要包含以下信息:

1)参数标识:遥测参数的唯一键;

2)遥测标记:遥测的符号标识,用于解析和标识遥测参数;

3)遥测名称:遥测数据的具体含义。

解析主要依据遥测描述表,遥测描述表规定了某个卫星遥测参数的参数标识(遥测参数的唯一标识)、参数标记和参数的数据名称。数据处理系统根据遥测描述表,解析遥测原始数据,产生按参数存储的遥测处理结果数据。

2.1.2 遥遥测存储使用流程

如图1 所示,测控系统卫星遥测数据存储流程主要分为以下几个步骤:

图1 遥测数据存储Fig.1 Telemetry data storage

1)数据传输:测控设备接收卫星发送的遥测数据,发送至数据处理系统;

2)数据处理:数据处理系统接收遥测原始数据,解析产生处理结果数据;

3)数据存储:

a)原始数据存储:实时存储软件接收遥测原始数据,按时间段将数据压缩打包,并存储至分布式文件系统;

b)处理结果存储:实时存储软件接收遥测处理结果数据,将遥测参数按一定格式存储至时序数据库,同时按时间段将数据压缩打包存储至分布式文件系统。

数据存储管理中主要分为以下两类:

1)文件存储:利用分布式文件系统存储量大、稳定性高的特点,存储卫星全生命周期的遥测原始数据及处理结果,供卫星遥测参数长驱分析、故障诊断等业务使用;

2)时序存储:利用时序数据库索引效率高的特点,分参数存储最新一段时间的遥测处理结果,供业务软件快速获取卫星最新状态。

遥测数据访问流程如下:

控制计算软件等业务软件,按照卫星代号、卫星遥测参数标识、数据开始时间和数据结束时间获取某卫星规定时间段的某个遥测参数内容。

2.1.3 遥测数据存储管理策略

当前测控系统的时序遥测存储管理策略如下:

1)分任务存储:时序数据库按卫星代号建库,以遥测数据时间、遥测参数标识和遥测数据内容等为遥测表的列元素存储一个月的遥测数据,利用时序数据库高效的索引效率,向业务软件提供快速的访问服务;

2)全生命周期数据存储:将遥测原始数据及处理结果记盘,每半个小时打包压缩,存储至分布式文件系统;

3)数据访问:业务系统统一通过数据访问服务软件获取所需遥测数据。

2.2 遥测时序偏好存储算法

2.2.1 遥测时序存储架构设计

遥测时序数据存储策略的核心是根据业务软件的遥测数据访问记录,调整遥测参数的存储时间。针对该需求,将业务软件的数据访问需求引入实时存储软件,作为其输入去调整遥测时序数据的存储策略。

如图2 所示,通过以下方式实现对数据存储策略的调整:

图2 遥测时序架构Fig.2 Telemetry time series architecture

1)获取用户习惯:数据访问服务软件将业务子系统发送的访问需求发送至实时存储软件;

2)调整存储策略:实时存储接收访问需求,并依据访问需求中的卫星代号、参数标识、数据使用时间和该卫星的历史遥测访问记录,调整参数的存储时间。

2.2.2 深度线性规划霍克斯模型

原始的霍克斯模型独立的学习每个卫星的遥测参数,没有对卫星遥测未来的存储策略进行优化。而且卫星遥测的业务过程中,有卫星组的概念。例如对于A 卫星组的卫星可以有A1,A2和A3等。对于A 组内A1卫星的遥测访问和存储,会对A 组内的其他卫星访问产生影响。本文不仅仅考虑的是当前的访问卫星,同时考虑关联组内的其他卫星,同时加入了时间影响因素进行优化,提出了一种深度的线性霍克斯模型。

1)参数定义

对遥测数据访问记录的相关定义如下:

①卫星集合:记卫星集合为S={s1,s2,…,sn},其中,si表示卫星i。

②遥测描述表:卫星i 的遥测描述表集合为Psi={psi1,psi2,…,psim}。

④卫星遥测访问元组:记卫星i 关于参数j 第k 次访问的访问元组μ={si,pj,ck,tk},其中k 表示第k次访问记录的生成时间,tk表示第k 次访问记录中数据的开始时间。

2)霍克斯模型

由于不同卫星的遥测描述表的生成是相互独立的,所以遥测时序存储策略的建模帧是针对单个卫星进行建模。实现遥测时序数据存储管理的核心根据业务软件对所访问遥测参数的实际需求时间,调整该参数的存储时间。要实现该目标,关键在于以下两点:

①参数激励:对业务软件可能会访问的遥测参数的存储,根据历史访问记录调整该参数数据存储时间;

②参数抑制:对业务软件不访问的遥测参数的存储,引入递增变量,不断降低该参数数据存储时间。

参数激励过程是标准的霍克斯过程,即每次历史访问都对未来是否访问该参数起到激励作用。本文定义参数的时序存储时间为强度函数,将所有访问的影响累加到对未来访问的发生上,可得参数j的强度函数为

其中,ρ0表示参数j 被访问的基础强度,ginc(t-tx)表示过去所有访问对该访问的激励作用。

针对参数抑制,引入时间作为递增变量,其强度函数为

其中,ρ0表示参数被访问的基础强度,gdec(t-ty)表示时间对当前访问的抑制作用。

综上可得参数j 被访问的强度函数为

3)融合遥测特征的深度霍克斯模型

实际业务中,遥测数据访问具有较强的关联性,如业务软件需访问的遥测参数为某卫星组A 内A1卫星X 部件M 零件A 的温度、可能同样A2卫星会访问零件B、C 和D 的温度,因此,参数激励过程中,不仅仅要考虑被访问遥测参数,还需考虑其组内的关联参数。

针对上述特征,基于霍克斯模型,激励作用的强度函数为

已知遥测数据访问主要参数包括卫星代号、卫星遥测参数标识、数据开始时间和数据结束时间,针对∑tx

对于∑ty

1)抑制参数:下降的关键参数是时间,随着时间增长,数据存储强度下降;

2)访问影响:数据访问记录的激励作用需完全抵消下降带来的抑制作用,且尽量避免产生更多激励作用。

故可得

其中,tc表示随时间参数,f1、f2均是正函数。为实现对非重要遥测参数的有效抑制,需满足,为避免产生多余的激励作用,将f1、f2均设为一阶函数,且增量相同,可得

线性规划约束如下

该线性规划问题可用梯度法求解,梯度法的初始参数(βinit,∂init,α'init,ρ0init)根据业务需求进行配置,各参数配置的原则如下:

1)收敛速度:β 决定未访问遥测参数的收敛速度,β 越大,未访问遥测参数越早停止存储,同时β过大会导致强度收敛过早,第一次被访问时可能无法获取数据,本文取βinit=1;

2)主参数要求:∂/α'的值越大,参数j 自身相较关联参数对强度函数的影响越明显,本文取∂init=2,α'init=1;

3)初始强度:参考全参数存储时间,本文取初始强度ρ0init=30。

根据式(19)求解得到一组解(∂m',α'm',βm',ρ0m'),将解代入式(15)便可获得参数j 的最新存储时间。

综上可得卫星所有遥测参数的存储策略。

3 实验验证

3.1 遥测数据存储基本架构

试验以AA1234 卫星PID=279 的遥测参数为例。该参数的访问记录如图3 所示。

可以看到,随着发射后时间的推移,该参数的访问频率日趋规律,平均14 d 访问一次。同样对278、279 进行参数访问记录统计汇总。针对3 种遥测参数2022 年1 月~ 3 月的数据访问,统计3 种存储策略下的遥测数据访问命中情况,结果如图4所示。

图4 3 种PID 下不同模型访问记录命中率Fig.4 Access record hit rate of different models in 3 kinds of PID

其中,全参数存储策略和深度线性规划霍克斯模型在PID=279 时命中率均达100%,T-NHP 模型命中率为96.7%,从PID=278 和PID=280 下来看,深度线性规划霍克斯模型的命中率为99%以上,消除了命中率为PID=279 下100%的偶然性。如图4所示,其中,2022 年2 月9 日,279 遥测参数的数据时间为118 987 s(1.38 d),相较前一次访问4 601 s 有明显提升,相较之前最长访问时间64 719 s 有45%的提升。

针对上述情况全参数存储策略存储时间始终保持30 d,能满足用户访问需求;T-NHP 模型对这种用户访问习惯剧烈变化的情况未能适应,导致无法满足该次访问需求;如图所示,深度线性规划霍克斯模型引入相关参数作为数据存储策略的变量,在279 参数剧烈变化的同时,历史访问记录中相关参数278 和280 遥测参数的访问,使得该279 遥测参数的存储时间相较访问需求有较大的冗余量,故能适应279 参数的剧烈变化。

3.2 数据存储量

对AA1234 3 个月的遥测时序数据存储策略进行统计,数据如图5 所示。

图5 不同模型遥测时序数据存储量Fig.5 Data storage capacity of telemetry time series for different models

其中全参数存储策略在30 d 后达到峰值,基本维持在27 GB,存储30 d 的遥测时序数据;T-NHP模型在2021 年12 月23 日收敛开始起作用,缓慢收敛至2022 年1 月1 日迅速收敛,直至2022 年1月8 日稳定在16.93 MB 左右;深度线性规划霍克斯模型在2021 年12 月14 日开始收敛,2021 年12 月31 日收敛稳定至20 MB 左右。

3.3 数据收敛特征

数据收敛特征主要对深度线性规划霍克斯模型和T-NHP 模型进行对比,以卫星PID=279 的遥测参数为例。该参数的数据遥测访问需求,相关参数访问需求,不同存储策略下的数据存储时间结果如下页图6 所示。

图6 不同模型下AA1234 任务参数279 存储策略变化Fig.6 279 storage strategy changes in AA1234 task parameter under different models

可以看到,深度线性规划霍克斯模型相较T-NHP 模型,收敛速度明显提升,在第2 次访问便完成了存储时间有效收敛;T-NHP 模型在2022 年1 月5 日前后才完成数据的有效收敛。由于T-NHP模型是依据所有访问记录进行建模,所以访问参数的收敛速度相对深度线性规划霍克斯模型较差;如图所示,T-NHP 模型相较深度线性规划霍克斯模型,最终收敛结果更贴近实际访问需求,收敛效果更佳。

对于未访问的参数,如图7 所示,深度线性规划霍克斯模型相较T-NHP 模型,收敛速度较快,由于T-NHP 模型根据所有访问记录建模,所以前期收敛速度较慢,而深度线性规划霍克斯模型根据初始的βinit取值,实现在30 d 内完成收敛。针对为访问参数,T-NHP 模型对总访问次数越少的卫星建模后,收敛速度越快。

图7 比对不同模型下AA1234 任务参数279 存储策略变化Fig.7 Compare the changes of AA1234 task parameter 279 storage strategy under different models

4 结论

本文针对遥测时序数据存储量的问题,引入用户访问记录作为存储策略的输入,提出了深度线性规划霍克斯模型算法对每个遥测参数的时序存储策略进行调整。并设计试验对该方法进行了验证,通过对比全参数存储策略和典型的深度学习模型,验证了该深度线性规划霍克斯模型算法在命中率上能实现完全命中,保证实现了存储量的有效降低,降低至全参数存储的1.97%,与深度学习模型基本保持一致,另一方面收敛速度相较深度学习模型实现了14.1%的提升,保证了模型的冷启动效果。试验证明该方法在保证用户访问有效的情况下,能在初始存储策略设置的天数内,将遥测时序存储量降低至全参数存储的2%以下,有效降低了时序数据的存储量,提高了时序数据库的使用效率。本文虽然解决了时序数据存储量大的问题,但在拟合求解过程中,将模型相关函数均取一阶函数以简化计算,相较深度学习拟合效果较差,还有进一步优化的空间。

猜你喜欢

霍克遥测时序
乐趣与自由
基于Sentinel-2时序NDVI的麦冬识别研究
《红楼梦》霍克思译本“红”英译问题辨析
自适应模糊PID控制的遥测方舱温度调节方法
《红楼梦》霍克思译本中的古诗词增译策略及启示
《红楼梦》霍克思译本中习语英译的跨文化阐释
某小型无人机遥测软件设计
基于FPGA 的时序信号光纤传输系统
一种毫米波放大器时序直流电源的设计
浅谈如何提高遥测状态估计合格率