大数据时代的航天靶场遥测思考
2015-04-25于志坚侯金宝
于志坚,侯金宝
(太原卫星发射中心 岢岚 630001)
引 言
遥测是将一定距离外被测对象的参数,经过感受、采集,通过传输媒介送到接收地点并进行解调、记录、处理的一种测量过程[1]。在航天发射靶场,遥测系统通常特指完成飞行器及其载荷工作状态和环境参数的采集、传输和处理的系统,提供的遥测数据是飞行器及其载荷状态分析、故障诊断、试验组织指挥辅助决策的重要支撑信息,也是飞行器及其载荷性能评定和设计改进的重要依据[1~3]。随着飞行器种类、试验频度、测量数据等的增多,靶场遥测数据也在飞速增长,数据总量已经达到TB量级。无论是考虑靶场的需求,还是考虑遥测数据本身的信息容量和应用价值,都需要站在大数据的角度来思考靶场遥测的发展。
根据维基百科定义,大数据是指无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。这个定义并不严谨,4V(Volume、Variety、Velocity、Value)特征更能够体现出大数据量大、类多、流动快、价值大的特点[4,5]。参考文献[6]在业界得到高度认可,作者认为大数据意味着信息从量变到质变,并伴随着思维和行为的变革。航天是最早提出发展大数据技术的领域,也是取得大数据成果最多的领域[7],靶场作为航天任务重要一环要紧跟大数据时代前进的步伐,进一步思考和研究自身的发展。
1 大数据时代对靶场遥测的思考
1.1 靶场遥测的广义理解
在文献[1~3]中,均将靶场遥测局限于对飞行器及其载荷状态和环境的内部监测,这是传统意义上的称谓,可以将其看作是对靶场遥测的狭义定义。其实靶场监测飞行器及其载荷状态和环境的手段是非常多的,除了传统遥测,还有外弹道测量、目标特性测量、实况镜像测量等,这些测量信息对于处理和分析遥测数据有重要的辅助价值;另外还有许多环境条件也与监测效果和监测数据处理分析密切相关,比如测试或信号传输所涉及的大气环境、电磁环境、飞行器组装和运输条件等,上述信息对遥测测量和数据处理分析有着直接或间接的关系,要发挥好靶场遥测的作用,必须将与其相关的信息绑定在一起。据此定义靶场遥测的广义概念:航天发射靶场遥测系统,是指完成飞行器及其载荷工作状态和相关环境感知中的信息采集、传输和处理的各类系统的总称。本文后续提到的靶场遥测,如无特殊说明均指广义上的靶场遥测系统。
1.2 大数据时代靶场遥测几个思维转变
大数据时代靶场遥测要做如下四个思维转变。
①从弹上遥测向全信息感知的转变
传统的靶场遥测重点是关注箭上系统的工作状态和工作环境,目标是能够监测飞行器及其载荷的工作情况。但监测飞行器及其载荷工作情况,仅仅依靠箭上传感器获取的信息存在很大的局限性,需要综合考虑其他手段获取的监控信息,建立基于全信息感知的大视野。
②从靶场范围遥测向全过程遥测的转变
目前靶场遥测的关注点主要集中在总检查和飞行过程获取的数据。由于航天产品对质量的要求远高于一般的民用工业产品,从飞行器到地面设备,在研制和制造期间都经过严格的测试和筛选,积累了大量数据,这些数据对分析、综合评估系统质量有重要的作用。大数据分析的一个重要价值就是能够反映信息之间更为广泛的关系。
③从基于物理过程分析扩展到数据挖掘
以往对遥测数据的分析,侧重于基于遥测信息物理背景进行过程的还原和关联,以及不同任务参数间的比对。考虑到遥测参数的特点,这些分析任何时候都是重要的和必需的,但参数间物理相关的复杂性往往导致人们对参数反映的物理过程认识不够精细和完整,而一些飞行器存在的缺陷恰恰就可能蕴含在这些相关性中,因此在做好单发任务参数基于物理过程分析的基础上,还需要综合多发任务、多种参数进行数据挖掘,发现共性规律,提高认识水平。
④建立航天遥测一盘棋思想
航天器是国家核心实力的重要代表,而航天器从规划、设计、制造到发射、管控、应用,涉及诸多环节和诸多单位,遥测及其相关数据的产生、存储和使用分布在这些环节和单位中,目前还没有一个有效的机制实现这些数据的共享,使得宝贵的资源白白浪费甚至流失。数据整合带来的价值远远不能用“1+1=2”比拟,数据的多元性和完整性恰恰就是进入大数据时代的重要基础,整合和受控使用是包括靶场遥测在内的各类试验数据未来发展的方向。
2 大数据时代靶场遥测体系
结合1.2节的分析,大数据时代的靶场遥测应该从广义概念考虑,将分析和掌控飞行器及其载荷工作状态所需的各类信息综合集成,基于“完整”数据分析飞行试验任务潜在规律。借鉴文献[8~10]提出的大数据平台体系、网络架构和技术环境有关理念,设计大数据时代的靶场遥测体系架构,如图1所示。
标准体系和安全体系贯穿靶场遥测的各个环节。考虑到靶场遥测数据种类繁多、信息系统往往由不同部门分别建设的现状,标准化是靶场遥测信息化的弱点,大数据时代系统互联、信息融合的要求将导致标准化问题更加突出,在一定程度上标准体系是大数据时代靶场遥测体系构建的基础。标准体系要包括信息编码、数据交换、数据存储、数据计算、功能接口、软件界面等多个层面。安全防护对靶场遥测而言其重要性毋庸置疑,确保安全便捷地使用试验数据,需要完善从采集到使用各个环节的安全手段。
感知环境,主要是指靶场的各类测量设备和监控系统,射频识别标签、小型化传感器等技术的发展更是为靶场获取丰富的试验信息提供了条件。
图1 大数据环境下的靶场遥测体系架构Fig.1 Range telemetry system in the big data environment
传输与汇聚环境,包括靶场信息传输环境,考虑到全过程、全信息感知的需要,还要实现与异地信息的互联。另外,考虑到任务中的图像、视频等含有大量可供计算分析的信息,需要专门进行数据提取和录入。
资源环境,既包括各类数据等数字资源,也包括服务于大数据的存储、计算资源,这些资源的高效利用和管理对大数据分析效率有重要的影响。
处理服务环境,是靶场遥测的技术核心。它包括基础支撑层、功能服务层和集成层三个层面,最下端是基础支撑层,包含对各类基础资源的操作和管理,提供基本的、标准化的计算分析功能,该层通常采用中间件实现;功能服务层位于基础支撑层之上,是针对靶场试验特定需要定制的软件功能,其中包含针对大数据应用的数据挖掘环境;功能服务层之上是集成层,为用户提供“云模式”、“云+端模式”和“端模式”三种应用环境,在方便应用的同时,又可以为专业化应用需求提供灵活的支持。
应用环境,就是要设计面向靶场多方面试验业务的服务环境。
3 适合靶场试验数据挖掘的方法
进一步对靶场遥测及其相关数据进行分类,可分为针对飞行器及其载荷的监测信息和外围环境(含设施设备)监测信息两大类型。其中针对飞行器及其载荷的监测信息主要包括地面状态监测信息以及飞行过程中获取的传统遥测信息、外弹道测量信息、目标特征信息、飞行实况景象等,是靶场试验信息的核心,也是靶场试验数据挖掘分析的重点,本节数据挖掘也主要讨论针对这些数据的分析。这些数据虽然量很大,但相同型号飞行器在靶场试验的样本并不多,严格意义讲不能称为大数据。靶场在飞行过程中获取的信息具有如下一些特点:关键测量数据多数是针对同一物理过程在不同层面的观测结果,数据时序性特征非常明显,数据中存在的误差是干扰分析结果的重要因素。靶场试验的一个重要目标就是查找影响飞行器和飞行质量的潜在规律,数据挖掘对靶场试验数据分析的重要性毋庸置疑,但如何在小样本数据条件下开展挖掘,需要进行理念和技术上的创新。下面从靶场试验数据挖掘的思路和适合靶场的数据分析方法方面进行探讨。
3.1 靶场试验数据挖掘思路
图2是靶场试验数据挖掘的一种方法。通过数据挖掘可以获得一些规律,但这些规律是否真实反映了试验实际情况,需要专业人员进行分析解释。如果机理上成立,说明挖掘结果可信,这本身也许就是对于试验规律认识的升华。如果机理上解释不通,说明只是数据中存在某种巧合,需要重新进行挖掘分析。
图2 靶场试验数据挖掘方法Fig.2 Range test data mining method
3.2 靶场试验数据挖掘的张量分析方法
由于靶场试验任务中关注对象聚焦在飞行器,靶场遥、外测数据实际上是从不同的层面对飞行器飞行过程进行感知。采用张量分析方法,使用统一的张量模型描述遥、外测数据,通过张量分解方法建立数据之间的关联关系,可为遥、外测同源参数间的关联性确定提供切实可行的指导。
张量是一个定义在一些向量空间和一些对偶空间的笛卡儿积上的多线性函数,其坐标是n维空间内有nr个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。r称为该张量的秩或阶(与矩阵的秩和阶均无关系)。在使用张量联合不同种类的数据之后,通过平行因子分析、Tucker分解等方法,将原始张量表示为一些低秩向量、较小张量的组合,揭示原始大张量中所蕴含的不同变量之间的关系。
在进行靶场数据分析时,如果将同一类型飞行器不同种类的数据,例如遥测数据、外测数据等联合到一起,就构成了一个简单的三阶张量,再通过适当的张量分解,形成由不同遥、外测数据构成的较小张量,为分析不同遥、外测数据之间的相关关系提供条件。
3.3 靶场数据挖掘的复杂网络方法
遥测参数通过对飞行器及其载荷各部分状态的直接感知来监控其工作过程。与外测系统将飞行器作为一个整体(点目标)来获取其运动状态不同,部署在飞行器上的遥测系统通过监控飞行器各个局部的状态来反映其整体工作过程。遥测参数是飞行器实施飞行状态调整的依据,并且记录了调整实施过程和结果,因此因果关系是连接遥测参数之间的一个重要纽带,基于因果关系分析遥测参数之间数值对应性是遥测参数挖掘的一条重要途径。
复杂网络主要用于表达和分析实际系统的内在关系及其动力学行为,其最主要的特征是拓扑性质。数据分析中,许多网络都不是孤立存在的,而是与其它网络之间存在着相互依赖、合作或竞争等关系,即多层网络。与一般网络不同,多层网络进一步细化了网络节点间的关系。与只能分析局部节点性质的时间序列分析方法相比,多层网络不仅可以分析网络中局部节点的性质,也可以分析网络的演化性质。利用多层网络的方法可以分析网络在不同时刻的状态和性质,更好地探索网络局部和整体变化趋势。
采用复杂网络方法进行靶场试验数据挖掘时,首先通过复杂网络对试验数据进行描述,使得数据信息的呈现和表达更加详细,而且可以用不同型号或者同一型号的不同类型数据作为网络的层,这些网络模型包括状态参数多层网络模型、关联规则多层网络模型等;再对状态参数多层网络进行拓扑性质分析,计算边聚类系数和跨层边聚类系数,得到多层网络中两节点间的聚类强度等信息。利用多层网络的方法可以分析网络对应的不同时刻飞行器飞行状态,更好地探索飞行状态变化趋势,从而为飞行故障预测提供指导。
3.4 靶场数据挖掘的几何结构方法
靶场试验数据属性之间相互关联、相互影响、彼此耦合,形成了错综复杂的关系,使得人们面对数据一片茫然,无处下手。对这种复杂关系进行分析,可以从数学的角度抽象为数据空间中复杂的几何结构,注意到数据之间关系往往发生在低维子空间上,再加上数据显著的稀疏特性,使得这种关联关系本质上呈现出不同子空间上的聚集特性。
几何结构方法旨在挖掘数据在不同子空间上的聚集特性。几何结构发现可以看作是一种特殊的流形学习,流形学习是把一组原始数据空间中的数据在更低维空间中重新表示。数据的几何结构即是数据空间对象在特定流形上的联系,与传统认识不同的是,在数据空间中,对象之间的这种联系并非表现在所有维度上,而是仅仅表现在某些维度上,称为子空间多元关系。
在靶场数据挖掘中,几何结构方法采用几何结构来描述试验数据之间的相互关系,比如利用几何结构对不同试验设备状态数据进行分析和描述,然后采用分类/聚类方法进行误差特性分析和挖掘,为分析误差机理、探求误差抑制方式和设备故障辨识提供指导,同时也可以通过设备状态参数关联分析,发现对应故障发生的关键因素,为设备故障预测提供建议。
4 结束语
大数据时代不仅意味着巨量的信息,更体现了对信息的高度重视和推崇。发射试验及相关服务是航天靶场对外提供的“产品”,数据是靶场提供服务的重要支撑,由于性质和定位的特殊性,试验数据的深层次利用不能生搬硬套大数据的概念和技术。面对大数据时代的挑战,应该建立大数据的思维,完善试验数据积累手段,优化试验数据融合平台,通过发掘数据中蕴含的潜力提升自身的服务能力和服务水平。数据化是信息化建设的一个高级阶段,体现了一种基于数据获取更丰富价值和实现更高效决策管理的理念,靶场需要结合自身的特点思考在大数据时代的发展之路。
[1] 刘蕴才,房鸿瑞,等.遥测遥控系统[M].北京:国防工业出版社,2000.Liu Yuncai,Fang Hongrui,et al.Telemetry and Telecommand System[M].Beijing: National Defense Industry Press,2000.
[2] 夏男银,等.航天测控系统[M].北京:国防工业出版社,2000.Xia Nanyin,et al.Space TT&C System[M].Beijing: National Defense Industry Press,2000.
[3] 黄学德,等.导弹测控系统[M].北京:国防工业出版社,2000.Huang Xuede,et al.Missile TT&C Systems[M].Beijing: National Defense Industry Press,2000.
[4] 赵 刚.大数据技术与应用实践指南[M].北京:电子工业出版社,2013.Zhao Gang.Big Data Technology and Application Practice[M].Beijing:Publishing House of Electronics Industry,2013.
[5] 郭 昕,孟 晔.大数据的力量[M].北京:机械工业出版社,2013.Guo Xin,Meng Ye.The Power of Big Data[M].Beijing:China Machine Press,2013.
[6] 维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代-生活、工作与思维的大变革[M].盛杨燕,周 涛,译.杭州:浙江人民出版社,2013.Viktor Mayer-Schonberger,Kenneth Cukier.Big Data-A Revolution That Will Transform How We Live,Work and Think[M].Sheng Yangyan,Zhou Tao,Trans.Hangzhou: Zhejiang People’s Publishing House,2013.
[7] 安 慧.航天领跑大数据[J].太空探索,2014,(4):28 ~31.An Hui.Space Atop the Big Data[J].Space Exploration,2014,(4):28 ~31.
[8] 宫夏屹,李伯虎,柴旭东,谷 牧.大数据平台技术综述[J].系统仿真学报,2014,26(3):489~495.Gong Xiayi,Li Bohu,Chai Xudong,Gu Mu.Survey on Big Data Platform Technology[J].Journal of System Simulation,2014,26(3):489 ~495.
[9] 汪圣利.大数据时代指挥信息系统发展分析[J].现代雷达,2013,35(5):1~5.Wang Shengli.Analysis on Development of C4ISAR Systems in the Era of Big Data[J].Modern Radar,2013,35(5):1~5.
[10] Han Jiawei,Kamber Micheline,Pei Jian.数据挖掘概念与技术[M].范 明,孟小峰,译.北京:机械工业出版社,2013.Han Jiawei,Kamber Micheline,Pei Jian.Data Mining Concepts and Techniques[M].Fan Ming,Meng Xiaofeng,Trans.Beijing:China Machine Press,2013.