APP下载

基于天基信息基础设施的数据容灾设想*

2017-01-16程永新

通信技术 2016年11期
关键词:骨干网容灾天基

付 江,程永新

(中国电子科技集团公司第三十研究所,四川 成都 610041)

基于天基信息基础设施的数据容灾设想*

付 江,程永新

(中国电子科技集团公司第三十研究所,四川 成都 610041)

介绍天基信息技术、天地一体化网络技术和数据容灾技术的发展现状,论述基于天基信息基础设施的数据容灾方案的可行性,提出了基于Hadoop的HDFS分布式文件管理机制构建数据容灾框架,并给出了通用的容灾策略。同时,提出采用云存储解决天基信息基础设施资源受限的问题,通过高速星地链路解决数据同步复制问题,利用天基热备份控制节点解决在重大自然灾害时数据服务不间断提供问题。

数据容灾;天基信息基础设施;云存储;HDFS

0 引 言

随着信息时代的来临,作为信息载体的数据,以指数方式增长。信息系统中的关键数据,大到人类的发明创造﹑国家的法律制度,小到企业的财务报表﹑个人的家庭照片,都已成为非常重要的资产和财富。数据的丢失,将会给国家﹑企业和个人带来巨大的损失。

信息系统中数据的丢失包括数据不能被访问﹑数据不完整和数据消失。数据容灾是解决信息系统中数据丢失的最直接﹑最有效的方法。

数据容灾是在异地建立和维护一个备份数据中心,利用地理分散性保证数据对于灾难事件的抵御能力。灾难大致可用分为自然灾害﹑设备故障﹑操作失误和病毒入侵。目前,容灾方案对设备故障﹑操作失误﹑病毒入侵等灾难都可以很好地应付,但随着全球环境的恶化,却难以应对日渐频繁的地震﹑火灾﹑海啸﹑龙卷风等自然灾难。

将备份数据中心搬到太空中,是解决自然灾害造成数据丢失的一种根本解决方案。太空环境比地面环境具有更高的物理安全性。太空中没有地球表面常见的地震﹑海啸﹑龙卷风等自然灾害,其主要的物理安全威胁来自天体的碰撞。但是,太空的空间大,天体互相碰撞的概率相对较小,且各天体按照轨道周期规律运行,即使碰撞也可提前预测,提前规避。所以,太空环境比地面环境更适合做备份中心。

1 可行性分析

随着卫星通信技术的日趋成熟,天基信息基础设施逐步完善,天地一体化网络逐步形成,基于天基信息基础设施的容灾方案的可行性逐渐增强。随着人们对数据安全的日益重视,数据容灾技术也呈现出百花齐放的盛况。

1.1 天基信息基础设施

天基信息基础设施由天基通信网络设施和天基信息服务设施组成。

1.1.1 天基通信网络

1957年10月第一颗人造卫星升空,标志着人类空间探索和开发利用的起始。90年代以前的应用卫星,主要侧重于研究靠单颗卫星来发挥作用;90年代以来,微电子和微机械技术发展所引发的小卫星热,为星座系统的发展注入新的活力。小卫星星座概念的出现,使多颗卫星组成星座或编队工作,发挥了比单颗卫星更多的作用。随着航天系统种类的不断增加,产品品种和系统功能的日臻完善,卫星系统之间自成体系,条块分割的局面逐渐形成。卫星各分系统功能越来越强,使得总体投资快速增长而卫星总体资源分布不合理。在这种背景下,天基通信网络孕育而生。天基通信网络是指不同轨道﹑不同种类﹑不同性能的卫星﹑星座和相应的天基设施,通过星际链路构成的一体化综合网络。该网络是多种卫星网络系统的综合,具有自主运行和管理能力以及智能化的信息贮存﹑处理和分发能力。

从计算机网络理论和地面网络的发展现状看来,地面网络基本的结构形态有两种:对等网和主干-接入网。对等网的网络结构是对称的,各个网络节点的功能是对等的;主干-接入网的网络结构不对称,各个网络节点通过接入网实现信息的聚合。从卫星网络的发展历程来看,天基通信网络也存在对等网和主干-接入网两种架构。因此,天基通信网络是对等网与主干-接入网络共存的异构网络[1-2],如图1所示。

图1 天基通信网络

天基通信网络由天基骨干网﹑天基接入网及各类天基用户组成。天基骨干网由高轨卫星通过激光﹑微波等高速链路组网而成。天基接入网由各类中低轨卫星星座群组成,天基接入网通过激光链路接入天基骨干网。天基用户包括车载﹑机载﹑舰载各型用户端,通过微波链路接入天基接入网。

1.1.2 天基信息服务

天基信息服务设施由各类载荷组成,包括卫星﹑宇宙飞船﹑空间站等各类航天器上的存储﹑计算等载荷。这些载荷为各类天基应用服务提供支撑平台。

1.1.3 基于云计算的天基信息基础设施

不管是天基通信网络设施,还是天基信息服务设施,都受空间资源有限的约束,如轨道有限﹑频率范围有限﹑载荷功率有限﹑载荷物理尺寸有限等,导致其不能更好地发挥信息基础设施的支撑作用。因此,专家们提出了在天基信息基础设施中采用资源虚拟化技术,以最大限度地综合利用有限的空间资源来满足对网络信息的需求。

建立基于云计算的天基信息基础设施,是目前公认的最好方法,其架构如图2所示。基于云计算的天基信息基础设施包括三层:基础设施层﹑虚拟化层和资源管理层[3]。基础设施层包括天基骨干网﹑天基接入网以及各类航天器上的信息载荷。虚拟化层利用虚拟化技术,将基础设施层的各类设施抽象成存储资源﹑计算资源﹑轨位资源﹑频率资源﹑天线资源等,形成统一的资源池,供管理者调用。资源管理层包括资源管理和资源调度,对下管理维护资源池,对上则根据用户需求按照策略对资源进行合理化调度,从而为上层应用提供支撑。

图2 基于云计算的天基信息基础设施

1.2 天地一体化网络

为了方便在地球上的人们更好地获取和利用太空资源,也为了更好地利用天基信息基础设施,专家们提出了天地一体化网络。根据我国地理环境的特点,天地一体化网络是以天基骨干网和地基骨干网作为支撑的双骨干网,如图3所示。地面站利用星地高速链路与天基骨干网相连,地面站利用光纤等通道接入骨干路由器,与地面骨干网相连。

1.3 数据容灾技术

数据容灾技术主要包括三个关键技术:数据备份技术﹑数据复制技术和灾难检测技术。

1.3.1 数据备份技术

数据备份是把数据从存储系统备份到其他介质的过程。随着网络的发展,备份技术己经从主机备份﹑网络备份发展到专有的存储网络备份。基于存储系统的备份是指数据流通过存储系统之间传递,与主机无关,优势是不占用主机资源。

1.3.2 数据复制技术

数据复制是将存储系统的数据通过网络复制到其他的一个或多个备份存储系统中,当灾难发生后再进行数据还原,以保证存储系统的数据安全。数据复制技术可分成同步数据复制技术和异步数据复制技术。同步数据复制是指在异地建立一套与本地数据实时同步的异地数据。这种方式可能做到数据的零丢失,但对系统的性能影响很大。异步数据复制技术则是将本地存储系统中的数据在后台异步地复制到备份系统中。这种方式会有少量数据丢失,但对存储系统的性能影响较小。

1.3.3 灾难检测技术

灾难检测是指由灾难导致存储系统异常时的自动检测。灾难检测技术一般采用心跳技术。心跳技术就是在应用系统和检测系统之间每隔一段时间产生一个心跳信号,能够检测到该信号,表明系统是正常状态,否则是非正常状态。目前,流行的Hadoop分布式文件系统HDFS,采用基于网络拷贝的备份技术﹑基于数据块的异步复制技术﹑基于心跳的灾难检测技术[4],是一种解决云存储的数据容灾机制。

2 数据容灾框架设想

基于天基信息基础设施的数据容灾是采用天基信息基础设施作为数据存储的基础,采用天地一体网络设施作为数据备份的通道。

天基信息基础设施采用云架构,那么数据存储设施也是基于云架构。基于云架构的数据存储能提供弹性的用户存储空间,利用云计算自身的分布式和多机冗余方式,提供数据存储的可靠性。对于容灾保护这种高峰资源需求远高于日常资源需求的业务,云存储的灵活性具有无法比拟的成本优势。

天地一体化网络在地基网络与天基网络之间采用多条高速的天地链路,为容灾系统中的数据备份传输提供了高速可靠的通道。

基于云存储的备份机制,核心是分布式文件系统。目前,主要的分布式文件系统是Google公司的GFS(Google文件系统)和Hadoop团队开发的开源系统HDFS(Hadoop分布式文件系统)。HDFS因为是开源项目,近几年被越来越多的知名厂商采用,技术机制也日臻完善。

基于以上介绍,数据容灾框架如图4所示,它利用天地一体化网络,采用HDFS机制实现云容灾。该方案具有高效率﹑高可靠﹑强扩展﹑低成本的特点。

图4 数据容灾框架

数据采用文件的方式进行管理。文件管理采用主从式架构,由名叫NameNode的控制节点和名叫DataNode的数据节点组成。控制节点维护着整个文件系统的命名空间,将文件系统的元数据保存在内存中,管理﹑控制文件的相关操作。数据节点存放实际数据,同时具备计算能力,可以管理自身携带的存储资源。文件是分块存储的,一个文件被划分成一个或多个数据块。这些数据块被分散存储在不同的数据节点上,每个数据块都可以通过数据节点之间的互相复制而具有多个备份。其中,数据节点需要定期与控制节点通信,以便控制节点知晓自身的工作状态。控制节点向数据节点发送控制指令,实现对文件数据块的创建﹑复制﹑删除等操作。

当数据用户端访问文件时,首先将包含该文件名字的访问请求发送给控制节点,然后控制节点将存储该文件所有数据块的数据节点地址信息反馈给用户端,进而用户端直接和相应的数据节点建立连接,并进行具体的文件读写操作。

本方案中,在地面云中建立一个NameNode节点和多个DataNode节点,同时在天基云中建立地面NameNode节点的一个镜像以及多个DataNode节点作为地面DataNode节点的数据备份存储节点。天基云中的NameNode是一个辅助控制节点,仅当地面云中的NameNode失效后,才启动其管理任务。

地面云中NameNode的元数据变动时,会及时通过星地链路,将变动信息备份到天基云中的NameNode。天基云中的NameNode通过星地链路,利用心跳信号,定期与地面NameNode通信,以便及时发现地面云NameNode的工作状态,准备随时接管其文件管理任务。

地面云中的DataNode根据容灾策略,将数据块的变动信息利用星地高速链路备份到天基云中的DataNode。

3 数据容灾策略

在容灾框架设计好以后,必要制定合理的容灾策略,才能完成整个容灾方案,为容灾系统更好地发挥效能提供支持。

容灾策略主要是DataNode的选择问题,包括DataNode副本数量的选择﹑DataNode远端节点的选择。对于不同安全等级的数据,其选择的DataNode策略不一样。对于安全性要求较高的数据,其中一个副本须选择在天基网络中的一个DataNode节点。

通常情况下,副本系数是3,存放策略是将一个副本存放在本地机架节点上,还有一个副本存放在同一个机架的另一个节点上,最后一个副本则存放在天基网络的节点上。这种策略下,副本并不是均匀分布在不同的机架上:1/3的副本在一个节点上,2/3的副本在一个机架上。这样减少了机架间的数据传输,提高了写操作的效率。与此同时,因为数据块只存放在两个不同的机架上,最终也就减少了读取数据时需要的网络传输总带宽。此外,机架的错误要远远小于节点的错误,所以这种策略不会影响数据的可靠性和可用性。

数据容灾策略的DadaNode的网络拓扑,如图5所示。每一个数据块有三个副本,其中两个放在地面网络中同一交换机下的两个DataNode中,第三个副本即远端节点,放在天基骨干网中的DataNode中。

图5 DataNode网络拓扑

4 结 语

一个好的容灾方案应具备以下条件:用于容灾的数据存放地点和原数据存放地点不在同一自然灾害带上;容灾系统通过有效的数据复制策略,能够实现容灾数据与本地数据的同步;灾难发生时,容灾系统应该保证尽可能少地丢失数据及保证数据的一致性。而本文提出的采用HDFS机制,基于天基云存储的数据容灾方案满足上述要求。当然,本方案只是一个初步方案,对于数据文件大小的划分﹑副本的动态调整等还需要进一步细化。此外,对于不同安全级别的数据应该采用不同的数据容灾策略,这也是下一步需要完善的地方。

[1] 闵士权.我国天基综合信息网构想[J].航天器工程,2013,22(05):1-14.

M IN Shi-Quan.An Idea of China’s Space-based In tegrated In formation Network[J].Spacec raft Engineering,2013,22(05):1-14.

[2] 黄惠明,常呈武.天地一体化天基骨干网体系架构研究[C].北京:天地一体化信息网络第二次高峰论坛,2015:120-133.

HUANG Hui-ming,CHANG Cheng-wu.Architecture Research on Space-based Backbone Network of Space_ Ground Intergrated Networks[C].BeiJing:Proceedings of the 2nd Summ it of Integrated Space_Ground Network,2015:120-133.

[3] 许方敏,陈高岭,姚海鹏等.空间信息网络资源虚拟化技术[C].北京:天地一体化信息网络第二次高峰论坛,2015:472-479.

XU Fang-m in,Chen Gao-ling,YAO Hai-peng,et al.Virtualization Technology of Space-based Information Network Resource[C].BeiJing:Proceedings of the 2nd Summ it of Integrated Space_Ground Network,2015:472-479.

[4] 李冰.云计算环境下动态资源管理关键技术研究[D].北京:北京邮电大学,2012.

LI Bing.The Rresearch of Dynamic Resource Management Key Technologies in Cloud Computing[D].Beijing:Beijing University of Posts and Telecommunications,2012.

Data Disaster Recovery based on Space-based Information Infrastructure

FU Jiang, CHENG Yong-xin

(No.30 Institute of CETC, Chengdu Sichuan 610041, China)

The present situation and development of space-based information technology, integrated spaceground network technology and data disaster recovery technology is described, and a scheme for data disaster recovery and a common strategy based on HDFS also given. And cloud storage is proposed to solve the problem of limited space resource, high-speed space-ground data link to solve the problem of date synchronous replication, and Namenode replication in the space-based infrastructure to solve the problem of uninterrupted date service when the major natural disaster occurs.

data disaster recovery; space-based information infrastructure; cloud storage; HDFS

TP302.8;V19

A

1002-0802(2016)-11-1503-06

10.3969/j.issn.1002-0802.2016.11.017

付 江(1973—),女,硕士,高级工程师,主要研究方向为信息安全;

程永新(1980—),男,硕士,工程师,主要研究方向为信息安全。

2016-07-09;

2016-10-08 Received date:2016-07-09;Revised date:2016-10-08

猜你喜欢

骨干网容灾天基
国外天基大气甲烷监测任务最新发展
天基物联网关键技术及应用前景
基于Gooding算法的天基光学目标跟踪定轨
有轨电车信号系统三层骨干网传输方案分析
高速公路收费中心容灾备份系统建设方案分析
美国天基空间监视系统概述与分析
NGB骨干网中QoS 保证实现机制研究
关于建筑企业容灾备份系统方案的探讨
基于数据容灾技术在企业信息系统中的应用研究
>> 中共山东省纪委办公厅、齐鲁石化赴山东省电子文件(档案)容灾备份中心开展电子档案容灾备份工作