基于黄河云平台的数据持续保护技术应用研究
2017-11-28李自尊
冯 建 李自尊 汤 进
基于黄河云平台的数据持续保护技术应用研究
冯 建 李自尊 汤 进
(黄河水利委员会信息中心,河南 郑州 450008)
基于黄河云平台的数据持续保护技术的研究是为了探讨在云计算环境下,如何利用云平台的特性,结合备份软件达到最好的数据保护效果。本文首先对云计算技术概念做了介绍,并对云计算的分类进行了简要描述,同时也介绍了数据持续保护技术的概念、分类及原理等情况,随后对黄河云平台体系及黄河数据容灾体系进行了现状描述。针对国家在政务云方面提出的数据保护标准要求,提出基于黄河云平台的数据持续保护体系,针对不同的因公环境设计出不同的数据持续保护方案,从而达到解决当前存在的问题和适应未来发展要求的目的。
云计算;数据持续保护;政务云安全要求
1 研究概述
目前,云计算结合大数据、移动互联网和可佩戴设备,推动了新的商业模式的出现,促进了经济的发展。政务云也借着云计算的发展建立起来,随着政务云的实施,新的业务应用系统部署方式对数据安全方面产生了较大影响,数据的安全性、保密性等方面都受到了新的挑战。
基于云计算的备份恢复方式也与传统的备份恢复方式具有较大区别。传统的备份方式不管是针对数据还是应用,都是在具体的物理机安装备份软件客户端代理程序,通过统一的备份管理系统对安装过代理的物理机上的数据、文件、应用进行数据备份。当物理服务器出现硬件故障、操作失误、病毒感染或者黑客攻击等造成的应用系统崩溃、数据丢失、文件破坏、数据篡改等事件时,需要通过备份软件进行数据恢复。有时,往往需要花费数个小时以上才能进行数据恢复;如果是硬件故障,需要咨询厂商备品备件事宜,从咨询到备品备件安装,耗时上快则1d,慢则7d以上,宕机时间过长显然会影响业务系统的稳定运行。
而在云计算平台下,甚至可以不需要安装备份软件代理,就可以实现对应用系统的备份。由于采用的是虚拟服务器方式,CPU、硬盘、内存等都是虚拟出来的,原有的物理机服务器因硬件故障造成的业务系统崩溃现象不会在虚拟机服务器中出现,不会造成业务虚拟机服务器长时间的宕机现象。从备份恢复的两大指标RPO和RTO来说,在云计算平台下的备份恢复方面,RPO和RTO性能指标无疑可以提高很多。基于云计算平台的特性,数据持续保护就具有了研究意义。
2 云计算技术
百度定义的云计算有狭义和广义之分:“狭义云计算指IT基础设施的交付和使用模式,即通过网络以按需、易扩展的方式获得所需资源;广义云计算指服务的交付和使用模式,即通过网络以按需、易扩展的的方式或者所需服务。这种服务可以是IT和软件、互联网相关,也可以是其他服务。云计算产业的三级分层:云软件、云平台、云设备。”[1]
云计算从交付模型上可分为:公用云、私有云、混合云、社区云。公用云是面向公众提供的云技术设施,私有云是组织专用的云基础设施,混合云是有2个或2个以上公有云及私有云构成的基础设施,社区云是多个机构之间共享支持特定社区的云基础设施[2]。云计算从服务模型上可分为软件即服务(SaaS)、平台即服务(PaaS)、基础设施即服务(IaaS)。
3 数据持续保护技术
全球网络存储工业协会(SNIA)数据保护论坛(DMF)的持续数据保护特别兴趣小组(CDP SIG)对持续数据保护的定义是:“持续数据保护是一套方法,它可以捕获或跟踪数据的变化,并将其在生产数据之外独立存放,以确保数据可以恢复到过去的任意时间点。持续数据保护系统可以基于块、文件或应用实现,可以为恢复对象提供足够细的恢复粒度,实现几乎无限多的恢复时间点。”连续数据保护技术最主要的特点是,可以大大提高数据恢复时间点目标(RPO),缩短数据恢复时间目标(RTO)。
数据持续保护的原理:通过在操作系统中植入文件过滤驱动程序,来实时捕获所有文件访问操作。对于需要CDP连续备份保护的文件,当CDP管理模块经由文件过滤驱动拦截到其改写操作时,则预先将文件数据变化部分连同当前的时间机器系统时间戳一起自动备份到时间机器存储体。从理论上说,任何一次文件数据变化都会被自动记录,因而称之为持续数据保护。
数据持续保护可分为实时CDP和准CDP。实时CDP其实就是一种数据实时同步,任何发生在被保护的数据源上的变化都被立即实时同步到另外一个存储空间中。在实时CDP情况下,目的端的东西不断被更新。准CDP仅仅记录特定时间点的数据变化。准CDP可以说成是快照和数据实时复制的折中产物。将这两种技术相结合之后,便会得到一种较好的数据保护机制,这种机制称为准CDP。本质上,准CDP其实就是对数据做细粒度的快照,之后可以将快照复制到目的端保存。
数据持续保护技术涉及的关键技术有:快照和镜像备份、CDP技术、数据复制、源端重复数据删除技术。
4 黄河云平台的数据持续保护
2015年,黄河水利委员会在水利财务分中心和异地容灾备份项目基础上,初步建立了黄河云平台系统,经过2年的运行,云平台上已经运行了众多的业务系统,但由于业务系统的安全要求不一样,并没有制定相对应的数据保护方案,仍按照传统的备份策略进行数据保护。
4.1 黄河云平台现状
黄河云平台采用多台高性能资源池服务器、一台云平台管理服务器搭配高端磁盘阵列存储设备进行云计算基础架构平台的搭建,通过华为FusionSphere底层的虚拟化功能池化成大的资源池。目前,云平台涉及的业务有:水利财务系统、黄委OA办公系统、防汛业务系统、综合门户网站业务、电子公文系统、气象、水文、地理信息、遥感影像和黄河医院系统等。涉及业务之多,跨行业之广都使云平台的数据安全管理显得尤其重要。图1为黄河云平台拓扑结构图。
图1 黄河云平台拓扑图
从图1可以看出,黄河云平台架构主要分为存储资源层、SAN链路层、物理资源层、云计算资源层、网络层和用户访问层等几个层次。
存储资源层主要是生产存储设备、备份存储设备及容灾离线存储设备等存储类设备,存储设备通过光纤交换机跟云平台进行联通,将存储设备纳入云平台的存储池,可将存储设备进行存储虚拟化,再通过云平台的存储资源分配机制进行分配。
SAN链路层主要是光纤交换机设备,通过FC-SAN光纤交换机的ZONE配置,可将存储直接分配给云平台、数据库服务器和备份服务器等。这种SAN网络连接方式可以达到集中管理存储资源的目的。
物理资源层主要纳入云平台系统的高性能服务器、云计算管理服务器、数据库服务器、备份管理服务器。高性能服务器主要是纳入云平台中,利用虚拟化软件将CPU、内存等物理设备进行虚拟化,然后按需求进行分配,创建虚拟服务器。
云计算资源层主要是通过云平台(虚拟化)软件,将虚拟化后的存储资源、计算资源、网络资源等进行合理规划后,按照实际应用需求创建出在CPU、内存、存储、网络等性能方面和实际物理服务器配置一样的虚拟机服务器。对使用虚拟机服务器的用户来说,是看不到实际物理服务器存在的。用户可通过IP远程访问虚拟机服务器,可安装业务应用要求的操作系统、配置应用环境、搭建WEB发布环境、安装数据库等。
网络层主要是局域网或者移动网,其任务是应用服务对外发布访问的网络。考虑到安全机制方面的因素,黄河云平台目前使用的网络主要是内部网络或者是通过VPN获得许可的外网终端访问。在网络安全方面也部署了诸如防火墙、堡垒机、安全审计等网络安全设备,对黄河云平台进行了全面保护。
用户访问层主要是云平台用户通过个人电脑、笔记本电脑、移动终端设备等通过网络层进行应用访问,并不需要关心访问的应用是在物理服务器上还是虚拟服务器上。
4.2 黄河数据容灾现状
黄河数据中心的容灾备份经历了多次建设,形成了现有的备份体系架构。从拓扑结构上来看,黄河数据存储与备份管理体系由数据中心、数据灾备中心和数据分中心等组成。黄河数据中心为一级数据中心,是黄委数据存储、共享和数据交换中心。异地数据灾备中心承担着黄委核心数据和系统的异地备份。各数据分中心为二级数据中心,主要面向本单位相关业务应用系统和数据的存储、备份及管理。
黄河数据备份及管理系统既承担着黄河数据中心,以及水资源局、河南局、水文局3个数据分中心各自的本地备份任务,也在此基础上负责完成3个数据分中心的核心数据在黄河数据中心的同城异地备份。而黄河数据中心的防汛核心数据又通过郑州到三门峡之间的数字微波,完成异城异地备份。黄河数据中心备份拓扑结构如图2所示。
4.3 基于云平台的数据保护方案
根据由国家电子政务外网管理中心电子政务云集成与应用国家工程实验室于2017年5月13日颁布的国家电子政务外网标准——政务云安全要求,对政务云的备份与恢复提出了以下要求:①同城系统备份的两个数据中心之间距离在50km以内,信息系统能迅速恢复使用;②异城数据备份与主数据中心之间的距离在200km以外,只做数据级备份;③应满足数据恢复和重建目标的需求,通过确定备份时间、技术、介质和场外存放方式,以保证达到RPO和RTO的要求,具体标准应通过云服务方、云服务客户和云管理单位三方确定;④政务云数据备份及灾难恢复要求遵循GB/T 30285《信息安全技术灾难恢复中心建设与运维管理规范》及GB/T 31500《信息安全技术存储介质数据恢复服务要求》[3]。
图2 黄河数据中心备份拓扑示意图
黄河云平台的容灾体系和原有的备份体系是分开的,云平台建立之后的备份体系采用新的备份软件、备份存储、离线备份设备等,并结合云平台快速部署的特性,增加实时备份功能。从RTO和RPO的角度看,基于云平台的数据保护方案设计主要有以下几类。
4.3.1 云平台快照+克隆。主要是利用云平台虚拟机特性,对虚拟机在某一时刻做快照或者克隆。当系统出现故障时,该系统利用快照恢复虚机到某一时刻的状态,然后利用云平台的机制,将故障时刻的业务盘重新分配到恢复的生产机上。备份恢复流程如图3所示。
图3 云平台容灾设计之一流程图
这种容灾方式的特点主要有以下几点。①适用对象:适合系统做过快照或者克隆的虚拟生产机且系统盘(操作系统存储分区盘,以下类同)和业务盘(应用系统和数据文件存储分区盘,以下类同)分离;②适用场景:系统崩溃,数据盘无损;③优点:恢复快,几分钟内可完成应用恢复;④缺点:需要定期进行手工克隆或者快照操作,数据盘数据丢失无法恢复。
4.3.2 定时备份+云平台。该容灾方式主要利用云平台虚拟机的整机创建的便捷性和定时备份软件结合,利用定时备份软件在某时刻对云平台虚拟机进行无代理的整机备份方式,当备份的虚拟机出现应用故障时,可以通过定时备份软件恢复出某时刻状态的虚拟机。备份恢复流程如图4所示。
图4 云平台容灾设计之二流程图
这种容灾方式主要有以下特点。①适用对象:无代理整机备份的生产虚拟机;②适用场景:系统崩溃、应用数据丢失;③备份周期内数据量:重复数据删除环境下,备份数据大小的1.5倍;④优点:可以同时应对系统崩溃、数据丢失故障,能每天自动定时进行备份;⑤缺点:整机恢复时间较长(600G的生产机无代理恢复过程耗时约1.5h),恢复期间应用中断,且只能恢复到上一个备份时间点。
4.3.3 实时备份方式。该容灾方式主要是利用数据持续保护功能对云平台虚拟机进行实时备份,当业务系统出现故障时,可以恢复到故障前最短时刻的数据,时间上可以达到秒级恢复。
这种容灾方式有以下特点。①适用对象:安装CDP代理备份的虚拟生产机,系统盘和数据盘分离,数据盘进行实时备份;②适用场景:数据盘数据丢失;③备份周期内数据量:备份数据大小的1.5倍;④优点:可恢复到故障最短的时间点(秒级单位);⑤缺点:系统盘无法恢复;若启用挂载方式,挂载恢复时间过长,一旦生产数据盘恢复正常之后,取消挂载,则挂载期间的生产数据会丢失。
4.3.4 云平台+备份组合方式。该容灾方式是结合云平台和数据持续保护及定时备份的综合运用,在业务系统出现故障时,先不进行覆盖恢复,直接让CDP利用挂载恢复接管应用业务,保持业务系统对外继续发布。然后,在系统闲时,利用定时备份和实时备份功能对系统进行数据覆盖恢复,其是可以在RTO和RPO方面达到最佳效果的一种备份恢复方式。
这种容灾方式主要有以下特点。①适用对象:安装代理的核心业务虚拟机;②适用场景:系统崩溃、数据丢失时,应用影响最小;③优点:可恢复到故障最短的时间点,且数据丢失最小;④缺点:恢复过程相对繁琐,需要运用到云平台机制、定时备份、CDP等综合运用。
5 结语
针对云平台的数据持续保护方案设计,应根据云平台上部署业务系统的安全级别及备份恢复RTO和RPO的性能要求制定相应设计方案。对于一般业务系统,只需要制定一般容灾方案即可;对于政务云,备份恢复在RTO和RPO方面要比一般的备份业务要求高,因此,要综合运用云平台的特性和备份软件的特点,设计出符合政务云安全要求的数据持续保护方案。由于笔者行业所限、水平所限,文中不合理之处请同行指正
[1]黎连业,王安,李龙.云计算基础与使用技术[M].北京:清华大学出版社,2013.
[2]Joysula V,M Orr,G Page.Cloud Computing Automat⁃ing the Virtualized Data Center[M].San Jose:Cisco Press,2011.
[3]国家电子政务外网管理中心电子政务云集成与应用国家工程实验室.国家电子政务外网标准-政务云安全要求[Z].GW0013-2017.2017-05-13.
Application Research of Data Persistent Protection Technology Based on the Yellow River Cloud Platform
Feng Jian Li Zizun Tang Jin
(Information Center of the Yellow River Water Conservancy Committee,Zhengzhou Henan 450008)
The research of continual data protection technology based on the Yellow River cloud platform is to explore the environment of cloud computing how to make use of the characteristics of cloud platform and backup software to achieve the best data protection effect in the cloud computing environment.Firstly,the concept of cloud computing technology was introduced,and the classification of cloud computing was briefly described.At the same time,the concept,classification and principle of continual data protection technology were introduced.Then the status of the Yellow River cloud platform system and the Yellow Riv⁃er data disaster recovery system was described.According to the national data protection standards pro⁃posed in the government cloud aspects.According to the national data protection standards proposed in the government cloud aspects,proposed the Yellow River cloud platform continuous data protection system based on the different design environment for going out different continuous data protection scheme,so as to solve the current problems and adapt to the objective requirements of the future development.
cloud computing;CDP;Government cloud security requirement
TP308
A
1003-5168(2017)10-0019-04
2017-09-01
冯建(1982-),男,本科,高级工程师,研究方向:水利信息化系统。