APP下载

云计算环境下CDP数据保护技术探讨及实现

2015-11-02北京林业大学王雅超

信息安全与通信保密 2015年9期
关键词:快照数据备份计算环境

■文/北京林业大学 王雅超

北京市密码管理局 黄泽刚

北京太极信息系统技术有限公司 翟 鑫

应用·Applications

云计算环境下CDP数据保护技术探讨及实现

■文/北京林业大学 王雅超

北京市密码管理局 黄泽刚

北京太极信息系统技术有限公司 翟 鑫

一、CDP背景介绍

云计算技术作为当前计算机技术研究的重点技术,是一种将虚拟化资源通过网络以服务的形式提供给用户使用的计算模式,它是以资源虚拟化和弹性化为主要特征。在云计算环境中因为虚拟机和传统物理机的区别导致数据保护的方式有了很大的变化。

传统的数据备份解决方案专注在对数据的周期性备份上,因此一直伴随有备份窗口、数据一致性以及对生产系统的影响等问题。这些数据保护技术一般包括:复制类技术(同步以及异步镜像等)、快照技术(指针快照以及分割镜像快照等)和任何有备份窗口的计划备份。以上这些数据备份方式不能够捕获任意的数据变化,因此当数据出现灾难需要恢复时也不能恢复到任意的时间点,这样就造成了数据丢失。

CDP(Continuous Data Protection,持续数据保护)技术是对传统数据备份技术的一次革命性的重大突破。CDP为用户提供了新的数据保护手段,CDP系统会不断监测关键数据的变化,从而不断地自动实现数据的保护,这样系统管理者无须关注数据的备份过程,而且当灾难发生后,管理员只须简单地选择需要恢复到的时间点即可实现数据的快速恢复。

通常情况下该项技术通过在操作系统核心层中植入文件过滤驱动程序,来实时捕获所有文件访问操作。对于需要CDP连续备份保护的文件,当CDP管理模块经由文件过滤驱动拦截到其改写操作时,则预先将文件数据变化部分连同当前的系统时间戳(System Time Stamp)一起自动备份到CDP存储体。从理论上说,任何一次的文件数据变化都会被自动记录,因而称之为持续数据保护。

在云计算环境下,因为虚拟化等多种技术的使用,数据保护被提高到一个前所未有的高度,怎样在虚拟的云计算环境下使用数据备份技术来保证数据的安全是云计算研究中一个重要的课题

二、 CDP技术综述

目前CDP技术被分为真CDP(True CDP)和准CDP(Near CDP)两类。CDP的分类是相对于数据保护时间点而言的。准CDP技术是按照一定的时间频率,持续的记录并备份数据变化,每次备份有一定时间窗口,需要数据恢复时,可以恢复到过去备份的时间点,并不能形成完全意义上的持续保护,因此称为准CDP技术,比较常见的就是快照备份技术。上面提到的数据快照技术,用通俗的话讲,类似于照相机技术,当使用快照技术进行数据备份时,就把需要备份数据的状态记录下来,数据恢复时就将快照时间点的数据状态在新的环境下重新部署从而完成数据恢复。如图1所示:

而真CDP技术是持续不间断的监控并备份数据变化,可以恢复到过去任意时间点,是真正的实时备份。本文讨论的CDP技术是指真CDP技术。CDP我们可以理解为摄像机数据保护技术,不需要进行特定时间点的设定,从数据保护开始就将数据的所有变化都记录下来。需要恢复时,用户可以像使用视频播放一样进行回放,从中选择任意时间点的数据状态。总之,CDP必须能够恢复到任意时间点,而不只是在做了快照的时候。如图2所示:

CDP系统起源于“数据分流”或“写分离器”。写到主存储的数据被“分流”或“分裂”成两条路径;每次写操作被发送到其原始目标的同时,也发给了CDP系统。数据分流可以是在受保护主机上的代理,或者是驻留在存储网络的某个地方作为主机代理运行,数据分流已经没有或很少对主机系统产生影响,因为所有的“繁重工作”是在CDP系统上完成的。

三、CDP数据保护实现过程

使用CDP技术时,每次写操作都被传送到首选恢复设备,通常是数据中心中其它地方的设备或磁盘阵列。这种与受保护数据的写操作进行同步复制或者很小间隔的异步复制。即使一个CDP系统支持同步复制,大部分用户都会选择异步的方式,以避免对生产系统造成任何的性能影响。CDP系统支持可适应的复制模式,在可能的情况下采用同步方式,但在压力大的时期,采用异步方式,这种方式实现的CDP技术不会给系统造成额外的压力。

图1数据快照备份示意图

图2CDP数据保护示意图

数据被存储在两个地方:“恢复卷”和“恢复日志”。恢复卷是受保护卷的副本,在恢复的时候替换受保护卷。恢复日志是顺序存放着所有对受保护卷的写操作的日志;它被用于在恢复的时候按时间向前或向后回滚恢复卷。它也被用作高速缓存,用于存放没有应用到恢复卷的写操作。这种设计允许恢复卷使用较廉价的存储,只要恢复日志使用的是和受保护卷一样快或更快的存储即可。

现代的连续数据保护也提供一种固定的、长期的存储可选方案。你可以选择一个短的时间范围(例如,从每天的中午12点到12点30秒),让CDP系统只保留那些必须保留的恢复点的数据块,并且删除这些恢复点之间的变化数据块。通常使用应用级快照的用户,通过这种调整,可与他们的一致性恢复点目标相匹配。对这些无关变化数据的删除,使CDP系统可以保留数据更长的时间。为了更长时期的保存,也可以把某些恢复点从磁盘上导出,备份到磁带上。很多公司使用全部这三种方法:对每个变化,保留几天;小时级恢复点保留一周;其后每日的恢复点会在90天后保存到磁带。

接下来介绍一下CDP是如何处理恢复的。无论什么应用需要一个恢复卷或测试卷,CDP系统可以立刻提供,可以向前或向后回滚到任意想要的时间点。恢复LUN可能是真正的恢复卷(向前向后回滚),也可能是用于测试恢复的虚拟卷,或者是已经被向前或向后回滚并提供给应用程序的恢复卷的中间的某个地方,而现实中实际的向前向后回滚是在后台发生的。某些系统针对同一个恢复卷能够同时提供多个时间点,一旦原来的生产系统被修复,恢复流程会被翻转。通过把数据复制回原始的地方,恢复卷被用来重建原始生产卷。如果系统仅仅是宕机,而不必替换,通常可能只是通过发送宕机期间的变化数据来更新一下当前时间点。随着原始卷更新完成,应用程序可以被迁回其原来的位置并开始反向复制过程。

四、云计算环境下实现CDP技术

虚拟化平台采用华为fusionsphere系统实现,操作系统采用Linux,存储设备采用同有公司的iSUM790,CDP设备采用同有公司的NRS2000,数据库采用人大金仓数据库,测试所用的虚拟机命名为人大金仓数据库CDP01(以下简称CDP01),快照恢复测试虚拟机命名为人大金仓数据库CDP02(以下简称CDP02)。

同有iSUM790作为数据库DB文件存储设备,同有NRS2000作为CDP数据保护设备。通过NRS2000代理插件将两者配置为镜像关系,并在NRS2000上开启对应资源的快照和CDP保护。人大金仓数据库分别在不同的时间点创建不同的测试数据表,恢复时通过NRS2000的CDP功能在不同时间点找回测试数据表。

五、CDP数据保护新手段

CDP为用户提供了新的数据保护手段,CDP系统会不断监测关键数据的变化,从而不断地自动实现数据的保护,这样系统管理者无须关注数据的备份过程,而且当灾难发生后,管理员只须简单地选择需要恢复到的时间点即可实现数据的快速恢复。但是,在实际应用中CDP技术还是应该和快照技术等其他数据备份技术同时使用,一方面是技术原因,在要求数据不间断监控和记录有一些苛刻,任何的数据监控中断都有可能造成数据的不连续;另一方面是由于CDP技术持续备份时产生的大量数据,远大于其他备份方式产生的数据量,会对数据存储形成巨大压力,也给具体使用造成费用负担,因此在具体的实现过程中应该将CDP技术局限在快照备份的间隙,这样既能减少数据丢失的风险又能合理利用存储资源。X

猜你喜欢

快照数据备份计算环境
泉州高速公路收费系统远程数据备份研究
云计算环境下网络安全等级保护的实现途径
面向Linux 非逻辑卷块设备的快照系统①
EMC存储快照功能分析
海洋数据备份平台的设计和实现
程控交换机的数据备份与恢复技术分析
No.4 IDC:2019年上半年数据备份与恢复市场同比增长10.0%
大数据云计算环境下的数据安全
一种基于Linux 标准分区的快照方法
云计算环境中任务调度策略