APP下载

云存储下的容灾备份技术研究与部署

2017-08-24阙志兴许雄凌陈飞

科技创新与应用 2017年21期
关键词:快照复制容灾

阙志兴+许雄凌+陈飞

摘 要:文章在分析目前存储系统的容灾技术基础上,针对云存储环境的特点,深入地研究了容灾部署相关的技术和特点。根据容灾系统的技术指标和要求,引入了典型的云存储平台,对其中部署的备份和容灾技术应用进行详细的描述。对于大多数的政企容灾应用具有一定的借鉴意义。

关键词:云存储;备份;容灾;快照;复制

中图分类号:TP274+.2 文献标志码:A 文章编号:2095-2945(2017)21-0034-02

1 概述

随着科学技术、信息技术和互联网技术的飞速发展与进步,各种信息数据正在急剧的膨胀变大,从TB,PB已经跃迁到EB,甚至ZB的级别,而且还在不断的增长当中。一方面是数据量的不断增长,另一方面这些数据的重要性、安全性也在不断的提高。就像知名咨询公司麦肯锡说的:数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。正是因为意识到数据的重要性,所以对存储系统的数据可靠性和安全性研究达到了前所未有的高度。

1.1 云存储

云存储是一种新兴的网络存储技术,是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。相对普通的存储系统,在云存储系统中,容灾备份是多层次多方面的,主要包含存储层容灾,网絡层和应用层容灾。

1.2 容灾备份技术的研究现状

随着科学技术的不断发展与进步,逐渐出现了异地容灾系统。在复杂的云存储环境下,集群、文件系统以及网络、存储设备、应用软件和服务器等连接在一起,相互协同工作,备份和容灾不止是存储设备间的数据备份和复制,还包括上层应用间的数据冗余备份。灾难恢复也不止在存储设备内就可以完成,还需要通过网络和应用层之间配合一起完成业务的切换。因此需要有一个容灾管理平台实现对备份和容灾的统一部署,以及灾难恢复的自动控制。

2 容灾系统的关键技术

2.1 快照技术

快照是某个数据集在某个时刻的一个可用副本,创建快照时,不需要进行数据的同步,只在源数据集第一次发生改变的时候才将老的数据拷贝到快照预留空间上,而未改变的数据还保留在源上。因此快照实际上不是一个完整的物理备份,其数据实际上是存放在源数据集和快照预留空间。

2.2 克隆技术

克隆是某个数据集在本地的一个完整物理备份,所以也叫本地复制,其与快照的区别在于,在创建克隆时,需要进行完整的数据同步,克隆具有一个与源数据集大小相等的物理存储空间。可以对克隆进行分离,也可以随时和源数据集保持数据同步关系。在容灾系统中,克隆可以提供本地的完整备份,当源数据集发生一些逻辑上的数据损坏时提供恢复功能。

2.3 远程复制技术

远程复制指的是在远程为数据集提供备份服务,是容灾的核心技术。与克隆技术一样,创建远程复制时,也需要进行完整的数据同步。远程复制有同步和异步之分,同步复制指的是用户在写入数据时,同时写本地和远程,只有两者都写入成功,才认为数据写入成功;异步复制则指的是,用户的数据先写入本地,本地写入成功后记录日志,待一定时间间隔之后,将日志里面记录的数据变化同步到远端。

2.4 容灾管理平台

云端容灾管理平台与客户数据中心、备份容灾数据中心之间网络互通,负责客户数据中心和容灾数据中心的资源配置,部署备份和容灾策略。容灾系统一般包含切换管理、数据管理、资源管理、监控及演练管理等业务。能够实时监控两个站点的运行状况,当客户数据中心发生异常时,实现自动通知维护人员,并按照既定的策略进行自动切换,快速恢复业务。

3 云存储平台的容灾部署

针对上述介绍的容灾技术和指标,试图引入一个典型的云存储平台,如图1所示,该平台在政企应用场景下具有一些共同的特征。

3.1 本地备份部署

在客户数据中心一般会部署两套或多套存储设备,为生产存储提供数据逻辑错误的恢复功能。例如数据和应用升级备份恢复,数据破坏备份恢复,人为数据误删备份恢复等。本地实现这种备份的技术可以采用快照或者克隆复制技术。对于采用快照技术来说,可以通过定时创建快照的策略来实现一周,一个月的持续数据保护。当需要进行数据恢复时,可以选择不同的备份时间点来进行恢复。对于采用克隆复制技术,可以设置数据同步的策略,同样可以选择每天定时进行数据同步,还可以设置同步的时间间隔,来实现备份的不同粒度。当出现数据被破坏而需要进行数据恢复时,可以通过克隆的反向同步或者直接切换到备份数据上来实现。

3.2 数据远程容灾

客户数据中心的本地备份存储,能够在本地设备或数据发生故障时,进行数据和系统恢复。但一旦客户数据中心发生不可抗的自然灾害,如水灾、火灾或者重大事故时,本地的设备全部损毁,此时就需要通过远程的容灾系统进行数据恢复或将客户的数据访问都切换到远程元数据中心。两个数据中心的距离在100km以内或者数据传输的时延在10ms以内,则可以采用同步复制技术,可以做到数据的0损失。对于距离较远或者传输时延较大时,则选择异步复制技术,数据的损失可以控制在分钟级别以内。

3.3 灾难恢复

当本地发生灾难,导致本地存储遭到损坏时,通过容灾管理平台,利用客户数据中心和云数据中心的远程复制关系,将客户的数据服务切换到云数据中心。对于数据的访问直接切换到云数据中心的数据库。对于虚拟机集群,则基于云数据中心的备份盘重新启动虚拟机。当客户数据中心的存储系统恢复后,还可以选择将云数据中心的数据再反向同步回去。云数据中心继续作为远程的容灾系统为客户数据中心提供可靠保护。

4 结束语

云存储下的容灾系统,结合本地备份和异地容灾技术,再加上云端的容灾集中管理、集中数据分析,为我们的计算机信息系统提供能应付各种灾难环境,如火灾、水灾、地震、战争等不可抗拒的自然灾难以及计算机犯罪、计算机病毒、掉电、网络/通信失败、硬件/软件错误和人为操作错误等人为灾难时,容灾系统将保证用户数据的安全性即数据容灾,甚至,一个更加完善的容灾系统,还能提供不间断的应用服务。

参考文献:

[1]2014年云计算大会云计算标准化体系草案形成[J].中国云计算,

2014-03-05.

[2]浅析云计算背景下云存储的优势与劣势[J].中国存储,2016-7-27.

[3]GB20988-2007-T.信息安全技术信息系统灾难恢复规范[S].

[4]张冬.大话存储[M].清华大学出版社,2008.

猜你喜欢

快照复制容灾
巧破困局,快速恢复本本活力
注册表拍个照 软件别瞎闹
Oracle MAA在汽车行业电子政务平台中的应用
一种协同工作环境中(分布式)的容错和安全数据存储方法
校园一卡通服务端高可用性改造实施方案
啪!一个瞬间讲述一个故事
让时间停止 保留网页游戏进度
降低容灾门槛