浅谈灾备系统建设
2014-12-08周兵安徽省经济信息中心安徽合肥230001
周兵(安徽省经济信息中心,安徽合肥 230001)
浅谈灾备系统建设
周兵(安徽省经济信息中心,安徽合肥 230001)
灾备中心是专门为灾备发生时恢复系统功能而设计建造的高等级数据中心,提供机房和相应的办公生活条件、数据处理设备、网络资源、日常运行管理等。一旦灾备发生,灾备中心将接替网络和数据中心运行,利用其各种资源恢复信息系统运行和业务运作。本文通过对灾备技术分析,介绍灾备中心按照不同数据保护服务级别的灵活设计。
灾备 系统 建设
随着全球信息化程度的提高,政府机构、金融、能源、交通、电信、军队等重要部门、行业对计算机网络基础设施依赖程度逐步增大,数据安全保障的重要性与紧迫性日益凸显,数据安全保障能力已经成为21世纪国家综合国力、经济竞争能力和生存发展能力的重要组成部分,成为事关国家政治稳定、社会稳定的全局性问题,是国家战略发展所必须关注的核心问题之一。灾备恢复是指利用技术、管理手段以及相关资源确保既定的关键数据、关键信息系统和关键业务在灾备发生后,在确定的时间内可以恢复和继续运营的过程。
灾备中心是专门为灾备发生时恢复系统功能而设计建造的高等级数据中心,提供机房和相应的办公生活条件、数据处理设备、网络资源、日常运行管理等。一旦灾备发生,灾备中心将接替网络和数据中心运行,利用其各种资源恢复信息系统运行和业务运作。灾备恢复是保证信息系统业务持续运作的最后一环。主要包括:灾备备份等级标准、灾备备份实施方法、灾备备份方案和灾备恢复计划的制定、灾备恢复机制的建立、灾备中心的信息安全保障和运营管理等。
1 数据灾备的基本概念
数据灾备是针对计算机系统的非正常停机事件所采取的减少灾难发生的概率,以及减少灾难发生时或造成的损失而采取的各种防范措施。主要包括数据备份和恢复二大部份。
按照国家标准《信息系统灾备恢复规范》(GB/T20988-2007),数据中心的灾备恢复水平可以划分为六个等级,如表1所示。
目前,大多数单位数据中心只达到2~3级备份,即在每天数据处理完成后,将数据磁带传输到异地保存,同时建立冷备份方式的数据中心。但是,对于国家机关、金融部门等重要企业,数据中心的备份级别要求必须达到四级以上。一些特别重要的应用需要在灾备发生时,保持业务的连续性运作,要求达到六级的标准,即建立无数据丢失、灾备发生时能够自动切换的数据中心。
2 数据灾备系统的发展趋势
2.1 数据备份方法和模式
备份技术是灾难恢复的基础。备份不仅是数据的保护,其最终目的是为了在系统遇到人为或自然灾难时,能够通过备份内容对系统进行有效的灾难恢复。备份不是单纯的拷贝,管理也是备份重要的组成部分。备份的方法主要有:文件备份、服务器主动式备份、系统复制、跨平台备份、SQL数据库备份、分级式存储管理、本地数据备份、远程备份。此外也分热备份和冷备份。备份方法在模式角度上可划分为如下两种:
(1)逻辑备份:每个文件都是由不同的逻辑块组成。每一个逻辑的文件块存储在连续的物理磁盘块上,但组成一个文件的不同逻辑块极有可能存储在分散的磁盘块上。备份软件通常既可以进行文件操作,又可以对磁盘块进行操作。基于文件的备份系统能够识别文件结构,并拷贝所有的文件和目录到备份资源上。这样的系统跨越了存储在每个inode上的指针,可顺序的读取每个文件的物理块,然后备份软件连续的将文件写入到备份媒介上。这样的备份使得每个单独文件的恢复变得很快,但连续的存储文件会使得备份速度减慢,因为在对非连续存储磁盘上的文件进行备份时需要额外的查找操作。这些额外的操作增加了磁盘的开销,降低了磁盘的吞吐率。另外,对于文件一个很小的改变,基于文件的逻辑备份也需将整个文件备份。
(2)物理备份:系统在拷贝磁盘块到备份媒介上时忽略文件结构,这会提高备份的性能,因为备份软件在执行过程中,花费在搜索操作上的开销很少。但这种方法使得文件的恢复变得复杂且缓慢,因为文件并不是连续的存储在备份媒介上。为了允许文件恢复,基于设备的备份必须要收集文件和目录是如何在磁盘上组织的信息,才能使备份媒介上的物理块与特定的文件相关联。因而,基于设备的备份适合于指定一个特定的文件系统来实现,并且不易移植。而基于文件的方案则更易移植,因为备份文件包含的是连续文件。另外,基于设备的备份方案可能会导致数据的不一致。信息系统应用的不断深入要求计算机系统提供不间断的系统服务,一旦业务系统出现问题,不仅将严重影响本单位和部门的业务工作,同时也将影响其它相关业务的正常开展,会带来连锁反应。为保证业务系统的连续可用性,所需的灾备备份级别日益提高,并对灾备技术有更高的可靠性要求。除了以最合理的代价保护业务系统数据的完整性与安全性,还要在灾备发生后尽快恢复运行,减少或尽可能消除业务停顿时间。为此,一般情况都要采用实时的热备份技术。虽然实时热备份技术具有一次性投资昂贵、通讯费用高等缺点,但能对数据完整性与业务连续性提供最强有力的支持和保证,将成为今后最重要的备份技术。
2.2 数据备份策略
表1
备份策略是一系列的规则,包括什么数据需要备份,应当何时备份数据以及将数据备份到何处等。有效的备份策略应当可以区分很少变化的数据和经常变化的数据,并且对后者的备份要比前者的备份更加频繁。目前被采用的最多的备份策略主要有以下三种:
(1)全备份(FullBackup):所谓全备份就是用一盘磁带对整个系统进行完全备份,包括系统和数据。这种备份方式的好处就是很直观,容易被人理解。而且当发生数据丢失的灾难时,只要用一盘磁带〔即灾难发生之前一天的备份磁带),就可以恢复丢失的数据。然而它也有不足之处;首先由于每天都对系统进行完全备份,因此在备份数据中有大量是重复的,例如操作系统与应用程序。这些重复的数据占用了大最的磁带空间,这对用户来说就意味着增加成本;其次。由于需要备份的数据量相当大,因此备份所需时间较长。对于那些业务策忙,备份窗口时间有限的单位来说,选择这种备份策略无疑是不明智的。
(2)增量备份(IncrementalBackup):增量备份相对全备份而言,只备份上一次备份后增加的和修改过的数据。该备份的优点是没有重复的备份数据,节省磁带空间,缩短备份时间。缺点在于当发生灾难时,恢复数据比较麻烦。
(3)差分备份(DifferentialBackup):差分备份就是每次备份的数据是相对于上一次全备份之后新增加的和修改过的数据。管理员先在周一进行一次系统完全备份,然后在接下来的几天里,再将当天所有与星期一不同的数据备份到磁带上。差分备份无需每天都做系统完全备份,备份所需时间短,节省磁带空间,灾难恢复也很方便。系统管理员只需两盘磁带,即系统全备份的磁带与发生灾难前一天的备份磁带,就可以将系统完全恢复。
全备份所需时间最长,但恢复时间最短,操作最方便,当系统中数据量不大时,采用全备份最可靠。而增量备份和差分备份可以节省磁盘和备份时间,但可靠性低,操作复杂。在实际应用钟,备份策略通常是以上三种的结合。
2.3 灾难恢复能力评价指标
一般地,灾难恢复能力采用三个主要的容灾指标RTO、RPO、NRO作为评判依据。
(1)恢复时间目标RTO(Recovery Time Object)。该指标是容灾恢复的时间指标,从广义上来说是从灾难发生造成业务中断,直到通过各种方法恢复业务所需要的时间。通常越短的RTO意味着越高的容灾能力。另一个狭义的RTO指标是指从决定进行容灾切换到业务可以继续运行所经过的时间。一般用狭义的RTO指标评价IT层面的容灾能力。
(2)恢复点目标。RPO(Recovery Point Object)宕机导致的停机不是故障影响的全部,宕机带来的另一种影响对企业的损害可能更大,那就是永久性数据丢失:宕机以前的数据没有保存到在线数据库或文件中。宕机之后数据开始恢复的时间点称之为恢复点,恢复点指标RPO,就是当业务恢复后,可以达到与灾难发生前那个时间点相同的工作状态。通常RPO对应着灾难造成的数据丢失程度,如果RPO为0,就相当于没有丢失任何数据。但这种理想状态往往是无法达到的,这就涉及到业务回滚。业务恢复与回滚的不同之处在于灾难恢复能力评价指标。
3 结语
本地存储设备与灾备中心之间通过网络建立远程复制连接。两地数据间初始化同步的实现方式有两种,第一种是在本地使用另一台存储设备,完成所有需要备份主机的数据初始化同步后,再将存储设备搬到灾备中心与本地建立起复制连接。第二种方法则通过网络直接进行数据同步,不需要进行磁盘阵列异地运输,本期工程拟用裸光纤进行连接,因此可以直接利用网络进行同步。复制策略可分为变化量触发和周期触发。在灾备发生时,本地和灾备中心之间上一次数据复制后的新增业务数据将丢失,无法恢复。因此策略选择的适中能使用户本地和灾备中心的数据尽可能保持一致。