传统备份到新型备份方式的转变
2009-09-23欧阳艳
摘要:文章从备份的重要性和传统备份方式的特点以及其局限性说起,到新型存储磁盘库的产生以及随之产生的新的备份方式,描述了企业在选择备份方式时的多种选择。
关键词:传统备份;新型备份;灾难恢复;磁带;磁盘库;备份方式
中图分类号:TP311文献标识码:A文章编号:1009-2374(2009)12-0012-02
灾难是可能发生的风险,而容灾是指对灾难的容忍,在灾难发生后能恢复灾难前的业务。容灾就是减少灾难事件发生的可能性以及限制灾难对关键业务流程所造成的影响的一整套行为。而备份是灾难恢复的前提,必须要有完整的备份,才能进行数据的恢复,解决面临的灾难。
一、传统的备份方式
备份主要由备份的介质、备份的软件以及备份的策略组成。
(一)备份介质
备份采用的介质最常用的有磁盘和磁带两种。磁盘的读写速度较快但容量小,一般只用于一些数据量较小的备份。一直以来,磁带都是企业备份的主要存储介质。
(二)备份软件
很多企业采用的是固定时间,比如一天一次的离线备份;还有一些是采用操作系统定制的计划任务或者一些应用软件、数据库等的自动备份策略进行定时备份,然后再定期备份至磁带;还有一些企业是使用备份服务器一客户端代理程序的架构进行备份,直接在线进行备份将数据备份至磁带,但这种方式所需备份时间较长占用系统资源较多,一般是安排在晚上等应用比较空闲时进行。
(三)备份策略
按照备份的类型来说,主要有以下三种备份类型:
1全备份(full backup)。全备份是指某一个时间点上所有数据的一个完全拷贝。
2增量备份(Incremental Backups)。增量备份指备份上一次正常或增量备份后,创建或改变的文件。备份后标记文件(换言之,清除存档属性)。如果使用正常和增量备份的组合,您需要具有上一次普通备份集和所有增量备份集,以便还原数据。
3差异备份(Differential Backups)。所谓的差异备份,就是从上次正常或增量备份后,创建或修改的差异备份副本文件。备份后不标记为已备份文件(换言之,不清除存档属性)。如果执行了正常和差异备份的组合,还原文件和文件夹要求您执行了上一次正常和差异备份。
传统的备份方式大多是使用备份软件,通过一定的备份策略(全备份和增量备份、差量备份的组合),将企业的信息备份至磁带。有些磁带作归档用于长期保存,而有些磁带则为容灾所需而备份数据,这些数据有一定的保存期限,超过保存期限一般被重写以减少磁带的消耗。
二、传统备份方式的局限性
(一)速度慢
备份速度慢、恢复速度慢。磁盘的读写由于磁带本身性质速度较慢,一般备份都是安排在晚上等相对空闲的时间进行。一旦系统崩溃需要进行恢复,从磁带恢复过来需要的时间较长,可能会影响企业的正常运行。
(二)容量小
随着应用的扩大以及支持这些应用的硬件的快速发展,特别是大容量的磁盘出现后,用于备份的磁带容量相对较小。
(三)备份方式落后
传统的备份方式是通过服务器一客户端代理程序的架构,通过备份软件利用网络进行数据传输备份到目标磁带上。这种方式除了速度慢以外,占用服务器的资源和网络资源也非常严重,从而影响整个企业的信息化应用。
(四)可靠性相对差
由于一直以来磁带都是企业的主要存储介质,因此企业对备份数据的管理与备份政策制定,也都是基于磁带的特性,如一天一次的离线备份,或是备份服务器一客户端代理程序架构等。但随着数据量持续增长,这种备份架构所需备份窗口过长,备份作业将会严重影响前端服务器正常运作,无法满足企业对还原时间与还原精细度的要求,且还原的可靠性也不足,必须通过新技术才能解决这个问题。
三、新的备份方式
(一)新型存储设备:磁盘库
磁盘库就是将磁盘阵列模拟成磁带库的存储设备,具有高数据传输率、高可靠性、兼容存储备份管理软件等特点。
与传统的磁带库相比,磁盘库有以下优点:读写速度快、减小备份时问;具有磁盘容错功能、提高可用性;磁盘存储应用广泛、技术认知度高、易于管理维护;结合磁盘阵列的快速拷贝、复制等功能、实现数据保护更高的可靠性等。
作为传统磁带库的一个有益的补充方案,磁盘库使用基于磁盘技术的数据备份,恢复系统,整合了磁盘所具备的快速访问、数据传输以及RAID的优势,同时利用仿真技术可以整合多种磁带格式及磁带库类型,在此基础上延续了磁带原本具有的稳定、可写入大数据块的特点,使得磁盘库很快成为了存储备份领域的一项主流技术。
(二)新的备份方式
基于磁盘库的出现,出现了很多有别于传统备份方式的新的备份方式。
1磁盘到磁盘到磁带式(disk-to-disk-to-tape)备份。通过中介磁盘作为前端在线存储与后端磁带间的缓冲,数据先备份到中介磁盘,再于离线时间转存到磁带。这种方式相比较原先的直接备份至磁带有很多优点。比如可缩短备份时间,由于从应用系统备份数据时直接写到调整读写的磁盘,因此大大缩短了备份的时间;另外转存磁带时不会影响在线系统。由于从磁盘再写到磁带时,是通过磁盘库写入磁带,因此不会影响在线使用的系统。不过这种方式仍以复制方式将数据搬移到中介磁盘,一次完整备份仍须相当长的时间,虽能通过增量/差异备份与组合来缩短备份时间,但对有要求更高的用户来说,还原点精细度仍不足。占用时间和系统性能仍然很多。
2磁盘快照。基于上述磁盘到磁盘到磁带备份方式的不足,又出现了利用磁盘快照(Snapshot),为磁盘迅速制作时间点更密集的备份副本。磁盘快照的基本概念与磁带备份等机制有非常大的不同。在建立磁盘快照时,并不需要复制数据本身,它所作的只是通知存储设备将目前有数据的磁盘区块全部保留起来,不被覆写。这个通知动作只需花费极短的时间。因此,通过密集地进行磁盘快照操作,可对数据进行多个时间点的备份操作。这种方式相比较磁盘到磁盘到磁带的备份方式有很多的优点:备份速度更快,可节约更多的时间;可靠性更高,由于可通过更加密集地进行磁盘快照操作,可大大地提高还原点的精细度,使系统的备份的可靠性得到提高。但缺点是成本较磁盘到磁盘到磁带来说要高很多,另外即使快照的频率很高也不能保证系统百分之百的可靠。
3连续数据保护技术。然而无论快照的频率再密集,所提供的也只是多个磁盘静止状态的副本,对某些业务极为关键的企业来说,需要的还原精细度必须达到每个I/O动作的程度,此时就只有连续数据保护(Continuous Data Protection,CDP)技术才能满足要求。CDP技术将传统着眼于“数据备份”
的备份技术,推进到着眼于快速恢复、最少数据丢失的数据保护的新阶段。其最大的技术优势就在于可进行任意时间点上的数据恢复。当数据丢失的损失以分钟(或更小的时间单位)来计算时,部署CDP方案就显得十分必要。同时,对于对系统暂停一刻都不能容忍的企业来说,CDP技术能减少从灾难发生到数据恢复所需要的时间,满足系统可靠性需达到99.999%的严苛要求。利用TimeMark与快照代理功能,通过设置合理的数据快照策略,管理员可以在任何时刻创建一个“TimeMark(时间标记)”,按照事先设定的时间间隔,将指定时刻点的数据视图保存下来。同时快照代理确保数据的完整性,TimeView功能则使应用主机能在瞬间加载过去任意时刻的数据版本,而不必忍受耗时的数据库修复和一致性检查,从而实现最小化的恢复时间目标。连续数据保护技术较之之前的磁盘到磁盘到磁带和磁盘快照技术对数据的保护更加可靠,能够大大缩短数据恢复和时间和精确度,对于在系统出现故障时要求在短时间内快速恢复的应用尤其适用。当然它的成本就更高了。
(三)新的备份架构
与传统的备份从备份服务器到安装代理的应用服务器数据的传输都要通过局域网来进行以及应用服务器必须牺牲相当的系统性能来进行数据的传输备份相比,出现了更为先进的备份架构。为适应新的存储环境,传统备份软件也有许多改进。绝大多数软件都已支持磁盘备份,通过备份到磁盘的存储池或虚拟磁带柜等方式,即可将磁盘作为备份介质。而为减轻备份对主机与网络的冲击,各备份软件近来也陆续支持“无局域网络备份(LAN Free)”与“无主机备份(Serverless)”两种新架构。
LAN Free Backup是在SAN环境下让备份数据不流经局域网络的架构,备份服务器可直接向前端的应用程序服务器下达指令,将磁盘阵列的数据透过SAN直接转存到磁带设备,而不经由局域网络,不过仍会占用服务器资源,因此就有Serverless备份的出现。
Serverless备份是无须前端应用服务器参与的一种备份,数据搬移(Data Mover)的角色由应用服务器转移到SAN交换器或备份服务器上,透过SAN直接在磁盘阵列与磁带设备间复制与转移数据。如Symantec的Off-Host Backup选购程序,即是先透过硬件或软件的快照功能为前端应用服务器的磁盘区(Volume)制作副本,然后将这个副本的Volume挂载到备份服务器上,备份即通过这个镜像副本来进行,因而不会影响到前端的应用服务器。
四、各种备份方式的实际应用
对于重要性特别高,一旦系统出现问题,必须在短短的几分钟内快速恢复运行,并且对数据以及业务的操作不能有任何丢失的应用来说,应该采用连续数据保护技术。对重要性高,一旦出现问题要在短时间内快速恢复的系统,可采取磁盘快照的方式。而对于一些重要性不是特别高的应用,如果出现问题可以在几小时甚至一天后恢复,这样的应用系统可仍然采用较为传统的备份方式,即用备份软件备份至磁带上。只是目前由于磁带的局限性可由磁盘来代替磁带。磁盘库可以建立多个虚拟的磁带,按照各个应用系统数据量的大小划分大小,一个应用系统对应一个虚拟磁带。在应用原有的备份策略的基础上,增加其他的应用系统,通过备份软件备份到磁盘库的虚拟磁带上,这个操作可根据需要定制,每天或者每隔一段时间进行备份。这些备份可作为容灾作用,需要恢复时,可快速恢复系统。企业可根据实际的需求,选择一种或者几种备份方式混合使用的方式,来达到对企业数据安全进行保护。
作者简介:欧阳艳,上海石油化工股份有限公司信息管理部系统运行管理工程师。