金融数据中心数据备份必要性及其机制研究
2016-01-24信怀义安卫杰
信怀义++安卫杰
摘要:随着金融业数据大集中的推进,金融数据中心集中存放着海量的金融业务数据。为保障数据安全及满足当前业务连续性的要求,金融数据中心必须对其管理的数据进行全方位、多层次、高效率的数据备份。大数据时代到来,数据的价值得到充分体现,数据也呈现爆发式增长,金融大数据备份也引起了众多学者和业界人士的广泛关注。但是当前却缺乏对金融数据备份理论方面的总结和归纳,为帮助系统运行维护人员及数据使用的相关人员对金融数据备份有个总揽性的认识,本文从理论视角对数据备份的原理、用途、原则、策略、内容等方面进行综述性介绍,并针对当前在数据备份方面所存在的问题提出了建设性的建议。
关键词:数据备份;数据中心;备份策略
中图分类号:TP399
文献标识码:A
DOI:10.3969/j.issn.1003-6970.2015.12.017
本文著录格式:信怀义,安卫杰.金融数据中心数据备份必要性及其机制研究[J]软件,201 5,36(12):72-75
0 引言
进入21世纪以来,随着信息技术在金融业中广泛应用,金融机构纷纷建立了自己的数据中心,实现了数据大集中。从过去主要由服务器、网络设备、小容量存储等设备组成的运算中心,到今天已经成为超容量、高可用、多并发的智慧中心。金融数据中心存放并管理着企业核心的金融业务数据,包括:系统业务数据、交易痕迹数据、客户行为数据等等。这些数据涉及企业运营的方方面面,是企业的核心信息资产。为保障企业信息资产的安全,保障业务连续性,金融数据中心必须对其所管理的数据进行高安全、多层次、快效率的。
数据备份是周期性地将整个信息系统的数据、运行状态以某种方式制作一个或多个拷贝,并将其存放在专门的设备上用以保留,以便在信息系统遭受破坏或数据丢失的情况下能够进行快速的数据恢复。其作为现代容灾管理的基础,是保障数据完整性和一致性的最后一道防线。随着大数据时代的到来,企业对数据的依赖性不断加强,数据安全问题更加突出,数据备份将在大数据时代发挥出越来越重要的作用。
1 数据备份概述
数据备份是为了保证数据的一致性和完整性,通过保存正在使用的数据,生成数据的副本,以备数据在遭到丢失或破坏时,能够有效进行数据恢复。
1.1 数据备份的意义
在信息时代,数据作为企业的重要资产,其价值和重要性不言而喻。而数据在传输、存储、交换过程中面临着遭受损坏或丢失的各种风险,如自然灾害、信息攻击、设备故障、误操作等等能。如果缺少数据备份措施,数据的一致性和完整性就得不到保障,就可能导致数据丢失或损坏的情况出现,对企业产生无法弥补的损失,甚至灾难性的后果.
1.2 数据备份的原则
为保障数据备份的安全性、可靠性、一致性,满足进行快速数据恢复的要求,数据备份须满足以下原则:
1.2.1 全面性原则。是指数据备份需要做到对备份内容全面覆盖,包括操作系统、数据库、应用程序、数据库、业务数据、交易日志等,如果备份内容不完备、不全面,就有可能导致在数据恢复时出现数据缺失,功亏一篑,无法达到完整恢复数据的效果。
1.2.2 容错性原则。是指数据备份的内容保存在不同介质上,需要对备份介质进行保护并具备一定容错能力。如引入RIAD技术对磁带进行镜像,就能更好地保证数据安全可靠,相当于对备份数据增加了一把保险锁
1.2.3 高性能原则。由于业务的快速发展,备份数据的量越来越多,对于大型的系统每天备份的数据量都是TB级的。为减少数据备份对系统性能产生的影响,一般要求数据备份要在限定的时间窗口内完成,这就要求数据备份具备高性能的处理能力。
1.2.4 自动化原则。根据系统业务特点及运维要求,不同系统的数据备份窗口各不相同,多数情况下数据备份会选择在业务低峰时段进行,不能完全依靠人工操作。因此需要数据备份具备自动化的处理能力,能够自动定时执行,自动记录执行过程日志,并能在出现异常情况下自动报警。
1.3 数据备份的模式
数据备份对象及备份需求存在较大差异,针对不同的数据对象及备份需求可采用不同的数据备份模式,根据不同划分原则,数据备份模式可分为以下几大类。
1.3.1 按备份数据的完整性划分,可将备份数据划分为以下3类:
(l)全量备份。是指对应用系统连续产生的在某时间点的横截面的全量数据进行备份,不依赖于数据的归档属性,也称为完全备份。在备份在过程中,任何现有的标记都被清除,每个数据快都被标记为已备份,也就是说清除存档属性。该备份方式的优点是恢复操作便捷、完整性强、可靠性高;其缺点是备份数据量大、备份时间长、备份期间数据容易变动、数据恢复时间长。
(2)增量备份。是指对应用系统在上次备份之后所产生、更新的数据。在备份过程中,只备份有标记的选中的数据块,备份后标记数据块,也就是说清除存档属性。该备份方式的优点是备份数据量少、占用空间少、单个备份或恢复时间短;其缺点是恢复操作复杂、数据完整性相对差,一旦发现单个增量备份不能正常恢复,整个系统的备份将受到影响。
(3)差分备份。是指只备份在上一次完全备份后有变化的部分数据。在备份过程中,只备份有标记的选中的数据块,备份后不标记为已备份数据块,也就是说不清除存档属性。该备份方式的优点是备份数据量少、占用空间少、单个备份或恢复时间短;其缺点是恢复操作复杂、备份及恢复技术要求较高。
在实际应用中,金融行业对数据完整性、时效性、安全性要求较高,一般在制定备份策略时会将3种方式的结合使用。例如每周一至周六进行一次增量备份或差分备份,每周日进行一次全量备份。
1.3.2 按备份数据的性质划分,可将备份数据划分为以下2类:
(1)逻辑备份。是指对金融大数据(如用户、数据表等)利用工具进行导出保存。该备份策略的优点是能够实现对象级的数据备份,易实现跨平台的数据迁移。其缺点是不能满足介质失效下的数据恢复,仅能满足逻辑故障下的数据恢复。
(2)物理备份。是指将物理文件进行转储保存,需要恢复时可以利用这些文件进行还原。该备份策略的优点是备份和恢复迅速,容易达到低维护、高安全的效果。其缺点是单独使用时只能提供到某一时点的恢复,不能按具体数据对象进行恢复。
1.3.3 按备份时是否终止外服务划分,可将备份数据划分为以下2类:
(l)冷备份。又称脱机完全备份,在关机(或停服务)的状态下进行对备份对象进行完成的截面数据备份。该备份策略的优点是备份快速、安全且操作方法简便。其缺点是在备份过程中必须处于脱机状态,对业务会造成一定的损失,而且只能进行物理备份,对存储介质造成空间浪费;恢复过程中只能进行完整数据恢复,不能以小粒度进行恢复。
(2)热备份。又称在线备份,是在生产系统运行状态下直接进行数据备份。该备份策略的优点是能满足业务连续运行要求。其缺点是热备份会占用一定的系统资源,一般需要选择业务低峰时段进行。
1.4 数据备份的策略
数据备份策略是指为满足数据备份需求,制定的数据备份内容、数据备份时间、数据备份时长、数据备份方式。备份策略的好坏直接影响备份系统的投资成本、备份时效、恢复效率、安全性等。完整的备份策略需要满足以下基本要素:
1.4.1 备份对象。指进行数据备份的数据内容,数据存放的物理位置,常见的数据备份对象有操作系统、数据库实例、数据库表、文件、磁盘等。
1.4.2 备份类型。指进行数据备份采用什么方式,如按备份数据的完整性分全量备份、增量备份、差分备份,按是否停机划分冷备份、热备份。
1.4.3 备份频率。指为满足备份需求执行数据备份的间隔。如:每天、每周、每4小时等。
1.4.4 备份时间窗口。指执行备份操作可执行的时间范围,规定了备份操作的最早开始时间、最迟结束时间。
1.4.5 备份保存时长。指为满足业务需求对备份文件保存的时长,一般来说备份文件保存周期必须要大于备份执行周期。
1.4.6 备份存放。指备份结果文件存放的位置(介质),例如:光盘、磁带、虚拟磁带库、数据库、文件系统、文件服务器、异地存放、云存放等。
2 数据备份内容
对于应用系统,一个完整、有效的数据备份涉及多个方面和多个层级备份内容,包括操作系统、数据库实例、物理磁盘(存储)、应用程序、数据库表、交易日志、非结构化数据文件等。操作系统备份、数据库实例备份、物理磁盘(存储)备份、应用程序备份、数据库表备份主要目标是实现系统故障阪复,保障系统的业务连续性,属于技术性需求的数据备份。数据库表备份、交易日志备份以及非结构化数据备份更多的是为了满足业务需求和监管部门要求,属于业务性需求的数据备份。
2.1 基础软件备份
基础软件备份是对整个操作系统、文件系统、设备驱动程序、常用工具软件等进行备份,主要用于实现对整个基础软件环境进行故障恢复,主要通过自身提供的备份命令(工具)将系统数据备份至磁带、磁盘、光盘等外部介质上。
由于基础软件相对较稳定,备份频率较低,一般每季度备份一次即可,另外在基础软件升级前后需要进行一次备份。
2.2 应用程序备份
应用程序备份是指对安装的应用程序、配置文件、用户数据等进行备份,主要用于满足应用程序故障恢复、版本回退等运维需求。其实现机制主要是通过定时任务调用备份工具(或脚本),对涉及到的应用程序、配置文件、用户数据进行备份。
因为业务发展的需要,目前金融数据中心应用程序(版本)变更相对比较频繁,其备份频率一般是每周一备,以及在每次版本升级前进行一次备份。
2.3 物理存储备份
物理存储备份是指通过磁盘镜像、磁盘复制等方式实现对整个物理磁盘的数据备份,主要满足磁盘级的数据保护和恢复。
磁盘镜像是指将两个磁盘接在同一个阵列卡上,用一个阵列卡来管理两个磁盘的技术。当用户向服务器写数据时,磁盘镜像技术就同时将数据写入两个磁盘中,基本上满足数据实时备份,一旦一个磁盘损坏,便可从另一个磁盘上获得数据,可维持系统的正常运行。
2.4 数据库备份
数据库备份是指对整个数据库实例进行备份,用于保证整个数据库实例的数据一致性、完整性,保障数据库在出现物理故障或逻辑故障情况下能够有效的进行恢复。
数据库实例备份一般采取0级备份和逻辑日志备份相结合的备份策略,0级备份实现对整个数据库的dbspace进行全备,可用于将数据库完整地恢复到具体某个时间点所处的状态。逻辑日志记录了数据库每一步的具体操作,基于前述的0级备份,再通过重做备份的逻辑日志的方式能够将数据库恢复到最近的一次操作所处的状态。0级备份和逻辑日志备份的执行频率要视系统数据的重要性、数据库的大小、可用备份时间窗口而定。
对于重要业务系统,一般采用每日进行一次数据库0级备份,每4小时进行一次归档逻辑日志备份。
2.5 交易日志备份
交易日志备份是指对应用系统运行日志进行备份保存,主要用于满足问题追踪分析、业务需求及监管审计要求等。应用系统时刻会产生应用日志以记录交易处理详细过程及重要的报错信息,由于本地文件系统空间限制,可保留的日志量有限,因此对于某些重要的日志需要定期将其备份到外部介质上进行保存。为方便对历史日志查询,一般是按日期每天进行一次备份。
2.6 业务数据备份
业务数据备份主要是针对应用系统在业务处理时产生的数据文件,如:批量文件、文本文件、图像、声音、视频等非结构化数据文件进行备份。这些文件包含了重要的业务数据,是保障业务连续性所需要的文件,为满足业务需求及审计监管要求,也需要定期对这些文件进行备份。其备份策略基本和交易日志备份相同。
3 数据备份不足
数据备份是日常系统运行维护工作中一项重要的基础工作,目前在数据中心广泛应用,但在具体的执行过程中还存在诸多问题和不足,需要我们予以关注。
3.1 缺乏对数据恢复验证
数据恢复验证是为了检验数据备份是否有效,及时发现在数据备份存中在的问题,并促使进一步优化、完善数据备份策略。由于系统运维人员对数据恢复验证重视不足及缺少相应恢复验证环境,目前普遍缺少数据恢复验证工作,对于多数数据备份的有效性、一致性、全面性不得而知,这就埋藏巨大的风险隐患。
对此,建议金融数据中心应更加注重数据恢复验证,通过制定相关的演练计划,定期进行数据恢复验证,测试备份介质的可用性,备份数据的完整性及恢复所需的时间是否满足要求。
3.2 等级划分落实不够
根据《信息安全技术信息系统灾难恢复规范》规定,信息系统等级是其灾备建设的重要考虑因素,也就说明数据备份需要根据信息系统等级进行规划。《规范》将信息系统划分为6级,不同的等级对数据备份系统要求各不相同,等级越高对于信息系统的保护效果越好,但同时成本也会急剧上升。在《规范》中也指出了,可以根据成本风险平衡原则(即在灾难恢复资源的成本与风险可能造成的损失之间取得平衡)来确定。应建立重要数据的定期数据备份机制,至少每天进行一次完整的数据增量备份,并将备份介质存放在安全区域内。应对关键数据进行同城和异地的实时备份,保证业务应用能够实现实时切换。应制定灾难恢复计划并定期进行测试,确保各个恢复程序的正确性和计划整体的有效性。
业务数据备份主要了满足业务需要、监管审计要求提出的,在制定数据备份策略过程中往往缺少相关业务部门参与,导致出现业务数据备份需求不明确,备份策略不完备,无法满足业务需求的情况。
3.3 安全要求存在缝隙
数据备份所涉及的数据均属于重要数据,其中不乏涉及客户资金账号、个人身份信息等敏感数据。因此在制定数据备份策略时,不仅要注重数据备份的完整性、有效性,同时也应注重数据的安全性,对于涉及敏感数据的备份应当采用必要的加密保护机制,对于所使用备份介质也应当采取相应的安全保护措施,防止信息泄露。
3.4 数据去重难于操作
数据去重是在数据备份前消除冗余数据以提高数据的存储和/或传输效率,金融业务处理中重复数据难免,备份大量的重复数据,会消耗一定的存储和带宽,导致资源浪费。随着数据急剧膨胀,该问题日益突出。因此,在保证数据备份的完整性的同时应当尽量减少重复数据的产生,或者应将重复数据删除和数据压缩技术纳入整体的备份策略当中。
4 结束语
数据备份是金融数据中心日常运行维护的基础工作,是保障数据一致性、完整性的必要手段。当前,数据备份在数据中心的运用已无处不在,各种数据备份技术成熟度趋于成熟,但由于缺少对各种备份方法理论方面的总结和介绍,致使系统运维人员在面对五花八门数据备份时困惑重重。随着信息技术发展,企业对数据的依赖性不断加强,数据安全问题更加突出,数据备份也将发挥出更大的作用。本文从理论角度出发,对数据备份所涉及的基本内容、基础知识进行总结,通过概述性的介绍帮助系统运维人员提高对数据备份的认识,在日常工作中,有效的做好数据备份,提升信息系统运维能力,防范运行风险。