浅谈灾备系统建设在区域地震数据中心的应用
2013-04-29黎斌胡睿李正汤兰荣
黎斌 胡睿 李正 汤兰荣
摘要:这些年在经历了地震、海啸等重大自然灾害的洗礼后,很多政府或是企业把数据的安全保护和备份工作提到了前所未有的高度。一些有条件的企业,比如金融行业,已经采取“两地三中心”的备份和数据恢复方案,更有甚者,还选择在不同的地震带上做备份和数据恢复。
关键词:灾备;地震数据;系统设计;备份恢复
中图分类号:TN311 文献标识码:A 文章编号:1009-3044(2013)08-1745-04
随着区域地震数据量的不断增长以及专业数据库的应用, 无法预知的IT硬件设备损坏、黑客攻击、自然灾害及系统人员误操作等造成数据丢失或业务突然中断带来了巨大安全隐患,使得对数据安全性提出了越来越高的要求。该文主要从数据灾备现状与需求,策略制定,系统设计,到灾备建设设想做些初步性探讨,从而实现关键数据不丢失的情况下,保证整个数据业务系统运行的连续性。
1 区域地震数据灾备现状与需求
1.1现状
目前,区域地震数据中心已经建立了基于SAN架构的数据灾备存储平台,管理着测震、前兆、信息、应急等业务系统的数据源。数据存储设备由两台磁盘阵列构成,分别是EMCCX3-20和基于HDS的Thunder 9500V系列的磁盘阵列,由两台交换机与各主机、数据库服务器和磁带库组成网络层体系,通过数据库服务器的oracle平台直接实现数据的存储与故障切换,从而保证数据库系统的高效稳定的运行。
1.2需求
随着灾备技术的快速发展,特别是近几年一系列灾害事件的频发(地震、火灾等),国内的各级政府单位都充分认识到了灾备的必要性。结合现阶段区域地震数据实际情况,既要满足数据的安全性,同时也要满足业务系统的连续性,于是考虑以同城双中心保证业务数据的连续性,外加异地灾备中心保证灾难发生时数据的有效性。
2 灾备策略制定
策略制定是整个容灾建设过程中非常重要的阶段,包含有确定灾难恢复级别、站点选择、确定站点类型、数据复制技术和其它相关技术选择及方案总体成本效益分析等内容。
首先,需要根据业务分析的结果,确定自身的灾备级别,需要达到数据级还是应用级的容灾。目前大多数用户考虑的不是自身所需要的灾备级别,而是一味地追求容灾的最高级别,也即是应用级自动切换,以致忽略了自身的很多约束件,如自身网络环境、投资预算、人员配置等。因此,在确定灾备级别时,用户需要理智地选择数据级容灾和应用级容灾,从自身实际情况出发,选择合适的灾备级别作为自己的实现目标。
其次,需要进行灾备中心的选址及确定站点的类型。选址的主要依据是看预防哪一类灾难。如果是防水灾,则灾备中心距离数据中心只需要几百米就可以;如果是防水灾,则要求它们之间的距离在几公里以上;如果是防地震的话,则需要保持几百公里的距离。于是,用户可以根据自身不同的地域选择不同的需求。站点类型主要是指工作模式,比如有冷备、热备、双中心工作等。
再是,数据复制技术选择,它是整个容灾系统中最核心的部分,作为信息化建设的核心是数据,数据从数据中心到灾备中心必须利用复制技术才能实现。根据复制技术的实现层次不同,分为主机层复制、SAN网络层复制和阵列式复制三个物理层次,将操作系统层、应用程序层和数据库层统归为主机复制层。
最后,在应用级灾备系统建设时,需要考虑两站点间的网络切换技术和应用切换技术。网络切换技术通常可采用基于浮动IP地址切换、基于DNS切换、基于4~7层交换机切换和基于应用切换四种切换技术。而应用切换通过结合两站点应用系统集群软件,可实现自动切换或半自动切换的方式。
3 区域地震数据灾备系统设计
作为一个典型的数据灾备系统应该具备发下特征:首先,应具有开放性,不依赖特定硬件系统,支持多种传输介质;另外,考虑到灾备能力和应用系统性能的影响,灾备方案不仅要支持近距离的同步数据容灾,还必须能支持运程的异步数据容灾;第三,完善的容灾系统应该包括各种实用的灾难恢复手段;最后,也是最重要的,要有完善的容灾制度和人力保障,定期进行灾备演练。
下面从灾备中心基础设施、网络通信系统、数据存储备份系统、灾难恢复计划四个部分对区域地震数据灾备系统设计作个初步探讨。
3.1灾备中心基础设施
灾备场所要满足避免灾难同时发生的条件,在灾备建设时要注意场地通信条件、电力供应、消防保障和后勤保障条件等。
1)通信保障应具备与运营商形成必要的通信设施和足够的网络带宽,以保证恢复工作有效开展。
2)电力保障系统应采用双路市电、双路冗余UPS和专用柴油发电机系统供电方式。完全实现电路的冗余及充分的后备电源设计。
3)灾备中心应设立专用钢瓶间并配备高效能七氟丙烷气体消防系统。通过先进的联动声光火灾自动报警系统及FM200环保型气体灭火系统,充分保障消防安全。
4)后勤保障条件也要细致考虑,如交通、安全、饮食和住宿等。
此外,灾备机房要有足够的空间来安装灾难恢复系统的各种设备,同时也要考虑在灾难发生时工作人员的操作等问题。
3.2网络通信系统
建立“两地三中心”的灾备模式,即地震数据中心、同城灾备中心和异地灾备中心。地震数据中心与2个灾备中心节点分别采用2条SDH 2M电路连接,同时,通过政务信息网专线接入Internet,通过VPN加密隧道在因特网上建立VPN传输线路,实现主链路(SDH传输专网)的备份,以保障整体链路的可靠性,减低单链路的故障率,组网如图1所示。
3.3数据存储备份系统
3.4灾难恢复计划
灾难恢复计划是一个全面的状态,它包括事前、事中和事后三个方面。事前主要针对灾难计划确定工作组及各自职能,事中是对紧急事件的应对过程中能及时地提供后备操作,而事后主要是处理数整的整理和恢复工作。
3.4.1明确灾难恢复小组及其职能
1)管理组:统筹规划,指挥各小组按照既定计划进行执行。
2)计算机恢复组:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。
3)损坏评估组:负责对公司损失的重要数据、财务进行总体评估。并针对相应损失的财产进行汇总并结合拥有的保险进行申报。
4)安全组:负责灾难发生后的人员、数据、财务的安全进行保护。并制定相应的安全策略。
5)设备支持组:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。
6)数据恢复组:负责对地震数据进行恢复,并制定相应数据恢复方案。
3.4.2制定详细的业务数据灾难恢复方案
主要针对的是由自然灾害造成的数据恢复流程,当然,这些数据恢复方案的前提是需要有可实施性强的监测技术做保障,否则仅依赖人为来发现故障,远远不能满足数据业务实时性的需求。故障或是灾难发生时主要通过以下两方面实现数据的恢复:
1)同城两中心的任何一中心发生不可预见的故障导致业务中断时,马上可以通过集群软件实现应急切换,保证数据业务的连续运行。由于数据中心与同城灾备中心采用的是同步复制,也即数据中心阵列接收到数据后,通过阵列间的同步复制数据会复制到同城灾备中心,两中心基本实现同步。
2)当同城中心发生自然灾害时,此时异地灾备中心就可以通过备份数据对业务数据进行后期的抢救恢复。异地灾备中心与同城灾备中心采用的是异步复制技术定期将数据进行复制备份。
3.4.3灾难恢复的几点考虑
1)单点故障的风险。在避免信息系统单点故障方面,目前已经采取了必要措施,重要系统应用服务器采用WEBLIGIC集群方式,数据库的部署采用ORACLE RAC方式,数据存储采用RAID0+1或RAID5保护方式。但是,仍然存在单点故障的风险,如存储设备本身和数据中心机房。
2)本地磁带库进行数据备份、恢复的风险。目前数据备份做法是对本地数据通过TSM每天进行两次增量备份,每周进行两次全量备份,每天的备份磁带复制一份通过邮递方式异地存放。这种做法存在风险包括:磁带备份的数据恢复时间较长;当机房出现重大自然灾害后异地存放的磁带无法进行数据恢复;磁带库备份策略无法快速、灵活的恢复由人为操作失误造成的数据丢失。
4 地震数据灾备关键技术
说到灾备技术,固然首先要明确灾备的级别,它分为数据级灾备和应用级灾备,由于容灾方案的技术复杂性和多样性,也分为离线式灾备和在线式灾备,离线式灾备主要依靠备份技术来实现,它的缺点是实时性低,优点是备份范围广、长期保存、投资较少等,而在线式灾备最关键是实现数据的复制,它的优点是实时性高、数据丢失少或零丢失、容灾恢复快,但是投资较高,较适合对数据连续性较高的大型单位或企业。本节主要介绍灾备技术的各实现层次的优劣对比。
4.1主机层
劣势:总体成本较高;对主机平台过于依赖,需在灾备中心驾构多套主机与业务数据中心对应;与服务器OS、FS相关,对备用服务器配置要求高,升级维护较复杂;数据传输占据较大带宽;RTO、RPO为数小时。优势:支持异构存储系统环境,与应用结合度较高。
4.2网络层
劣势:各设备间会存在性能和扩展性的瓶颈。优势:对目前网络环境改动小,易于实施;可实现复制数据的逻辑一致性;增量复制,降低带宽要求;主机和阵列扩展灵活;RTO、RPO为分钟级。
4.3存储层
局限性:光纤直连受距离限制,网络成本高;两端阵列须为同一品牌,不适用于异构存储环境;卷层次的数据镜像,无法保证一致性问题;RTO、RPO为小时级;优势:对主机应用系统没有影响,架构简单。
4.4应用层
局限性:总体成本较高;异构服务器实施、升级和维护较难;此层只针对特定的数据库应用,局限性较大。优势:能快速保证数据一致性;数据量传输量较小,带宽要求不高;RTO、RPO为分钟至小时之间。
5 结束语
从以上几个方面,介绍了下关于区域地震数据灾备系统建设的一个简要流程,结合目前单位已有架构,分别从现状与需求、策略制定、系统设计、各层次对比、方案选型等方面做了些探讨,以更加稳定可靠的方式来保证我们数据的安全高效运行,使灾害损失降到最低,最后希望本文能给同行业在数据灾备系统建设方面提供些参考。
参考文献:
[1] 张晨.省级地震数据容灾备份技术初探[J].防灾减灾学报,2012,28(2):79-83.
[2] 何琳.地震应急系统数据存储容灾备份机制的研究[J].电脑知识与技术,2011,7(11):9692-9694.
[3] 数据中心灾备系统建设方案大全[EB/OL]. http://wenku.baidu.com/view/8809C99a51e79b8968022687.html.
[4] 华为灾备解决方案[EB/OL].http://www.huaweisymantec.com.