APP下载

基于虚拟化技术的数字校园容灾系统

2016-10-14郑怀宇

三明学院学报 2016年2期
关键词:灾备存储设备备份

郑 斌,郑怀宇

(福建中医药大学 现代教育技术中心,福建 福州 350122)

基于虚拟化技术的数字校园容灾系统

郑 斌,郑怀宇

(福建中医药大学 现代教育技术中心,福建 福州 350122)

为了实现数据中心异构操作系统的整合,解决单一存储扩容造成的服务停机,数据库、服务器、存储或备份设备等因单点故障造成数据的丢失,提出了基于虚拟化技术的统一存储平台的灾难备份系统建设方案。通过灾难备份系统的建设,不但降低了整体运维管理成本以及复杂度,而且有力保障了数据的有效性、连续性、可靠性和安全性。

灾难备份系统;虚拟化技术;统一存储;数据库双活

福建中医药大学自2007年开始运行数字化校园系统,教务、科研、学工、研究生、办公、人事等都已经实现信息化管理,信息化应用系统已成为日常工作不可或缺的工具。这些应用系统每天都生产并调用大量数据,相应地数据已经成为学校的重要资源,一旦遭到人为或其他因素的破坏,就会造成业务系统的故障或瘫痪,会严重扰乱学校的正常工作、教学秩序。建设数字校园的容灾备份系统,做好数据的存储、备份,使系统在遇到各类灾难时能及时尽快恢复运行,保证业务系统在各种异常情况下能够正常开展,已经迫在眉睫。

1 灾难备份系统与数据存储

1.1灾难备份系统概述

灾难备份系统 (backup system for disaster recovery)是用于灾难恢复目的,由数据备份系统、备用数据处理系统和备用的网络系统组成的信息系统[1],简称灾备系统。

根据灾难恢复后可达成的结果,灾难备份系统可分为数据灾备、应用灾备及业务灾备三个等级。数据灾备指当生产中心的数据系统(包括数据库服务器、存储、相应数据服务软件等)出现故障时,灾备中心能接替其继续运行,实现数据不丢失;应用灾备指生产中心的应用系统(包括应用系统服务器、相应业务软件)出现故障时,灾备中心能接替其继续运行,实现应用不中断;业务灾备指在在应用容灾的基础上,实现应用的在线自动切换。

1.2灾难备份技术

灾难备份技术的发展与两个因素密切相关:数据存储介质和数据传送通道[2]。磁带做为传统的数据存储介质,已越来越多地被磁盘所取代。

1.2.1传统备份技术――磁带存储备份

在磁盘技术不断发展和应用的今天,传统的磁带存储方式仍占有重要的一席之地。磁带介质有着保存时间长且成本低廉的优势,但其缺点也同样明显——数据存储速度慢,数据恢复时间长。在类似历史文档归档备份这样不需要高速读写的应用场景下,选择磁带存储仍是目前性价比最高的方案。

1.2.2基于DAS、NAS和SAN的数据存储和备份

直连式存储DAS(direct-attached storage)存储设备是通过电缆(IDE或SCSI接口电缆)直接到服务器的,它本身不带有任何存储操作系统,通过服务器的计算资源和IO进行数据的读写操作。数据量越大,占用的主机资源及网络带宽就越大。随着数据量不断增加,其连接通道SCSI会成为数据传输的瓶颈。随着NAS和SAN等新技术的应用,DAS存储正逐渐淡出存储市场。

网络附属存储NAS(network attached storage)是一种专用的数据存储服务器。相当于把存储设备直接挂在局域网上,无需应用服务器的干预,用户就可通过网络在NAS上存取数据。NAS分离了应用服务器及存储设备,使应用服务器能够专心于提供应用服务,而把对数据的处理和管理统统交给NAS设备,减轻应用服务器的负载。NAS即插即用,增加NAS设备不用停止应用服务器的运行。

存储区域网络SAN(storage area network)是一个用在应用服务器和存储资源之间的专用的高性能的网络体系,在多台主机和多个存储设备间提供任意两个结节间的通信通道[3]。一般情况下,SAN通过光纤信道FC(fiber channel)及光纤信道协议FCP(fiber channelprotocol)连接。在SAN存储网络中,存储设备和服务器在逻辑上是隔离的,数据的读写不使用客户端与应用服务器之间的局域网,而是通过SAN从源存储设备到目的存储设备,因此,数据存储不占用带宽。增加存储设备时,不需要停止应用服务器。存储网络允许连接到它的所有服务器都可以访问存储设备,即存储设备具有共享性。因此,冗余的存储容量可以被灵活地分配给需要的服务器。具体见表1。

表1 DAS、NAS、SAN比较表

1.2.3基于数据库的数据备份技术

以Oracle Data Guard为代表的基于数据库的备份技术,利用数据库自带的数据同步功能,将数据从源数据库传输到目标数据库。Oracle Data Guard,在Oracle 8i之前被称为Standby Database,最主要功能是容灾、数据保护、故障恢复等。DataGuard基本原理是将日志文件从源数据库传输到目标数据库,然后在目标数据库上应用(apply)这些日志文件,从而使目标数据库与源数据库保持同步。DataGuard提供了3种日志传输(redo transport)方式,分别是ARCH传输、LGWR同步传输和LGWR异步传输。在上述3种日志传输方式的基础上,DataGuard提供了3种数据保护模式,即最大性能(maximum performance mode)、最大保护(maximum protection mode)和最大可用(maximum availability mode),其中最大保护模式和最大可用模式要求日志传输必须用LGWR同步传输方式,最大性能模式下可用任何一种日志传输方式。

2 灾难备份系统技术方案

图1 数据存储及备份拓扑图

2.2.1应用服务器无冗余

数字校园应用系统之间,开发语言和结构各不相同,无法进行整合,故而应用与应用服务器之间往往是一一对应的关系,这就给应用系统的部署带来了难题:双机集群需要两倍的服务器数量,也就需要更大的资金和人力投入、更多的能源消耗和更大的机房。在数字校园建设初期,在有限的资金条件下,往往只能采购仅够让系统“跑起来”的一套硬件设备,应用服务器没有冗余,必然导致在硬件宕机或软件系统崩溃的情况下的业务中断。

2.1数字校园运行及数据存储备份存在的问题

福建中医药大学数字化校园从开始建设以来,陆续有十多个应用系统投入使用。数字化校园拥有信息门户系统、统一身份认证系统、共享数据平台等3个基础平台,其中OA采用Domino平台,门户等应用系统的中间件采用IBM公司的Websphere6.0应用服务系统,数据库为Oracle 10g。应用系统通过集群部署在Sun X86架构服务器群上。主数据库运行于SUN小型机,数据存储为FC-SAN架构的Sun StorageTek 6140磁盘阵列(RAID),每天凌晨通过SUN磁带库进行数据备份。拓扑图见图1。

2.2.2数据中心交换设备无冗余

因资金不足,数字校园仅部署了一台数据中心交换机,两个业务系统之间、业务系统与数据库之间,以及业务系统与局域网之间,都通过这台交换机进行数据交换。交换设备的单点故障虽然不会造成数据的丢失,却会使业务的访问中断。

2.2.3数据存储及备份

数字校园系统的运行过程中,每时每刻都在产生大量的数据。这些数据是学校宝贵的资产,也是保证信息系统运行的物质基础。在只有一台生产存储的情况下,存储的扩容必须停机,无法保证业务的连续性,且在主存储数据被破坏的极端情况下,备份磁带库的数据也仅能使数据恢复到当天凌晨的状态。

主存储与备份磁带库都部署在同一机房内,断电乃至洪水、台风等自然灾害都有可能给系统带来不可估量的损失。

2.2灾难备份系统建设目标

通过灾难备份系统的建设,达成异地(两座不同楼宇或两个校区)间的灾难备份。即在合理利旧的前提下,实现服务器、存储和网络整个链路上的冗余,数据业务系统同时具有本地数据同步备份和异地灾备功能。当生产数据中心的数据系统(包括数据库服务器、存储、相应数据服务软件)遇到灾难事件时,应先由本地热备系统自动接替其继续工作;当本地热备系统也出现问题时,备份数据中心的灾备系统应能接替其继续运行。

2.2.1合理利旧,实现硬件设备的冗余

备份数据中心在大多数情况下都处于“待命”的状态,不承担生产任务。从投资性价比的角度考虑,在采购新硬件的同时,保留原有整套硬件设施,迁移至备份数据中心,通过软件技术实现灾难时的业务系统接管。

2.2.2多套数据备份,确保数据不丢失

通过储存备份技术和数据库软件备份技术,实施生产数据的本地实时备份及异地的异步数据备份,最终实现两地共3份数据镜像。

2.3系统技术方案

2.3.1利用虚拟化技术实现服务器和存储的整合和冗余配置

从配置的灵活性考虑,在虚拟化技术非常成熟的今天,采用该技术对应用服务器进行整合。通过虚拟化,实现数字校园应用的异构操作系统的整合,保证原有应用的持续运行,提高稳定性,延长老旧服务器的使用周期。备份数据中心只需要少量的高性能服务器就可以虚拟出所需的数十台备份服务器,节约能源、空间和有限的资金。

跨存储设备或是异地的数据备份,能最大化地保证数据的安全,有利于灾难后的数据恢复。然而,异构的存储设备往往成为数据异地备份的最大障碍。我校自数字校园建设以来,购置了Sun磁带库、Sun StorageTek 6140及EMC NS-120、VNX5500等不同厂商不同型号的异构存储设备。因此,需要利用虚拟化技术,将异构的存储资源虚拟成一个统一的“存储池”,把零散的存储资源整合起来,通过集中化的管理,根据具体的需求把存储资源动态地分配给各个应用,备份/恢复、数据归档和存储资源分配等工作通过自动化的方式来进行,从而提高存储设备的整体利用率,同时降低系统管理成本。

2.3.2网络链路实现双机高可用

部署思科统一计算系统,通过两台UCS6248互联阵列的HA,实现服务器之间数据交换网络的双活。同时,MDS9124光纤交换机双机部署以实现服务器与存储间的链路高可用。

2.3.3利用RAC和DataGuard实现数据库多个备份

生产数据中心通过Oracle RAC集群部署来实现数据库系统的高可用,同时通过VPLEX进行LUN级别的数据实时镜像备份。

备份数据中心通过Oracle的DataGuard技术实现数据异地备份。

2.3.4系统结构

灾难备份系统逻辑结构分为3层:第1层为虚拟化的应用服务器层,两者通过IP网络相连;第2层为数据库层,生产中心通过 Oracle RAC集群实现数据库双活,并且利用Data Guard技术实现异地的数据库备份;第3层为统一存储层,利用EMC VPLEX存储虚拟化设备实现多套磁盘阵列间的数据同步。

数据存储架构仍为FC-SAN。生产数据中心的服务器群与存储通过两台光纤交换机实现高速连接,应用服务器通过IP网络与数据库连接。灾备数据中心通过IP网络与生产数据中心相连系统。拓扑如图2。

图2 灾备系统拓扑图

3 系统部署及实施

3.1系统实施规划

由于项目需要将原有数字化校园系统的硬件环境及网络环境进行整合,将应用系统迁移到虚拟主机上,为了减少对应用系统的影响,项目组做了详细的项目规划,分步实施。首先,对硬件设备进行规划,包括服务器设备规划(见表2);数据库服务器分配 (机器型号、安装的操作系统、分区要求、存储划分、机器配置,IP地址(实地址及虚拟地址)、域名、使用的端口、数据库软件版本、安装目录等);虚拟机资源划分:主机名,虚拟机名,CPU,内存,磁盘,磁盘类型,操作系统和IP地址分配。存储规划:生产存储和容灾存储分配表:划分磁盘组,对应的逻辑单元号,磁盘大小,卷计划,存储主机名,连接方法。其次,搭建生产数据中心虚拟化、存储、数据库等应用系统环境,完成应用系统、数据库迁移,进行应用系统测试,在线迁移测试。最后进行备份数据中心应用系统环境搭建、存储部署,异地容灾配置,数据同步,系统试运行。

表2 服务器规划

3.2关键技术的实施

3.2.1利用VMware vSphere实现服务器的虚拟化和高可用

使用VMware vSphere 5.5将7台Cisco UCS B200服务器虚拟出16台Linux服务器,将原来运行在物理服务器上的数字化校园应用系统迁移到虚拟机上。通过vSphere的VMotion功能,控制台能主动发现服务器的硬件故障并及时迁出该服务器上的虚拟主机,保证业务不中断。

3.2.2ORACLE RAC数据库双活

双活是指生产中心和灾备中心之间并没有明确的主备之分,每个中心都有生产、互为灾备的任务[3]。RAC是一种并行模式的架构,两个节点的集群节点间是一种并行运行的关系,支持相同的应用负载,并且在一方出现故障时能够迅速切换到另一方(分钟级),保证业务高可用性。在这种解决方案下首先确保了数据不丢失,这是最基础的也是必须要保证的;其次是确保了数据服务不停机,使Oracle数据库一直维持在正常的运行状态,避免停机给业务带来的损失。

ORACLE数据库集群的构建:将2台CiscoB200刀片(单台配置2路2.40GHz E5620 CPU,4*8G内存)做为高可用集群的数据库服务器。交换机采用Cisco的多层光纤阵列交换机MDS-9124,共享由存储EMC NS-120、EMC VNX5500及其他异构的存储构成的存储资源池。利用ORACLE的RAC技术,配置成两台数据库服务器并行操作数据。这样就保证了在任意一台数据库服务器发生故障的情况下,应用系统能通过另外一台数据库服务器继续进行数据读写。

3.2.3基于Data Guard的异地数据容灾

异地数据库容灾构建:将一台Lenovo RD930服务器作为备份数据服务器,采用了Data Guard最大可用模式,在不牺牲源数据库可用性的条件下保证了尽可能高的数据保护等级。与最大保护模式一样,日志数据需同时写到源数据库的联机日志文件和至少一个目标库的备用日志文件(standby redo log),事务才能提交;与最大保护模式不同的是,如果日志数据不能写到至少一个目标库的备用日志文件(standby redo log),源数据库不会被关闭,而是运行在最大性能模式下,待故障解决并将延迟的日志成功应用在目标库后,源数据库将会自动回到最大可用模式下运行。

3.2.4存储虚拟化

我校采用EMC公司的VPLEX存储虚拟化设备,将Sun StorageTek 6140及EMC的NS-120、VNX5500、NVX5400等不同品牌、不同型号的存储设备虚拟化成一个可统一管理“存储资源池”,将异构存储上的LUN(Logical Unit Number,逻辑单元号)分配给VPLEX,然后由VPLEX对LUN进行重新封装和处理,最终由VPLEX管理异构存储相应的LUN,这样就可以在VPLEX上进行LUN的操作,实现LUN的异构备份,或是LUN的跨存储迁移。通过VPLEX,实现了两台存储间的双活,使虚拟主机和数据库通过存储的虚拟化得到了更高的可用性,避免了单台存储故障导致的应用或数据服务中断。

4 灾难备份系统建设的成效

4.1应用虚拟化技术实现服务器资源的高效整合和灵活配置

采用VMwarevSphere 5.5虚拟化平台,将服务器的物理资源cpu、内存、磁盘、I/O等抽象成可管理的逻辑“资源池”,根据不同应用的业务访问量灵活配置资源,实现服务器资源的高效整合。解决了物理服务器数量随着应用系统的增加而不断增长带来的一系列问题,如机房空间接近饱和、电力消耗不断加大、服务器闲时空载运行等问题。

4.2应用数据库双活技术等保证数据服务的高可用性

基于Oracle的RAC、Date Guard等关键技术,让多个节点并行对外提供服务,使数据库服务器系统资源得到充分利用的同时,任何一个节点出现故障的情况下,服务不出现中断且数据不丢失。

4.3利用存储虚拟化提高容灾能力,提高存储管理效率

通过存储虚拟化的应用,实现了异构存储间LUN的完整迁移和双活,无论是虚拟主机还是数据库都实现了在多台存储上的多副本并行,极大提高了存储容灾能力。同时,通过存储虚拟化设备对存储资源的“池化”和统一管理,丰富了管理员的管理手段,简化了管理和监控的流程,提高工作效率。

5 结语

通过虚拟化技术的应用,我们不但实现了数字校园应用服务器的高效整合,还实现了异构存储设备的统一管理,构建了ORACLERAC数据库集群,以及基于Data Guard的异地数据灾备。通过灾难备份系统的建设,不但降低了整体运维管理成本以及复杂度,而且有力保障了数据的有效性、连续性、可靠性和安全性。

灾难备份系统的建设是一项复杂的工程,今后我们仍将应用新技术,结合校情,不断完善灾难备份系统的建设,向应用容灾等更高级别的容灾备份系统迈进。

[1]GB/T20988-2007信息安全技术信息系统灾难恢复规范[S].北京:中国标准出版社,2007.

[2]程志锐,戚丽,沈立强,等.高校信息系统灾备建设的研究与探讨[J].中山大学学报(自然科学版),2009,48(S):223-225.

[3]鲁士文.存储网络技术及应用[M].北京:清华大学出版社,2010.

(责任编辑:朱联九)

Digital Campus Disaster Recovery System Based on Virtualization Technology

ZHENG Bin,ZHENG Huai-yu
(Modern Educational Technology Center,Fujian University of traditional Chinese Medicine,Fuzhou 350122,China)

In order to realize the integration of heterogeneous operating system for data centers,and solve the problems that caused by the expansion of a single storage service downtime,database,server,storage and backup equipment due to failure cause data loss,unified storage platform of disaster backup system construction scheme based on virtualization technology is proposed.Through the construction of disaster backup system,it not only can reduce the overall operation and maintenance management costs and complexity,but also effectively protect the validity,continuity,reliability and security of the data.

disaster backup system;virtualization technology;unified storage;database double live

TP309.3

A

1673-4343(2016)02-0059-07

10.14098/j.cn35-1288/z.2016.02.010

2016-01-06

郑斌,女,福建福州人,实验师。主要研究方向:数字校园。

猜你喜欢

灾备存储设备备份
“备份”25年:邓清明圆梦
创建vSphere 备份任务
Windows 7下USB存储设备接入痕迹的证据提取
基于Flash芯片的新型存储设备数据恢复技术研究
旧瓶装新酒天宫二号从备份变实验室
企业级信息系统应用级灾备建设与应用
轨道交通清分系统灾备升级方案研究
深蓝云海“云灾备”正式上线
用批处理管理计算机USB设备的使用
应用级灾备系统的研究与设计