APP下载

基于SAN存储的医疗卫生数据中心异步数据灾备设计

2017-04-13黎茂林葛蕴翊吕德奎

软件导刊 2017年3期
关键词:灾备存储设备备份

张 鹤,黎茂林,葛蕴翊,吕德奎

(中国电子科技集团公司第二十八研究所,江苏 南京 210007)

基于SAN存储的医疗卫生数据中心异步数据灾备设计

张 鹤,黎茂林,葛蕴翊,吕德奎

(中国电子科技集团公司第二十八研究所,江苏 南京 210007)

随着数据中心建设的兴起,及其所承担业务重要性的逐渐提升,灾备中心越来越多地伴随主数据中心共同建设。目前灾备中心的建设思路多种多样,从存储网络上可涵盖DAS、NAS、SAN,从灾备级别上可涵盖数据级、应用级、业务级灾备,从灾备技术上可涵盖冷备、暖备、热备、双活,从实现方式上可涵盖异步、同步,从部署地点上可涵盖同城、异地。详细比较各类存储网络、灾备级别、灾备技术的特点,并以医疗卫生灾备数据中心为设计和建设出发点,介绍了以SAN为存储网络,建设远程异步数据级灾备中心的详细思路与工作流程,可为中小型数据灾备中心建设提供参考。

SAN;数据存储;数据级灾备;灾备技术

0 引言

随着计算机技术与网络通信技术的不断进步,各级政府在进行日常工作时,越来越多地依赖于使用信息化手段进行数据处理,而数据处理的效率则依赖于数据中心的稳定运行。由于数据中心本身固有的特性,它将用于承担海量数量的存储与处理,而随着网络的开放性逐渐加大,以及各类不可控灾难的发生,数据中心出现数据丢失的可能性也与日俱增。如果不能够对这些风险进行有效地控制与处理,一旦出现数据丢失,很有可能对各级政府的日常工作造成不可估量的损失。因此,如何确保数据中心的高可用性与高可靠性,是数据中心建设必须要考虑的问题。

鉴于上述问题,本文提出采用SAN存储网络进行数据存储,并搭建医疗卫生主数据中心与远程异步数据灾备中心,为中小型医疗卫生数据中心进行灾难备份提供应用参考。

1 灾备技术简介

灾备,即灾难备份,是指为了防止出现操作失误或系统故障而导致的数据丢失,而将整个系统或部分数据,从应用服务器主机的存储介质复制到其它存储介质的过程[1]。

1.1 灾难备份级别

灾难备份从保障的程度上一般分为3个级别:数据级、应用级和业务级。其中数据级灾备用于保障数据不受到损坏、应用级灾备用于确保灾备中心应用能够快速地接管主数据中心应用,业务级灾备用于备份业务场景。

(1)数据级灾备。数据级灾备主要关注数据,就是在灾难发生之后,可以确保数据不受到损坏[2]。对于低级别数据级灾备来说,只需要定期将备份的数据存储设备从主数据中心转运至异地保存即可。而对于高级别的数据级灾备,则需要借助于数据复制工具来实现主备数据中心之间的数据传输。

(2)应用级灾备。应用级灾备关注于应用系统,在异地灾备中心再构建一套应用支撑系统,支撑系统包括数据备份、备用数据处理、备用网络等系统。应用级灾备中心能够在主数据中心发生故障后快速接管应用,从而尽量减少系统宕机时间,提高业务连续性。

(3)业务级灾备。业务级灾备是最高级别的灾备系统。业务级灾备不局限于业务数据、业务应用的备份,而是将备份的范畴拓展到了实际业务场景。当发生严重灾难而导致用户的业务场景出现损坏时,业务级灾备为用户提供了另外一套备份业务场景用于业务处理。当然,业务级灾备的使用必须在数据级灾备与应用级灾备的基础之上完成。

1.2 灾难备份技术

随着数据中心承载业务的重要性逐渐提高,只有引入切实有效的灾备技术,才能够真正意义上减轻数据中心发生故障后带来的损失。数据中心灾备技术主要分为4种:冷备、暖备、热备和双活。

(1)冷备。冷备技术是中小型数据中心或者承载业务不重要的站点经常使用的灾备技术。当数据中心出现故障时,数据中心管理人员借用其它的数据中心(例如其它企业数据中心或网络公用云数据中心)临时恢复数据中心的运转,而当数据中心故障恢复后,再将业务切回本中心。这种灾备方式的时间难以保证,有时临时搭建的平台也可能因为不稳定而再次出现中断。当然这种方式不必准备大量的空闲设备,维护成本可以忽略不计。冷备技术从启用到真正可以开始工作需要较高的成本和时间,通常需要几天甚至一周或者更长的时间。

(2)暖备。暖备技术是在主备数据中心的基础上实现的。应用业务部署于主数据中心,备用数据中心则采用暖备部署方式。当主数据中心出现故障后,需要在规定的RTO之内,启用备用数据中心,实现业务的整体切换。暖备中心平时处于休眠状态,只有当主数据中心出现故障时,才由数据中心管理人员手工启用。

(3)热备。热备技术同样在主备数据中心的基础上完成。不同于暖备技术,热备技术使用调度软件感知主数据中心故障,一旦故障发生,立即切换灾备数据中心业务应用软件。热备中心需要随时保持待命状态,一旦主数据中心出现故障,能够立刻被自动启用。

(4)双活。双活技术一般应用于大型数据中心。使用双活技术,主备数据中心均需要保持正常运转,并通过负载均衡技术,将数据中心业务分摊至两个数据中心当中。当其中一个数据中心出现故障时,另一数据中心将承担所有业务。使用双活技术不会造成数据中心资源的浪费,等同于主备数据中心都在为用户提供服务。

1.3 灾备选择

灾难备份的级别与技术需要根据数据中心的级别与承载数据的重要性确定[3],本文依托的应用背景为中小型医疗业务数据中心,因此选择对主数据中心进行异地数据级灾备,并使用热备技术确保数据能够快速地进行切换。

2 存储网络简介

2.1 存储网络技术

网络存储技术是基于数据存储的一种通用网络术语。网络存储结构大致分为3种:直连式存储(DAS)、网络存储设备(NAS)和存储网络(SAN)。

(1)DAS。DAS,即直连式存储,是最为简单,也最为常用的一种存储网络。它将外部存储设备直连在服务器的内部总线上,使数据存储设备成为整个服务器结构的一部分。DAS存储方式主要适用于地理位置分散的网络、小型网络和特殊服务器上。

(2)NAS。NAS(网络附加存储)存储方式全面改进了低效的DAS存储方式。NAS独立于服务器,单独为网络数据的存储开发了一种文件服务器,用以连接存储设备,并形成一个网络[4]。这样数据存储就不再是服务器的附属,而是作为独立网络节点存在于网络之中,可由所有的网络用户共享。

(3)SAN。SAN存储是基于光纤介质,最大传输速率达17MB/s的服务器访问存储器的一种连接方式,同时SAN也是最昂贵和最复杂的存储选项,SAN存储方式创造了存储的网络化,存储网络化顺应了计算机服务器体系结构网络化的趋势,SAN的支撑技术是光纤通道技术,它是ANSI为网络和通道I/O接口建立的一个标准集成,其最大特性是将网络和设备的通信协议与传输物理介质隔离开,这样多种协议可在同一个物理连接上同时传送[5]。

2.2 存储网络选择

从连接方式上对比,DAS将存储设备直接与应用服务器进行相连,具备一定的灵活性;NAS通过网络技术连接存储设备和应用服务器,存储设备位置灵活,随着万兆网的出现,传输速率有了很大的提高;SAN则是通过光纤通道技术将存储设备和应用服务器进行连接,具备极快的传输速率和极强的扩展性[6]。3种存储方式各有优势,相互共存,被广泛地应用于数据存储应用中。

表 1中详细描述了3类存储网络技术的区别,其中SAN包括ISCSI/IP SANS与光纤通道两种类型。

表1 存储网络技术对比

存储网络的选择取决于数据中心的预算、存储数据的类型、灾备等级要求等多种因素,本文描述的数据灾备中心使用基于磁盘阵列的数据复制技术,在存储网络技术上,选择SAN技术,并使用光纤通道连接磁盘阵列与服务器。

3 医疗卫生数据中心灾备设计

3.1 数据中心概述

本文依托的项目为区域医疗信息化项目,主数据中心部署于当地政府卫生局数据机房当中,用于存储当地医疗卫生机构和居民的医疗卫生信息。考虑到主数据中心存储的居民新农合与医保结算费用信息、居民健康档案信息、居民健康卡维护信息等一旦丢失,将严重影响医疗卫生体系的正常运转,影响居民的日常就诊行为,因此在进行数据中心设计时,要为主数据中心配备一个异地灾备中心。

由于业务需要,异地灾备中心部署于离主数据中心超过2 000km的软件公司数据机房中。考虑到主备数据中心之间传输距离过长,在进行同步与异步的灾备方式选择时,决定使用异步的方式进行灾备。同时,考虑到本次灾备设计的出发点,是保证数据不丢失,并能够在主数据中心恢复1小时之内完成主备切换,因此,在灾备级别选择时,系统选择使用数据级灾备的方式,并通过磁盘阵列自身盘阵的数据块复制技术进行数据的远程拷贝。

3.2 网络设计

如图 1所示,系统主数据中心网络结构采用“双活”策略,防火墙、核心交换机、汇聚交换机均使用双机备份。其中,所有服务器通过两台双活汇聚交换机接入到网络中。同时,所有服务器与磁盘阵列之间使用存储交换机进行连接,存储交换机也使用双机备份的策略,所有服务器通过光纤交换机与磁盘阵列共享存储。

图1 数据中心主备网络

系统灾备中心网络结构则较为简单,磁盘阵列直接挂载在核心交换机上,在进行灾备同步时,主数据中心存储直接通过核心交换机与灾备中心存储进行读写操作。

3.3 容灾设计

由于异地容灾主备中心之间的距离较远(>200km),因此采用异步镜像方式,并且会有少量的数据丢失。本系统采用基于存储设备的数据复制技术,一旦主数据中心发生数据级故障,可以直接利用灾备中心的数据,为主数据中心的业务应用提供数据支撑。当主数据中心数据级故障解除后,也可利用灾备中心的数据进行主数据中心业务数据的恢复,从而使主数据中心的业务快速回复到灾难发生前的状态。

基于存储设备的数据复制技术如图 2所示。

图2 数据复制技术

如上图所示,基于存储设备的复制技术有多种方式,如“一对一”、“多对一”及“一对多”。其中“一对一”复制技术是将一个存储的数据复制到另一个远程存储中;“多对一”复制技术是将多个存储的数据复制到同一个远程存储中;“一对多”复制技术是将一个存储的数据复制到多个远程存储中。

基于存储设备的数据复制技术是当前选择较多的容灾技术平台,这主要是由于基于存储的复制技术方案有如下优点:①基于存储的数据复制技术利用存储设备底层的技术机制,不需要消耗主机的处理资源;②基于存储的数据复制技术应用于存储设备底层,受应用、主机环境等因素的影响较小,非常适合于主机和业务系统繁多的环境;③采用异步方式没有距离限制,可以实现距离超过200km的灾难备份;④灾备中心的数据可以得到一定程度的有效利用(用作测试或报表等)。

基于存储的数据复制技术有两种方式,即同步方式和异步方式。

(1)同步方式。使用同步复制方式,是将主数据中心与备份数据中心的数据进行同步更新,只有每一次I/O写入操作在主数据中心及备份数据中心都完成之后,才能执行下一条I/O写入操作。

采用同步复制方式,使得备份数据中心磁盘阵列中的数据总是与主数据中心数据同步,因此当主数据中心发生灾难事件时,不会造成数据丢失,可以实现RPO为零。为避免对生产系统性能的影响,同步方式通常在近距离范围内(FC连接通常是200km范围内,实际用户部署多在35km之内)。

(2)异步方式。使用异步复制技术,每一条I/O写入操作不光在主数据中心执行,也在备份数据中心执行,主数据中心不用等待备份数据中心完成I/O写入操作,就可以执行下一条数据更新。

采用异步复制方式对远程备份存储设备性能的影响较小,并且主数据中心与灾备数据中心之间的距离理论上没有限制(通常基于IP连接来实现数据的异步复制)。

由于本系统主备数据中心之间距离长达2 000km,同步方式会导致延迟太高而无法实现,因此采用异步方式。

4 结语

本文根据某区域卫生信息化系统的实际情况,给出了基于SAN存储网络,建设医疗卫生主数据中心的异步、数据级、热备数据中心的详细设计方法,并对灾备设计过程中常见的问题进行了分析,能够有效地指导中小型数据中心灾备系统的设计与建设。

经过在实际业务系统中为主数据中心搭建灾备中心,并进行测试,灾备中心基本能够确保数据不丢失,并且数据恢复时间平均控制在15分钟左右。

[1] 贾云洁,欧阳旦,王晋东,傅永刚.网络信息系统远程备份的设计与实现[J].信息工程大学学报,2006(1):67-70.

[2] 白勇.数据级灾难备份技术的理论与实践[J].金融科技时代,2012(11):82-83.

[3] 周兵.灾备系统建设[J].中国科技纵横,2014(19):213-214.

[4] 刘利.基于NAS和SAN技术的校园网数据存储结构策略[J].阜阳师范学院学报:自然科学版,2011,28(2):64-67.

[5] 赵建翊.构建基于SAN存储网络架构的烟草企业数据中心[J].硅谷,2010(6):52,72.

[6] 吴洪桥.基于存储的数据中心远程灾备技术方法探析[J].国土资源信息化,2012(4):81-84.

(责任编辑:孙 娟)

张鹤(1989-),男,江西丰城人,硕士,中国电子科技集团公司第二十八研究所工程师,研究方向为区域卫生信息化系统集成技术;黎茂林(1979-),男,贵州都匀人,中国电子科技集团公司第二十八研究所高级工程师,研究方向为区域卫生信息化系统集成技术;葛蕴翊(1980-),男,江苏南京人,中国电子科技集团公司第二十八研究所工程师,研究方向为数据库复制技术;吕德奎(1983-),男,山东菏泽人,硕士,中国电子科技集团公司第二十八研究所高级工程师,研究方向为复杂系统集成技术。

10.11907/rjdk.162542

TP392

A

1672-7800(2017)003-0146-03

猜你喜欢

灾备存储设备备份
“备份”25年:邓清明圆梦
Windows 7下USB存储设备接入痕迹的证据提取
基于Flash芯片的新型存储设备数据恢复技术研究
企业级信息系统应用级灾备建设与应用
轨道交通清分系统灾备升级方案研究
深蓝云海“云灾备”正式上线
浅析数据的备份策略
用批处理管理计算机USB设备的使用
应用级灾备系统的研究与设计
出版原图数据库迁移与备份恢复