烟草行业同一数据中心双活存储研究和探索
2016-05-23王宁
王 宁
(海南烟草专卖局,海口 570100)
烟草行业同一数据中心双活存储研究和探索
王 宁
(海南烟草专卖局,海口 570100)
摘要:双活软件的安装位置决定其实现方式。双活软件可以安装在服务器上,可以安装在第三方设备上,可以安装在存储上;演变为基于主机卷镜像方式、基于虚拟化网关方式、基于存储双活套件方式。但随着存储技术的积累、沉淀和发展,基于存储双活套件方式(非虚拟化网关方式)将引领双活存储解决方案。
关键词:RPO;RTO;双活架构;主机卷镜像;虚拟化网关;存储双活套件
1 引言
按照国家局“统一平台、统一数据库、统一网络”的总体技术要求,以及加快行业信息化建设中电子商务、电子政务和生产经营决策三大应用系统主体框架建设的统一信息化战略部署。以实现MES生产制造执行系统、ERP、办公自动化系统(OA)、企业财务管理(EFM)和客户管理系统(CRM)等集成,资源整合,信息共享。存储建设模式以单一业务为中心垂直建设转向以数据中心横向拉通,基于应用灵活组织IT资源实现动态IT架构,实现基础架构资源化。
2 灾备建设标准和衡量要素
2.1 灾备建设遵循标准
根据业界权威机构的统计,在故障分类中,硬件故障占44%,软件、人为、病毒故障占49%,自然灾难和社会灾难占7%。在这其中,占93%的是软硬件故障,需要的则是数据中心的本地保护。
2007年7月,全国信息安全标准化技术委员会提出并归口颁布了《信息系统灾难恢复规范》(GB/ T 20988-2007)国家标准,如表1所示。
表1 RTO/RPO与灾难恢复能力等级关系(GB/T 20988-2007)
2.2 灾备建设衡量要素
在数据保护和灾备系统建设中主要有2个指标:
(1)RTO(Recovery Time Object,恢复时间目标):RTO是将信息系统“从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态”所需时间,其中包括备份数据恢复到可用状态所需时间、数据处理系统切换时间、备用网络切换时间等,该指标用以衡量灾备方案的业务恢复能力。
(2)RPO(Recovery Point Objective,恢复点目标):RPO是指业务系统所允许的灾难过程中的最大数据丢失量。数据保护的根本目的,就是在一定的预算和技术基础上,要求实现尽量小的RTO,RPO。当发生各种故障时,可以进行快速的系统和数据恢复,使得系统继续发挥作用,提供数据服务和业务服务能力。
3 双活存储架构发展历程
3.1 核心业务,双活存储需求迫在眉睫
数据信息是当今社会进步、发展的关键,数据安全和业务连续性显得尤其重要。当前,大部分信息中心都采用中心服务器和单台存储的模式,服务器具有较高可靠性和可用性,存储设备提供数据支持,一旦服务器或存储出现故障,业务就会被中断,并可能丢失关键数据。
在一些关键应用,不允许有业务中断和数据丢失。对于维护人员,数据中心应用规模加大的同时,带来了更大的管理难度,如何在故障情况下尽快恢复使用并保证数据的安全,已经成为一个日渐突出的问题。
常见应用只考虑了服务器冗余,应用集群保护,交换机冗余,链路冗余保护,唯独存储系统存在单点故障。双活存储技术正是解决本地由服务器或存储软硬件故障而引起的问题,该技术较为成熟,具有维护简单、稳定可靠等优点,能充分保障业务连续和数据安全。
3.2 双活存储架构原理剖析
⊙ 数据同步,镜像。RPO=0,数据不丢失。
⊙ 自动接管,切换。RTO=0,业务不中断。
⊙ 双活软件,位置,决定实现方式。
双活软件可以安装在服务器上,可以安装在第三方设备上,可以安装在存储上。位置不同,决定实现方式不同,例如:基于主机卷镜像方式(LVM卷镜像,Storage Foundation……);基于虚拟化网关方式(EMC VPLEX,IBM SVC,宏杉MS5500V……);基于存储双活套件方式(HDS GAD,NETAPP MetroCluster,宏杉SDAS……)。
由于三种架构采用了不同的技术方案,因此,在方案可靠性、业务连续性以及可扩展性方面都存在一定差异。如图1所示。
图1 三种双活存储架构
2010年和2015年是两个分水岭,2010年以前实现两台存储双活,以主机卷镜像方式为主,主要在金融、电力和运营商行业为主。确切地说,以VPlex为代表的“虚拟存储”(Virtual Storage)是EMC 在EMC World 2010大会上主推的概念,也是虚拟化网关方式逐渐成为主流双活存储解决方案的触发点。
但是由于技术上的限制,传统的双活存储方案无法由存储阵列自身直接实现,更多的是通过在服务器上增加卷镜像软件,或者通过增加额外的存储虚拟化引擎实现。直到2015年基于存储双活套件方式(非虚拟化网关模式)各大厂家陆续推出新产品高级特性,例如:EMC VMAX3(SRDF/ METRO),HP(Peer Persistence),DELL(Live Volume),IBM(PowerHA HyperSwap),华为(HyperMetro)等,预示着2015年开始基于存储双活套件方式将成为双活存储解决方案的主流趋势。
3.3 三种双活存储架构分析
3.3.1 主机卷镜像方式
指在操作系统层面通过逻辑卷管理软件,对由两台不同存储设备提供的存储资源进行镜像关系的创建,实现数据的实时同步。以赛门铁克Storage Foundation为代表,在前端服务器安装软件代理,通过跨阵列卷镜像技术,进行阵列双写,无论是主存储还是镜像发生问题,都不会导致应用停顿,从而实现零停机时间、业务不中断。此外,其中存储设备一旦发生灾难,正常工作的存储会记录从中断开始的所有操作日志,修复后数据从正常存储增量同步到故障存储,而不需要重新同步所有数据,对系统的影响极小。
基于主机卷镜像方案优势:
⊙ 提高业务连续性:用户原有一台存储,通过新增一台存储和卷镜像方案的实施,可保证任何一台存储故障,业务都不中断。
⊙ 数据迁移或存储设备更换:通过主机卷镜像软件(即逻辑卷管理软件)将已有存储上的数据迁移到新增存储,卷镜像同步完成后可拆除原有存储。
⊙ 实现异构存储远程灾备:通过卷镜像方案实现原有存储上数据的抽取,为远程灾备打下基础,解决异构存储灾备难题。
主机卷镜像不足之处:
⊙ 维护复杂,需要在各个业务系统部署卷镜像软件。
⊙ 成本较高,按照服务器数量授权,购买license。
3.3.2 虚拟化网关方式
指利用虚拟化技术,统一整合管理FC SAN, IP SAN等多种存储设备,形成统一的资源池供上层业务使用,屏蔽不同存储之间的差异。在数据中心部署存储虚拟化引擎,接入现有或新建的存储系统,通过虚拟化引擎存储可以做到镜像关系(即双活),从而达到两台存储之间双活。所有存储通过虚拟化引擎对外提供统一的管理接口和访问接口,应用系统只需要访问虚拟化存储,可以支持异构的存储系统。该技术主要由各存储设备生产厂家所推荐,如EMC VPLEX,IBM SVC,华为VIS等都提供了相应的解决方案。
基于虚拟化网关方案优势:
⊙ 实现异构双活,利旧现有存储设备。
⊙ 维护简单,各个业务系统无需一一安装代理。虚拟化网关不足之处:
⊙ 通过存储虚拟化后的卷镜像技术实现高可用,增加存储虚拟化的工作量和风险。
⊙ 在主机和存储间增加虚拟化层,增加架构复杂度和故障点,导致成本增加,性能下降。
⊙ 不能完全提供新的智能存储功能。
⊙ 与传统的容灾技术不能良好的集成和兼容。
3.3.3 基于存储实现双活
指在存储系统层面,通过存储双活管理软件实现两台存储的双活工作,互为冗余。当其中一台存储发生故障时,可由另一台存储实时接管业务,实现RPO,RTO为0(数据不丢失,业务不中断)。该技术主要由各存储设备生产厂家所推荐,如宏杉MS3000/5000/7000产品、HDS VSP/VSP G1000产品都提供了相应的解决方案。
宏杉科技的对称双活存储(SDAS)由两台存储阵列组成,分别对应存储引擎A、引擎B。存储引擎A和B上的卷可配置为双活镜像对,中间通过10Gb/40Gb以太网链路进行高速数据同步,数据完全一致。由于采用虚拟卷技术,双活镜像对中的两个卷对外形成一个虚拟卷。对服务器而言,双活镜像对就是可以通过多条路径访问的同一个数据卷,服务器可以同时对双活镜像对中两个卷进行读写访问。组成双活镜像系统的两台存储互为冗余,当其中一台存储阵列发生故障时,可由另一台存储阵列直接接管业务。服务器访问双活存储系统可根据实际需要,选用FC,iSCSI方式,服务器访问存储的SAN网络与数据同步的万兆网络相互独立,互不干扰。
HDS的新双活模式GAD(Global-Active Device)是由两台高端存储G1000组成,用户数据可以在两台存储中实现时时同步复制,并提供对外数据访问服务,用户主机可以访问任意一台存储数据,如果一台存储设备出现故障,可以使业务不停的访问另一台存储设备。当生产中间出了问题,可以自动地不停机的切换到另外一台存储设备上。如果基于传统的容灾,被中心存储的资源是不能被使用的,HDS的双活方案两边存储都可以使用,所有主机也都可以使用,这样就能让资源得到很好的使用,并实现设备自动切换,不影响业务运行。
基于存储双活技术优势:
⊙ 无须任何第三方软硬件,基于两台MS存储阵列就可实现,大幅降低了双活存储的建设成本。
⊙ 无须人工干预的自动切换,实施简单方便,大大降低了双活系统的管理复杂度,提升可维护性。
⊙ 相对于传统灾备系统的一主一备模式,双活
存储系统是双活模式,有效利用了灾备系统的资源,大幅提升了投资有效性。
⊙ 可兼容主流应用厂商的双机、集群系统,部署灵活,可与现有IT系统有效融合。
对于传统的中端存储阵列需要依靠存储虚拟化网关设备实现双活部署的方案,宏杉的对称双活方案具有的特点和优势如图2及表3所示。
表2 双活存储解决方案对比分析
图2 双活数据中心
表3 两种双活技术对比
4 结束语
让我们拭目以待,随着存储技术的积累、沉淀和发展,基于存储双活套件方式(非虚拟化网关方式)将引领双活存储解决方案。
2016年GSMA亚洲移动大奖现已开始接受报名
由GSMA颁发的亚洲移动大奖(AMO大奖)嘉奖对象从来自亚洲市场的全新移动终端及科技到移动应用及服务,旨在强调移动为亚洲广泛区域内的用户、产业、公司、社团及经济所带来的与日俱增的价值。
此奖项由全球顶级的从事撰稿、评估并研究各类移动服务和产品的独立专家进行评选,大奖分为五个类别:
• 移动应用 • 互联生活 • 移动设备
• 技术创新 • 卓越成就
AMO大奖现已开始接受报名。该奖项的颁布将在今年6月2016年世界移动大会-上海推向高潮。
详情浏览www.asiamobileawards.cn。
The Research and Exploration about Data Synchronization in Data Center of Tobacco Industry
Wang Ning
(Tobacco Sales Company of Hainan, Haikou, 570100)
Abstract:In order to achieve data redundancy & system sustanble in data center, the first thing we should do is decide on which device we should install the special software which can synchronize the data and remain the system on sustainable. The software can be installed on Server, on another External-Device, or directly on Storage; Correspondly, the technology evolve into three different ways, the first one is through Host LUN Mirroring, the second one is deploying Storage Virtualization Gateway, and the last one is based on Dual Active Storage technology. As the storage technology is becoming more and more effective and mature itself, the dual active storage technology will lead such solution in the future.
Keywords:RPO; RTO; Data Redundancy & System Sustanble; Host Lun Mirroring; Storage Virtualization Gateway; Dual Active Storage
中图分类号:TP392
文献标识码:A 文章编码:1672-7274(2016)04-0014-04
doi:10.3969/J.ISSN.1672-7274.2016.04.004