APP下载

基于双活虚拟化存储系统技术设计与实现

2018-01-04郑朋飞高淼郑朋举

中国科技纵横 2017年22期

郑朋飞 高淼 郑朋举

摘 要:随着信息技术的快速发展及公司业务逐渐走向快速、灵活、多变,河南中烟对于存储解决方案的要求也更加灵活。通过对现有存储系统的整合,构建能够支撑河南中烟未来业务发展的核心存储系统,通过双活数据存储系统的建设,初步形成本地高业务连续性解决方案,保障烟草生产调度指挥体系的安全运转。

关键词:存储虚拟化;双活;异构存储

中图分类号:TP308 文献标识码:A 文章编号:1671-2064(2017)22-0023-02

1 虚拟化存储系统建设的背景

根据建设时期和年代不同,以及一些历史原因,不同的系统分别部署在不同的集群。每个集群都有相对独立的服务器集群系统、SAN网络及存储系统。由于业务系统的不断发展,管理水平的不断增强,随着与计算技术的不断应用,IT系统集中化进程的加快,现有的存储环境,已经无法满足现有业务系统的发展的需要,主要问题如下:

1.1 现有存储容量扩展性不高

现有存储系统都为各个厂商的中端存储,存储容量扩展性不高,且在应对大数据量和复杂的容灾架构的时候能力较弱,无法满足未来数据中心的大数据量需求。

1.2 存储孤岛不利于数据统一管理

目前,虽然在两台AMS2500上实现了重要业务系统相对集中存储,但仍存在现有存储系统各自形成孤立的数据孤岛,在资源统一管理上捉襟见肘。每套存储系统只能利用自身的空间,而无法利用其它存储的空间,造成很大的存储资源浪费和重复投资。

1.3 异构存储整合问题

现有存储系统由不同厂商的不同存储系统构成,扩容成本大,不同业务应用和厂商的设备独立扩容,无法集中选择性价比更高和服务更优的产品;共享难,各业务系统独立使用存储资源,即使其他存储设备有闲置容量也无法加以利用,导致额外的容量浪费;管理难,各厂商的存储管理软件互不兼容,无法统一管理,导致运维难度大;业务和数据保护难,各厂商数据保护技术多样,部署新功能困难,成本高昂。

1.4 缺乏业务连续性

目前存储系统的部署方式存没有实现高可用性架构,存在单点故障,不能够有效的保护数据安全和业务连续性。

2 双活虚拟化存储系统技术的设计与实现

针对目前存储系统存在的问题,通过构建双活存储系统实现存储系统的高可用性,并利用存储虚拟化技术对存储孤岛和异构存储进行整合,实现存储资源的统一管理。

2.1 整体架构设计

双活存储系统其中一台使用智能异构虚拟化功能,将现网两台磁盘阵列进行接管,并通过LUN迁移功能,在保证原有上层业务无感知的情况下,把磁盘阵列中核心生产系统的LUN迁移到新购高端存储上,利用新购存储更好的性能,提升业务质量,同时将非核心业务系统的LUN部署在原磁盘阵列上,实现数据分级存储,使得整体资源合理利用。这样通过存储异构虚拟化技术,接管现有存储,实现存储资源的大整合,通过建立虚拟存储资源池,统一为业务提供存储空间服务,实现基于虚拟化的统一存储平台,完成存储整合任务。

2.2 存储虚拟化详细设计

异构虚拟化技术就是着眼于客户的存量设备,为异构设备提供丰富的异构虚拟化功能。通过异构接管功能降低用户管理不同异构阵列的复杂度并提升异构LUN性能;通过提供异构LUN在线迁移实现在不断业务的情况下实现异构LUN之间数据平滑的迁移;通过提供异构远程复制技术实现异构LUN间的容灾;通过提供异构快照技术实现异构LUN的快速备份。

2.3 双活存储详细设计

双活存储解决方案指两个存储均处于运行状态,可以同时承担生产业务,从而提高数据中心的整体服务能力和系统资源利用率。

双活数据中心解决方案为AA双活架构,以业界领先的OceanStor V3 HyperMetro功能为基础,与Web、数据库集群、负载均衡、传输设备和网络等组件相结合,为客户提供100km内的端到端双活数据中心解决方案,确保业务系统发生设备故障、甚至单数据中心故障时,业务无感知,自动切换,实现RPO(Recovery Point Objective)=0,RTO(Recovery Time Objective)=0(RTO与应用系统及部署方式有关)。

2.3.1 存储层双活架构

(1)并行结构。HyperMetro特性基于两套存储阵列实现AA(Active-Active)双活,两端阵列的双活LUN数据实时同步,且双端能够同时处理应用服务器的I/O读写请求,面向应用服务器提供无差异的AA并行访问能力。当任何一台磁盘阵列故障时,业务自动无缝切换到对端存储访问,业务访问不中断。

(2)免网关设计。HyperMetro双活架构无需额外部署虚拟化網关设备,直接使用两套存储阵列组成跨站点集群系统。最大支持32个存储控制器,即两套16控存储阵列组建双活关系。

(3)I/O访问路径。HyperMetro在应用主机侧,通过Ultra Path主机多路径软件,将两台存储阵列上的双活成员LUN聚合为一个双活LUN,以多路径vdisk方式对应用程序提供I/O读写能力。应用程序访问vdisk时,Ultrapath根据选路模式,选择最佳的访问路径,将I/O请求下发到存储阵列。

2.3.2 高可靠技术

HyperMetro在继承OceanStor存储系统高可靠设计的基础上,全新设计了一些解决方案级高可靠技术,最大化提高了存储双活方案的可靠性。

(1)跨磁盘阵列集群。两套独立的存储阵列组建成本地高可用集群,提供双活存储架构,向应用服务器提供无差异的并行访问,处理应用服务器的I/O请求。集群节点具有并发访问能力。当出现单个控制器故障时,其承接的业务将被切换到本阵列的其它工作控制器;当阵列的工作控制器全故障时,则切换至另一个阵列。在跨磁盘阵列集群基础上,HyperMetro以双活Pair或双活一致性组为单位提供服务和进行状态管理。

(2)数据实时镜像。HyperMetro 通过实时镜像功能,保证两个存储阵列之间数据的实时同步。主机写操作通过实时镜像技术同时写入两个数据中心的双活成员LUN,保持数据实时一致。

HyperMetro支持断点续传功能。当某些故障场景(如单套存储故障)导致双活Pair关系异常断开时,HyperMetro通过记录日志的方式,记录主机新产生的写I/O。当故障恢复时,HyperMetro将自动恢复双活Pair关系,并且将所记录的增量数据自动同步到远端,无需全量同步所有数据,整个过程对主机“透明”,不会影响主机业务。

(3)跨磁盘阵列坏块修复。硬盘在使用过程中可能因为掉电等异常情况出现坏块,如果是可修复错误但是本端已经无法修复时,HyperMetro将自动从远端阵列获取数据,修复本地数据盘的坏块,进一步提高系统的可靠性。

(4)冲裁设计。当提供双活LUN的两套阵列之间的链路故障时,阵列已经无法实时镜像同步,此时只能由其中一套阵列继续提供服务。为了保证数据一致性,HyperMetro通过仲裁机制决定由哪套存储继续提供服务。

2.3.3 高性能技术

在双活镜像数据的初始同步或者恢复过程中的增量同步过程中,差异数据块通常有大量的零数据块,无需逐块复制,通过硬件芯片,对数据拷贝源端进行快速识别,找出零数据,在拷贝过程中,对全零数据特殊标识,只传输一个较小的特殊页面到对端,不再全量传输。该技术可有效减少同步数据量,减少带宽消耗,缩短同步时间。

2.4 原有存儲系统利旧使用

对于原有的存储系统可以分两类来用:对于购置时间较长和性能不高的存储系统用来组件集中备份系统。对于性能较好的2台原核心存储,用新购置的华为OceanStor 18500 V3存储系统的异构存储虚拟化功能进行接管,继续作为生产存储使用,可以存储一些非关键应用的数据。

3 实施效果

通过本项目的实施,利用双活存储解决方案提供了存储系统的高可用性架构,双活存储的高可用性架构消除了数据中心存储系统的单点故障,当任一存储系统发生故障时,另一存储系统可自动接管业务,能够充分保证业务系统连续性,任意单个存储系统发生故障时,业务数据无丢失,业务系统不会中断。双活存储解决方案还提供了全自动的故障处理机制,故障切换无需人工干预,大幅降低容灾系统维护成本,使得维护与管理变得更加规范。并通过对现有存储系统的整合,充分利用现有资源,构建能够支撑河南中烟未来业务发展的核心存储系统,初步形成本地高业务连续性解决方案,保障河南中烟应用系统的安全运行。