APP下载

基于云计算的存储虚拟化技术研究

2017-10-13杨志成

网络安全技术与应用 2017年3期
关键词:计算环境存储设备存储系统

冀 鸣 朱 江 曹 雄 杨志成



基于云计算的存储虚拟化技术研究

冀 鸣 朱 江 曹 雄 杨志成

(广东凯通科技股份有限公司 广东 510000)

随着信息技术的发展,云计算技术已经成为当今国内外开发与研究的重点方向。基于云计算的虚拟化技术主要包括服务虚拟化、存储虚拟化、应用虚拟化、桌面虚拟化。对云计算下的存储虚拟化技术的研究有利于更加合理地分配存储资源,促进云计算技术的研究发展。本文首先介绍了云计算的概念以及主要技术要点,并结合云计算虚拟化技术对的存储虚拟化的实现方式进行分析,最后分析实现存储虚拟化的关键技术及一些解决方法。

云计算;虚拟化;存储虚拟化

0 前言

随着信息技术的发展,特别是大数据时代的到来,数据快速增长对业务和应用的要求不断提高,IT系统规模日益庞大。而现有的服务器和存储系统等设备都没有被充分利用,采用的技术和基础架构不统一,造成系统资源不能有效适应业务要求。针对这一现状,云计算技术应运而生。

云计算将网络中的硬件设施、软件技术和计算机网络应用服务等各种资源整合成一个大的资源池,并以新的计算模式和方法,对用户提供按需定制服务,包括基础设施服务、软件服务、应用服务。云计算的出现,改变了传统信息服务的提供方式,其资源可以无线扩张,并及时获取,按需使用,具有很大研究价值和商业价值。在云计算中,研究重点就是计算机的虚拟化,虚拟化技术是将各种计算及存储资源充分整合和高效利用的关键技术,通过虚拟化技术可以实现资源的虚拟计算[5][7]。

1 云计算环境下的存储虚拟化

虚拟化技术是云计算的基础,是一种将各种计算及存储资源整合后有效分配利用的方法。虚拟化技术将各种资源包括硬件、软件、数据、网络、存储等统一抽象成虚拟资源。进行虚拟化后的资源,可以实现容量扩展和缩小、软件配置简单以及架构动态化,并能集中管理和动态使用物理资源及虚拟资源,从而提高系统结构的弹性和灵活性[3]。

云环境中的虚拟化技术主要有服务器虚拟化、存储虚拟化、应用虚拟化和桌面虚拟化,不同种类的虚拟化技术从不同的角度解决不同的系统性能问题。在数据量快速增长的今天,特别是在云环境下,存储设备及数据存储方式的多样性,为了进一步提高数据存储系统的性能以保障数据的安全性和完整性,需要对存储虚拟化技术的研究做进一步加深。

云计算环境下的存储虚拟化是把多个存储介质模块通过虚拟化技术集中管理起来,将所有存储模块集中在一个存储池中进行统一管理,从而实现对同构或异构的多个存储设备的统一管理存储系统,并能将存储器的物理管理与逻辑管理进行分离,达到存储器的透明化访问[6]。

在存储虚拟化的实现上,可分为两种方式:带内虚拟化和带外虚拟化。可在三个层次上实现,分别为基于主机的存储虚拟化、基于存储设备的存储虚拟化、基于网络的存储虚拟化。最终可实现的结果为:块虚拟化、磁盘虚拟化、文件系统虚拟化、文件或记录虚拟化和磁带、磁带驱动器虚拟化。

图1为云计算环境下存储虚拟化的实现模式。

图 1云计算环境下存储虚拟化实现模式

云计算环境下的存储虚拟化技术的特点包括以下三点:

(1)管理集中化。云环境下的存储虚拟化通过存储软件集中管理,既能简化管理操作又能提高存储效率。

(2)通用性。云环境下的存储虚拟化技术打破了各个存储设备厂商之间的界线,用户有更多的产品可以选择。

(3)透明性。云计算环境下的存储虚拟化技术将各种异构存储设备整合成统一资源池,使得用户在使用存储产品过程中无需太多考虑存储容量等问题,虚拟化使得用户的存储空间可以动态伸缩,提供了近乎于无限的存储空间。

2 云计算环境下存储虚拟化的实现方式

由于存储设备的种类很多,不同设备使用方法不同,存储数据的方式也有较大的差异,所以要高效的管理这些设备比较困难。而虚拟化技术刚好为解决存储设备管理效率问题提供了一种有效的方案,通过虚拟化技术将各种异构的存储资源整合在一起,采用Striping、LUN Masking等技术对存储资源池进行操作,实现存储池动态增长和按需分配,使存储系统具备更好的兼容性、扩展性和可靠性。

存储虚拟化技术按照实现的原理可以分为三个层次,分别是:基于主机的存储虚拟化、基于存储设备的存储虚拟化、基于网络的存储虚拟化[4]。

2.1 基于主机的存储虚拟化

基于主机的存储虚拟化是通过在服务器操作系统中安装存储虚拟化软件来实现的,一般由服务器操作系统中的逻辑卷管理器(LVM)软件完成,通过逻辑卷把分布在多机上的物理存储设备映射成一个统一的逻辑虚拟存储空间,可实现系统级和应用级的多机间存储共享。逻辑卷管理系统实际上是一个从物理存储设备映射到逻辑卷的虚拟化存储管理层,服务器只需要处理逻辑卷,而不需要直接去控制管理这些独立的物理存储设备。

图2基于主机的存储虚拟化

一种云计算环境下基于主机的存储虚拟化结构如图2所示。

基于主机的存储虚拟化只需在应用服务器端安装卷管理驱动模块就可以完成存储虚拟化的过程,不需要任何附加硬件,使这种存储虚拟化技术具有容易实现、设备成本低、同构平台下性能高等特点。

但是它也有缺点:(1)安装存储虚拟化软件会给操作系统带来一定的开销,降低应用性能;(2)升级、维护和扩展非常复杂,而且容易造成系统不稳定;(3)对操作系统的依赖性较大,使得虚拟化系统不能兼容不同的平台,移植性较差。

2.2 基于存储设备的存储虚拟化

基于存储设备的存储虚拟化是在存储控制器上添加虚拟化功能,通过特定的算法或者映射表把逻辑存储单元映射到物理设备之上,将不同的存储系统融合在一起,形成基于存储设备控制器的存储虚拟化应用平台。典型的例子是在智能磁盘子系统中的块级虚拟化,通过采用逻辑单元号掩盖和各样的I/O通道向多个服务器提供存储功能。

通过存储设备控制器上存储虚拟化平台可以在存储系统不停机的情况下,实现存储资源池的迁移,并且可以在不同类型存储设备之间进行数据复制,使用户在数据管理方面更简单透明。通常的企业级存储阵列通过RAID和镜像提供低级虚拟化,有些产品也支持高级功能,可以实现对服务器完全透明,并且无需在服务器上面安装任何代理软件。

一种云计算环境下基于存储设备的存储虚拟化结构如图3所示。

图 3基于存储设备的存储虚拟化

由于这种虚拟化技术没有统一标准,一般只适用于特定厂商的产品,不同厂商的数据管理功能不能互相操作,使得异构产品间很难实现存储级联,所以这种存储虚拟化产品的可扩展性比较差,近期也有一些研究成果采用基于目录的虚拟化方式[1]来克服这些不足。

2.3 基于网络的存储虚拟化

基于网络的存储虚拟化是在网络层添加虚拟化管理设备,抽象化服务器与存储阵列之间的实际存储资源,使用得服务器可以灵活高效的使用共享存储资源。比较典型的网络虚拟存储技术包括网络附加存储NAS(Network Attached Storage)和存储区域网络SAN(Storage Area Network)。基于网路的虚拟存储化技术是当前存储虚拟化的主流技术,是实现虚拟存储中最具有逻辑含义的部分,被认为是存储虚拟化中最为“开放”的虚拟化。近年来各家存储厂商都研发了各自的基于网络的存储虚拟化设备[8][9]。

在实现上主要有三种方式:第一种是基于互联设备的虚拟化,分为对称虚拟化结构和非对称虚拟化结构;第二种是基于交换机的虚拟化,将虚拟化功能模块嵌入到交换机固件中或者运行在于交换机相连的主机上,对与交换机相连的存储设备进行管理;第三种是,基于路由器的虚拟化,通过将虚拟化功能模块嵌入到路由器固件上,实现虚拟化。

图 4基于网络的存储虚拟化

一种云计算环境下基于网络的存储虚拟化结构如图4所示。

基于网络的存储虚拟化技术提供了统一的异构存储管理接口,支持异构主机、异构存储设备间的同步数据复制和远程异步数据复制,能使不同存储设备的数据管理功能统一,可扩展性比较好。但是也存在部分厂商数据管理功能弱,产品成熟度较低,使得数据管理难度增大,存储设备与主机之间的不兼容等问题。

3 云计算环境下存储虚拟化的关键技术

存储虚拟化的核心工作是实现异构存储设备到虚拟存储池的映射,屏蔽不同物理设备的特性,使用户可以根据需求对资源池任意划分,并分配给特定的主机和应用程序。由于存储网络的复制性,存储虚拟化技术在实现上的难度较大。下面是实现存储虚拟化需要解决的几个关键技术:

(1)异构存储介质的互联和统一管理。存储虚拟化的核心任务是实现真正意义上的存储设备的透明性,及兼容多种类型的存储设备,屏蔽它们的不同物理属性并向用户提供统一的访问方式。但是,不同存储网络环境常包含不兼容的技术和标准,即使是在同一个SAN内都可能出现不同操作系统的服务器和不同类型存储设备。要解决这个问题,则要选择一个好的虚拟化系统,能兼容多种协议并屏蔽各类设备的差异性,从而简化逻辑存储设备的管理。

(2)数据的共享冲突与一致性。存储虚拟化的另一个主要功能是实现数据共享,这就要求不同物理存储设备间及不同操作系统间的数据能互相拷贝,此外还需防止不同操作系统所带来的存储共享冲突和并行I/O访问冲突。可以在主机与虚拟存储池之间添加Cache以减少I/O次数。当然Cache机制也存在一致性问题,所以需要良好的锁机制算法和Cache一致性等技术来保证数据的完整性。

(3)数据的容错容灾。存储虚拟化要保证数据的完整性必须建立容错容灾机制,当存储系统出现误删、单点失效甚至是意外灾难时都能保障数据恢复,防止数据丢失。为此,应实现多种机制下的数据备份或者基于纠删码机制对数据进行编码存储,以达到数据系统容错容灾及自动恢复等功能。

(4)性能优化和负载均衡。不同应用有不同的数据访问特性,存储系统应该从全局的观点并根据不同的存储设备的存储特性来优化存储系统,根据用户对数据的请求,设计I/O均衡策略,实现对数据的按需存取。可以通过数据的主动存储和数据的过预取策略来提高用户对数据的访问效率,也可以采用基于存储对象的存储主动服务策略来提高对数据存储的预测,从而优化存储系统的性能。

(5)数据安全。由于存储网络中数据的透明性,必须对数据的访问加以控制,防止数据被越权访问或者恶意攻击。为了数据的安全性,虚拟化管理软件可以通过多样的访问策略来保证安全,如基于密钥的认证管理和数据加密策略或者是在存储体之上加入一层可信的管理层节点[2]。

4 结束语

虽然虚拟化技术已经得到了较大的发展,但是不同企业的用户类型不同,存储策略也相应的不同。企业需要把自己的现有的存储资源、存储技术和存储虚拟化技术相关联并应用与云环境中,从而找到适合自己的存储策略,以更好地利用资源、简化管理。有一点需要注意的是数据存储的安全问题,特别是在大数据云计算环境中,数据的存储地方与数据被谁访问,数据的存放是否安全问题这些问题都是在云计算环境中需要进一步解决的存储安全问题。

[1] Joukov N,Krishnakumar A M,Patti C,et al. RAIF:Redundant Array of Independent Filesystems. IEEE Conference on MASS Storage Systems and Technologies. IEEE Computer Society,2007.

[2]Zhang M,Zhang D,Xian H,et al. Towards A Secure Distribute Storage System[J],2008.

[3]叶娟.试论云计算中虚拟化技术的应用[J].计算机光盘软件与应用,2012.

[4]谭生龙.存储虚拟化技术的研究[J].微计算机应用,2010.

[5]朱光磊.云存储技术的发展应用趋势探析[J].电脑知识与技术,2011.

[6]Tom Clark. Storage Virtualization[J]. Addison-Wesley, 2007.

[7]Zhang S,Zhang S,Chen X,et al. Cloud Computing Research and Development Trend[C]// Second International Conference on Future Networks. IEEE Computer Society,2010.

[8]Li B,Shu J,Zheng W. Design and Implementation of a Storage Virtualization System Based on SCSI Target Simulator in SAN[J].清华大学学报自然科学版(英文版),2005.

[9]Xiao D,Shu J,Xue W,et al. TH-VSS:An Asymmetric Storage Virtualization System for the SAN Environment[J]. Lecture Notes in Computer Science,2005.

猜你喜欢

计算环境存储设备存储系统
云计算环境下网络安全等级保护的实现途径
分布式存储系统在企业档案管理中的应用
天河超算存储系统在美创佳绩
大数据云计算环境下的数据安全
Windows 7下USB存储设备接入痕迹的证据提取
基于Flash芯片的新型存储设备数据恢复技术研究
云计算环境中任务调度策略
华为震撼发布新一代OceanStor 18000 V3系列高端存储系统
云计算环境下电子书包教育应用创新研究
用批处理管理计算机USB设备的使用