SAN与NAS融合技术在数字图书馆中的应用研究
2009-11-19李静董倩
李 静 董 倩
〔摘 要〕本文对数字图书馆的现行存储技术进行了简单介绍,分析NAS网络架构的特点与技术优势,探讨为现代数字图书馆建设提出适宜的网络存储技术架构。
〔关键词〕网络存储;存储区域网络;NSA;数字图书馆
〔中图分类号〕G250.76 〔文献标识码〕A 〔文章编号〕1008-0821(2009)09-0101-03
Research of SAN and NAS Storage Technology in the Digital LibraryLi Jing Dong Qian
(Library,Hebei University of Economics and Business,Shijiazhuang 050061,China)
〔Abstract〕This article introduced the present network storage technology in digital library,analyzed the characteristics of SAN and NAS network architecture and technology,attempted to put forward suitable schemas for network storage technology storage.
〔Key words〕network storage;storage area networks;NSA;digital library
数字图书馆是当今探索知识资源社会共享和增值利用的重要模式,通过数字图书馆,我们可以很快地得到相应有效用的信息。近几年来,随着信息技术、网络技术的发展和数字图书馆的全面建设,高校图书馆的数据存储量急剧膨胀,数字化资源呈几何级数增长,同时各种全文文献和多媒体信息使读者的访问量激增,这对图书馆存储系统I/O请求以及系统的安全性和稳定性都提出了更高的要求,因此采用先进的存储技术架构合理的数据存储平台,实现数据的集中存储、分析和共享是数字图书馆面临的首要问题。
1 数字图书馆主要的网络存储技术
数字图书馆中的数字化信息增长迅速,数字信息存储的容量需求越来越大,对存储技术要求越来越高。数字图书馆存储技术的发展经历了硬盘存储、磁带库、光盘塔存储、光盘库存储、磁盘阵列等,这些存储技术都很难满足大容量存储的需求。此时海量信息存储技术应运而生,如在DAS基础上发展起来的SAN存储与NAS存储都是较为先进的数据存储方式,是新型数据存储模式中的两个主要发展方向。
1.1 SAN(Storage Area Network,存储区域网络)
SAN是独立于服务器网络之外的高速存储专用网,以数据存储为中心,采用高速的光纤通道作为传输媒体,利用高性能的光纤通道Fiber Channel加载SCSI协议来达到可靠的块级数据传输,实现了真正高速共享存储的目标。其优点是:引入存储网络的理念,实现了数据存储的集中化;通过专用网络进行数据存储与备份,不占用原有网络带宽,有效地改善了网络的传输性能;允许多台服务器使用由SAN连接的磁盘存储设备组成的存储池,具有几乎无限的扩展能力;能方便地实现高性能的服务器集群、负载均衡、双机热备、异地容灾等应用,极大地提高系统的性能和可靠性;光纤接口使得服务器和存储系统实现物理上分离,体现了部署的极大灵活性。SAN适用于存储量大的工作环境,需要巨额的投资成本,它曾经被看成数字图书馆存储系统一种比较理想的选择。
在实际应用中,SAN也存在一些不足:设备互操作性较差;操作系统仍停留在服务器端,用户不能直接访问SAN,造成SAN在异构环境下无法实现文件共享,只能独享数据存储池;由于其复杂结构导致器材昂贵,安装与维护成本巨大。所有这些均阻碍了SAN技术的普及应用与推广。
1.2 NAS(Network Attached Storage,网络附加存储)
NAS是一种专业的网络文件存储及文件备份设备,或称为网络直联存储设备、网络磁盘阵列。一个NAS里面包括核心处理器,文件服务管理工具,一个或者多个的硬盘驱动器用于数据的存储,它将存储设备通过TCP/IP协议连接到现有的网络上,提供数据和文件服务;转变了“以服务器为中心”的存储方案为“以数据为中心”的智能网络服务器方案。NAS存储系统具有即插即用的网络集成,无需进行较多的配置就能将NAS安装到网络;具有独立的优化存储操作系统,不用应用服务器干预,就能在网络上存取数据,这样就减少了CPU的开销,提高了网络的整体性能;管理简单,基于Web的GUI管理界面使NAS设备的管理一目了然;可扩展性和可访问性好;能够在异构的操作系统用户间实现文件级共享;能够利用现有的以太网设备,降低资金投入,目前已有许多中小型图书馆在数据扩容时采用了NAS存储技术。
NAS也有不尽如人意的地方:NAS是文件级的存储,采用NFS、CIFS等网络文件协议,而不是块协议或数据库协议,因此不支持需大量依赖于数据库处理结果的应用;NAS解决了服务器I/O带宽的问题,但是它的数据读写占用网络的带宽,特别是对大量数据进行备份的时候,容易导致网络的堵塞;NAS很难与现有备份系统集成,因此NAS的备份与恢复实现相当困难。
2 数字图书馆存储集成的优势
SAN技术和NAS技术都是信息整合的手段,二者各有特点,适合不同的市场需求。数字图书馆数据多样性的特点,将SAN与NAS技术相融合的存储系统无疑是一个适用良好的网络存储系统。
2.1 SAN与NAS存储优势互补
数字图书馆的需求主要体现在数据库服务与文件服务等方面,针对于数据库服务,分析其特点是I/O请求非常频繁,对响应要求高,要求系统的可靠性非常高;文件服务中,其特点是存储文件较大,I/O请求次数相对较少,该类服务要求存储系统容量大、速度快、性能高、扩展性强等,同时还需要该系统具备集中管理、异构资源整合和再利用的特性。不同的数据类型适用于不同的存储模式,SAN与NAS各有其擅长应用的地方,SAN是一个以数据块(Block)为存储单位的存储技术,而NAS则是一个以文件(File)为级别的存储方式。可以采用SAN运行关键应用,例如数据库、备份等,以进行数据的集中存取与管理;而NAS则支持若干客户端之间的文件共享,所以图书馆可以使用NAS作为日常办公中需要经常交换小文件的地方,例如存储网页、E-mail文件等,利用二者的混合模式是非常好的选择。
2.2 存储与服务器的分离更便于管理
目前图书馆一般拥有多台服务器,由于所有的服务器采购时间较早,其存储系统都是直连的模式,这种分散的存储对其管理必须通过其主机系统,而SAN存储网络提供一个存储系统、备份设备和服务器相互连接的架构,它们之间的数据不再在以太网络上流通,从而大大提高了以太网络的性能。正由于存储设备与服务器完全分离,用户获得一个与服务器分开的存储管理理念。现在可以对图书馆的数据和存储进行特殊和专业的管理,不用再像以前那样把数据管理与服务器管理混为一谈。复制、备份、恢复数据和安全的管理可以以中央的控制和管理手段进行。把不同的存储池以网络方式连接,用户可以以任何他们需要的方式访问他们的数据,并获得更高的数据完整性。
2.3 增加了存储系统的可用性
SAN的高可用性基于它对灾难恢复、在线备份能力及对冗余存储系统和数据的时效切换能力。NAS应用成熟的网络结构,提供快速的文件存取时间和高可用性,数据复制(在存储系统层面)等功能可以保护和提供稳固的文件级存储。一个融合SAN和NAS技术的存储解决方案可全面提供一套以块和文件1/0为基础的高效率平衡方案,从而全面增强数据的可用性。应用光纤通道的SAN和NAS相融合能提供对主机的多层面的存储连接,高性能、高可用和容易维护等优点全由一个网络架构提供。
2.4 SAN与NAS混合模式存储具有较强的扩展能力
海量的电子图书资源和多媒体资源是数字图书馆存储的主要内容。而这些数据每年都在增长,所以必须拥有一套或多套大容量的存储系统来满足海量存储的要求。以光纤为接口的存储网络SAN能提供一个高扩展性、高性能的网络存储机构。光纤交换机和光纤存储阵列同时提供高性能(20OMbps)和更大的服务器扩展空间。这是以SCSI为基础的系统所缺乏的。网络存储NAS可以是已经配置好的、完整的并可追加至数个至数十个TB的网络存储设备。由于NAS设备是基于目前的TCP/IP网络,远距离存储设备完全可以实现。一套融合SAN和NAS的解决方案全面获得应用光纤通道的能力,从而让图书馆的存储系统获得更好的扩展性。
3 数字图书馆网络存储集成方案
NAS和SAN的融合是存储的需要,是存储技术发展的必然结果。它们的融合有这样几种典型方案:
3.1 NAS与SAN简单互联,分别提供不同的服务
其实严格来说这种方案还谈不上“融合”,只是两种存储方式并行使用。这两种存储还是使用各自的响应数据请求的方式和各自的网络,没有对原来的存储架构进行革命性的改变,也没有消除信息的重复性和孤立性,不是一种彻底的全新的解决方案。这种融合方式的拓扑图如图1。
3.2 SAN作为NAS的一部分
也就是通常的NAS头方案。这实际上是将NAS中瘦服务器与它的实际存储单元进行分离,将NAS服务器中的RAID卡去掉,增加一个光纤通道卡,使它们通过FC交换机或集线器连接起来。并与其他在这个光纤网络中的服务器一样共享和访问存储资源。集成后的网络既可利用普通的NAS服务器直接连接到存储子系统提供文件级的服务。也可利用NAS引擎连接到SAN上来。提供数据库应用和牵涉到大量数据块I/O的操作服务,可获得较高的数据效率。对于终端用户而言,整个过程是透明的。在这个过程中NAS的作用就像是一个网关一样,负责文件和块数据之间的转换工作。所以NAS头也叫NAS网关,这种方法也是为不同系统提供共享SAN存储资源的一个锐化方法。这种融合方式的拓扑图如图2。
NAS头系统虽然在一定程度上解决了NAS与SAN系统的存储设备级的共享问题,但在文件级的共享问题上却与传统的NAS系统遇到了同样的可扩展性问题。当一个文件系统负载很大时,NAS头很可能成为系统的瓶颈。
3.3 统一存储系统
而“统一存储系统”方式和在SAN前加NAS头正好相反,不是SAN到NAS的支持,而是NAS到SAN的支持,即在原有的NAS基础上,增加对FCP协议的支持。由于NAS具有自己的操作系统和文件系统,因此增加的FCP和原有的NFS、CIFS、HTTP一样,仅是一个协议的支持。NAS设备同时安装两个接口卡,在局域网端安装网络适配器(NIC卡)提供传统的NAS访问服务,而同时又安装HBA卡连接到光纤交换机,将它的存储资源融合到SAN存储池中,向它提供访问服务。这样,一方面NAS服务器可以像SAN中普通工作站一样获得对SAN中存储资源高效的块级数据访问,另一方面,SAN中的工作站也可通过SAN交换机,利用NAS系统的文件缓存,获取较高的性能和较快的数据响应时间。这种融合方式的网络拓扑图如图3。
4 结 语
数字图书馆的建设应该从系统的可扩展性、可管理性、可用性等考虑,确保系统运行的高可靠性,可以预见,这些数据存储技术将在数字图书馆建设中发挥越来越重要的作用,最终将成为面向不同应用层面、分级的各种存储技术的相互融合与统一。随着千兆以太网技术的成熟以及万兆以太网应用的不断普及,网络存储必然以其性价比、通用性、无地理限制等优势飞速发展,SAN与NAS融合将共同开创网络存储的新局面。将自身协议和特点完全不同的SAN与NAS技术加以融合便于实现数据集中管理、集中备份、数据保护、数据高速共享等。因此,应该将SAN与NAS两种系统积极地融合在数字图书馆网络存储结构中,发挥各自的优势,取长补短,减少重复建设和浪费,从而构建自己安全、快速、成本更低的数字资源存储网络。
参考文献
[1]康春荣,苏武荣.数据安全项目案例存储与备份SAN与NAS容错与容灾[M].北京:科学出版社,2004.
[2]徐文贤.基于SAN/NAS的图书馆数据存储方案[J].图书馆,2005,(1):74-76.
[3]张继征,杨波,陆体军,等.NAS与SAN的融合[J].计算机应用研究,2005,(8):190-192,240.
[4]教育行业存储解决方案[EB].http:∥www.it.com.cn/f/solution/057/18/145355.htm,2008-06-17.
[5]董晓莉,张建刚.虚拟存储技术在未来数字图书馆中的应用[J].现代图书情报技术,2006,(8):18.
[6]中华服务器网.存储新概念[EB/OL].http:∥www.ccw.com.cn/server/wlcc/htm2006/20060529-188587.htm,2007-02-15.
[7]赵文辉,徐俊,周加林,等.网络存储技术[M].北京:清华大学出版社,2005.3:129-130.
[8]施威.网络存储技术再度进化[EB/OL].http:∥media.ccidnet.com/art/2647/20061024/930547-1.html,2007-02-15.