SAN 和NAS 在高校数字图书馆网络存储上的融合讨论
2021-12-04季莹赵宁韩露
季莹,赵宁,韩露
(1.哈尔滨工业大学图书馆,黑龙江哈尔滨 150001;2.黑龙江电视台,黑龙江哈尔滨 150001)
随着网络技术的发展和数字图书馆的使用,数字图书馆的用户和资源量访问量的增加,对数字图书馆的数据存储与系统输入输出的稳定性和数据安全有更高的要求。
1 高校数字图书馆面临的存储问题
高校数字图书馆存储了大量电子文献,学位论文库、特色库、媒体库、自建库和购买的电子期刊备份、全文库等都在随着年份的增长而不断增加,数据是多样性的[1]。
高校图书馆的存储面临以下问题:需要保证数据安全和服务器7×24 h 可用;数据的传输性、实时性和兼容性较差;需要解决服务器系统之间交换数据文件,满足大块数据的输入输出、数据的共享性、跨平台的计算环境、足容灾容错集群管理、多级备份、在线备份与近线备份等问题;存储多数使用磁盘列,不能共享;主流硬件设备和存储类型不同,扩充不便。
2 网络存储结构比较
高校数字图书馆存储技术包括DAS、NAS、SAN。DAS是直接附加存储技术,通过SCSI 接口或者光纤等将磁盘阵列接到服务器上,但是加大了管理难度[2],不适合大规模存储。按照存储网络工业协会SNIA 的定义,SAN 是存储区域网,利用互联网协议,在服务器与存储之间传送数据;NAS是存储设备,直接连接LAN,提供文件级服务[3]。
2.1 SAN
SAN 是服务器连接存储的结构。存储设备不在服务器系统中。SAN 将LAN 上的存储转换到由存储设备组成的SAN 上[4-7]。
优点是高宽带,低延时,数据传输速度高、距离长,子网不影响主网的带宽和性能,操作的可靠安全性和可扩展能力高[8-9]。缺点是互操作性差,成本较高,无法实现异构环境的文件共享,维护较难。
2.2 NAS
NAS 是跨平台数据存储设备。通过网络协议和I/O 方式数据传输,即插即用LAN,支持共享数据。将数据存储任务从主服务器分离出来,主服务器只用于数据处理[3]。
优点是设备故障不影响其他服务器,在网络上存取数据减小CPU 开销,支持共享数据和多种传输协议[10],文件级操作,价格低廉。缺点是难与现有备份系统集成,备份恢复困难,操作占用大带宽,其他I/O 受影响,扩展受限多,增加存储介质影响网络性能,读写占用流量,不能集中管理,不支持数据库服务,传输速度慢。
3 SAN 和NAS 的融合
NAS 和SAN 存储优势互补。SAN 用作数据库的快速运行,NAS 负责客户端,通过专线网络存储与备份数据,不占用原来带宽,传输性能改善,无限扩展[11-12]。
3.1 SAN 和NAS 互联
SAN 和NAS 互联只是设备互联,两种存储方式并用,各自的网络还是各自响应数据的I/O 方式。SAN 和NAS 的互联如图1 所示。
图1 SAN 和NAS 的互联
3.2 NAS 和SAN 集成
NAS 是功能服务器和存储器件。去掉存储,即RAID 卡,加上一个FC 卡,通过光纤交换机或集线器连接共享和访问网络存储资源。NAS 服务器提供子系统的文件级服务或用NAS 引擎连接存储区域网,提供数据块I/O 操作和数据库应用。NAS 负责文件和数据块之间的转换,实现数据共享。但文件级的NAS 承受不了大负载。NAS 和SAN 的集成如图2 所示。
图2 NAS 和SAN 的集成
3.3 SAN 和NAS 的统一连接
增加FCP 协议。安装NIC 网卡访问局域网和HBA 卡连接光纤交换机,将NAS 存储子系统融入SAN。NIC 在主机和存储设备之间传送数据包,块状数据通过HBA 或者并行SCSI 接口传送;HBA 负责主机和存储之间传送块状数据。NAS 对存储资源进行数据块访问,获得迅速的数据响应。SAN 和NAS 的统一连接如图3 所示。
图3 SAN 和NAS 的统一连接
4 高校数字图书馆网络存储的融合方案
高校数字图书馆采用灵活的网络拓扑结构,通过光纤交换机及设备连接,高速传输,实现任意节点间的多路可选择的数据交换,并将专用数据存储局域网与应用网络分离,设计满足数字图书馆不同数据处理要求的存储系统。
采用EMC 公司存储设备产品,如Clariion CX400/500,磁盘阵列采用光纤通道技术,采用通用的硬件体系结构和软件应用程序套件。NAS 设备NS501 前端口连接以太网接口或iSCSI 口,后端连接DPE 获得存储资源,NAS 管理台管理存储容量。NAS 设置NFS/CIFS/HTTP 和FCP 文件服务器,前端口用NIC 连接以太网交换机,后端口配置HBA 卡,或者通过FC Switch 连接DPE。光纤交换机FC switch 是扩展CX400/500 磁盘阵列连接的服务器数目。组建的FC-SAN(8 端口)可以使得128 台主机通过存储网络访问磁盘阵列的存储资源。关键性业务采用SAN 的Lan-free,不占用LAN带宽,不降低性能,一般业务通过Server-free 方式,提高了网络传输速度。
5 结论
SAN 和NAS 融合是一种新的存储方式,既有SAN 的高性能和可直接访问存储设备的特点,又有NAS 的统一管理、共享数据的特点。结合高校数字图书馆要求对于所保存信息的数字化、服务方式的网络化,实现集中存储、访问和共享。保持系统持续运行,高速有效的访问;不仅扩充硬件设备,还兼容异构系统,确保数据完整一致。