APP下载

面向数字图书馆的多级混合存储技术分析

2020-07-19冯绍卿

科学导报·学术 2020年74期
关键词:存储技术数字图书馆优化措施

冯绍卿

【摘 要】图书馆作为我国重要的社会基础机构,承担着为群众提供阅读服务以及社会教育职能。在现代信息技术快速发展的背景下,数字图书馆建设不断完善,是当前图书馆的主要发展方向,通过数字图书馆建设能够为人们提供电子化阅读服务,从而促进图书馆服务质量提高。但是在数字图书馆建设过程中,对于存储能力要求较高,必须采用稳定的存储方式将图书馆馆藏资源进行数字化存储。因此,本文将对面向数字图书馆的多级混合存储技术进行深入地研究与分析,并提出一些合理的意见和措施,旨在进一步促进我国数字图书馆建设质量提升。

【关键词】数字图书馆;存储能力;存储技术;多级混合存储技术;优化措施

在人们阅读方式转变的背景下,传统图书馆的服务模式已经不能满足群众现代阅读需求,所以近些年来数字图书馆建设取得很大发展,能够为读者提供更加优质的电子化、网络化阅读服务。在数字图书馆的存储方式中,传统的机械硬盘存储方式虽然成本较低,但是速度较慢,固态硬盘存储速度较快,但是综合成本较高,内存虚拟硬盘存储速度最快,但是存储成本最高,且如果发生断电就会出现数据丢失问题。因此,如何将多种存储方式混合使用,是当前数字图书馆建设需要考虑的主要内容。

1当前数字图书馆主要存储方式分析

1.1传统机械硬盘存储

传统的机械硬盘存储是采用磁盘高速旋转的方式,将磁头在硬盘中读取数据的模式,随着数据量逐渐增加,磁盘的碎片也会提升,磁头读取数据所需要花费的时间也会随之延长,存储速率就会降低。例如常用的FC机械硬盘,内部传输速率相比于普通硬盘更高,采用高密度的磁盘技术,持续性数据传输率能够达到171MB/s,在数字图书馆存储中具有重要的作用[1]。

1.2固态硬盘存储

固态硬盘是指采用固态电子存储芯片阵列而制作的硬盘,内部结构主要包括控制单元、存储单元,在数字图书馆存储中有着广泛地应用,固态硬盘在外形与尺寸方面有传统机械硬盘基本相同,但是相较于机械硬盘能够实现耕地成本、更大容量,相比于机械硬盘各方面表现更为出色,但是综合成本造价较高。

1.3内存虚拟硬盘存储

内存虚拟硬盘存储管理和使用较为简单,能够降低服务器运行压力,数据读写和存储速度较快,具有许多优势。但是,存储数据为普通数据网络传输模式,容易受到其他流量的影响,当网络中数据流量较大时,其系统性能将会受到影响,且因为采用普通网络传输模式,容易发生系统数据泄漏和丢失问题,对于数字图书馆系统稳定性和安全性要求较高。

2数字图书馆数字资源基本特征分析

单体读者访问数字图书馆资源时具有随机性和无序性特征,但是图书馆不能要求读者按照数字图书馆建设访问资源,因为不同读者的阅读方向不同,但是从大量的读者访问数据来看,其热点数据具有一定的规律性,将数字图书馆资源根据其访问热度进行划分,在一定时间范围内根据相应的条件进行数据迁移,则能够提高数字图书馆多级存储能力[2]。在数字图书馆正常运行时,读者会在任何时间访问数字图书馆内部资源,在同一时间内有几率访问同一资源,但是数字资源的写入并不是随时能够进行,例如,传统数字图书馆的电子期刊比如知网、维普等,在本地镜像时以年为时间单位对其进行内部更新,后期更新速度较为缓慢。对于传统图书馆而言,数字图书馆资源以频繁读取为主要模式,偶尔会出现大量数据写入的问题。因此,采用多级存储方式的数字图书馆局部与传统数字图书馆相似,读者读取数据按照数据优先访问规律开展数据迁移,但是因为CACHE、SSD等价格相比于传统机械硬盘价格更高,且容量较小,所以在数字图书馆多级存储方式中占比较小。

3数字图书馆多级混合存储技术应用分析

3.1热点数据迁移模式

数字图书馆作为一个大规模的数据资源库,有收藏、推新以及推热的基本功能,电子期刊、电子图书以及影视资料等数据将新的资源移动的到高速存储介质中,将旧有资源或訪问量较少的数字资源移动到低速存储介质中,通过对数据迁移进行合理化配置,根据迁移配置模型能够使数字图书馆多级混合存储技术的应用效果最大化发挥。当前,数字图书馆热点数据迁移中有存储卷迁移和文件迁移两种主要模式,大部分新型储存器都带有存储卷迁移功能,存储器会将存储磁盘拆分成为若干个卷,存储器中的程序会根据卷的热点程度进行迁移,而不是采用单体数据文件的形式,所以适合采用存储卷迁移模式。数据迁移模式主要包括:人机交互平台已手工的方式根据要求将资源存储到对应的多机存储区域,还可以采用软件进行数据迁移,根据相应的算法采用自动化数据迁移方式[3]。通过对数字图书馆热点数据迁移模式的优化,成本最高的存储器主要用于访问较为频繁、热点程度较高且价值最好的数字资源存储,成本适中的用于存储访问频率中等且价值一般的数字资源存储,传统机械硬盘用于存储冷门数据和价值较低的数据存储,从而能够对数字图书馆资源存储进行优化,发挥出多级混合存储技术的最优效果,提高数字图书馆存储系统稳定性和实用性。

3.2数据库建设

图书馆中的数字资源主要包括电子图书资源、音频资源、食品资源以及期刊论文资源等几个类别。因为传统的纸质阅读方式已经不能满足当前读者的阅读需要,所以数字图书资源是其建设的主要核心,需要考虑到图书资源的基本信息,根据信息建立相应的数据库。通过建设数字图书馆数据库的方式,建立数据库模型,将数字图书资源根据其基本信息进行数据迁移,并根据资源类型的不同,采用不同的数据库建设方式,图书基本表中的信息主要包括:ID号、内部或出版图书表示、电子图书书名、作者名、出版单位、出版时间、ISBN编号、页码、出版次第、装帧、开本、书籍分类、附件大小、下载次数、下载地址、录入者、录入日期、阅读次数、热点因子、迁移目标位置以及存储介质等。根据图书基本信息,将其分类录入到数字图书馆的资源库中,形成规范化、制度化、标准化的数据库,从而能够将多级混合存储技术优势最大化发挥,提升数字图书馆存储系统稳定性和经济性。

3.3多级存储混合技术应用流程

1.电子图书基本表、音频/食品数据基础表、期刊论文基本表中存储的信息,根据表中的浏览频率、下载次数以及读者在线调查等作为热点选择依据,按照数据热点不同,采用不同的存储技术。

2.电子图书辅助表、音频/视频数据辅助表、期刊论文辅助表,根据图书馆的实体销售与网络数据,收集热门数据,按照数据热点不同,采用不同的存储技术。

3.根据辅助表中的数据引入技术,将其与基本表进行比对,如果辅助表中的数据都可以在基本表中体现,则将基本表中的热点因子进行调整,如果没有对应表现,则需要在辅助表中记录,将其作为图书馆下一步数字资源的主要内容。

4.根据文件大小对文件系统基本表中的热点因子进行修正,文件数据越大则热点因子越小,从而根据热点因子选择不同的存储技术。

结束语

综上所述,本文详细阐述多种不同存储技术的优势和缺点,同分对数字图书馆数据访问特征进行分析,并提出多项有效的数字图书多级混合存储技术的应用方式,希望能够对我国数字图书馆建设起到一定的借鉴和帮助作用。

参考文献:

[1]李红华. 数字图书馆资源的云存储系统需求与设计分析[J]. 现代科学仪器,2019,(005):29-33.

[2]孟一奇. 基于云存储技术的数字图书馆馆藏资源安全保障体系研究[J]. 中国中医药图书情报杂志,2019,43(002):1-4.

[3]陈桂菊. 面向数字式图书馆的海量文献数据查询优化方案分析[J]. 现代科学仪器,2019,000(005):166-168.

猜你喜欢

存储技术数字图书馆优化措施
关于云计算平台中存储技术的探讨
中国开创第三类存储技术
医院工资薪酬分配及优化对策
基于云计算的数字图书馆建设与服务模式研究
刍议数字图书馆计算机网络的安全技术及其防护策略
云数据安全存储技术分析