APP下载

数字图书馆建设中大数据问题初探

2017-02-04刘冬

中文信息 2016年9期
关键词:数字化图书馆应对对策大数据

刘冬

摘 要: 在大数据时代,网络资源的变化速度不断加快,这就给数字图书馆的建设带来了巨大的挑战。本文主要结合实际情况,就大数据的特征和大数据时代数字化图书馆建设需求进行了分析,最后分析了数字化图书馆应对大数据的对策,希望通过本次研究对同行有所助益。

关键词: 数字化图书馆 大数据 应对对策

中图分类号:G250.76 文献标识码:A 文章编号:1003-9082(2016)09-0067-01

进入新世纪以来,我们日常生产生活中各种文献信息呈现爆炸式增长,随着互联网技术、物联网技术的应用和发展,大数据概念被提出。数字化图书馆在建设过程中受到大数据方方面面的影响,面对日益膨胀的复杂化数据信息,给数字图书馆的技术人员带来了巨大的工作压力。因此,做好数字图书馆建设过程中的的大数据问题研究工作就显得十分重要了。

一、图书馆大数据的特征分析

1.数据总量呈现爆炸式增长

对于数字化图书馆来说。每天要面对大量复杂的数据信息,数据总体的储存量不断增加,已经从KB向着TB储存转变,面对这种情况,数字化图书馆不得不建设更大的数据中心,随着数据量不断增加,给数字化图书馆带来了巨大的储存压力,面对这种问题图书馆又缺少必要的办公经费,加大了图书馆数据储存的压力。

2.数据种类复杂多样

随着数字化图书馆建设进程进一步加大,很多图书馆都建立了具有本馆特色的数字化图书馆,从而构成了一个十分复杂数字化图书馆文献资源体系。在数字化图书馆中既包括了中结构化数据和半结构化数据,又包括了非结构化数据,数据种类复杂多样,给图书馆数据处理带来了较大的压力。

二、大数据时代背景下图书馆需求分析

1.数字资源的管理需求

在大数据时代背景下,数字化图书馆需要对自身的数字资源进行创新管理。在数据采集、回收、整理和分类管理过程中都要实现创新发展。在大数据背景下,虽然很多数据信息都是一种有价值的信息资源,但是这些数据信息都是杂乱无序的,这种信息并不能被直接使用,需要经过处理后才能算作知识。数字图书馆和一般的图书馆一样同样具备传播知识的职责,在向读者用户提供各种知识之前,需要对数据信息和资源进行重新整合,然后才能提供给读者用户使用。这就要求数字化图书馆在对数据进行管理过程中要贯穿于图书馆数据传输的始终,从数据选择到数据使用整个过程进行全面的管理创新。

2.数字化图书馆服务质量的需求

将大数据技术和数字化图书馆建设进行高效融合,可以显著提升数字化图书馆的服务水平和服务质量。在数字化图书馆建设过程中,能够对读者用户的各种数据信息进行深度分析、挖掘,保证图书馆更加了解读者用户的阅读需求,从而针对不同读者群体的信息需求制定针对性的推介服务。同时,在数字化图书馆建设过程中和大数据技术进行有效融合,还可以对图书馆的潜在读者群体的需求进行分析,为数字化图书馆准确从海量信息中选取有用的信息资源提供帮助,保证信息选取更加具有针对性和科学性。此外,将大数据技术和数字化图书馆建设进行有效结合,能够更好的转变图书馆的服务模式,由被动服务向着主动服务转变。

三、数字图书馆更好应对大数据的发展对策分析

1.加大数据储存建设

支撑大数据技术应用的核心环节是储存系统,信息分析和信息挖掘主要是通过储存系统将相应的信息传输到服务器上进行分析计算,整个传输和分析过程会在储存系统和应用服务器之间多次实现往返。随着科学技术不断发展,储存系统不断发生变化,储存容量不断增加,整个系统传输效率和计算能力大大得到提升。现阶段数字化图书馆采用数据储存技术主要包含了直接外挂数据储存技术、网络附储存技术和储存于网络等三种储存方式。其中第三种储存技术相对于其他两种储存技术来说传输效率额更快,拥有更高的资源拥有率,但是在大数据背景下,这种储存技术利用效率还比较低,并且应用这项技术需要投入较高的成本,因此,在未来储存系统建设过程中,需要我们更好的融入大数据技术,提高系统储存容量,加大信息的传输效率。

2.建设数据网挖掘平台

云计算是最近几年比较新兴的一项技术领域,其是解决数字图书馆大数据问题的有效武器。云计算分为了基础设施服务、平台服务和软件服务,现阶段在世界范围内还没有一个统一的技术框架体系,但是其有五个统一的特征即宽带网络访问、资源池化、快速弹性、可评测的服务和按需分配的自助化服务等几个方面。大数据技术应用过程中,主要是应用了数据储存技术、数据挖掘技术和数据分析技术,而应用云计算能够对系统中海量数据进行有效的计算分析和挖掘。云计算是基于分布式计算和并行式计算,因此其计算能力和分析能力较传统的计算方式有着更大优势,能够完成大量非结构数据的挖掘和分析。建设过程中主要涉及到物理资源层、资源池层、管理中间间层和SOA构架层。

3.数据分析

在图书馆中应用大数据技术更加容易,因为在数字化图书馆中存在大量结构化数据,非结构化数据较少。在数字化图书馆建设过程中,数据库是十分重要的一个环节,也是应用价值最大的一个环节,所以数据库除了具备储存能力之外还要具备数据分析的能力。在数字化图书馆中结构化查询语言是高层次的,能够被多次使用,能够适应各种数据路结构类型,但结构化查询语言有时候处理问题比较繁琐,查询率比较低,针对这种情况可以采用高效性和高扩展性以及高容错率的HADOOP工具进行分析,这对于建设资金不足的数字图书馆来说十分有利。

结语

总之,在大数据时代,数字化图书馆必须紧跟时代发展进程,转换发展思路,在进行数字化图书馆建设过程中,需要充分利用好大数据技术,不断拓展数字化图书馆文献资源建设的途径和范围,对网络上各种信息资源进行搜集、整理、分类和编目,同时还要强化数据挖掘技术的应用,提高数字图书馆服务质量。

参考文献

[1]瑙明格日乐.高校图书馆蒙古文文献资源建设与特色服务——以内蒙古农业大学图书馆为例[J]. 内蒙古农业大学学报(社会科学版). 2015(05)

[2]罗懿菡.信息时代下数字图书馆的资源及其开发策略[J]. 湖南工程学院学报(社会科学版). 2016(02)

[3]王培丽.试论数字图书馆内涵及我国数字图书馆建设[J]. 内蒙古民族大学学报. 2005(01)

[4]钱兴彦,胡振渝.IPTV技术在数字图书馆阅读推广服务中的可行性分析[J].曲靖师范学院学报. 2016(03)

[5]霍瑞娟.公共文化服务体系构建中的数字图书馆新媒体服务平台应用与创新[J]. 图书馆理论与实践. 2016(06)

[6]郑林生.贵阳市图书馆数字图书馆增添新数据万方数据知识服务平台成该馆新成员[J]. 贵图学苑. 2016(02)

猜你喜欢

数字化图书馆应对对策大数据
从2016年全国Ⅰ高考书面表达看应用文写作特点
中学体育教学师生关系障碍及对策
数字化网络化环境下图书馆读者服务模式研究