APP下载

浅析大数据对图书馆资源建设的影响

2016-11-26甘肃农业职业技术学院樊惠民

办公室业务 2016年17期
关键词:结构化图书馆数字

文/甘肃农业职业技术学院 樊惠民

浅析大数据对图书馆资源建设的影响

文/甘肃农业职业技术学院 樊惠民

大数据是21世纪的又一信息化产物,伴随着互联网和个人终端的使用,数据的采集、分析和使用成了又一焦点话题。图书馆作为知识和信息的载体自古都是以藏书为主,自有文献记载以来,藏书的种类、数量一直都是衡量一所图书馆规模的标杆。在当前信息化时代下,以向用户提供特定的数据服务为目的的高效可用的资源体系构建也受到了大数据带来的巨大影响。相比较传统图书馆,大数据的兴起使得图书馆数字资源建设正面临着巨大的影响和挑战,不仅带来了数据类型的丰富,还为图书馆未来资源的管理,服务的构建等提供了导向性的意见。本文通过对图书馆资源建设目标和大数据特征的阐述,归纳出在信息时代大数据对图书馆建设的影响,特别是图书馆资源建设过程中信息资源种类增多,产生大量半结构化和非结构化的数据。进而从三方面分析了伴随数据结构的改变,图书馆资源建设所受到的影响。

大数据;图书馆;资源建设

一、引言

图书馆自古都是以藏书为主,自有文献记载以来,藏书的种类、数量一直都是衡量一所图书馆规模的标杆。新中国成立后,藏书建设的概念逐渐丰富与完善,藏书建设到新中国成立后七十年代逐渐形成了一个相对完整的体系,表现为各地区和学校相继建立了具备藏书、查询、借阅等功能的图书馆。随着社会和经济的发展,国内图书馆之间的各种交流合作增加,原有的藏书服务体系已无法满足用户需求,因此在20世纪80年代提出了文献资源建设的概念。伴随着智能终端和计算机网络的普及发展,数字化虚拟图书馆的概念应运而生,到了20世纪90年代中期,文献资源建设体系的弊病逐渐显露出来,与此同时信息资源建设的概念开始蓬勃发展。

图书馆资源建设的目标是以向用户提供特定的数据服务为目的的高效可用的资源体系构建。我国的图书馆资源建设现已发展了几十年,在文献资源建设和关系型数据库资源建设方面取得了一定的成绩,主要集中在大型的综合数据库和部分自建的特色数据库中。伴随着全球大数据呈现爆发式增长,大数据已经渗透到各个行业和业务职能领域。在当前图书馆数字资源的建设过程中,急剧增长的资源建设和多元化的信息服务建设引起图书馆的思考与探究。而大数据时代的来临,使得图书馆数字资源建设面临巨大的影响和挑战。

二、大数据简介

“大数据”的产生学术界普遍认为是继云计算、物联网之后IT产业的又一次技术革新,会对人类探索和认识世界的思维方式带来巨大的改变。同时“大数据”也是一个用来描述海量的结构化和非结构化数据的短语。有着广泛的分布,包括业务流程的数据、企业产生的大数据、社会发展的大数据、个人生活的大数据、科学大数据等。利用大数据,不仅可以在产生、收集和传递信息方面精简人力,提升工作效率,而且在信息分析和推理上形成重大的意义,还可以根据数据的产生趋势进行正确、有效、有依据的判断和决定。通过合理的使用大数据,可以为决策和个人生活带来巨大的便利。大数据的产生也与以互联网技术为标志的信息技术密切相关,其具体的形成过程涉及数据挖掘、海量存储、数据分析等。虽然业界一直没有对大数据进行准确的定义,但对大数据的特征可以进行如下的总结:

(一)数据量大。随着互联网和移动终端等的不断发展,人们的个人信息、网络社交等各种类型的数据呈爆炸式增长,形成了信息量庞大、内容不断更新变化的大数据。对图书馆而言,伴随着信息资源的电子化、用户访问和需求数据等的快速增加,数据量日渐庞大成了必然。

(二)数据类型多。数据的类型主要指数据结构。随着移动互联网的快速普及,移动智能终端和通信工具的发展,传感器技术的渗透,数据的结构从以前的单一结构化慢慢增加为半结构化和非结构化的形态。

(三)数据流动快。数据的流动包括数据的创建速度和数据的处理速度。大数据的一个重要特点就是实时性,实时性是指数据的创建速度和处理速度都非常快。所有用户通过智能终端产生的数据都具有流动快的特点,也都属于实时数据,因此称之为流式数据。而这类数据需要进行及时的采集和处理,这是传统的数据服务系统无法满足的。

(四)数据价值密度低。数据价值是进行大数据分析和挖掘的目标和意义。数据的价值与飞速增长的数据量没有绝对的正比关系,相反伴随着数据量的快速增加,数据所具有的价值没有太大增幅数据的价值密度就会降低,因此增加了获取数据中有价值信息的难度。

三、大数据对图书馆资源建设发展趋势的影响

随着大数据的应用向各行各业进行渗透,传统的数据管理模式也将面临重大的革新,特别是在数据的来源、存储、组织、分析和价值利用等方面都将进行革新,而图书馆作为知识和文化的传播桥梁也会受到影响。这些影响可分为数据类型和图书馆资源建设两方面。

在数据类型方面,传统图书馆数据以纸质类的图书和报刊为主,近些年依托网络和数字化建设,电子书资源和数据库资源逐渐在丰富,许多纸质书籍报刊也都转换为数字资源,甚至许多音频和视频资源也都进行了整理,而这些数据资源都属于结构化的数据。随着互联网的发展,图书馆的数据类型也发生了改变,主要有以下三种数据:

1.基于社交平台的半结构化和非结构化数据。在社交网络逐渐成为生活中不可缺少的一部分时,借助大数据分析技术可以对社交网络中产生的半结构化和非结构化数据进行收集,分析出当前大部分读者的爱好和阅读习惯。为后续图书馆资源建设和服务开展提供导向性意见。

2.由读者产生的非结构化数据。根据读者的各种检索、查询、借阅等信息综合产生的读者阅读信息,与读者所拥有的用户信息、地理位置信息、浏览器信息等数据结合,再配合图书馆所固有的各种电子资源,成了图书馆的大数据。通过对这些进行收集、整理形成完整的图书馆大数据。

3.政府及相关机构发布的即时信息。这类即时信息的特征是实时性强,主要集中于社会关注的热点和各行业的指导信息,大多属于板结构化和非结构化的。图书馆通过对这类信息进行处理和分析,一方面挖掘这些数据的价值,另一方面可以为读者提供各类即时服务,使读者获取更专业的知识和信息。

数据类型的改变也为图书馆资源建设带来了诸多影响,可以归结为以下几点:

1.核心资源的转移。目前图书馆的核心资源依然是经过长时间数字化形成的各种传统关系型数据库,但是随着大数据分析处理技术的发展,数据背后的隐藏价值被发掘和利用,原有的传统关系型数据库其将发生重大变化,普通读者用户通过各类应用在互联网上产生的社交网络数据将取而代之。读者在使用图书馆数字资源时产生的访问数据,政府、新闻媒体及其他社会机构发布的即时信息等将成为大数据背景下图书馆的核心资源。

2.依托大数据进行服务质量的优化。图书馆行业的竞争本质上不局限于馆藏信息资源的规模,还包括对大数据信息的挖掘、处理和分析,进行更符合读者需求的数字资源建设以保持图书馆在传播知识和信息领域的核心竞争力。通过大数据的分析还可以对图书馆未来发展提供支持,进行服务质量的优化和升级。

3.数据结构类型更加复杂。传统图书馆的数据以处理关系型数据库的数据为主,属于结构化数据,而面对类型为半结构和非结构的数据时就无从下手。针对半结构和非结构数据进行分析、处理和挖掘,获取这些数据可以为图书馆数字资源建设创造许多有价值的信息。

四、大数据建设对图书馆资源建设的意义

从上文论述可知,在大数据时代,随着数据来源、数据类型等的改变,图书馆资源建设也面临重大变革,主要表现在以下几方面:

(一)扩大图书馆数字资源范畴。保留图书馆纸质图书、期刊、报纸等资源的同时,一方面将传统资源数字化,并且将一些政府信息、社会关注热点、信息访问量大的热点包括其中,更要将用户通过图书馆终端搜索、查询、下载等的行为信息作为资源进行采集。另一方面,要增加对数据资源的关联和挖掘分析,以形成各类由于的信息,真正扩大数字资源的范畴。

(二)加强图书馆数字资源加工深度。数字资源的组织加工时对数字资源的整序,是资源的一种知识展现形式。对于数字信息,结构化的信息所具有的表现形式基本上限制在资源库内部。在大数据环境下,需要将图书馆数字资源建立语义关联,形成面向社会资源的图书馆数字资源组织架构。同时,应将信息通过知识解构和知识建构的方式进行深加工。不仅充分发挥数据发掘、软件分析工具的作用,更要特别提升图书情报领域涉及的主题词表、分类词表等的应用和共享能力。

(三)促进图书馆用户行为信息组织。用户的行为信息是互联网环境中图书馆所获得的新的非文献资源。用户行为信息可以作为图书馆知识服务与推荐的宝贵资源,通过进行行为信息的深度挖掘和有效组织,能够做的将用户行为与文献资源、目标资源以及其他资源进行关联,为知识服务个性化提供参考依据。

(四)提升图书馆网络设施建设。由于大数据处理需要较强的数据采集和存储能力,较高的计算能力,因此对图书馆的IT构架提出更高的要求。同时随着数据量的不断增加,数据的类型越来越多,图书馆支持复杂数据组织和管理的硬件基础设施提出了更高的要求。

(五)促进图书馆服务的变革。通过挖掘元数据仓储使得网络计量学和文献计量学的某些统计以及评价方法可以扩展,发展成为便民服务;通过对数据信息的挖掘和分析,创建图书馆服务的新模式;对实时数据进行分析和决策,发挥图书馆的智慧导向功能。

五、总结

图书馆作为知识传播和推广的平台,其资源的建设和有效的利用非常的重要。在大数据快速发展的今天,利用大数据理论和技术对图书馆资源库的建设进行扩展,不仅可以帮助图书馆建设更为丰富完整的资源体系,更可以为读者提供更加优质的服务,进一步促进知识和文化的交流。

[1]张兴旺.图书馆大数据体系构建的学术环境和战略思考[J].情报资料工作,2013(2):12-17.

[2]刘明,李娜.大数据趋势与专业图书馆[J].中华医学图书情报杂志,2013,22(2):1-6.

[3]杨海燕.大数据时代的图书馆服务浅析[J].图书与情报,2012(4):120-122.

[4]韩翠峰.大数据时代图书馆的服务创新与发展[J].图书馆,2013(1):121-122.

[5]王捷.大数据时代下图书馆开展信息服务的对策[J].现代情报,2013,33(3):81-83.

[6]苏新宁.大数据时代数字图书馆面临的机遇和挑战[J].中国图书馆学报,2015(11):4-12.

猜你喜欢

结构化图书馆数字
借助问题情境,让结构化教学真实发生
改进的非结构化对等网络动态搜索算法
深度学习的单元结构化教学实践与思考
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
图书馆
答数字
数字看G20
去图书馆
成双成对
数字变变变