大数据技术在图书馆数据中的应用研究
2021-11-21郑艳
郑 艳
(武汉职业技术学院,湖北 武汉 430074)
0 引言
在互联网信息时代,现代网络科技的迅猛发展助力图书馆行业发生了巨大的变革,转变了传统图书馆的构成模式、阅读渠道,也随之改变了图书馆的管理与服务方式。尽管从大数据技术应用层面来看,现代图书馆在资源获取、图书内容、阅读服务等方面颠覆了人们对原有图书馆的认知,然而从社会地位性、认可度方面来看却不及传统图书馆时期。究其原因,主要还是信息化的便利性使得读者改变了传统的阅读方式,很多读者不再往返于图书馆耗时耗力获取资料,这也成为现代图书馆在转型期发展的阵痛,我国图书馆行业正面临着重大的机遇和挑战[1]。因此,如何在大数据时代,利用网络科技的力量获得成功转型、重新得到读者青睐,现已成为图书馆行业的重要使命。
1 大数据与图书馆
在大数据时代各行各业都与数据挂钩,“大数据”这个名词已经脍炙人口,如今社会企业、医疗机构、高等院校、金融领域等都在分析使用大数据。大数据技术让人们从数据系统中获取到更多有深度价值的信息资源,帮助人们及时做出重大决策,这也对大数据研究提供了重要依据。鉴于存储、分析大数据所需的软硬件成本较低而实用性很强,这也就使得越来越多的行业对大数据产生了兴趣,传统图书馆行业更要在逆境中求生存、化阻力为动力,利用大数据技术转变管理及服务模式。在现代图书馆管理中,大数据技术能够将图书馆数据转化为信息资源,为读者提供个性化服务。因此,当前大量的大数据研究都在分析图书馆大数据的应用问题,力求通过大数据技术优化图书馆工作效率及服务品质。在大数据背景下,现代图书馆数据库具备以下特点:
1.1 图书馆数据组织复杂
从图书馆表面管理来看,图书馆中的各类图书、杂志、刊物等数据组织井井有条,读者可以通过类别查询所需内容;然而针对存储的图书研究数据却不尽人意。通常大部分图书馆的数据较为混乱,数据研究者惯于使用自我认知来分类组织数据,这些数据通常经项目管理,而项目完成了数据也就受到封存。
1.2 无规范数据格式
数据研究者在组织数据时没有规范格式标准,尽管有些图书学科或领域已创建数据标准,然而大部分学科往往都缺少规范化,尤其是政治、社会研究这类集中的数据库。此外,数据格式也缺乏统一性,数据研究者惯于用自己的格式对数据进行收集,即便是同一个数据研究者,不同数据格式也会用于不同项目,这就给收集数据带来很大阻力[2]。
2 当前图书馆大数据存在的不足
图书馆数据库中所存储的数据庞大,鉴于图书多源异构的特征,这个大数据也不同于其他数据领域,因此在图书馆数据收集、处理、分析及转换等方面均存在一定问题。图书馆大数据要获得科学合理应用,其应用技术区别于其他领域,这也正是当前图书馆大数据存在的不足之处。
2.1 行业紧缺图书馆数据分析师
作为图书馆数据分析师,不但要掌握基本的计算机和统计学技术,同时必要具备图书馆管理领域知识和技能。当前,大部分图书馆之所以在大数据技术方面应用不足,主要是专业人员技术力量的不足,图书馆管理人员更需要加强大数据信息的管理培训,这是一个循序渐进的过程,绝非靠短期突击学习所能达成。
2.2 利用大数据的能力不足
在互联网信息时代,大数据的挖掘来源于行业各个领域,现在很多行业并未实质做好大数据的研究准备工作。据了解,社会半数以上的行业机构因缺少专业人才、应用平台而无法实现大数据的处理及应用。然而,图书馆行业的大数据研究起步甚至更晚,究其原因主要还是基于图书馆更像是一个独立的组织单位,自成一体与其他行业的关联性不强。
2.3 图书馆成本投入不足
尽管现在很多人都明白应用大数据分析的优势,但大数据研究还需要一些较大的成本投资,比如高性能的计算机服务系统、分析服务系统等。基于有些图书馆规模较小、成本预算不足,无法将大数据技术普及到图书馆实际管理中;同时专业人才成本较高,其所研究数据极少能受到充分重视也是问题之一。据了解,当前很多图书馆研究数据仍为多年前所产生的,显然资源数字化本非一项简单工作,还需要耗费大量的时间和精力。
2.4 具备技术挑战难度
大数据要实现使用功能,必须要经过数据收集、存储、处理、转换等环节,通过这些技术应用才能呈现真实的数据信息。图书馆数据库中的数据类型多且杂,其数据表象不同,一些数据没有数字化;同时大量数据中还包含了许多错误、无意义的数据,要排除这些无用数据则需要花费更多的数据处理时间。鉴于图书馆数据类型、格式的特异性,大数据研究者要将其实现集成必定是一项庞大且困难的工作,很多类型的数据看似具备可用性,实则在通过处理之后其可用性会明显降低;同时基于数据的可访问性,图书馆数据库发生系统入侵的风险问题也必须慎重考虑。
3 大数据技术在图书馆数据中的应用
3.1 实现图书推荐
众所周知,传统图书馆运营模式下,读者首先要确定自己需要哪本或哪个方面的书籍,随之通过图书馆查询系统搜索该书籍所在馆内具体位置实现借阅,或是自行浏览图书馆挑选感兴趣的书籍。但随着知识学科的进步发展,现在的图书资源越来越丰富,此种传统借阅方式将消耗读者大量的查找时间;同时由于书籍的多样性,读者的选择困难度更高,亟待通过技术行为帮助其解决找书问题,那么大数据技术的优势就显现出来了。图书馆通过借阅系统中的个人借阅信息,应用大数据技术分析其近期借阅书籍的喜好和关注点,继而以此为依据给读者推荐合适的书籍。如依据借阅信息判断读者喜欢的图书类别,通过借阅时长分析读者的喜好程度。图书馆管理人员将所有读者的借阅信息进行分类、量化、评估,再与其他馆内图书进行相似计算,就可以实现类似书籍的自动推荐,帮助读者获取到一些他们可能感兴趣但未能触及的书籍。
3.2 实现阅读推广
实现阅读推广是发挥图书馆服务的一项重要工作。图书馆除了优选推荐读物给受众者,还应通过书评为读者精确推广阅读内容。图书馆以引荐指导读者为目的创建书评资源库,可以邀请一些专业领域学者综合对馆内所有藏书进行多方位评价,将一些精品书、好书通过书评方式引荐给读者。图书馆还能通过大数据技术搜集网络书评,获取一些热门网上书店如当当网、天猫书城、文轩网等在线书评,包括图书购买问答区的评价信息,利用大数据处理技术对这些数据进行分类、整合再向读者进行推荐,从而为读者提供阅读决策意见,提高图书推荐的精准性。
3.3 实现决策支持
行为数据分析包括很多内容,有读者的图书查询检索记录、借还流通日志、下载资源地址等,这些行为数据经过分析可以反馈出读者群体的阅读需求、阅读时间、阅读趋向等。图书馆可以充分利用这些大数据为其管理决策做出有效支撑。例如,在采购图书时,可以通过大数据技术对图书借阅量进行数据分析,及时了解哪些图书资源匮乏,进行有针对性的补充;针对搜索次数多、预定借阅多、浏览简介多、续借次数多的书籍,我们都应该增加复本数量,以保证读者的借阅需求。据实践了解,借助大数据技术以读者意愿驱动采购,能够促进图书借阅率获得显著提高。尤其是在高校图书馆方面,鉴于教学的时间规律性特点,高校的图书馆往往会有图书借阅高峰期,那么借助读者借阅行为数据的分析,就能知悉不同时间段的图书借阅频率,更有利图书馆合理安排工作人数,并实现图书馆的高效管理和服务。
4 图书馆数据库系统的维护
鉴于图书馆数据库信息的庞大复杂性,加之互联网病毒侵袭、网络故障等问题均有可能导致图书馆数据库系统产生故障、系统崩溃。为提高图书馆数据库系统的安全性,尽量减少故障发生率、减小损失率,对数据库进行定期维护是图书馆管理工作中的一项必要任务。鉴于当前图书馆信息数据海量陡增,需要在传统图书馆管理工作思维的基础上,强化数据备份处理功能,在原有冷备份方式上采用网络备份新技术,进一步提高数据备份的效率,降低图书馆数据库的故障产生率。
5 结语
在大数据背景下,图书馆行业要顺应时代发展需求,充分利用大数据及时实现数字化图书馆的管理与服务,才能在新时代的大弄潮中占有一席之地。通过大数据技术的应用,改变传统图书馆模式、提高图书馆管理效率、提升知识服务层次、提供个性化服务需求,以此发挥出图书馆的最大最优功效。