大数据视角下图书馆数据服务
2022-06-29罗佩玲
罗佩玲
摘 要:图书馆数据服务工作具有重要的意义,随着大数据技术的发展,图书馆数据服务工作出现了许多变化,面对这些变化,图书馆工作人员需要思索图书馆数据服务工作创新发展的路径。以大数据为切入口,首先界定大数据和图书馆数据服务的概念,然后分析图书馆数据服务的意义以及大数据对图书馆数据服务的影响,最后重点分析在大数据环境下图书馆数据服务创新发展的路径。
关键词:大数据;图书馆;数据服务
中图分类号:G258.7 文献标志码:A 文章编号:1673-291X(2022)16-0127-03
在大数据时代,数据规模是海量的,数据量呈现出指数级的增长速度。数据作为一种生产要素,它的价值得到了社会的广泛关注,于图书馆而言,同样如此。图书馆数据服务工作为各行各业的发展提供了充分的数据支持,开展好图书馆数据服务工作具有重要的意义。但是在大数据技术环境下,图书馆数据服务工作面临着许多新情况。在这种背景下,如何更好地开展数据服务工作,是图书馆管理人员需要认真思考的议题。
一、相关概念界定
(一)关于大数据的认识
大数据是一种数据集合,数据规模是海量的,数据流转是飞速的,数据类型是多样化的,数据价值密度是低的。大数据具有海量的数据规模,传统的数据库处理软件很难处理,在进行数据获取、数据存储、数据管理、数据分析时面临着许多困难[1]。大数据的特点鲜明,主要表现在三个方面。首先,大数据的数据量是巨大的。数据量巨大是大数据最显著的特征,在信息技术快速发展的背景下,各行各业的活动轨迹都以数据的形式呈现出来,数据量以指数级的速度增加,数据量巨大。其次,大数据的种类是多样的。在物联网快速发展的背景下,各行业对数据的需求量越来越大,数据的种类也越来越多。最后,大数据的价值密度比较低。大数据的价值密度是低的,这与大数据的表征方式有关。
(二)关于图书馆数据服务的认识
图书馆数据服务是在遵循数据全生命周期管理原则的基础上进行的数据服务,数据资源是主要的管理对象,在统一的图书馆数据管理平台上,对图书数据进行整理、归集、挖掘和分析,在进行全生命周期处理后,把数据传递给需求者[2]。在这一流程中,大数据平台发挥着统摄作用。图书馆数据服务与传统的图书馆管理工作存在差异,具体来看,传统的图书馆管理工作更多是在信息服务这一范畴下进行的,而图书馆数据服务归属于数据服务这一范畴。图书馆信息服务是服务于用户的共性需求,提供的内容具有一般性和概括性。而图书馆数据服务对提供内容的要求更具体,采用全息数据来描述事物,主要表现在数据服务粒度更细、精度更高、速度更快等。
二、图书馆数据服务的意义
图书馆是各类数据的重要存放地,图书馆数据服务工作给社会上各类组织机构提供了便捷的查询通道,具有重要的意义。图书馆数据服务的重要意义主要表现在三个方面,分别是聚合各类数据资源、为各类组织提供决策依据、为科学研究提供支持。
(一)聚合各类数据资源
图书馆数据服务是社会上各类组织都需要的,使用途径是多样的,比较常见的使用目的有科研、经营管理、政策制定等。以科研活動为例来看,更需要健全的图书馆数据服务。科研活动的主要场所是高校,做好高校图书馆数据服务工作就具有了现实的紧迫性[3]。高校的科研、管理活动会产生各类数据,这些数据具有很高的价值,但是处于零散的状态。需要进行聚合管理,让这些数据的价值充分发挥出来。对高校内的各类数据资源进行聚合,可以减少对数据资源的重复性整理,同时也可以促进数据资源在高校各个组织部门间流动。
(二)为各类组织提供决策依据
社会上各类组织在制定重大决策时,都要进行多方调研,尽可能保证数据政策具有合理性,大量查看相关数据就具有了现实的必要性。图书馆数据是各类组织制定决策时主要的参考依据。图书馆中保存的数据分类存放,按照对应的序列进行查看,花费的成本很低。借助于图书馆数据资源库,各类组织可以获得必要的决策依据。
(三)为科学研究提供支持
科研活动对数据的需求量非常大,科研人员在进行科研活动时,需要大量查阅研究领域的数据,关注世界范围内同行的研究进度。图书馆是获取这些数据的重要途径,通过提供优质的图书馆数据服务,可以为科学研究活动提供大量支持。整理数据在科研活动中花费的时间占据了整个科研流程的很大比重。图书馆中的数据按照特定的规则进行存放,查找方便,帮助科研工作者省去了很多的查找时间。
三、大数据对图书馆数据服务的影响
(一)对业务功能的影响
在大数据时代,图书馆的业务范围不断拓展,数据资料的类型不断增多。图书馆工作人员在开展业务时,同步变革了业务活动,对大数据时代的业务需求做出了回应,回应的内容主要为两个方面,分别是读者和图书馆工作人员。
就读者方面而言,图书馆工作人员会积极收集、整理与读者相关的数据,建立大数据管理系统,整理读者阅读过的各种介质的数据,包括书籍、报纸、刊物、音频、视频等。同时也会对数据资源库中的数据资源进行组合,尝试建立大数据资源整合中心,借助大数据管理系统,分析读者的阅读行为,做好日志记录。图书馆工作人员还会对读者在图书馆中的活动轨迹进行场景分析,场景分析内容包括阅读位置、进馆时间、数据搜索偏好、历史搜索行为、书籍借阅记录等。就图书馆工作人员方面而言,图书馆工作人员会对自身的工作表现进行总结,分析工作中的得与失。具体来看,图书馆工作人员会对自身提供数据服务的时间、服务的内容、工作效率等进行数据归集,对这些数据进行半结构化和非结构化分类,然后对这些数据进行全生命周期管理,通过数据分析来提高工作效率,进而提升业务服务质量。
在大数据时代,图书馆的业务功能面临着新的环境,充满了机遇和挑战,图书馆工作人员要通过大数据分析,找出读者的数据使用规律,同时还要对自身的数据服务工作展开反思和分析,让业务功能更加全面和高效,这些做法正是大数据时代对图书馆业务功能召唤的回应。
(二)对技术体系的影响
在大数据时代,图书馆的技术体系出现了变化。图书馆使用比较多的管理系统是Libsys、ILAS、SULCMIS等,使用比较多的数据库服务平台是Oracle、Sybase,以关系型数据库作为后台支撑,使用web2.0技术来提供个性化服务。随着大数据技术的发展,原有的图书馆技术支撑体系遭到了颠覆,在数据管理系统中比较热门的是RFID,以及其他先进的个性化服务技术等。通过采用先进的数据库管理技术,图书馆数据服务将迈入web3.0时代,图书馆数据分析工作也将朝着语义分析的方向发展。
在大数据时代,物联网技术和数据库技术发展较快,为图书馆的数据技术革新提供了充足的动力,传统的关系型数据库不再是主流选择。目前主流的图书数据管理系统有Hadoop、BigData、NoSQL等。NoSQL采用多节点分布的方式,运用MapReduce处理方法来处理海量数据,采用Hadoop平台来管理图书馆日常数据运营。MapReduce通过“Map”(映射)和“Reduce”(化简),将图书馆管理程序运行在Hadoop平台上,实现图书馆数据服务系统的高效运转。在大数据时代,语意技术和web3.0技术也逐渐成为了图书数据管理系统使用的主流技术,这些技术是在现有结构化和非结构化数据库的基础上形成的语义叠加层,通过使用这些先进的技术,可以汇聚散落在各个地方的数据。图书馆数据服务涉及到了许多非结构化数据,非结构化数据具有复杂性,在运行过程中也存在不规则性,促使新的数据处理技术不断出现,图书馆技术体系在数据技术革新的过程中不断更新。
(三)对工作人员的影响
在信息技术的推动下,图书馆管理活动实现了从手工管理到系统自动化操作的转变,图书馆工作人员也在这一背景下,开始学习图书管理系统的操作技能,图书管理理念也发生了转变。在大数据技术的推动下,图书馆管理活动将迎来第二次转变,图书馆工作人员也将再次变革自己的工作方式。图书馆管理活动的第二次转变是在大数据技术的推动下进行的,图书馆管理活动将呈现出智慧化的特点。
面对大数据技术对图书馆管理活动的冲击,图书管理人员应积极增加自己的知识储备,加强自身工作技能。具体来看,图书管理人员不仅需要掌握图书情报方面的基础知识,而且还需要学习新型技术手段;要围绕非结构化数据来探索可行的业务再造流程,善于使用大数据分析工具来分析图书管理数据;开发智能化的数据分析平台,打造出能够促进知识加工和知识服务发展的数据支撑体系。为应对大数据技术对图书馆数据服务工作的影响,图书馆工作人员应主动学习数据分析技术,要善于在那些零散的无关联的数据中挖掘出读者感兴趣的数据,并且及时把这些数据推送给读者,实现图书馆数据服务价值的最大化。图书馆数据采编人员需要对读者的历史浏览数据进行分析,评测图书馆现存数据的质量,评估读者对各类数据需求量的紧迫程度,然后制订相应的数据采购计划。这些做法正是在大数据时代,图书管理人员需要注意的。
四、图书馆数据服务创新发展的路径
(一)重點分析读者的信息和日志
用户在浏览图书数据时,会留下相应的个人信息,包括浏览时长、类型、借阅频率等。分析好这些数据,可以对读者做出更好的用户画像,从而制定出个性化的数据服务策略,提升读者对数据服务的满意度。另外,对读者的相关行为数据进行分析,可以找出数据之间的关联,从而调整数据的购买计划,及时购进和整合读者关注较多的数据。在图书馆的日常经营管理活动中,存在着许多碎片化的数据,图书馆工作人员需要对这些数据进行归集整理,挖掘出这些数据蕴含的价值[4]。读者的兴趣爱好存在偏差,关注的图书数据也存在差异。图书馆工作人员需要通过大数据分析技术,制定分众化的数据服务策略,既要在二八法则的指导下,关注主要读者群体的数据使用偏好,又要参考长尾理论的框架,关注小众群体的数据使用偏好,提供个性化的数据推送策略,从而提供贴切的图书馆数据服务。
图书馆管理和超市经营存在许多相似之处,读者查阅数据的行为和在超市购买商品的行为有许多相似之处,图书馆工作人员需要整理好与读者数据查阅行为相关的日志,并且重点分析这些日志。借助读者日志来分析不同读者群体间存在的差异,结合相关的关联规则、聚类方法和时间序列等,构建出数据资源需求意愿分析模型,预测读者数据需求的变化趋势。
(二)做好图书馆的数据分析和共享工作
大数据时代,图书馆工作人员需要重点做好数据分析和共享工作。在大数据技术推动下,图书馆的传统业务开始向数据分析和共享方向转变。图书馆资源数量较多,种类多样,包括纸质资源、光盘资源、数据库资源等。这些数据资源蕴含着巨大的价值,但是缺乏整理,需要做好充分的分析,只有进行充分的分析,才能够挖掘出巨大的价值。目前很多图书馆都在进行数字化改革,图书馆内部的文献基本实现了数字化,相关的图书资料也可以通过网络途径进行查阅。读者在查阅这些数字化资料时,会留下对应的历史浏览数据,通过对读者的历史浏览数据进行大数据分析,可以分析出读者的阅读心理和数据需求。结合读者的数据需求,进而检索出有用的数据资源,以制定合适的数据服务方案。
每个图书馆的数据资源存储存在差异,具体表现在数据存储格式、存放类型、数据编码方式、数据特征等方面。这些差异使得图书馆的数据资源存放表现出分布式、异构化、多样化的特点。针对这些差异,图书馆工作人员需要做好馆际间的数据共享,满足不同地区读者的数据需求,让图书馆数据价值得到充分释放。各图书馆之间共享数据是大数据时代数据服务工作的必然选择,顺应了大数据时代的发展趋势,是图书馆数据服务工作的重要选择。
(三)推动图书馆数据服务工作的智能化发展
在大数据技术推动下,智能分析逐渐成为数据营销主要依赖的方法。图书馆工作人员需要借助大数据技术,围绕图书馆数据服务进行智能分析,建立强大的数据搜索引擎,为读者精准推送他们所需要的信息[5]。在大数据技术和语义分析技术的推动下,打造出智能化的图书馆,推动图书馆的智能化发展。
语义分析技术对数据价值发挥有重要意义,图书馆工作人员借助语义分析技术,可以盘活数据价值,让图书馆数据服务工作更高效,让读者获得更好的数据使用体验。在传统的图书馆数据搜索引擎中,搜索出的数据结果大多是无用的,借助语义分析技术,加入一些可以被计算机识别的语义信息,可以准确地搜索出读者真实需要的数据,降低读者的时间成本。借助于语义分析技术,图书馆数据服务工作将表现得更加智能化,读者查阅数据的行为将会更加便捷。在传统的图书馆数据服务工作中,读者如果想要获得某一类型的数据,他们会在多个平台中去检索,花费的时间较多。在大数据时代,通过语义网分析,使用推理、机械学习等智能技术,可以有效地判断读者的意图。屏蔽掉读者不感兴趣的数据,帮助读者更快地检索到他们真正感兴趣的数据。
结语
大数据对图书馆数据服务具有重要的影响,在大数据技术的推动下,图书馆的业务功能、技术体系、工作人员都出现了一定的变化。图书馆作为数据存储的重要场所,对社会发展有着重要的推动作用,各社会组织在作出重要决策前都会收集相关的数据作为参考,图书馆是获取数据的重要途径之一,所以做好图书馆建设具有重要意义。在大数据时代,图书馆数据服务工作需要与时俱进,主要的突破口是数据分析和智能化发展。本文基于大数据时代的发展特点,分析图书馆数据服务工作的意义及创新路径,为相关研究提供参考和借鉴。
参考文献:
[1] 唐彬.跨界搜寻、大数据能力对平台企业商业模式创新的影响研究[D].长春:吉林大学,2021.
[2] 蔚海燕,李旺.图书馆数据服务助力新文科建设之路径[J].图书与情报,2020,(6):77-83.
[3] 卢祖丹.我国高校图书馆数据素养服务供给实证评价研究[J].图书馆杂志,2020,(10):63-70.
[4] 陈雅,谭华军,郑建明.图书馆个性化服务中的Web日志分析技术研究[J].图书馆杂志,2011,(7):43-46+54.
[5] 王雅丽.图书馆智慧数据服务策略研究[J].图书馆学研究,2021,(15):77-82.