APP下载

大数据时代数字图书馆面临的机遇与挑战

2021-03-25靳婕

鄂州大学学报 2021年5期
关键词:数字图书馆文本

靳婕

(中国音乐学院图书馆,北京100101)

数字图书馆相比传统图书馆的优势在于数字图书馆拥有更丰富的馆藏资料,且以文本数据作为存储方式,能够满足用户数据检索并获取文本信息的需求。然而,大数据虽然给数字图书馆的发展带来了新的机遇,却也提出了新的挑战。数字图书馆需要直面大数据带来的挑战与机遇,充分发挥出大数据的积极影响,以大数据技术增强数字图书馆的信息服务能力,同时提升其服务层次,从而有效推动数字图书馆的转型发展,为知识型社会的建设提供助力。

一、大数据时代下数字图书馆的发展挑战

(一)大数据研发投入不足

将大数据技术应用于数字图书馆中,需要购置大量软硬件设施,同时要在大数据的管理、服务等方面大量投入资源,才能够有效发挥出大数据对数字图书馆的积极影响。然而,图书馆并非盈利机构而是服务性机构,其公益性特点决定了不可能以市场经营作为资金的主要来源,而是要依赖当地政府的拨款,这就导致图书馆的可用资金有限,难以筹集大量资金开展大数据的研发和建设工作。图书馆的资金一方面用于员工工资,另一方面则用于书籍订购、整理归档等文献采访工作,能够用于购置大数据相关的软硬件设施的资金较少。作为一种社科类研究项目,大数据研究的资金缺口大,加上数字图书馆对于大数据的应用尚未形成明确的标准,导致图书馆在数字化建设的初步阶段往往难以明确得出大数据所带来的积极影响,给提高政府拨款带来了一定困难。[1]

(二)专业化人才稀缺

当前我国数字图书馆在应用大数据时通常采用直接采购或与企业协同开发的方式,独立开发的大数据应用项目较少,其根本原因在于数字图书馆的大数据研发需要大量高素质人才的支持,但各行业普遍缺乏大数据高端人才,而数字图书馆与其他行业相比又缺乏足够的竞争力,加剧了数字图书馆人才稀缺的问题。此外,很多图书馆对大数据的发展趋势缺乏认知,不了解大数据的前沿发展动态,制约了其思维和视野的发展。在与企业合作进行大数据应用项目开发时,往往只是被动接受而没有根据自身需求进行应用项目建设,使得企业对大数据应用项目的开发参与力度不足,所开发出的应用项目通常难以完全满足数字图书馆的需求。

(三)大数据采集处理难度高

数字图书馆应用大数据的主要目的在于要利用大数据的海量信息存储和处理能力,增强图书馆对数字化文本资源的存储和检索水平。在大数据时代背景下,文本资源的数字化使得数字图书馆需要处理的资源愈发丰富和复杂,这些异构分布的资源对数字图书馆的数据采集、处理能力提出了新的要求。[2]然而,即便数字图书馆建设了完善的大数据软硬件设备,也会因工作人员数据处理能力或算法掌握能力等因素的影响,降低大数据采集处理的有效性。与此同时,在应用大数据进行数据的采集处理时,需要关注两点技术之外的问题。其一是数字图书馆需要与出版社等合作机构进行协商,建立起完善的合作机制,确保文本数据资源的完整、有效;其二是要建立起用户隐私保护和书籍的版权保护体系,确保数字图书馆的大数据建设不会引发法律纠纷。

二、大数据时代下数字图书馆的发展机遇

(一)大数据有助于提升资源建设水平

大数据的发展使数字图书馆的进一步建设成为了可能,尤其是如云计算等技术的兴起,为数字图书馆服务能力的提升提供了重要的推动作用。在大数据时代下,文本的数字化使得数字化资源愈发呈现出海量、异构的特点,这些多元化的信息资源为数字图书馆提出新的要求,需要数字图书馆积极提升信息处理能力。而大数据技术所具备的信息存储、分析和处理能力,能够有效分析出信息数据之间存在的联系,通过掌握规律来将问题定量化处理,能够有效提升数字图书馆的馆藏建设水平。如语义技术能够通过分析数据间的语义关系,利用文本间的语义关系提升用户获取知识的能力;数据聚类技术能够将具有某一属性或特征的数据进行聚拢,便于用户的资源检索;信息分析技术能够通过对文本信息的分析,为用户提供直观的数据分析结果;检索技术则能够通过海量文本信息的检索,在极短时间内找出用户所需的文本资源。利用大数据能够对传统的图书馆馆藏模式带来颠覆性的革新,有效提升数字图书馆的服务能力。

(二)大数据有助于增强信息服务能力

应用大数据的信息处理能力,能够在存储海量文本资源的同时,在极短时间内对海量信息资源的检索,完成人力所无法完成的工作。将大数据应用于数字图书馆建设的各个环节,能够通过确保海量文本资源直接为用户所用,实现与用户的无缝对接。同时,数字图书馆可以通过大数据分析建立检测分析系统,预测目标用户群的需求,从而提高对用户的信息服务能力。[3]在大数据环境下,数字图书馆可以开展如下几种产品或服务模式:其一,服务产品。数字图书馆能够借助大数据存储海量资源,为增强自身核心竞争力,需要提供丰富的服务产品,除了文献和信息的检索阅读外,应提供智库等再生信息服务和知识科普等文化宣传服务;其二,分析产品。大数据时代往往更加缺乏解决问题的知识和信息处理的能力。数字图书馆可以通过大数据分析用户行为,通过整理用户所关注的领域和话题进行需求预测,并结合预测结果推送文本资源,增强数字图书馆馆藏资源的利用率;其三,服务模式。数字图书馆本应采取用户自助式的服务模式,但在大数据环境下,用户面临着海量文献资源往往很难找到真正想要的信息,这就需要数字图书馆将自助式服务转变为主动推荐式服务,根据对用户需求的预测结果主动推荐文本,或根据时事热点新闻进行重点推荐,增强数字图书馆的资源推荐水平。同时,数字图书馆应开办咨询服务,采取系统自动应答、人工应答和专家应答三种方式,使数字图书馆能够真正为用户学习、工作、生活所用,充分发挥图书馆的社会教化功能。

(三)大数据有助于推动图书馆转型升级

在云计算、人工智能等技术的发展进程中,大数据已经呈现出了全新的技术生态,信息的存储、处理、分析能力显著上升,对各领域的转型发展起到了重要的推动作用。如语音识别、文本分析等技术的发展,使得数字图书馆得以有效利用各种先进技术,调整现有的服务业态。我国数字图书馆以满足用户知识需求为主要目标,通过大数据实现了文本资源的广泛传播,且作用于经济、文化等领域,使数字图书馆更大程度上发挥了公益服务和社会教化功能。在大数据环境下,图书馆需要构建新的管理模式以实现用户与文本资源之间的直接对接,在扩大文本资源的传播范围同时,增强文本资源的知识服务能力,有效推动图书馆的突破性发展。因此,在大数据时代,图书馆应从以下几个方面实现转型升级:其一是打破资源框架。大数据时代,无论是数字图书馆存储的文本资源,还是用户所需求的信息资源都呈现出多元化的发展趋势,对数字图书馆的资源采集、分析、管理和服务能力提出了新的要求。数字图书馆必须利用大数据技术建立数据框架,将文本和图像信息纳入到馆藏之中,通过分析信息之间的语义关系建立信息组织框架,从而突破传统图书馆的资源框架;其二是形成全方位的服务理念。数字图书馆应结合大数据技术拓宽自身的服务范围,一方面要将受众面向全社会,充分发挥图书馆的社会教化功能,为学习型社会的建设提供助力。[4]另一方面则要提供全资源服务,为用户提供包括文献图像、视频音频、政策法规等多种形式的信息资源,以满足用户的多元需求。此外,数字图书馆需要调整自身的服务模式,通过信息推送、个性化服务等方式增强信息资源的辐射能力,全面开展数字图书馆业务;其三是发展高端业务。数字图书馆应以智库作为建设目标,与各学科的前沿领域相结合,发挥其信息分析的能力为各学科的科研工作提供资源支持;其四是调整馆员角色定位,数字图书馆馆员应对大数据有深刻理解,具有一定的数据分析能力,懂得大数据的应用方法,利用各类软件工具进行馆藏资源的分析整理工作,并加强文献数据库的建设,以发挥出大数据对数字图书馆的积极影响。

数字图书馆建设中应用大数据技术,需要建立大量高新的软硬件设备,不仅要求数字图书馆加大资金投入力度,还对馆员的专业能力提出了新的要求。与此同时,大数据的信息采集和处理本身难度较高,且涉及到如出版社、合作企业等机构,需要数字图书馆对文本资源的采集处理、知识产权等有更高的重视。大数据技术虽然会为数字图书馆带来诸多挑战,但同时也带来了新的发展机遇。在大数据时代,数字图书馆需要充分利用各类数字资源提升自身的资源建设水平,为更多用户提供更为丰富的信息支持,同时大数据能够提升数字图书馆的信息服务能力,使其开发新的产品或服务模式。此外,大数据能够有效推动图书馆的转型升级,使数字图书馆发展更多高端业务成为可能。

猜你喜欢

数字图书馆文本
在808DA上文本显示的改善
基于doc2vec和TF-IDF的相似文本识别
图书馆
答数字
数字看G20
文本之中·文本之外·文本之上——童话故事《坐井观天》的教学隐喻
去图书馆
成双成对
如何快速走进文本
数字变变变