APP下载

美国数字图书馆联盟资源协同共享的技术路径与启示

2023-06-17夏有军

图书馆界 2023年2期
关键词:检索成员网格

夏有军

(衢州市图书馆,浙江 衢州 324000)

随着信息技术的发展和网络应用的普及,网络成为读者获取信息的主要渠道。数字图书馆是互联网环境下可扩展的知识网络系统和信息服务组织,可以为读者提供信息和知识服务。因此,自1990年以来,数字图书馆发展一直受到许多国家的重视。然而,数字图书馆的信息孤岛劣势成为其发展的主要障碍,如何实现数字图书馆信息共享成为21世纪以来的重要改进方向。

为了整合图书馆的信息资源,为读者提供高效、个性化、全面、一站式的信息和知识服务,国外出现了一些新型的图书馆组织,美国数字图书联盟(Digital Library Federation,DLF)即为其中之一。DLF致力于倡导应用信息技术来扩展图书馆的馆藏和服务,实现资源的跨库交互。

既往学界初步对DLF的成功经验给予了关注,如何小明[1](2004)对DLF的发展经验进行了分析,张瑞贤[2](2007)对DLF的项目运作进行分析,但是忽略了对DLF的技术实现路径的探讨。实际上,DLF一大技术创新是通过各种专业跨领域的库构建,为用户提供一体化的多学科或跨域内容服务。DLF由不同的自助服务组织组成,这些组织在信息处理平台和数据存储格式上有很大的差异,为了向用户提供高性能和无缝的内容服务,它们协同工作,共享内容资源,建立起一个可以动态配置内容资源的协作工作平台。

基于此,本文对DLF资源协同共享的技术实现路径进行探讨,结合中国当前图书馆数字资源协同建设的现状,以期为中国数字图书馆资源协同共建共享提出建议,并为推进中国数字图书馆联盟发展协同共享提供新的学术线索。

1 DLF概况及其数字资源协同共享情况

DLF成立于1995年5月,是由16个成员单位共同签署国家数字联盟协议,成员中既有大型研究图书馆,还有政府代理机构以及部分社会组织。该组织是目前全球最大的研究型图书馆联盟。自成立之日起,DLF就致力于建立起更加包容、更加多样、更加公平的实践平台,实现共同学习和共同研究,推进社会正义和公共利益的实现。DLF认为,为了更好地推动数字图书馆建设,定义“数字图书馆”十分重要,这样才能更好地达成共识。1998年,DLF在充分讨论的基础上给出了定义,即数字图书馆是一个蕴含资源、提供资源的组织,它能够更好地推进数字化馆藏的连续性,包括专业人员的调配和选择,智能化存取技术的构建,数字资源的解析、保存、使用等等,能够最大限度地实现馆藏的连续性,最终实现更为智能化的阅读服务。DFL认为给出准确的数字图书馆定义有利于其发展,有利于数字图书馆获得更多资源和更多成员单位的支持与投资。

DLF的职责是促进以下方面的工作:开放式数字图书馆标准、软件、接口、基础架构和最佳实践;数字管理和策展,包括研究数据管理以及数字馆藏的汇总和保存服务;数字人文和其他实践与服务,扩大了对资源的访问,并为研究、教学和学习创造新的机会;加强数字图书馆从业人员与相关或相关专业、部门和研究领域之间的联系;数字图书馆工作的社会背景和影响,包括监督和政府记录透明度和问责制问题;社区驱动的政策倡导、专业标准、道德、代表性和多样性问题、劳工、包容性及数字图书馆从业者以及DLF所服务的人员和公众关注的其他事项的社区驱动框架。

由于图书馆一直致力于将电子资源纳入其馆藏、服务和运营中,因此大多数图书馆现有的综合图书馆系统无法支持这些新资源。DLF组织联邦电子资源管理倡议,支持协同系统的快速发展,通过制作一系列相互关联的文档来定义需求并帮助建立数据标准。DLF的做法是在分布式、异构、自主的网络资源环境下动态构建虚拟组织,实现跨域资源共享和协同工作。网格整合分散的网络资源,解决异构环境下资源共享和资源管理统一的问题。

DLF数字资源协同共享资源类型多样,且近年来,DLF数字资源协同共享情况呈现出逐年上升的趋势,且完成率达到较高水平(见图1)。

图1 DLF数字资源协同共享情况(1)数据来源:DLF官网(https:∥www.diglib.org/)

图1数据显示,2014—2021年,DLF数字资源协同共享情况上升迅速。2014年协同完成率仅为84.2%,但是到2021年,这一数据已经上升至99.8%,基本上已经接近完全满足协同共享的需要。需要指出的是,这一期间,DLF数字资源使用增长率不断上升,但是完成率亦同步上升,说明DLF协同服务响应的精准性高。

2 DLF数字资源协同共享的技术实现

2.1 技术设计层面

各种内容资源都离散地存储在每个专业的数字图书馆中,如果这些内容资源被逼迫进行有效的组织和管理,那么数字图书馆就无法提供精确、集成的内容服务[3]。DLA框架可以相互协作并共享异构数据,为客户提供个性化服务。根据DLF的服务共享与合作需求和网格计算的发展趋势,构建DLF协同服务框架模型(见图2)。

图2 DLF协同服务框架模型

DLF协同服务框架模型从下到上分为5层,底层是基础设施层,提供基本的网络支持环境,共享逻辑资源和物理资源。连接层定义了基本的通信、接口和认证协议,并提供了实现SOA的环境。网格中间件层是DLF服务框架的核心。服务层主要提供网格节点之间的资源共享和协同支持[4],DLF主要包括流程控制、资源分配、虚拟团队空间、资源发布/订阅、语义标注、语义查询、本体创建等。应用层为每个内容服务提供商提供的内容服务。图3显示了DLF协同服务的层次结构。

图3 DLF协同服务的层次结构

DLF服务网格的核心中间件主要包括面向消息的中间件(MOM)、服务聚合、数据中介服务、网格信息服务、可靠性批量文件传输(RBFT)等。MOM提供稳定可信的异步通信机制,构建耦合可靠的分布式应用系统。服务聚合使一组相关服务映射为单个逻辑服务[5],屏蔽了服务发现、选择、异常处理等的复杂性。网格信息服务管理网格系统中各种资源网络的元数据,包括网格节点、组织、域、服务等,支持网格环境中的数据、资源和服务查找和发布,提供网格资源整体的静态统一视图和动态管理界面。RBFT保证跨域(组织)数据的可靠传输[6]。电网监控和服务管理保证了电网运行的可靠性、稳定性和可维护性。网格监控负责监控网格运行情况,包括网格中间件的工作状态、Web服务及其实例的调用状态、网格节点的运行状态等。服务管理提供服务注册、取消和地址绑定。DLF可以提供语义和知识服务等高级应用,因此该层提供本体服务和服务匹配引擎。本体服务支持内容资源、服务和协同上下文本体的查询和应用。服务匹配引擎提供基于语义和集体上下文的服务查询。此外,服务组合提供了Web服务的动态组合。复制管理支持网格数据的透明迁移和复制,以及数据副本的透明选择。

在DLF网格中,每个数字图书馆都会将其自治域的资源映射到其对应的网格节点,然后通过网格节点之间的资源共享来实现协作服务。元数据是实现资源共享的重要基础,可以描述资源特征和用户需求。用户需求与资源特征的匹配,可以在不同层次的元数据、本体和语义上实现。

DLF提出一种基于发布/订阅通知和概念检索模型的资源共享,可实现资源的推拉服务。图4描述了DLF网格中的资源共享过程。

在DLF网格中,每个数字图书馆只向网格节点提供资源元数据,资源本身可以存储在每个数字图书馆的内容服务器中。DLF网格中的共享资源可以根据都柏林核心元数据标准进行描述。资源的元数据将被发布或映射到网格节点,并且可以使用Web服务来封装元数据库,以统一资源着色的操作[7]。当每个数字图书馆发布其资源时,网格节点将自动生成有关资源元数据的消息,并且这些消息将由MOM广播到整个系统。一方面,可以根据用户的订阅信息或用户特征向用户推送内容资源;另一方面,可以根据用户的检索情况提供用户所需的内容,从而实现内容推送和拉取服务。

内容检索服务是数字图书馆的主要服务之一。在DLF网格中,内容检索由内容检索代理和服务聚合中间件实现。图5描述了DLF网格中的内容检索过程。在内容检索过程中,用户将基于元数据的检索请求引用给系统,然后系统自动分解检索任务,并根据组织视图将任务自动分配给相关网格节点。实现检索任务的网格节点将启动匹配过程,每个节点的检索结果将通过业务聚合中间件进行收敛,然后将收敛的检索结果返回给用户。

图4 DLF协同服务的过程实现

图5 DLF协同服务的结果呈现

在上述检索过程中,用户向内容检索代理发出检索指令,其中包括检索范围的元数据信息和内容属性。系统返回与用户检索请求匹配的内容及其链接地址。用户不访问属于每个数字图书馆自治域的内容服务器(包括www服务器、FTP服务器、流媒体服务器等),除非对返回的内容感兴趣或满意,否则他们只是通过内容链接地址获取资源。

2.2 制度保障层面

以上是技术设计层面的实现策略。然而,图书馆联盟资源的协同共建共享仅仅依靠技术设计是不够的,还需要依靠制度保障。DLF的制度保障主要包括协议许可、使用管理与沟通机制三个方面。

一是协议许可。DLF的许可标准可以划分为三个方面,分别是SERU、ONIX-PL和ONIX for RROs。当前,各个图书馆的数字资源在不断增加,如果每年都要签订一次许可协议,这对于成员单位来说十分烦琐,而这三个方面的许可标准就是为了解决这个问题。SERU(Shared EResource Understanding)是一个规范性文件,成员单位在平等、信任的基础上,只要对常规许可条款内容达成一致协议,就无须再签署其他的许可协议。此外,ONIX-PL和ONIX for RROs两个标准是为了解决成员单位数字图书馆系统差异或者系统升级带来的无法识别、交换的问题而开发的。ONIX-PL是图书馆及其他结构等,他们以XML格式来交换电子资源许可信息;ONIX for RROs则是版权集体管理组织、出版商及作者,以XML格式交换其作品版权信息的标准。这些许可标准规范有助于图书馆系统地挑选和许可字段展示,能够更好地推动数字图书馆建设。

二是使用管理。为了维护联盟内部的平衡性,DLF从多个方面制定了组织规则,并对成员单位进行分类管理。成员单位中,一类是联盟的长期合作伙伴,他们是指导委员会的成员,有权以联盟的研发、资源贡献、指导项目规划等形式来参与联盟项目。DLF战略合作伙伴包含大学图书馆、公共图书馆等机构。还有一类是普通联盟成员,他们相互独立,与DLF之间存在多种关系和联系,实行统一的管理制度,能够实现资源共享。普通联盟会员包括信息技术提供商、RLG、OCLC、出版商、商业及非营利性组织。

三是沟通机制。由于图书馆联盟彼此之间存在很大差异,数字联盟之间的共享并非一蹴而就[8],需要完善的保障措施。为保证联盟内部信息交流的畅通无阻,促进联盟成员单位的协调工作,提高联盟工作效率,DLF还采取了一系列的积极沟通措施,如领导和支持新项目的启动、研究发展,召开一年两次的会议,向联盟成员单位汇报电子资源发展与管理领域的进展,交流经验。设立电子邮件讨论版,以交流信息、宣布项目启动、资源鉴定和开展讨论等活动。以沟通会议为例,DLF举行了两次相关会议进行协调,会议关注协同服务中数据的多样性。

3 DLF经验对我国的启示

目前,我国数字资源联盟保存的理论和实践研究均比较薄弱,尚处于初步阶段。因此,开展相关研究具有重要开拓意义。

3.1 利用新兴机技术搭建共享平台

一直以来,数字资源的长期保存问题是困扰学术界和图书馆界的一个难题[9]。当前,我国部分大学图书馆和公共图书馆开始重视数字技术在文献资源共建共享的重要作用,他们积极推动数字技术的提升,但是从整体上来看,这些技术与国外相比还存在较大的提升空间。DLF的成功经验表明,统一信息技术标准,有利于数字资源更广泛、更长久地保存,这是一个战略选择。以云技术为支撑,更好搭建数字资源仓储系统,能够实现统一的资源存储方式和统一的开放服务,进而更好地实现资源集中管控,实现资源动态管理,在增加存储空间之余实现更低的保存成本[10]。我国要充分利用数字技术发展带来的良好机遇,利用好新兴技术来搭建联盟保存技术平台,推动移动终端资源整合和发展,积极构建私有云平台和资源平台。要坚持需求导向,积极平衡合作方的差异性,以实现更大的合作效益,从而建立跨区域小的数字资源保存和服务平台,不断扩大整体协同效益。

为了实现统一的数字图书馆联盟协议,可以在学术力量的基础上引入市场力量,来实现单个成员无法完成的任务,打造一个统一的技术平台[11]。一方面,技术联盟可以是图书馆和有关企业之间的技术联合,如DLF引入IBM、苹果等互联网技术企业,他们拥有的先进技术将为联盟带来新的技术冲击。另一方面,联盟成员图书馆之间也可以共享专家资源、技术资源。但是,技术联盟也会存在违约、黑客攻击等人为风险,这些风险需要及时预警,防止演变成严重的技术风险[12]。此外,还存在不可抵抗的自然风险,以及在项目管理的全过程中存在的阶段风险和全程风险。这些风险如果管控或处置不当,将会造成严重后果。

3.2 制作和共标准格式协议

DLF之所以成功,关键在于其构建了完整的标准格式协议,这为统一技术和同步实践打下了良好基础。根据国外的经验我们可以发现,标准格式协议主要由数字资源建设标准规范、应用规范、保护规范、权力规范以及电子商务标准规范等组成。其中,数字资源建设标准规范覆盖数字资源的加工、描述、存储、服务等全过程以及可互操作的数字对象调度机制。

近年来,电子技术快速发展,中国的图书馆数字资源主要呈现出以下两个特点:第一,图书馆资源大爆炸,增长迅速,数量巨大;第二,图书馆的电子资源主要是通过DRAA引进的,尤其是外文电子资源的引进,少数是从行业高校或者地方图书馆联盟集团引进,这些资源具有较大的重合性,浪费严重[13]。DRAA集团采购的电子资源通常使用内部统一协议和较为规范的条款。基于以上分析,我们可以看出在诸多管理系统中的电子资源,其许可协议的内容机遇和挑战并存。对于很多图书馆来说,手工建立电子资源许可协议和条款是一个巨大的工程,过程烦琐复杂且对于深层次内容的理解十分困难。但是,很多图书馆想要获得数字资源必须开展这一工作。前文指出,我国大多数图书馆适用的是DLF ERMI和ONIX-PL格式,因此,可以考虑在使用相同格式的图书馆之间建立共享标准协议,从而节约资源,避免重复性劳动,并争取在下一代图书馆管理系统的简便化进程中取得较好的效果。

3.3 成员之间合作与交流

DLF的合作基础良好,能够更好地指导联盟的发展,更新最新的资源信息。通过数字图书馆服务、馆藏计划分享,联盟成员之间能够充分地互通有无,进而加速成员之间的协同发展。因此,建立图书馆联盟网站非常重要。通过网站,联盟成员之间能够更加深入地交流,了解其他成员数字图书馆建设的情况[14]。此外,联盟也可以通过这个平台来推动各个联盟成员的发展,诚如现在的图书馆博客圈一样,成为成员之间交流的重要平台,这也是统一文化氛围的重要体现。

作为一个没有明确约束机制的合作联盟,联盟成员之间必须达成并遵守共识,明确联盟的建设目标,以及各自承担的任务。所谓名正言顺,只有成员之间尊崇联盟宗旨,朝着相同的目标前进,拥有明确的任务,才能实现真正的协同发展[15]。一直以来,数字图书馆的信条之一就是实现资源共建共享,DLF的历史悠久,资源共享已经成为每个成员的共识,这使得DLF各个成员之间能够更好地合作。

随着数字技术的快速发展,我国图书馆可以充分吸收DLF成功的经验,持续加强战略合作意识,破除保守主义、本位主义的思想禁锢,强化数字资源联盟是未来图书馆数字资源保存的最终路径,通过加强成员合作,加大资源共建共享力度,进而最终实现互利共赢。具体来说,联盟成员之间要常态化举行学术交流和经验交流活动,共同开展工作业务培训,共同培养专业化学术人才,共同探讨馆藏的剔旧,共同研究保存技术的改善,等等[16]。只有这样,数字图书馆联盟才能真正具备凝聚力和向心力,实现文献资源保存利用的最大化,更好地服务更多客户。

3.4 完善联盟的组织管理

经过多年的发展,DLF管理机制也较为完善,其加大了对联盟成员加入的审核力度,即要求联盟成员具有重大的研究开发能力,能够对联盟的发展作出有益的贡献。因此,DLF整体实力在不断增强,联盟也在不断发展。在加入联盟后,新成员会受到指导委员会的管理,而指导委员会就是从成员中产生的自治组织。联盟的成员之间在业务上是协作关系,这有利于联盟更好地运作[17]。

相比而言,我国的图书馆联盟审核不严格,导致加入联盟的成员实力不一,成员的投入产出失衡。联盟的成员之间是隶属关系,合作的模式采用指导委员会和学会下的集中管理,成员之间在业务上是指导关系,这些都会导致成员之间的积极性减弱。此外,联盟的指导委员会几乎形同虚设,联盟成员之间容易出现各自为政的现象,无法实现协调一致。但是,我国的这种模式也存在一定的好处,即更容易实现集中管理。例如,中国数字图书馆联盟依托中国数字图书馆公司的先进技术,突出了国家图书馆的龙头作用,可以吸引更多地方性公共图书馆和高校图书馆加入。但是,CDLF没有形成独立的管理机制,随着联盟规模的不断扩大,原来的管理模式缺陷越来越凸显,有必要建立起更加独立的管理监督机制,推动、加快中国数字图书馆联盟的发展。

4 结 语

从成立之初开始,图书馆联盟模式已经发展了数十年,尤其是在数字技术快速发展的今天,为图书馆协作带来机遇,这种合作模式也成为图书馆行业的主潮流。本文对DLF进行了深入研究,结合我国数字图书馆联盟建设的实际情况,指出其中存在的不足,找到了制约其发展的桎梏,并针对性地提出我国数字图书馆联盟建设的举措。

研究发现,DLF是由各种专业图书馆和跨域图书馆组成,它既可以为用户提供集成的多学科服务,也可以为用户提供跨域的内容服务。DFL协同运行实现了异构环境下的资源共享,有利于图书馆资源的统一管理和使用。它构建了一种基于发布订阅通知来实现资源共享,建立DFL资源协同服务架构,并基于网格治理构建起联盟成员的内容服务网络,通过标准协议来实现真正的技术大提升。

从DLF的发展经验可以看出,对于传统图书馆联盟和现代数字图书馆联盟,数字化和网络化都是发展的主流,图书馆之间的合作是大势所趋。通过对国外先进管理模式的学习,我国图书馆可以结合自身实际,通过建立联盟来提升内部凝聚力。要想实现数字资源联盟的合作共赢,进而更好地解决数字资源保存的难题,数字资源联盟保存是数字图书馆联盟发展的必由之路。

猜你喜欢

检索成员网格
用全等三角形破解网格题
主编及编委会成员简介
主编及编委会成员简介
主编及编委会成员简介
主编及编委会成员简介
反射的椭圆随机偏微分方程的网格逼近
2019年第4-6期便捷检索目录
重叠网格装配中的一种改进ADT搜索方法
基于曲面展开的自由曲面网格划分
专利检索中“语义”的表现