新版RDA对智慧图书馆描述性元数据建设的实现
2023-08-28白雪
白 雪
(国家图书馆,北京 100081)
1 引言
智慧图书馆这一概念自2003年第一次被提出,发展至今已有近20年的时间,学界对该主题的研究热度依然不减,对智慧图书馆的认识也逐渐深入和具体化,学者从对智慧图书馆面貌的粗略描述也逐渐抽丝剥茧,敲开人工智能等技术的外壳去探寻智慧图书馆的内在属性。“智慧图书馆是当代图书馆事业创新转型与数字化、网络化和智能化信息技术实现历史交汇融合的必然产物”[1],图书馆发展从数字图书馆,到智能图书馆再到未来的智慧图书馆,离不开数字化、互联网以及人工智能等信息技术的支撑,但不管何种形态的图书馆,其本质首先是图书馆,主要职能依然是对文献的集合与保存、对文献信息的揭示与描述,并以此为基础,利用各种查询工具与技术为读者提供信息服务[2]。由此可见,资源信息组织依然是图书馆业务的根基。智慧图书馆以先进智能技术为支撑来提供智慧化的知识服务,其中资源是基础,技术是桥梁,资源信息的组织效果则决定了智慧图书馆“人、资源与空间”的融合能否有效实现,而非仅是空中楼阁。
作为资源信息组织的重要手段,描述性元数据在智慧图书馆建设中发挥着不容忽视的作用。然而目前我国的资源描述性元数据建设依然面临着各种各样的问题,实现智慧图书馆所要求的元数据资源建设目标任重而道远。2010年6月,一部专为数字环境设计的资源描述与检索的新标准——《资源描述与检索》(Resource Description and Access,简称RDA)的发布为新时代的编目工作注入了新鲜血液。2019年4月,新版RDA的稳定版本经过近三年的修订发布,进一步适应了关联数据下图书馆资源描述与检索的新要求。笔者将在归纳总结智慧图书馆描述性元数据建设的原则、国内描述性元数据建设所面临的困境的基础上,分析新版RDA与智慧图书馆描述性元数据建设的内在契合性并提出了启示。
2 智慧图书馆描述性元数据建设
描述性元数据是资源组织的重要手段,是图书馆进行资源管理,为读者提供资源信息服务的重要工具。作为未来图书馆发展形态的智慧图书馆,其描述性元数据建设既要满足图书馆的传统基础功能,又要能适应新时代的要求,更要凸显出“智慧性”。根据国际图联(International Federation of Library Associations and Institutions,简称IFLA)最新书目数据模型IFLA LRM(IFLA's Library Reference Model)的定义,元数据建设所要实现的基本功能是满足用户查找、识别资源,选择、获取所需资源,并能浏览相关资源的需求。但是在智慧图书馆框架下,对基本功能的实现要更加深入探索。在“智慧”技术渗透到生活方方面面的时代,用户获取资源信息的需求不仅是获取信息服务的形式智能化,而且对获取资源信息中的智慧性内容——知识——的广度和深度有了更高要求,用户所要求的不仅是获取文献资源,而是在泛在网络下彼此关联的知识海洋中遨游。因而,笔者认为智慧图书馆元数据建设的基本功能是对资源隐含的知识进行深度揭示,实现知识的广泛关联,为用户提供知识服务。在此功能的要求下,智慧图书馆元数据建设应遵循新的原则,也面临着新的困境。
2.1 建设原则
(1)用户中心性原则
早在1931年,阮冈纳赞提出了图书馆五定律,其中4条都是围绕读者服务展开的,图书馆在从资源建设到服务建设等各项业务中也一直贯彻着以人为本、以用户为中心的理念,在2018年1月1日起施行的《中华人民共和国公共图书馆法》中,总则第三条更是明确指明了公共图书馆要坚持以人民为中心。图书馆无论发展为何种形态,无论以何种手段提供服务,其面向的对象终究是人。智慧图书馆元数据建设也必然要坚守这一原则,以用户的需求为导向和动力,着眼现实,努力满足智慧环境下用户对信息检索和获取知识服务的新要求。
(2)技术适应性原则
元数据建设从早期的卡片目录时期到机读目录格式时期,再到如今关联数据日渐兴起,无不是图书馆适应新技术、利用新技术的结果。智慧技术背景下的图书馆元数据建设也要从基础理论、概念模型以及实操工具层面上与互联网、大数据分析、语义网等技术进行深入、全面的融合。既要有能适应开放数字环境的基础理论模型做指导,也要有能适应开放社区,适用于多种资源形式的具体内容规则标准为工具,同时也要有与之匹配的书目框架做支撑。
(3)合作共建原则
智慧图书馆要为用户提供泛在的、智慧的知识服务,需要有内容高质、结构丰富、数量庞大的资源,同时也要有相应规范化、结构化、细粒度的描述性元数据做基础。在资源大爆炸、新型资源层出不穷的信息化社会,符合这种要求的元数据资源建设远非靠某一个图书馆之力可以完成,甚至不是图书馆界可独立完成。图书馆势必要突破行业壁垒,积极寻求与其他行业领域在元数据上合作共建,甚至在全球范围内寻求合作,以此才有可能真正建成一个泛在的智慧图书馆知识空间。
2.2 智慧图书馆描述性元数据建设面临的难点
(1)元数据标准的统一
规则标准是图书馆元数据建设的重要基础性工具,决定了元数据的质量和整体面貌。智慧图书馆背景下的元数据标准既要能适应关联数据和语义网,还要能在最大范围实现元数据的共建共享,这就对元数据标准的国际化和统一性提出了要求。
为适应数字环境下资源建设以及语义网背景下信息组织的要求,2021年3月,国家标准GB/T 3792-2021《信息与文献 资源描述》发布,该标准的一大变化是它统一了各类型资源著录标准,对GB 3792系列标准、GB/T 3469-2013共计8项标准进行了合并修订,参考ISBD(统一版)和RDA,进一步适应了国际化要求。但该项国标仅仅是作为文献著录的纲领性文件,在元数据编制的实践中,还需要有国家图书馆和全国各大联编中心、各机构制定的细则来进行指导。如,全国联合编目中心、CALIS联合编目中心等的中文文献编目工作目前基本都是遵循《中国文献编目规则》(第二版),但又制定了各自的编目细则[3],随着全新、统一的国标问世,相应地各个机构也面临着细则的对照修订,这是我国中文文献元数据建设面临的首要问题。另外,外文编目方面,上海图书馆、CALIS和国家图书馆先后宣布采用RDA规则,这标志着我国外文文献编目已经进入RDA规则时代,但中外文文献标准的差异也为中外文元数据的融合提出了难题。除内容标准外,中外文元数据建设的格式标准也并不统一,除港澳台地区以外,中文编目采用的机读目录格式均为CNMARC,而外文编目采用的则主要是MARC21格式。这些编目中的差异给中外文元数据的共享整合带来了难度。
(2)关联数据的实现
图书馆元数据一般较为规范和权威,但受限于图书馆编目传统思想和MARC格式,图书馆元数据具有封闭性、静态型、粗粒度性和隐形的语义揭示等缺点,数据困于图书馆的“围墙”,能被计算机处理的程度有限,难以融入语义网之中,这与智慧图书馆泛在、开放的理念相冲突。而具有开放性、可拓展性、可重用性、显性的语义关系和国际化特点[4]的关联数据更符合智慧图书馆元数据建设的要求,智慧图书馆描述性元数据的未来也必然是实现关联数据化。关联数据实现有以下两个要点:一是书目信息能被计算机识别;二是数据之间的关系能被揭示且能被计算机识别处理。若要在泛在智慧图书馆框架下实现描述性元数据关联数据化,图书馆还需进一步探索,发现适合我国国情且能满足上述两点要求的描述性元数据建设标准。
3 新版RDA与智慧图书馆
3.1 新版RDA的诞生与发展
RDA正式问世是在2010年6月,以RDA toolkit工具包的形式呈现在大众面前。最初编制RDA是为了推出一个能够取代英美编目条例(第二版)(Anglo-American Cataloguing Rules 2,简称AACR2)、适应数字化环境下资源建设的全新编目内容标准,国际图联1998年出版的《书目数据的功能需求》(Functional Requirements of Bibliographic Records,FRBR)以及2003年通过的《国际编目原则声明》(International Cataloguing Principles,ICP)更是为RDA的编制提供了理论模型支持和编制方向。自RDA正式推出以后,RDA指导委员会(The RDA Steering Committee,以下简称RSC)在2011—2017年间一直在对RDA进行更新和维护,但这期间的更新并未涉及变革性的改变。2017年4月,RSC启动了3R(RDA Toolkit Restrue and Redesign)项目,该项目提出了12项目标,旨在对RDA工具包进行重新设计,并对RDA内容进行修改。3R项目的动因,一是RDA工具包本身存在诸多问题,影响了工具包作用的发挥和用户体验;二是RDA规则旨在建立的元数据要符合以用户为中心的关联数据模型标准,而2017年IFLA新的书目数据模型——IFLA LRM——的推出,使RSC需对RDA进行修订以适应新的模型;三是推动RDA成为一个国际标准,提高其使用率和在世界范围内应用的灵活性。2018年6月13日,作为3R项目成果一部分的新版RDA测试版工具包首次上线。随着其设计、结构的逐步完整,2019年4月30日,RDA英文文本宣布进入稳定阶段,这标志着RDA测试版工具包不再进行实质性修订。该稳定版本可作为RDA文本翻译、本地政策声明编写、RDA相关资料撰写的基准文本。2020年12月15日,RDA测试版工具包正式转为官方版本,标志着3R项目的圆满结束。用户可通过网址access.rdatoolkit.org访问工具包,而原始工具包则可通过网址original.rdatoolkit.org访问,亦可通过新工具包的资源栏目或顶部横幅菜单进行访问[5]。
新版RDA在工具包和内容方面均产生了诸多变化,总体来看,这些变化实现了3R项目的12项目标:一方面,通过重建工具包技术基础设施和数据存储库、对工具包采用响应式设计、执行国际通用无障碍标准、改进用户操作体验、完善工具包结构等工作,进一步改善了各类用户使用RDA工具包的有效性和便利性;另一方面,通过对RDA内容的修改以及结构的重构,实现了与IFLA LRM的一致性和对关联数据的适应性,并推进了RDA国际化的进程[5]。
3.2 新版RDA与智慧图书馆元数据建设的内在契合性
新版RDA诞生于智慧化的大背景之下,其发展的动因以及其模型基础和内在原则都有着深刻的智慧化烙印,与智慧图书馆描述性元数据建设的原则和功能相契合,体现在以下方面。
(1)以用户为中心。作为智慧图书馆元数据建设的用户中心性原则贯穿在RDA的工具包和内容的始终。在编制新版RDA参照的书目框架模型IFLA LRM,以及贯穿RDA始终的国际编目原则声明(ICP)中,用户都处在中心位置。IFLA LRM是个高层概念参考模型,是对FR家族的3个模型的整合,是在增强的“实体-关系”模型框架下开发的,该高层模型可作为编制规则的指南或是基础[6]。该模型与FR家族三模型虽都强调用户的重要性,但不同的是该模型是以用户任务为出发点进行开发的,在整个模型中用户任务章节也被提至全文开篇:无论是分离实体,还是识别实体的属性、建立实体之间的关系,都是以查找、识别、选择、获取、探索这5项用户任务为着眼点,新版RDA是该模型的一个实际应用,遵循LRM实体的基本理念和基本结构,其用户任务导向性也印刻其中;在ICP中,更是将用户便利性原则明确列为编目基本原则之首,以此为基础编制、修改的新版RDA亦是将满足用户需求作为其首要目标,明确提出“元数据应满足支持用户任务的功能需求”[7]。
(2)深度支持关联数据技术。新版RDA与智慧图书馆元数据建设契合之处主要体现在其本身对关联数据技术的支持。如前文所述,关联数据实现有以下两个要点:一是书目信息能被计算机识别;二是数据之间的关系能被揭示且能被计算机识别处理。新版RDA对其实现体现在以下3点:①元素的妙用。在计算机识别数据的实现过程中,元素发挥了关键的作用。新版RDA首次提出了数据元素集的概念,在其定义和目的中强调了RDA自身就是一个数据元素的集合。元素可以简单理解为RDA实体的属性和关系,是对有用的书目信息要素的拆分解析,经过解析而成的元素是具有精确性和细粒度性的数据单元,易于被计算机识别和处理。相较AACR2,RDA还增加了许多新类型的元素,以此拓宽了书目信息可被计算机识别的范围,细化了书目信息描述的粒度。②关系的深度揭示。RDA从编制之初就十分关注关系的揭示,新版RDA从以下方面实现和加强了对关系的揭示。一是大大增加了关系元素。一方面,由于新版RDA引入了地点实体、时间段实体以及名称实体,使得许多旧版RDA的属性元素得以转换成关系元素。如,出生地就由个人的属性转化为个人与地点之间的关系,作品题名则由作品的属性变为作品和作品名称之间的关系。另一方面,原来作为RDA附录部分的关系说明语在新版RDA中也被转换为关系元素。如,作者author由关系说明语转变为作品与个人的关系,便于精确说明关系性质。通过上述两种方式扩展关系元素增强了关系揭示的精度,使得关系揭示更为全面、细致、精准,这就为数据关联的实现夯实了基础。二是新版RDA定义了明确记录的4种路径,其中除了旧版RDA中已有表述的非结构化描述、结构化描述、标识符以外,还增加了国际化资源标识符(Internationalized Resource Identifiers,简称IRI)作为可选的记录方法之一,而IRI是关联数据指示数据间关系的重要方法之一,由此可见新版RDA对关联数据环境的高度融合性。③本体论的内在逻辑。新版RDA和LRM的哲学逻辑是本体论,而本体论是关联数据实现的哲学基础。在本体论的指导下,LRM从更为普遍和立体的层面定义了实体,定义了超类实体Res,其他各类实体均为它的子类,而名称也被定义为一个实体,本体和指代其的名称则通过实体间的关系来体现。以此逻辑进行修订,新版RDA使得数据可以突破语言表达、规则差异等限制实现关联。在新版RDA的指导下,描述性元数据建设也将从看重书目信息特征描述转向对知识概念本体的深入揭示,并通过“实体-关系”网络建立起一个多向度、能表现知识多重属性的知识网络,也便利了大数据与图书馆元数据的整合,使得图书馆元数据更具多元性、动态性,知识网络的构建也更能反映用户的多元需求,从而实现智慧图书馆元数据建设的功能需求。
(3)国际化与可扩展性。RDA国际性和可拓展性使其能突破图书馆环境和国家的限制,在更广范围内被使用,为跨国和跨领域合作共建智慧图书馆提供了可能。旧版RDA的国际化体现在其与国际编目原则、模型相一致,多国广泛参与编制与修订流程,内容去英美化,增加本地化选项等方面。3R项目启动后,在项目目标中再次强调了要进一步推进RDA国际化的任务,值得一提的是,始于2014年的治理结构“国际化”改革,改革结果是RDA理事会(RDA Board)增设了6个全球代表,RSC增设了区域代表机构,使RDA的管理更具国际代表性。新版RDA的可拓展性也得以进一步加强,因在其顶层模型IFLA LRM中就声明该模型“选择的术语、制定的定义可通用于所有资源类型或所有实体”,任何应用它的机构,都可按自己的需要在遵循模型基本原则和框架的基础上进行扩展或省略,模型本身极具灵活性和可扩展性,新版RDA延续了这种可扩展性,定义了可扩展的元素集,为其他社区使用RDA提供了可能。新版RDA这种国际化和可拓展性的原生属性正是智慧图书馆描述性元数据在国际范围内和广阔的文化遗产社区内合作共建的前提和基础。
4 启示
RDA自初次问世到新版发布,历经了十余年的发展,国内对RDA的了解也从无到有,对其态度也从观望到心动。虽然在国内全面实施RDA规则的条件尚未成熟,但是RDA及其理念是智慧图书馆元数据建设的未来,RDA的问世发展无疑为探索国内中外文描述性元数据的建设提供了方向和参考。
4.1 加快对新版RDA及其相关标准的研究
目前国内有关RDA的研究主要是针对旧版,对新版RDA的研究仍处于基础理论研究的起步阶段。一方面,需要进一步加强对新版RDA、IFLA LRM模型以及与之相匹配的BIBFRAME书目框架的基础理论研究,及时追踪最新发展动态;另一方面,研究终要落地、指导实践,因此要从本地化角度加强对新版RDA和IFLA LRM的解读。对于国内外文文献编目来说,侧重点应在现有本地政策的更新以及书目格式的升级和适配问题;而对于中文文献编目而言,问题更为复杂,一方面要加强对两套规则的形式、内容、基础模型等方面进行比较研究,另一方面,要探索中文编目与RDA结合的具体可行路径。
4.2 以“修”促“换”
对我国图书馆外文文献编目而言,RDA规则已经基本在实践中为编目员所接纳和适应,新版RDA可被视为对现行规则的一次大的修订,但并不会对编目人员在理念和规则理解方面产生巨大的冲击和不适。而对于中文文献编目来说则是另外一番体验。
《中国文献编目条例》(第二版)编制和修订的基础为ISBD和AACR2,内容体例上仍保留着传统目录时代的印记,其与RDA的差异与其说是内容上的,不如说是理念上的,在现阶段放弃前者,完全采用RDA规则,仍不现实。编制中文编目规则的RDA本地政策声明本身就是一项巨大工程,RDA对中国特色的实现情况尚不明朗,CNMARC格式对RDA的呈现与适应问题还有待进一步探索;避RDA而不谈更不明智——无论是从中外文文献元数据建设的整合统一角度,还是对未来书目数据格式工具的升级而言,RDA均已提供了成熟的方案。以“修”促“换”或是更为现实可行的方法。国家标准GB/T 3792-2021《信息与文献资源描述》的发布迈出了“修”的重要一步,接下来则应对标国标对具体规则进行进一步修订。但承载着IFLA LRM的全新理念,体现着关联数据、智慧化的时代特征的新版RDA的问世,又为中文文献编目国家标准和具体实施细则的进一步修订提供了新的参考和要求。在内容方面,可将IFLA LRM作为修订的一个基础高层模型,参考其结构框架,重构规则编制的理念,巧用层级结构,进一步融入国际化轨道;在资源描述的原则方面,可参考RDA所提出的区别性、充分性、关系性、准确性表达的5点原则,尤其是关系性原则,引入元素的概念,以细化和深耕实体属性及其关系的揭示;在发布形式方面,要开发规则的线上版本,使其形式符合当代编目员的使用习惯,也便于相关资源的一站式整合,提高编目效率;在管理机制方面,RDA优越之处不仅体现在其内容和形式上,它的管理机制也颇有可借鉴之处。如,成立RDA理事会,负责为RDA的发展制定战略方向,签署发展计划,确保RDA有序管理,为战略的实现提供风险控制和财政保障等;另设RSC负责RDA的更新维护,RSC会根据需要任命工作组来协助其开发RDA的具体方面,常设工作组为RSC技术工作组和RSC翻译工作组,其他工作组则按需进行设立。国内编目规则的管理机制也可如此借鉴,由包括国家图书馆在内的国内各类型图书馆的代表成立全国性的编目工作常委会,分设管理委员会和专家委员会,分别负责元数据建设的宏观管理和具体内容规则的制定、修改,以加快规则的更新频率和效率,并为编目员或是机构反馈修改意见提供畅通的渠道。
4.3 推进亚洲RDA兴趣小组的建立
智慧图书馆元数据建设仅靠一馆一国之力是远远不够的,而在RDA实施过程中的转换成本问题、文化适应性问题或许是最大的障碍,而这巨大障碍的跨越更需要联合更多力量实现。以欧洲为例,RDA在欧洲被广泛接受的原因除却语言和文化上的优势,也离不开欧洲RDA兴趣小组(European RDA Interest Group,EURIG)的推动,EURIG初步成立于2010年,2011年正式成立,在2010年,大多数欧洲国家还对RDA持谨慎和观望态度,而2013年的一项调查报告显示,情况已经发生了重大变化,超过一半的受访者制定了明确的实施计划,其余受访者对标准进行了分析或评估,到2016年,RDA已在10个欧洲国家的机构中实施[8],EURIG对此功不可没。如今EURIG不仅为RDA用户和潜在用户提供了一个交流的平台,促进成员之间的合作与交流并承担相应的翻译工作,而且还是RSC区域机构用户代表,通过与RSC密切合作,根据欧洲图书馆和用户的书目需求进行信息推广并协调RDA的发展[9]。
我国也应借鉴相关经验推动亚洲RDA兴趣小组的成立。一方面,将推动共同障碍的扫除,促进RDA在亚洲地区的推广和认可,助力RDA生态的建立;另一方面,可以增加亚洲国家在RDA规则建设中的话语权,进一步推动RDA的国际化进程。2018年,中国国家图书馆针对RDA在亚洲地区的研究和应用情况开展了专题调研,调研人员向包括中国国内图书馆在内的23家亚洲地区的图书馆发送了调查问卷,调研对象馆对RDA的了解程度、应用情况及对RDA及在亚洲开展合作的态度等,结果显示大部分对象馆对RDA规则十分熟悉和了解,所有对象馆无论是否实施了RDA,均已做了相应准备,其中有15家书目机构已经实施了RDA,11家制定了本地政策声明,15家对象馆愿意参与到RDA相关工作的亚洲合作中来[10]。由此可见,兴趣小组建立的前景是乐观可期的。
5 结语
智慧图书馆元数据建设工作任重而道远,新版RDA的问世又提出了新的挑战,但也为智慧图书馆描述性元数据建设工作提供了广阔的前景。对于新版RDA及其相关模型、标准的研究还处于初级阶段,笔者也仅从较为宏观的层面对新版RDA与智慧图书馆描述性元数据建设的实现进行了浅述,以期抛砖引玉。