新版RDA探微
——3R项目稳定阶段略述
2020-02-24丁政蔡丹
丁政 蔡丹
(国家图书馆,北京 100081)
1 RDA的缘起与发展
1.1 RDA的推出与早期发展
《资源描述与检索》(Resource Description and Access,RDA)是用于创建结构良好的元数据的一组数据元素、指导方针和规则条款,这些元数据旨在支持图书馆和其他文化遗产社区所收藏资源的发现与识别,并且RDA的规则必须依托于国际编目模型而构建[1]。RDA从2010年面世就打破了编目规则囿于印刷型的传统,直接以“工具包”在线电子资源的形式推出,而印刷本仅为补充产品,这一创新之举令编目界耳目一新。RDA工具包(RDA Toolkit)是一个集成的、基于浏览器的在线产品,它为创建元数据的编目员提供一个与RDA资源描述规则(包括实体、元素、词汇表编码方案等)和其他相关编目资源交互的平台,它已成为RDA内容发布的主要途径。
2011—2017年,RDA工具包网站上的RDA英语文本每年都会进行更新,除年度更新外,RDA文本还会通过包含编辑变化的季度小更新的方式进行增补。2011年,RDA词汇表首次进行开放元数据注册,标志着RDA与关联数据的紧密结合。2013年,包含更新变化的新印刷型RDA纸本得以出版。同年,许多美国图书馆开始使用RDA进行原始编目,并将2013年3月31日作为RDA切换日“Day One”。2014年,RDA注册网站启动,网址为“https://www.rdaregistry.info/”。同年,RDA的法语与德语译本首次出版,为RDA在非英语国家进行推广提供了有力支持。
1.2 新版RDA与3R项目
2017年8月,由国际图书馆协会和机构联合会(International Federation of Library Associations and Institutions,IFLA)研发的编目概念模型——IFLA图书馆参考模型(IFLA Library Reference Model,IFLA LRM)由IFLA专业委员会审定通过。该模型是对FR家族概念模型的继承和发展,它打破了原模型的平面结构,以超类/子类建模方式减少冗余,同时允许模型扩展,以满足不同类型机构的应用需要,在更高的概念层次实现了模型的统一[2]。RDA是国际功能需求模型的具体应用和细化,因此模型的变化必然引发对RDA修订的联动效应。另外,RDA工具包已推出10年,在对多浏览器的支持方面存在一定不足,未能达到“Web内容可访问性指南(WCAG)2.0”AA评级,已不能很好地满足用户需求。此外,在后台维护更新方面,RDA指导委员会(RDA Steering Committee,RSC)为了能够跟踪和管理更大范围内的与RDA条款相关联的元数据,需要将RDA条款的存储库进行重构,使其与当前最佳的数据管理实践相匹配,因此一场针对RDA工具包的全面优化势在必行。
在此背景下,由RSC主导的RDA工具包重构和再设计(RDA Toolkit Restructure and Redesign,3R)项目于2017年4月正式启动。2018年6月13日,RSC如期推出RDA工具包测试版站点(RDA Toolkit Beta Site)。2019年4月30日,RSC发布了新版RDA的英文稳定文本,标志着3R项目已经进入稳定阶段。同年10月15日,RSC又发布了3R项目阶段性完成声明。3R项目步入稳定阶段具有基石般的意义,因为此后新版RDA将可作为各语种翻译本和各机构制定政策声明的基础文本,各项围绕新版RDA的工作得以顺利展开,为其未来应用做好了坚实的铺垫。
优化RDA工具包界面是3R的一个初衷。从RDA工具包测试版的诞生,到3R项目的阶段性完成,RDA工具包在提升用户体验方面做了诸多努力。例如,所有页面均增加了可随页面滚动的“回到顶部”按钮,并且添加了面包屑导航(breadcrumb navigation)功能,使用户能够了解自身目前所在的位置,以及当前页面在整个网站中所在的位置,体现了网站的架构层级,减少了返回到上一级页面的操作。又如,登录框获得了升级,能够自动识别用户是否为登录状态,确保用户登录的是自身的订阅账号,而不会误登其他账号;新增了额外的登出按钮(标签为“登出机构”),使经过IP认证的用户能够完全登出测试版RDA工具包网站,从而迅速释放一个用户席位。再如,新的帮助系统已加入工具包站点,用户可点击位于RDA测试网站最顶端工具栏的“Help”下拉菜单,即可获取关于浏览站点或使用检索参数的指导,现有的帮助文档已涵盖了许多领域,并将随网站的发展而不断丰富。此外,全新的“Public”配置选项已加入到文档创建工具的用户界面,以便将更多的标记为“Public”的文档向非付费用户分享。
相较于界面的变化,新版RDA在体例编排和内容编制上的变化更引人注目。RSC一再强调,“3R的重构过程将最低限度地影响现有的编目实践”[3],具体而言,原版RDA的条款将尽可能保留,除非是因为与IFLA LRM冲突而必须修改的。在这样的原则下,按新版RDA编目的元数据将与应用原版RDA条款所形成的编目成果极为相似,变化不大。然而,IFLA LRM的产生是新版RDA的修订之源,新概念模型在实体、属性、关系方面的变化之多是有目共睹的,还增加了对合集(aggregates)和连续出版物的建模,这些变化直接体现在新版RDA的内容修订中。在体例上,新版RDA取消条款编号的做法也改变了RDA原有的结构,附录等规则被重新组织进新的版块,关系说明语也变为了关系元素,这些内容上的新变化还是值得深入学习和总结的。笔者在本文中首先明确“3R项目稳定阶段”的内涵,进而总结新版RDA的主要变化,最后阐述RSC对新版RDA的未来工作方向,以期助力国内对RDA的研究与实践。
2 “3R项目稳定阶段”的内涵
如前所述,2019年4月30日,RSC宣布3R项目进入稳定阶段。此前,RSC已经发布数次更新声明,多次征求意见,经过慎重的考虑和多次的磨合,在推出RDA工具包测试版的基础上反复修订与完善,最终才确定了新版RDA的英文稳定文本。由于RDA的内容不断变化修订,RDA工具包自其诞生之日起,就一直处于更新的状态中。对于书目机构而言,频繁更新的环境对制定本地政策声明形成不小的挑战,而“稳定”版本的推出,恰似动中取静,意味在此版本生效时间内,RSC对RDA文本将不再进行持续修订,包括取值词表、元素集、实体章节、指南章节和资源章节,从而为各语种翻译本及各机构制定政策声明提供了可靠的基础文本。此后,翻译、政策声明编制、应用纲要开发、补充材料撰写和RDA样例编辑等方面的人员将以此版本为基础继续开展后续工作。RSC甚至将该版本称为“3R项目的里程碑”[4],可见这个版本对于RDA发展的重要意义。然而,尽管名为“稳定阶段”,但其“稳定”不代表“一成不变”,未来RSC仍将对新版RDA做小幅修改,主要包括三方面。一是编辑方面的修改,如更正输入或其他明显的错误,改善文本的一致性以及润色修辞等;二是在对翻译或政策声明编制人员以及编目成果不产生大的影响的前提下进行一些附加修改,如在现有元素中增加条件/选项框,对取值词表进行修改等;三是增加或修改一些样例。在界面方面的优化也将继续。
此外,虽然本次发布是3R项目从测试版走向官方版的重要节点,但这并不意味着3R项目已经结束,目前RDA的官方版本依然为原始版本。新版RDA官网的切换工作也在计划之中。RDA理事会、RSC和RDA工具包发布者在最近的一次讨论中已达成共识,将RDA工具包测试网站转变为官方网站的准确日期定为2020年12月15日,届时现有的测试版工具包网站“beta.rdatoolkit.org”将切换为“access.rdatoolkit.org”,而原版RDA工具包将按原计划移至“original.rdatoolkit.org”。值得注意的是,原版RDA工具包删除倒计时钟并不在切换当日同时开启,其开启的具体日期将由RDA理事会和RSC协商确定,初步计划在2021年。开启之后,倒计时钟将运行1年,剩余时间将在“original.rdatoolkit.org”站点上突出显示。
3 新版RDA的主要变化
3.1 新版RDA内容方面的主要变化
IFLA LRM的产生是新版RDA的修订之源,因此新版RDA在内容方面产生的许多变化都与IFLA LRM保持同步,这些变化主要包括编制范围,实体、属性和关系,以及术语等节点。
3.1.1 编制范围的变化
在范围方面,编制原版RDA时,由于《主题规范数据的功能需求(FRSAD)》还未能出台,因此原版RDA中与主题相关的章节均处于“待补充”的状态。编制新版RDA时,RSC已明确,与主题编目相关的规则超出了RDA的范围,且目前存在许多比较完善的主题编目方案,因此原版RDA中关于概念、物体、事件的“占位符”章节在新版RDA中被删除,这充分体现了RDA与概念模型从FRBR第3组实体到FRSAD,再到IFLA LRM的演进过程保持一致。新版RDA不包含具体的主题编目规则并不意味着不包含主题书目关系。IFLA LRM第12种关系(LRM-R12)就定义了作品与资源之间的主题关系。与之相适应,新版RDA提供了一组广泛的元素,用于关联作品和作为其主题的RDA实体。例如,在实体作品的元素部分,新版RDA定义了若干与主题相关的关系元素,如subject person、subject work、subject family等。
3.1.2 实体、属性和关系的变化
引入IFLA LRM的新思想是RDA修订最主要的动因,因此新版RDA在定义实体、描述属性和揭示关系上也充分体现了实施IFLA LRM的态度。实体是书目用户感兴趣的关键对象,是事物的抽象分类,也是通过关系连接的定义域和值域。FR家族先前三模型共包括18个实体,经过重新整合,IFLA LRM定义了11个实体,并按超类/子类关系分为三层,新增实体共6个,即Res、行为者、命名、集体行为者、地点、时间段。其中Res为顶层实体,包含书目世界的万事万物。此外,新模型还依据用户任务的变化(将与图书馆管理和运行相关的任务排除在外)以及实体合并的情况,取消了10个实体。RDA是IFLA LRM的一个应用实例,因此,一方面新模型的变化需要在新版RDA中体现;另一方面,RDA对新模型也并非完全照搬,可根据实际需要进行本地化的改造。据此,新版RDA在定义实体上与新模型基本保持一致,但存在两个细微的调整。首先,未引入IFLA LRM的顶层实体Res,因为RDA本身就是IFLA LRM的一种具体实现,无须采用Res这样宽泛的实体[2]。但为了反映RDA中实体的共同特性,新版RDA还是定义了一个超类实体,命名为RDA实体,可将其视为Res的一个子类。其次,IFLA LRM将家族和团体合并为一个超类实体集体行为者,但是,为了与RDA传统实践相衔接,新版RDA还是保留了家族和团体两个实体。综上,新版RDA共定义了13个实体,即RDA实体、作品、内容表达、载体表现、单件、行为者、个人、集体行为者、团体、家族、命名、地点、时间段。
在新版RDA中,与13个实体相联系的属性和关系均被称为“元素”。属性元素是RDA实体内在或外部赋予的特征元素。在IFLA LRM中,11个实体仅定义了37个属性,与原模型相比,属性的数量大幅减少。其中的原因主要有三方面。一是新模型在定义属性时考虑的是代表性,而不是穷尽一切。所有的属性均是非必备的,只有当属性适用,且容易获得时才予以记录。二是新模型的超类/子类结构,使得超类的属性可以自动适用于其子类,因此无须为子类重复声明属性。三是原模型中的属性在新模型中声明为了关系。例如,“载体表现的正题名”在FRBR中被定义为实体载体表现的属性,在新模型中却作为关系13“Res”与“命名”实体之间的关系予以声明。如前所述,新版RDA是IFLA LRM的一个具体实现,因此在新模型的基础上,RDA也根据自身需要定义和增加了大量附加的属性。例如,实体个人在IFLA LRM中的属性仅定义了一个,即职业/工作,此外,还包括继承自其超类行为者的3个属性,即联系信息、活动领域、语言;在新版RDA中,个人的属性元素被细化为10个,包括个人地址、传记信息、个人类别、活动领域、性别、语言、个人附注、职业/工作、个人的相关实体、头衔。
在原版RDA中,关系揭示主要依靠关系说明语。关系说明语就像取值词表一样作为附录集中呈现。新版RDA完全打破了这种方式,将关系说明语变为元素的一个类别,即关系元素,与属性元素一起用于描述实体。与属性一样,IFLA LRM仅在模型的高层声明了36种一般性的关系,更具体的关系在RDA中附加。新模型以定义域和值域的形式呈现关系,定义域是元素所描述的RDA实体,值域则是作为关系元素值的RDA实体,且关系具有互逆性。新模型对关系的呈现在新版RDA中得以体现,并进一步细化。例如,IFLA LRM的关系6“内容表达由行为者创作”,在新版RDA中被细化为“abridger person of”“animator person of”等多种关系元素。在呈现形式上,新版RDA也与新模型保持一致,在每个关系元素的规则中,通过“元素参考”版块指明关系元素的定义域和值域,以及表达关系的标签。为了更好地查找关系,RSC计划开发一个关系矩阵,用于关系元素的集中展示。但是,2020年6月,RSC宣布取消关系矩阵的开发,原因是“此功能因内容不准确、难以处理修改更新”[5]。为了弥补这个不足,RSC在实体的元素版块改进了检索功能,实现了属性元素和关系元素的筛选检索。
3.1.3 术语的变化
实体、属性、关系的变化必然会引起术语的变化,IFLA LRM带来了一些新术语,如代表性内容表达的属性、载体表现说明、合集、定义域、值域等;还有一些旧概念被赋予了新名称,如取值表变为词汇表编码方案、检索点的构建规则变为字符串编码方案等。其中关系说明语变化很大,如前所述,关系说明语的术语不仅变成了元素,有的还被拆分,有的则变更了名称,例如,“abridged as(expression)”变为“abridged as expression”等。此外,还有一些概念发生变化,例如,“个人”的概念已不包括虚构的和非人类角色,只包括真实的个人。又如,记录方法在原版RDA中虽然也涉及四路径,即结构化描述、非结构化描述、标识符和IRI,但是IRI的方法不是明确提出的,是隐含的。新版RDA不仅明确了四路径的记录方法,而且提高了记录方法的重要性,在每个元素的规则中都明确了可供选择的记录方法。
3.2 新版RDA结构方面的主要变化
除内容层面的变化以外,新版RDA在结构上也有所创新,这些创新主要体现在体例编排、编号规则以及规则弹性等方面。
3.2.1 体例编排的变化
在体例编排方面,新版RDA采用下拉菜单的方式呈现内容,而原版RDA采用等级列举式,按编号逐级展开。新版RDA将原版RDA的内容打散重组,按实体(entities)、指南(guidance)、政策(policies)与资源(resources)四大选项卡进行编排。
实体版块具有统一的编排体例,包括定义与范围、记录前、记录、元素4个部分。元素是实体版块最重要的组成部分,原版RDA附录I-M的关系说明语都转变为了关系元素,在元素部分予以显示。同样,每个元素也具有统一的编制体例,包括定义与范围、记录前、记录、相关元素4个部分。其中,定义与范围版块设置了元素参考(element reference),用以说明该元素的IRI、定义域、值域、交替标签、MARC映射等内容。
指南版块主要是有关RDA和RDA工具包的背景信息和适用于大多数元素的规则等。具体包括RDA导言、合集、应用纲要、内容和载体、数据出处、历时作品、虚构及非人类称谓、载体表现说明、命名和称谓、RDA实施情境、记录方法、代表性内容表达、资源描述、术语、转录规则、用户任务。
政策版块目前仅包含英国国家图书馆和美国国会图书馆两家所编制政策声明的部分内容。美国国会图书馆从2019年8月开始启动政策声明的编制,到2020年5月初见端倪,目前还未完成[6]。
资源版块分为四部分:第一部分,RDA参考,包括RDA术语表及词汇表编码方案;第二部分,容纳了部分原版RDA附录的规则,包括个人名称附加说明、大写及首冠词;第三部分,是其他未纳入RDA文本的内容,包括修订历史及社区词汇表;第四部分,是AACR2的链接,包含AACR2 2002年修订版的全文内容。
“修订历史”是2019年9月RDA工具包新增的功能。该功能允许用户跟踪标准的更新情况,并访问早期版本。“修订历史”由发布说明和规则档案两部分组成。发布说明以表格的形式总结RDA每个新版本的变化,包括修改、添加或删除的情况,并提供新旧两个PDF的链接。发布说明在工具包中保存3年,此后文档将被保存到规则档案中供追溯。此外,原版RDA工具包的最后一个版本也以PDF的格式存储在规则档案里。
3.2.2 编号规则的变化
新版RDA区别于原版的另一个结构特征是取消了条款编号。然而,部分用户表示仍然有必要引入一种编号系统,以便在纸本印刷品或其他非数字通信场合引用RDA规则。基于此,RSC为新版RDA引入了引文编号功能,以满足用户的需求。引文编号的格式为“××.××.××.××”,这些数字是随机的、永久的,并可用于检索。目前,引文编号功能已经在实体及元素版块以及指南版块实现。当用户在RDA测试版站点的搜索框输入引文编号时,搜索引擎将直接定位到相关文本。此外,站点能够支持用户按原版RDA规则编号进行搜索,当用户在搜索框中输入原版编号,将会显示新版RDA中对应原版编号的内容。
3.2.3 规则弹性的变化
RSC现任主席Glennan[7]在谈及3R项目目标时曾指出,其目标之一是“在选择记录信息方面提供更多的弹性”。新版RDA也努力践行着上述目标。新版RDA奉行“一切可选”的原则,记录什么元素,怎么记录元素,记录多少元素,均是可选的,除非RDA规定了“最低描述”的内容。新版RDA甚至都未设定核心元素,元素的必备性和重复性将由政策声明或应用纲要等本地化文件予以规定。原版RDA也崇尚为编目员提供更多规则弹性,所以在设置正文条款之外,还辅以可选择的附加、可选择的省略、例外、交替4种规则。新版RDA进一步增大了弹性,甚至取消了正文条款,并用条件/选项框取代了上述4种可选规则。“条件”表示可能遇到的情形,“选项”表示可以选择的做法。
4 新版RDA未来展望
2020年RSC发布了《2020—2022年行动计划》(RSC Action Plan 2020—2022),该文件阐明了RSC未来3年新版RDA研究与实践的方向,对每年的具体任务进行了规划。未来3年,RSC将继续促进新版RDA对用户需求的响应,聚焦于新版RDA的成本效率、灵活性、连续性和国际化发展,继续未完成的指南章节的开发,每季度对新版RDA进行一次更新,增加和修改样例,优化翻译本、政策声明、RDA注册表的更新流程,提供新版RDA的专业培训[8]。2020年,RSC将着重推出翻译本和发布政策声明。按2019年10月15日发布的完成声明所预计的,RSC将在“15个月内(2020年底)发布9个翻译版本”。2021—2022年,RSC将开始研发新版RDA与BIBFRAME的映射,也就是RDA与BIBFRAME之间如何实现互操作,这是特别值得关注的。
新版RDA的推出为编目世界更好地融入关联数据环境搭建了桥梁,也为RDA在我国的本地化应用提出了新的挑战。原版RDA工具包站点共发布了8个语言版本,包括英语、德语、法语、西班牙语、芬兰语、意大利语、加泰罗尼亚语、挪威语。2014年出版的RDA中译本是以2012年的RDA印刷版为蓝本,当时并未开展在线翻译工作,因此中译本内容相对滞后,跟不上RDA更新的步伐。在新版RDA官方版本即将发布之际,国内编目界应尽早筹划在线中译本的翻译工作,期待在RDA工具包官方网站上能分享到中文版本的RDA,为国内RDA的研究与实践扫平语言障碍,这样既能促进RDA在我国的推广使用,也能彰显我国编目事业的国际化进程。RSC为RDA翻译创造了很多便利条件。为了满足不同的需求,RSC提供两种途径:一是完全翻译,即翻译RDA工具包的全部用户界面(帮助文档为可选翻译),其成果在RDA工具包和RDA注册表中发布;二是部分翻译,仅翻译RDA参考,即全部RDA元素及其定义和相关的范围注释,以及取值词表术语和定义,其成果仅在RDA注册表中发布[9]。此外,RSC还组建了RSC翻译工作组,为RDA翻译工作提供专业的技术指导。在政策声明方面,国家图书馆已于2018年1月1日启用了外文资源编目RDA本地政策声明,面对新版RDA的诞生,该本地政策声明也面临大规模的更新,其中新政策声明将以何种形式呈现值得我们深入思考。此外,在2015年ALA年会上,来自LC的代表宣布美国国会图书馆计划在2020年底实施BIBFRAME,届时LC将开始制作原生的BIBFRAME元数据,而不再生产MARC记录,如果机构需要,会以BIBFRAME元数据转换为MARC记录的方式提供。面对如此之多的挑战,我们新时代的编目员唯有加速转型,增强元数据核心能力,将编目与技术有机结合,才能继续乘风破浪地推进我国编目事业的国际化发展。