APP下载

“资源描述与检索”内容框架演变的历程分析

2011-05-31中国科学院国家科学图书馆北京100190

图书与情报 2011年5期
关键词:草稿检索实体

徐 静 (中国科学院国家科学图书馆 北京 100190)

1 引言

出于统一描述,提高信息描述机构间数据交换效率,最大程度揭示出满足用户需求的信息,实现信息有序化的目的,相关机构专门编制了适用于各类特殊需求的国际性编目原则和规则。1961年发布的“巴黎原则”促成了“英美编目条例”(Anglo-American Cataloguing Rules,AACR)的诞生,在一定程度上解决了图书馆信息资源描述的统一问题,为书目世界的沟通带来便利。然而无论是信息本身的特性,还是用户需求,随着时代的发展总会表现出新的变化,AACR系列也因此成立专门的联合修订委员会 JSC(Joint Steering Committee for the Revision of AACR)。

新版AARC系列的修订计划发端于2003年,并于2010年6月以新名称“资源描述与检索”(Resource Description and Access,RDA)正式发布。RDA的出现与AACR系列有着密切渊源,它既是AACR2某种形式的延续,又对其做出了大范围的改动,特别是思路方面的大变革。一方面希望RDA能够尽可能的兼容根据AACR2进行描述的历史数据,最大程度地降低数据转换成本;另一方面,又因认识到AACR2编制年代的局限,而在新一版中做出了前所未有的变化,与AACR系列有着明显的思路分歧。通过对RDA历次宏观内容框架的对比和分析,帮助我们更好的理解RDA的本质,窥探信息描述的发展力程,在未来的实践应用中把握方向和前景。

2 RDA历次内容框架的尝试和争议

RDA是为数字世界设计的一套新标准,它由AACR发展而来,为各种类型的内容和媒体提供一系列有关资源描述和检索的指南和说明。RDA将满足图书馆用户以及其他信息组织机构发现、识别、选择、获取资源的信息需求。[1]它是一个元数据的内容标准,用来指导如何对信息资源进行描述,决定哪些信息有被描述的必要,如何规范描述才能更好的满足用户需求,为其他机构理解并接受,符合机器识别的需求。

自JSC决定开发新版AACR系列后,内容框架历经数轮大改动。按照公示草稿的时间,可分为2004年12月、2005 年 12 月、2006 年 6 月和 2008 年 11 月[2][3][4][5][6]共计4个版本(框架细节见表1)。

2.1 2004年12月版AACR3草稿:初次尝试

2004年12月首次提供外界评审的新版本被延续命名为 AACR3,“著录”部分被划分为“通用”、“特殊”两个层次。“通用规则”涉及资源普遍存在的特征,其中A2章、A3章分别针对图书馆工作中常见的连续性资源和集成性资源给予单独指导;第二层则根据不同“内容类型”和“媒介类型”特征提供专门的补充规则。Part I的每一具体章节内容均对应ISBD的著录项进行组织。

在使用规则时,编目人员可根据资源特性,通过“一般规则+特殊内容类型+特殊媒介类型”的方式,组配出个性化规则。这种尝试一改AACR2按照资源类型划分著录部分的组织方式,在一定程度上减少对具有相似特征资源的规则冗余,也相对更适应新信息环境下的资源所承载的复合特征。自AACR3起,JSC开始尝试对资源特征进行抽象和归纳,降低资源类型的分类维度,提高信息描述的灵活度,从而提高规则的通用性。

这一版的草稿虽未提供Part II(检索点的选择)和Part III(检索点的形式)的具体内容,但从大标题可获知新版本已开始舍弃传统卡片目录时代“标目”、“款目”的术语,接纳“检索点”的概念。

虽然这一版草稿对Part I进行归纳的初衷值得肯定,但仍存在明显局限。首先,“通用规则”章节安排的逻辑思路不明晰。A2(连续发行的资源)和A3(集成性资源)作为某一种特殊形态的资源类型而纳入“通用规则”,将“通用”规则的普遍适用程度降低;其次,“特殊规则”部分的分类范围和标准不明确。无论是特殊内容类型还是媒介类型,AACR3仅区别出为数不多的几种,且未提供“其他”类型资源的适用规则,能否适应当今越来越复杂的资源类型仍存疑;第三,该草稿的章节编号规则极为复杂,非线性的数字+字母组合的复杂编号方式更加大了使用者理解的难度。

表1 RDA历次内容结构变化表

该版本同样也受到了来自评审社区的质疑,例如希望新规则能够适应于网络环境、覆盖所有的材料、在使用和理解方面应简单易用、提高与其他资源描述和检索标准的兼容、超越图书馆社区的范畴等。[7]总之,这一版AACR3虽在编纂思路上试图做出改进,但更像是对AACR2章节的拆分、合并和重组,更多的被业界视为AACR2的新修订版。

2.2 2005年12月版RDA草稿:概念模型的确定

针对上一版争议,JSC意识到当前信息环境已发生巨大改变,在充分调研的基础上,决定改变编纂思路,将FRBR(书目记录的功能需求)、FRAD(规范记录的功能需求)和FRSAD(主题规范数据的功能需求)为主的“FR家族”概念模型作为基础,同时将AACR3的副题名“资源描述与检索”作为新版正题名,去除“英美”、“编目”字眼,既凸显其国际化战略,又显示其走出图书馆界的雄心。[8]

在内容和结构方面,第1章主要涉及描述方法、必备元素、著录语种和文字等基本规则。第2~6章分别从识别、描述、获取的角度对资源进行剖析。Part II(关系)和Part III(检索点控制)的内容尚处于规划阶段,Part II将关注于检索点的使用,反映FRBR模型中第一组实体间的关系以及第二组与第一组实体的关系,同时也将涵盖第一组实体间的“引用”关系,探索如何简易方便的选择“引用”作品的主要检索点;Part III将检索点的“选择”和“形式”合并为“检索点控制”,术语上更加贴合FR家族的概念,主要关注于反映个人、家族、团体和作品题名的名称规范形式和变异形式。

在与ISBD的协调方面,这一版本决定将原有规则中关于数据的描述功能和展示功能独立开来,通过新增附录来提供展示数据的原则和规则,如ISBD与RDA的协调,未来计划扩展到诸如OPAC等其他展示方式。这一改动首次将ISBD纷繁复杂的各种标点和规则剥离出来,为RDA日后成为纯粹的元数据内容描述标准奠定了基础。同时在各具体章节的组织方面舍弃了按ISBD著录项目的组织顺序,尝试以“元素”作为组织内容的核心。例如第2章的具体章节分别是:题名;责任声明;版本;编号;出版者、发行者等;出版地、发行地等等。强化了“元素”的价值,与“元数据”概念更加接轨。

这一版的问题则主要集中于对FR家族的取舍过于片段,最终导致内容框架逻辑不清。以Part I部分为例,其虽反映出按照用户任务组织文本的逻辑思路,但将FRBR所定义的“发现”任务合并入“识别”实难理解。而如果按FRBR第一组实体的角度来分析,第3章或可视为“载体表现”,第4章为“内容表达”及“作品”层,第5章则是“单件”的一种语言表达方式,是层次方面的另一种混乱。此外,该版本过多的关注于“载体表现”和“单件”,对FR家族的优势——内容及内容间的关系有所忽略,关系的层次、各类实体间关系的细节都没有得以展示。

从总体上说,这一版已可以看出JSC接纳FR家族的尝试和探索,确认了FR家族作为概念模型的基础地位,开始接受FR系列术语。但是RDA对FR家族的融合程度又并非完全和彻底的,反而造成理解方面的困惑,并未充分发挥出概念模型的价值。

2.3 2006年06月版RDA草稿:关系的舍弃

2006年6月,RDA框架再次微调,将原有Part I(著录)和Part II(关系)合并为Part A(著录),涵盖图书馆意义上的“书目记录”;原有Part III(检索点控制)更换为Part B(检索点控制),涵盖“规范记录”。新结构源于JSC认为没有必要过于区分“描述”元素和“检索”元素,而且关系元素的处理也必然涉及大量描述方面的内容,将两者合并起来有利用使RDA被其他信息描述社区所接受。[9]

这一版本主要提供了Part A第6章和第7章涉及“关系”的部分供审阅,前者围绕FRBR第一组实体,后者为第二组实体。“相关作品”和“特殊作品类型”等特殊性规则不在单独罗列为一个章节,有利于章节逻辑层次的统一。JSC希望合并后的Part A能够使得整个结构更加协调。然而从具体的章节来看,由于未对上一版本Part I进行实质性修改,仍然继承之前存在的问题。

FR家族概念模型从实体到实体的分析优势在这一版基本被舍弃。草稿将“关系”拆分为各种线性组合,如:整体与部分关系、部分与部分关系、来源与复制关系、格式与格式关系、版本与版本关系、合订关系、关于音乐资源/艺术资源/法律资源的附加规则等。首先,这一方法是否能够真正涵盖所有分类有待证实,术语的使用也让人理解困难;其次,后半部分脱离普遍关系,转而专门涉及几种特殊资源的附加规则,逻辑思路依稀可见AACR3草稿的影子;第三,整个第6章所涉及的“关系”无法分清到底是FRBR第一组实体间的关系,还是单个实体内部的关系。第7章也存在类似问题。

受邀进行评审的各机构也对草稿提出尖锐意见。ALA对于这种再三的结构改动和复杂的工作计划表示出了担忧,其中一条关键建议:勿再使用AACR2作为开发和实践RDA的思路来源。[10]RDA不应再被视为现有编目规则的修订版,应指引未来图书馆编目和元数据的蓝图,适应更有效的元数据框架和其他元数据标准。ALA强烈建议RDA与FRBR和FRAD进行更充分的结盟,对术语和分类按照FR家族的思路重新审视,并强调章节安排的逻辑性。在可能的情况下,RDA中的“关系”可使用受控的数据,为未来语义领域的表达打下基础。业界此时也有声音将RDA视为“20世纪的编目规则”,[11]并一度被美国国会图书馆未来编目控制组建议暂缓开发。[12]

总之,这一版本的尝试并未达到JSC的预期,逻辑层次不清的问题是RDA面临的最大问题,RDA真正走向未来的元数据内容标准还有很大的差距。

2.4 2008年11月版RDA草稿:正式版本的定型

由于2006年6月版草稿的评审意见并不乐观,JSC在2008年对整体框架进行了大范围调整,正式出版时间一再推迟。2010年6月正式出版的RDA文本基本保持了2008年草稿框架。

JSC接受了各方关于RDA与FR家族更加契合的建议,新方案按照ER分析方法分为“属性”和“关系”两大块,共10个部分。Part A严格遵循FRBR的三组实体对各实体的属性描述设定规则,反映编目人员的工作流,从单件到所代表的载体表现,进而深入挖掘资源内涵;Part B也舍弃原先方案,遵循FR家族所识别的实体内及实体间的关系。模块化的属性和关系将有利于开发支持资源发现的应用,新的组织结构不再与任何特殊的记录结构绑定,有利于灵活适应各类社区的数据库结构。新框架的适应性和扩展性,将为RDA今后走向面向对象的模型结构提供更好的扩展空间。

同时,RDA不再延续按资源类型分类的组织结构,而是从内容、媒介和载体三个角度分别对资源类型进行界定。一方面有利于适应复合多种类型的资源描述,另一方面降低了资源类型的颗粒度,为未来进一步开发RDA的应用提供潜在便利。虽然这种安排方式或许会对当前从事信息描述工作的人员,尤其是图书馆的编目人员带来不便,但RDA在线工具Toolkit所提供的工作流抽取和重组的功能或可改善这一问题。随着应用的推广,大型信息资源机构,尤其是国家级图书馆或可共享使用针对具体资源的编目工作流。

在新版的RDA草稿中,不在单独设立关于检索点的大模块,而是将检索点的描述与著录部分合并在各个相关章节里。例如第06章在展示了作品、内容表达相关识别元素的规则后,继续分别介绍了通用的、音乐类、法律类、宗教类和正式照会作品及内容表达的规范检索点和变异检索点的构建;第09、第10、第11、第16章也是类似处理,先给出著录方面的规则,再给出构建个人、家族、团体规范检索点和变异检索点的规则。

由于该版本的内容框架与FR家族的关系已相当密切,逻辑思路也较为清晰,基本获得了评审社区的认可。虽然由于追赶进度一度在文字书写及排版方面出现了较多问题,对RDA的质量和评价带来一定负面的影响,部分降低了信任程度,但随着后续对内容的不断细化和改进,RDA的宏观内容框架基本获得认可,最终的问题集中于具体的规则细节方面,例如使用的语言过于“精巧”,理解困难;缺少适合各类情况的具体示例,使用者易造成困惑;部分规则含糊,没有给出实际的操作方案,在具体实践中无法确切把握等。

3 RDA内容框架演变历程的分析与启示

3.1 强调逻辑分析的价值和逻辑思路的统一

早在1997年的“AACR原则与未来发展国际会议”上,JSC即明确应对AACR的原则和结构进行逻辑分析,辅助AACR2的修订,决定未来发展方向,并责成加拿大国家图书馆的TomDelsey着手开展。Delsey在次年的特别会议上介绍了利用E-R分析方法对AACR2原有内容模块化而得的实体、属性和关系,[13]将逻辑结构分为对对象进行描述性编目,强调具有一定的物理形态的“单件”和为描述的对象决定和建立标目,以智力资源“作品”为主要研究对象的两部分。这一逻辑分析方法与同期开发的FR家族异曲同工。在充分调研FRBR的基础上,JSC最终采纳FR家族作为开发下一代AACR的逻辑基础。

RDA的开发过程,是对FR家族接纳程度的不断反思。逻辑思路的统一贯穿整个开发历程,一度成为RDA最致命的问题。从最终正式发布版本来看,RDA较为忠实的接纳了FR家族的思路,接受FR家族定义的实体、关系和属性,并遵循FR家族的用户任务,使用FR家族术语,与FR家族密切契合。

3.2 尝试对复杂信息资源类型和新信息特征进行描述

信息创造、记录以及表现手段的发展导致信息资源的类型变得愈加复杂,从物理形态或内容形态单一角度对资源进行分类的方式也变得更加困难,所描述的信息资源已不仅仅局限于单纯的书本、期刊、舆图、录音等形式,更多的走向杂糅和细化。随着数字化、自出版等新技术和新发行模式的流行,资源类型更加复合。新时代下,作为试图规范如何描述信息资源的RDA不可避免的面临着如何组织规则的难题。

从RDA开发伊始,已放弃按资源类型来组织规则的惯常手段,“一般规则+特殊内容类型+特殊媒介类型”的组配是一种很好的尝试。在与出版行业ONIX合作后,RDA更加细化了资源类型维度,开发出了一套从内容类型、载体类型和媒介类型三个角度对资源进行分类的方法,同时提供了三种类型的受控词表。相对应的,由于RDA尝试对更加复杂的信息资源类型进行描述,从中抽象出符合用户需求的新信息特征,不可避免的造成较之AACR2更加复杂和琐碎,同样的也可能遗漏更多。

3.3 强调挖掘信息资源的内容,反映实体间的关系

随着信息量的海量增长,信息资源已不再是一个个独立的信息源,对资源内容和资源间关系的挖掘已成为用户使用的重要趋势之一。反映在信息资源描述方面,则不再仅仅关注于资源外部特征和浅显内容特征的转录,需通过更加细致的描述方式,为未来挖掘信息资源的内容和关系留出足够空间,降低描述单元的维度和耦合度。

从RDA框架的一路演变来看,在接受FR家族概念模型的基础上,对资源属性模块化,采纳“实体”概念,越来越强调“作品”和“内容表达”的价值,对“关系”的挖掘也按照FRBR所定义的3组实体而细分为6个部分,形成“属性”和“关系”的两大部分。从信息层面到知识层面的服务升级,不可能仅通过对资源的完整描述来实现,但合理的基础数据是进行下一步拓展服务的基础,作为元数据内容标准的RDA已经做出了这方面的努力和尝试。

3.4 强调以用户为中心

RDA接纳了FR家族,特别是FRBR“发现、识别、选择、获取”的用户任务,站在用户的角度来重新认识资源特征,强调“用户便利性”。06年06月版Part A已略可看出“识别-选择-获取”的逻辑思路,直到最终正式发行版关于用户任务的对应更加清晰,例如Section 1的第01章(记录载体表现和单件属性的一般规则)对应“发现”;第02章(载体表现和单件的识别)对应“识别”;第03章(描述载体)对应“选择”;第04章(提供获取与检索信息)对应“获取”。无论是RDA,还是其他内容标准,无论是图书馆界还是其他行业,最终立足点都将是尽可能的方便用户找到所需的资源。以用户为中心,满足用户需求的核心价值理念将始终引领技术和服务的发展。

4 结语

综上所述,从RDA历次版本的更新可清晰看出其与FR家族步步深入结合。与之对应的,也就要求信息描述人员除了掌握RDA本身外,还需要学习FR家族的相关概念、深入理解“实体-关系-属性”的ER分析技术等,把握资源的内容实质,挖掘资源、实体间的各种可能存在的关系,这些均对信息描述人员的能力提出很大挑战。RDA未来如何应用到实际工作中,如何充分发挥它的价值还需要相关行业进一步分析和把握。

[1]JSC.statement of purpose for RDA[EB/OL].[2011-05-02].http://www.rda-jsc.org/stratplan.html.

[2]JSC.AACR3-Part I-Constituency Review of December 2004 Draft[EB/OL].[2011-05-29].http://www.rda-jsc.org/docs/5aacr3-part1.pdf.

[3]JSC,RDA:Resource Description and Access Part IConstituency Review of December 2005 Draft[EB/OL].[2011-05-09].http://www.rda-jsc.org/docs/5rda-part1.pdf.

[4]JSC.RDA:Resource Description and Access Part A,Chapters 6-7.Constituency Review of June 2006 Draft[EB/OL].[2011-05-20].http://www.rda-jsc.org/docs/5rd a-parta-ch6&7.pdf.

[5]Ed Jones.The shape of Things to Come:Resource DescriptionandAccess(RDA)[J].TheSerialsLibrarian.2007,52(3/4):281-289.

[6]RDA Toolkit.RDA Constituency Review Draft[EB/OL].[2011-07-17].http://www.rdatoolkit.org/constituencydraft.

[7]JSC.Outcomes of the Meeting of the Joint Steering Committee Held in Chicago[EB/OL].[2011-05-02].http://www.rda-jsc.org/0504out.html.

[8]胡小菁.RDA的国际化战略[J]数字图书馆论坛,2010,(12):16-18.

[9]Outcomes of the Meeting of the Joint Steering Committee Held in Ottawa[EB/OL].[2011-05-20].http://www.rdajsc.org/0604out.html.

[10]ALA.RDA:Resource Description and Access Part A,Chapters 6-7.Constituency Review of June 2006 Draft[EB/OL].[2011-05-20].http://www.rda-jsc.org/docs/5rda-parta-ch6&7-alaresp.pdf.

[11]Karen Coyle.Resource Description and Access(RDA):Cataloging Rules for the 20th Century[J].D-Lib Magazine,2007,(1/2):131-133.

[12]On the record:report of the library of congress working group on the future of bibiliographic control[EB/OL].[2011-04-20].http://www.loc.gov/bibliographic-future/news/LCWGResponse-Marcum-Final-061008.pdf.

[13]Tom Delsey.The Logical Structure of the AACR Part I[EB/OL].[2011-04-30].http://www.rda-jsc.org/docs/aacr.pdf.

猜你喜欢

草稿检索实体
知识图谱的候选实体搜索与排序①
The Inventor of Basketball
CNKI检索模式结合关键词选取在检索中的应用探讨
通过实际案例谈如何利用外文库检索提高检索效率
瑞典专利数据库的检索技巧
实体书店步入复兴期?
跟踪导练(四)3
不能多写一个字
2017实体经济领军者
不能多写一个字