《资源描述与检索》测试方法研究*
2011-07-17霍艳蓉华东师范大学图书馆上海200241
霍艳蓉 (华东师范大学图书馆 上海 200241)
《资源描述与检索》(Resource Description and Access,简称RDA)于2010年6月正式在网上发布,并从2010年7月开始了预计9个月的测试。在经过将近1年时间之后,RDA测试协调委员会于2011年6月20日正式发布了最终的测试报告。
1 测试的评估要素和标准
美国RDA测试协调委员会(US RDA Test Coordinating Committee)(以下简称委员会)制定了一系列测试评估要素来检验RDA在实际应用中是否达到了预期目标。同时在分析阶段之前,委员会进行了大量交叉研究,以确保设计的调查问卷能够尽可能全面地覆盖这些评估要素,从而能够得出预期的数据。评估要素包括8个方面:①记录的创建;②记录的使用;③培训及所需的文档;④RDA工具包/RDA内容的使用;⑤系统和元数据;⑥技术可行性;⑦本地操作;⑧成本和收益。评估标准包括:①一般标准:编目员能否真正使用RDA规则进行编目;系统开发商能否在现有图书馆系统中使用RDA记录;用户能否在数据库中找到所需的信息;实施RDA后图书馆能否检索到更多类型的资源。②技术可行性:RDA记录与现有AACR2/MARC书目记录和规范记录之间的兼容性;是否有必要转换成MARC21或者其他未来的元数据格式;与其他编目工具对比RDA工具包的功能和完整性;是否应该在实施RDA之前开发相应的系统。③操作可行性:相对于当前的编目工具来说,使用RDA工具包可能产生的影响;用户最终获取RDA数据可能遇到的问题。④财务可行性 (成本/收益) :培训的成本;改变工作流程的成本;从纸本版改变为网络版编目文档的订购成本;如果需要的话,转换现有数据格式的成本[1]。
2 测试者的选择
委员会希望被选出的测试者能够尽可能多地代表各类型图书馆。但是考虑到没有那么多人力、物力来分析过多的测试结果,而且美国图书馆协会出版社(American Library Association Publishing,简称ALA Publishing)也不希望无限制地提供免费使用RDA工具包的账户,因此只选择了一部分测试申请者参加测试。根据美国国家医学图书馆(National Library of Medicine,简称NLM)的一位统计分析专家估计,至少应该对750条记录进行分析统计才能得出准确性较高的数据。基于这个原因,委员会最终选出了20个测试机构,每家机构分别为原编共同集(Common Original Set,简称COS)中的每个品种(共20~25个)创建2条记录[1]。
RDA测试希望能够尽可能多地涵盖各种类型、各种规模的编目机构,对各种类型的资源进行编目,并且涉及多种图书馆系统和编目规则。基于这个目的,委员会最终选出了各类型具有代表性的图书馆,包括国家图书馆、政府图书馆、学术性图书馆、公共图书馆、学校图书馆、专业图书馆以及档案馆、博物馆、书商、系统开发商、图书馆学校等。同时,委员会还要确保测试涉及多种编目系统、OPAC(Online Public Access Catalogue,联机公共目录查询系统)、交换格式及待编目的资源类型。为了确保RDA能和目前美国国内使用的大多数编目规则进行比较,委员会有意识地选择了使用AACR2(Anglo-American Cataloguing Rules, 2nd Edition,《英美编目条例》(第2版))、存档动画资料编目手册(Archival Moving Image Materials, 简称AMIM)、档案内容描述标准(Descriptive Cataloging of Rare Materials, 简称DCRM)、绘图资料著录规则(Graphic Materials: Rules for Describing and Historical Collections, 简称GIHC)等编目规则的图书馆,并从音乐图书馆协会/联机音像编目员(Music Library Association/ Online Audiovisual Catalogers)中选出编目员对AV(Audio Video)格式资源进行编目,从图书馆与信息学院(Graduate School of Library and Information Sciences,简称GSLIS)选出老师和学生参与测试。
由于正式测试者的名额有限,而未入选的申请者参与兴趣极大,因此委员会允许其他个人和团体作为非正式测试者进行测试。他们可以提交使用RDA创建的记录以及使用RDA的心得和经验。
3 测试方法设计
RDA测试的方法效仿CONSER(Cooperative Online Serials)标准记录曾采用的方法,即每一位CONSER的编目员从测试记录中集中选择一半品种,用当前使用的规则进行编目,而对剩下的另一半品种用待测试的新规则进行编目,从而对比使用新旧规则编目所花费的时间。每个测试机构创建的记录由其使用者评估,从可用性和易懂性这两方面对这些记录进行排序。一般情况下,委员会尽量不干涉各机构的工作流程。除了原编共同集,各图书馆还可以根据编目员的水平层次和人数,按照本地正常的编目流程在本地数据库或者OCLC(Online Computer Library Center,联机计算机图书馆中心)中对记录进行操作,创建规范记录。而对于原编共同集,测试者只需做描述性编目及选择性地做一些规范著录,不需要主题分析和分类标引。
3.1 原编共同集
创建RDA测试记录包括多个部分。第一部分是原编共同集,该集合共有25个品种[2],所有参与测试的机构都必须对这25个品种的资源进行编目。测试机构要让不同的编目员分别用AACR2(或者是测试机构使用的编目规则)和RDA进行编目,即分别为每个品种创建2条记录,然后对比使用当前规则和使用RDA创建记录所花费的时间。原编共同集的选取原则是尽量选择各类型图书馆都有的资源类型,而不选择条约、地图和乐谱等类型的资源。法律文献、地图、乐谱及其他专业文献属于原编附加集(Extra Original Set,简称 EOS)。
在实际工作中,一些编目员并不熟悉要编目的资源,这种情况对于测试是有益处的,因为有经验的编目员用自己熟悉的编目规则编目速度会相对较快,但是如果让编目员用AACR2中他们不熟悉的规则编目,和让他们用同样不熟悉的RDA规则编目进行对比,这样得出的结果才会相对公正。
此外,委员会还制作了表格,列出了他们期望入选原编共同集的所有资源类型及资源的一些属性,这些属性可能在AACR2记录和RDA记录中有不同的著录格式,如仅有一个版权日期的载体表现、有3个以上著者的文献、无共同题名的作品等。除了测试者提供的电子资源,委员会还从国会图书馆下属的美国版权局选取了大量的测试品种,Basecamp网站和国会图书馆网站会从每种实体资源书目记录中选出一些记录,并且对这些记录仔细审查,列出各品种资源的电子样本(Digital Surrogates)及各电子资源的URL(Uniform Resource Locator,统一资源定位器)。然后将这25个原编共同集品种按照字母A~Y顺序排列。OCLC为每个COS品种创建了很简单的简编记录,测试者可根据这些简编记录创建详编记录。见下页表1。
3.2 套录共同集(Common Copy Set,简称CCS)
因为在实际的编目工作中大部分是套录工作,因此委员会又给出了5个套录共同集品种[2],编目员可以考虑自己所在的图书馆将如何处理这些套录记录(AACR2和RDA两种情况),进而比较不同的处理方法所花费的时间。OCLC提供了套录共同集的记录,然后将RDA测试记录按照AA~EE排序,Basecamp网站和国会图书馆网站同时提供各品种的电子样本。
表2套录共同集[2]
表1 原编共同集[2]
3.3 原编附加集和套录附加集
除了创建原编共同集,委员会还希望每个参加测试的机构能够根据自身正常的工作流程创建RDA记录,也就是原编附加集。EOS可以确保测试尽可能多地涉及各种著录格式和资源种类,能够为系统开发商和感兴趣的机构提供大量用于研究和实验的记录。按照本地工作流程编辑套录记录的图书馆可以提交记录给套录附加集(Extra Copy Set,简称 ECS)。每个参加测试的机构都要求将RDA记录提供给用户(可以是个人用户也可以是团体用户)使用,并征求反馈意见。
4 设计调查问卷
委员会针对原编共同集(COS)、套录共同集(CCS)、原编附加集(EOS)和套录附加集(ECS)设计了4份调查问卷。参与测试的编目员要根据自己创建每条测试记录的情况完成调查问卷。调查的目的在于获得客观信息(如记录类型、创建记录的时间、要创建多少条规范记录等)和主观信息(如对编目格式的熟悉度、编目过程中遇到的问题、对哪些规则不清楚、使用RDA Toolkit(RDA工具包)遇到的问题等)。
逐条记录调查(Record-by-record Surveys),即参与测试的编目员要根据自己创建每条测试记录的情况完成调查问卷,该调查的目的在于获得客观信息和主观信息。此外还有其他3项调查,分别是记录创建者调查(Record Creator Profile Survey),主要是调查记录创建者的各种信息,如编目经验、RDA的培训情况等;用户调查(Record User Survey),主要是调查记录的可用性和易用性;机构问卷调查(Institutional Questionnaire),主要是调查RDA的实施对于机构所产生的影响[1]。并且在测试的前3个月,调查问卷的草案会寄发给一部分测试者,根据这些测试者的反馈对问卷草案进行修改,然后将修改后的调查问卷寄给所有测试者进行调查。之后的很多结论都是基于这8次调查(对4项调查问卷进行前后两次调查,共8次)所得到的信息。
5 测试记录的收集策略
共同集记录和附加集记录存储在美国国会图书馆特定的数据库中,并允许任何人获取、下载和使用。附加集记录和共同集记录是分开存放的。测试者可以继续使用OCLC,这样在最大程度上保留了他们原有正常的编目流程,从而使测试者不必提交两次记录。美国国会图书馆最后从OCLC中获取这些记录。其他不使用OCLC编目的图书馆可以通过E-mail或者FTP等方式上传给美国国会图书馆。
共同集记录问题比较多。委员会认为应该最大程度地确保编目社区是一个整体。共同集中的每一个品种都对应有52条记录(26家测试机构,每个机构为每个品种创建2条记录),并允许图书馆按照自身的编目工作流程创建记录。OCLC建议由测试机构来监督测试编目员,以确保他们为每个品种创建唯一的版本,并为共同集记录冠以类似“RDA测试记录A”、“RDA测试记录B”等的通用名称,以确保这些记录不会和其他记录发生冲突,也不会在共享的环境下出现问题。共同集测试记录会被锁定,这样主书目记录(Master record)就不能被编辑修改,不过在测试期间该锁定会在较短的时间内过期,过期后编目员就可以修改主书目记录,因此OCLC会定期、快速地存储这些原始版本[2]。
如果允许测试者向OCLC提交附加集记录,就必须正确处理规范记录。测试的一个重要部分就是确定RDA规范检索点和AACR2标目之间的区别以及这些不同之处对编目时间和数据库检索产生的影响。委员会认为,不论在书目著录还是检索点方面,RDA记录都应该是“纯粹的RDA记录”。但是委员会并不想修改现存的AACR2规范记录,那样将会引发OCLC或者其他系统的大变动。因此,委员会最后决定根据RDA规则创建规范记录,并存储到LC/NACO规范库中,同时在现有的AACR2标目中增加7- -字段来著录RDA形式的标目,而不是改变1--字段。测试完成之后,评估那些具有这种7--字段的记录。这种做法的目的在于,如果最终实施了RDA,那么可以确定哪些记录的标目需要修改;如果不实施RDA,具有这种7--字段的书目记录还可以再转换成AACR2记录,同时删除这些7--字段。
6 测试记录的分析和评估
委员会只对COS记录进行深入分析。为此还开发了一个系统专门用于分析、研究所有的COS记录。附加集记录数量庞大,委员会不可能对这些记录逐条分析,而是重点分析附加集中那些最有可能受RDA影响的资源类型,如乐谱、法律文献、善本、测绘资料、非MARC格式的记录等。
为了判断测试者能否创建可用的RDA记录,委员会让测试者为COS的每个品种同时创建RDA和AACR2两种基准记录。具体做法是,对COS每个品种同时用RDA和AACR2规则编目,并确定RDA核心元素及RDA扩展核心元素(RDA核心元素加上国会图书馆所需的元素)。由于测试机构并没有明确说明需要哪些RDA元素,而且在测试过程中创建的大多数RDA记录需要的元素都可能会超出RDA核心元素的范围,因此基准记录既要包括RDA核心元素也要包含扩展核心元素。基于RDA扩展核心元素的基准记录依据国会图书馆政策声明(Library of Congress Policy Statements,简称LCPSs)。该声明在测试之前已经发布,是RDA工具包的组成部分。AACR2基准记录依据AACR2 level 2,与大多数美国图书馆编目实践一样会用到国会图书馆条例解释(Library of Congress Rule Interpretations,简称LCRIs)、BIBCO标准及CONSER标准。在制订分析记录的指南时,委员会成员认为按照AACR2和 RDA规则编目会有多种选择,因此对特定的品种编目不可能只有一种正确的方法。基于这个原因,基准记录在很多情况下有多种做法。
测试者针对原编共同集25个品种的编目记录分别由3个国家图书馆检查,具体是LC分配8条,NAL分配8条,NLM分配9条。 委员会对记录的每个可变字段设定了等级:A代表合格的核心元素,M代表无核心元素,AA代表合格的非核心元素,RE代表不符合规则的核心元素,ARE代表不符合规则的非核心元素,ME代表错误的MARC核心元素,AME代表错误的MARC非核心元素[1]。由于很多测试者都提出很难将RDA记录转换成MARC格式,因此委员会更关注MACR格式。记录的评价表格由图书馆系学生来填,而不是参与测试的编目员。评估者可以对每条记录提出意见,总结对每个品种的检查结果、错误的类型、大多数编目员遇到的难题及编目员未来需要在哪些方面进行培训等[3]。
7 结 语
RDA成为新的国际标准已是大势所趋,RDA的中文化研究也应尽早得到重视并开展。了解美国RDA测试的评估因素、测试方法、记录收集方法和分析方法等,对于我国今后开展RDA中文编目测试具有很大的参考借鉴意义。
[1]Report and Recommendations of the U.S. RDA Test Coordinating Committee[EB/OL]. (2011-06-28)[2011-07-02].http://www.loc.gov/bibliographic-future/rda/rdatesting-finalreport-20june2011.pdf.
[2]Library of Congress Documentation for the RDA(Resource Description and Access) Test[EB/OL].(2010-11-23)[2011-07-02].http://www.loc.gov/catdir/cpso/RDAtest/rdatest.html.
[3]Library of Congress Documentation for the RDA (Resource Description and Access) Test: Training Materials for RDA Test Participants[EB/OL].(2010-05-14)[2011-07-02]. http://www.loc.gov/catdir/cpso/RDAtest/rdatraining.html.