APP下载

UNIMARC的FRBR化改造及其记录编制

2014-12-31丁建勤上海图书馆上海200031

图书馆建设 2014年7期
关键词:数据格式字段书目

丁建勤(上海图书馆 上海 200031)

1 FRBR模型及其实现方式

《书目记录功能需求》 (Functional Requirements for Bibliographic Records,简称FRBR)是国际编目界的重要理论成果。FRBR模型以用户需求为出发点,改变了传统书目记录的扁平结构,试图以作品、内容表达、载体表现和单件(work、expression、manifestation、item)为层级来组织揭示资源,通过揭示书目记录之间、书目记录中各个描述对象之间的相互关系,使目录成为一种方便用户查找和浏览的聚合检索工具。目前,FRBR模型的实现方式主要有非FRBR记录的FRBR化显示、直接编制和存储FRBR记录两种[1]。

1.1 非FRBR记录的FRBR化显示

OCLC(Online Computer Library Center,联机计算机图书馆中心)从2001年开始致力于FRBR 及其应用研究,并进行了一系列的实验项目,其中一个就是探索使用一些算法聚合现有的作品及内容版本记录。作品聚集的算法就是对每一个书目记录生成一个著者/题名信息键(author/title key),然后利用这些信息键把作品集中到一起[2]。

中国国家图书馆基于Primo资源发现系统进行了国家书目FBBR化试验,工作内容包括制定FBBR化规则、数据进入Primo前的规范化处理、Primo内部数据格式的生成和Primo前端检索结果的展示等[3]。

1.2 直接编制和存储FRBR记录

通过改变元数据的现有结构和组成,实现按照FRBR模型对信息的各种实体及其属性进行编目揭示是FRBR化的重要实现方式[1]。例如,中国国家图书馆曹宁主持的FRBR化实验项目,通过新增自定义字段标识和处理规则,实现记录的FRBR化标记和显示[4]。

鉴于前(非)FRBR的MARC(Machine Readable Catalogue,机器可读目录)记录的FRBR化处理存在一定的难度, MARC格式的FRBR化改造既可实现MARC记录编制符合FRBR模型,又可避免新增自定义字段标识可能造成的数据交换困难,方便数据处理和展示。UNIMARC(Universal Machine Readable Cataloging,国际机读目录格式)永久委员会(The Permanent UNIMARC Committee ,简称PUC)致力于UNIMARC的持续更新,UNIMARC的FRBR化改造是其重要任务。《UNIMARC手册:书目格式》和《UNIMARC手册:规范格式》(以下简称UNIMARC规范数据格式)的第3版及2012年更新版[5-6],包含了相当多的FRBR化改造成果。

2 UNIMARC格式的FRBR化改造

2.1 FRBR第一组实体和对应中UNIMARC处理格式

UNIMARC规范数据格式“154编码数据字段:题名”的$a子字段第1字符位为“实体类型代码”,其用一个单字符代码来表示实体的类型,其中“a”为作品,“b”为内容表达[7]。这表明规范数据描述对象包括FRBR第一组实体的作品和内容表达。《国际编目原则声明》 (Statement of International Cataloguing Principles,简称ICP)5.1条款规定“一般而言,应为每一载体表现创建一条独立的书目著录”[8],因此,FRBR第一组实体和对应的UNIMARC处理格式的关系已相当清晰,如表1所示。

表1 FRBR第一组实体和对应的UNIMARC处理格式

应指出的是,ICP 5.2条款同时规定“书目著录通常以作为载体表现代表的单件为基础,并可包括属于被体现的作品和内容表达的属性”[8],因此UNIMARC书目数据格式依然可以描述作品和内容表达的部分属性,如ISRC(International Standard Recording Code,国际标准音像制品编码)(016字段)、 “首选检索点(作品识别)”(506字段)、“首选检索点(内容表达识别)”(507字段)等。应注意的是,UNIMARC书目数据格式以FRBR实体及其属性为依据,对某些字段进行了评估和重新定位,如100字段$a子字段的17~19字符位“阅读对象”代码属于内容表达,拟通过新增书目数据和规范数据格式184字段(尚未正式发布)予以描述,184字段启用后,100字段$a子字段的17~19字符位必须填“x”(不适用)。又如,书目数据格式101字段的$a子字段“正文、声道等语种”、$b子字段“中间语种”、$c子字段“原著语种”、$d子字段“提要语种”、$j子字段“字幕语种”均为内容表达的属性,若记录编制符合FRBR,就不宜使用上述子字段,而应在规范记录中予以描述。因此,书目数据可以没有101字段(在没有$e、$f、$g、$h、$i等载体表现子字段描述的情况下),反之可启用新定义的第一指示符值“8”予以说明。

2.2 FRBR实体属性和UNIMARC题名字段

UNIMARC规范数据格式(2012年更新版)新增了FRBR第一组实体的作品、内容表达题名字段。其中作品层包括规范数据2--、4--、5--、7--字段的-31“规范检索点——题名”字段、-41“规范检索点——名称/题名”字段,内容表达层包括规范数据2--、4--、5--、7--字段的-32字段“规范检索点——题名”、-42字段“规范检索点——名称/题名”[6]。与此相适应,书目数据格式同步增加了506字段“首选检索点(作品)”、507字段“首选检索点(内容表达)”、576字段“名称/首选检索点(作品)”、577字段“名称/首选检索点(内容表达)”,如表2所示。

表2 FRBR实体属性和UNIMARC题名字段一览表

2.3 FRBR第一组实体的相关创作者、实现者、主题检索点

UNIMARC规范数据格式(2012年更新版)在52-字段前新增了5-1、5-2相关检索点,分别用以描述作品和内容表达的相关创作者和实现(贡献)者[6]。同时将6--字段“分类和实体历史块”更名为“主题分析和实体历史块”,并新增了60-、61-、63-、64-字段主题检索点用以描述作品的主题,其中63-和64-字段分别为作品、内容表达的题名主题,如表3所示。

2.4 兼容前(非)FRBR记录

UNIMARC在进行FRBR化改造的同时,依然保留原先的某些字段,尤其是原先的“统一题名”(现名“首选检索点”),以兼容前FRBR和非FRBR记录。因此,一般而言先前记录仍然可以使用,如表4所示。

3 UNIMARC记录的FRBR化编制

3.1 引用和创建作品和内容表达层记录

表3 FRBR第一组实体的相关创作者、实现者、主题检索点一览表

表4 前(非)FRBR和FRBR记录的题名字段表

FRBR作品和内容表达层应对应创建UNIMARC规范记录,由于中文编目没有复合标目的概念,因此,所谓对应的规范记录主要是指以231或232字段为核心的数据。书目数据编制时,应注意查检规范文档,506、507字段直接引用规范记录的231、232字段。对于一个作品存在多个内容表达及其载体表现的情况下,在引用作品和内容表达规范记录数据元素的基础上,添加载体表现属性,将有助于提高编目质量和编目效率。

当规范文档缺乏相应记录时,应首先编制规范记录。应指出的是,内容表达实体没有题名属性,换句话说,内容表达规范记录中的题名子字段可以从作品规范记录中复制,只需要在作品题名后附加属性。因此,同一种书目数据是否需要同时描述506、507字段还有待于进一步探讨。

当一种著作只有一种内容表达,而这种内容表达也只有一种载体表现时,国内有的实验项目只建立一条载体表现层的元数据,不再编制作品和内容表达的元数据[4]。

3.2 完善规范记录中的书目关系

编目人员可以利用新增的501、502、511、512字段分别著录作品和内容表达的创作者和实现者,利用6--字段描述作品的主题关系,以构建和完善书目关系。应注意的是,中文编目若能实现501、511字段的合理次序(如规定创作者著录于第一个501、511字段,其后创作者著录于后续的501、511字段),将弥补缺乏复合标目的缺陷,为后续FRBR化处理和显示创造条件。

3.3 前(非)FRBR记录的升级完善

中国国家图书馆国家书目实验表明,约有30%的书目数据可参与FRBR化聚合[3],即大部分书目记录是一种著作的内容表达的载体表现,因此这部分数据可以考虑暂时不予升级转换处理。

一般而言,存量前(非)FRBR记录的升级完善主要有两种方式。一种是通过编写算法进行数据转换(包括必要的人工干预),尤其是在新旧系统更换所涉数据迁移时,可在分析存量书目数据编制特性的基础上,同步完成数据清洗、作品和内容表达规范记录的自动生成,减少编目工作量,为今后数据的进一步完善提供可能。应该看到,UNIMARC的FRBR改造和国内外前(非)FRBR记录的FRBR化显示处理,为存量书目数据升级转换提供了有力支持。第二种方式是在FRBR化记录编制时,通过作品和内容表达规范记录的引用和创建,逐渐修改、完善所涉存量数据。

在现行MARC环境下,关注和思考MARC格式的FRBR化改造和记录编制,不仅有利于MARC数据的FRBR化呈现和服务,也有助于今后可能进行的新型书目数据格式的MARC数据转换处理。

[1]詹丽华.基于FRBR的信息组织的评价研究[J].图书馆杂志,2012(11):35-37.

[2]张俊娥.浅析OCLC的FRBR作品聚集算法[J].大学图书馆学报,2006(6):66-69,93.

[3]廖永霞.中国国家书目的FRBR化实践与思考[J].图书情报工作,2013,57(17):102-108.

[4]曹 宁.根据FRBR模型重新构造书目数据体系的探索[J].数字图书馆论坛,2008(5):43-48,75.

[5]UNIMARC Bibliographic,3rd edition. UPDATES 2012[EB/OL].[2014-01-03].http://www.ifla.org/node/7974.

[6]UNIMARC Authorities,3rd edition. UPDATES 2012[EB/OL].[2014-01-03].http://www.ifla.org/node/7950.

[7]维 勒.UNIMARC手册:规范格式[M]《.中国机读规范格式》工作组,译.北京:国家图书馆出版社,2013:73.

[8]Statement of International Cataloguing Principles[EB/OL].[2014-03-15].http://www.ifla.org/publications/statement-of-internationalcataloguing-principles.

猜你喜欢

数据格式字段书目
推荐书目《初春之城》
浅谈台湾原版中文图书的编目经验
题名与责任说明附注字段用法分析
MIT—BIH心率失常数据库的识读
基于RFID的户外广告监管系统的设计与实现
一种融合多业务的信息化系统框架研究
无正题名文献著录方法评述
本刊邮购书目
《全国新书目》2009年1月荐书榜
中央文献出版社等提供869种可供书目